Deepseek: Yr un aflonyddgar yn chwyldroi'r dirwedd AI

Grŵp Aipu Waton

Cyflwyniad

Pryder parhaus ymhlith modelau mawr cystadleuol, darparwyr cwmwl sy'n cystadlu am gyfran o'r farchnad, a gweithgynhyrchwyr sglodion gweithgar - mae'r effaith Deepseek yn parhau.

Wrth i ŵyl y gwanwyn ddod i ben, mae'r cyffro o amgylch Deepseek yn parhau i fod yn gryf. Amlygodd y gwyliau diweddar ymdeimlad sylweddol o gystadleuaeth yn y diwydiant technoleg, gyda llawer yn trafod ac yn dadansoddi'r "catfish hwn." Mae Silicon Valley yn profi ymdeimlad digynsail o argyfwng: mae eiriolwyr ffynhonnell agored yn lleisio eu barn eto, ac mae hyd yn oed Openai yn ailbrisio ai ei strategaeth ffynhonnell gaeedig oedd y dewis gorau. Mae'r patrwm newydd o gostau cyfrifiadol is wedi sbarduno adwaith cadwyn ymhlith cewri sglodion fel NVIDIA, gan arwain at recordiadau gwerth marchnad undydd yn hanes marchnad stoc yr UD, tra bod asiantaethau'r llywodraeth yn ymchwilio i gydymffurfiad y sglodion a ddefnyddir gan Deepseek. Ynghanol adolygiadau cymysg o Deepseek dramor, yn ddomestig, mae'n profi twf anghyffredin. Ar ôl lansio'r model R1, mae'r ap cysylltiedig wedi gweld ymchwydd mewn traffig, gan nodi y bydd twf yn y sectorau cymwysiadau yn gyrru'r ecosystem AI gyffredinol ymlaen. Yr agwedd gadarnhaol yw y bydd DeepSeek yn ehangu posibiliadau cymhwysiad, gan awgrymu na fydd dibynnu ar ChatGPT mor ddrud yn y dyfodol. Mae'r newid hwn wedi'i adlewyrchu yng ngweithgareddau diweddar Openai, gan gynnwys darparu model rhesymu o'r enw O3-Mini i ddefnyddwyr rhydd mewn ymateb i Deepseek R1, yn ogystal ag uwchraddiadau dilynol a wnaeth gadwyn feddwl O3-Mini yn gyhoeddus. Mynegodd llawer o ddefnyddwyr tramor ddiolch i Deepseek am y datblygiadau hyn, er bod y gadwyn feddwl hon yn grynodeb.

Yn optimistaidd, mae'n amlwg bod Deepseek yn uno chwaraewyr domestig. Gyda'i ffocws ar leihau costau hyfforddi, mae amryw o wneuthurwyr sglodion i fyny'r afon, darparwyr cwmwl canolraddol, a nifer o fusnesau cychwynnol yn ymuno â'r ecosystem, gan wella effeithlonrwydd cost ar gyfer defnyddio'r model DeepSeek. Yn ôl papurau DeepSeek, dim ond 2.788 miliwn o oriau GPU H800 GPU sydd ei angen ar hyfforddiant cyflawn y model V3, ac mae'r broses hyfforddi yn sefydlog iawn. Mae pensaernïaeth MOE (cymysgedd o arbenigwyr) yn hanfodol ar gyfer lleihau costau cyn-hyfforddi gan ffactor o ddeg o'i gymharu â Llama 3 gyda 405 biliwn o baramedrau. Ar hyn o bryd, V3 yw'r model cyntaf a gydnabyddir yn gyhoeddus sy'n dangos teneurwydd mor uchel ym Moe. Yn ogystal, mae'r MLA (sylw aml -haen) yn gweithio'n synergaidd, yn enwedig mewn agweddau rhesymu. "Y sparser y moe, y mwyaf y mae maint y swp sydd ei angen yn ystod rhesymu i ddefnyddio pŵer cyfrifiadol yn llawn, gyda maint y kvcache yw'r ffactor cyfyngol allweddol; mae'r MLA yn lleihau maint KVCache yn sylweddol," nododd ymchwilydd o Chuanjing Technology mewn dadansoddiad ar gyfer adolygiad technoleg AI. At ei gilydd, mae llwyddiant Deepseek yn gorwedd yn y cyfuniad o amrywiol dechnolegau, nid dim ond un sengl. Mae mewnwyr y diwydiant yn canmol galluoedd peirianneg tîm Deepseek, gan nodi eu rhagoriaeth mewn hyfforddiant cyfochrog ac optimeiddio gweithredwyr, gan sicrhau canlyniadau arloesol trwy fireinio pob manylyn. Mae dull ffynhonnell agored DeepSeek yn tanio datblygiad cyffredinol modelau mawr ymhellach, a rhagwelir, os bydd modelau tebyg yn ehangu i ddelweddau, fideos, a mwy, y bydd hyn yn ysgogi'r galw yn sylweddol ar draws y diwydiant.

Cyfleoedd ar gyfer gwasanaethau rhesymu trydydd parti

Mae data'n dangos, ers ei ryddhau, bod Deepseek wedi cronni 22.15 miliwn o ddefnyddwyr gweithredol dyddiol (DAU) o fewn dim ond 21 diwrnod, gan gyflawni 41.6% o sylfaen defnyddwyr ChatGPT a rhagori ar 16.95 miliwn o ddefnyddwyr gweithredol dyddiol Doubao, a thrwy hynny ddod y cais sy'n tyfu gyflymaf yn fyd-eang, ar frig y siop Apppe App Apple mewn 157 o wledydd/rhanbarthau. Fodd bynnag, er bod defnyddwyr wedi heidio mewn defnau, mae hacwyr seiber wedi bod yn ymosod yn ddi -baid yn app Deepseek, gan achosi straen sylweddol ar ei weinyddion. Mae dadansoddwyr diwydiant yn credu bod hyn yn rhannol oherwydd cardiau sy'n defnyddio Deepseek ar gyfer hyfforddiant tra heb ddigon o bŵer cyfrifiadol ar gyfer rhesymu. Adolygiad Technoleg AI Hysbysedig Diwydiant, "Gellir datrys y materion gweinydd mynych yn hawdd trwy godi ffioedd neu gyllid i brynu mwy o beiriannau; yn y pen draw, mae'n dibynnu ar benderfyniadau Deepseek." Mae hyn yn cyflwyno cyfaddawd wrth ganolbwyntio ar dechnoleg yn erbyn cynhyrchu. Mae DeepSeek wedi dibynnu i raddau helaeth ar feintioli cwantwm ar gyfer hunan-gynnal, ar ôl cael ychydig o gyllid allanol, gan arwain at bwysedd llif arian cymharol isel ac amgylchedd technolegol purach. Ar hyn o bryd, yng ngoleuni'r problemau uchod, mae rhai defnyddwyr yn annog Deepseek ar gyfryngau cymdeithasol i ddyrchafu trothwyon defnydd neu gyflwyno nodweddion taledig i wella cysur defnyddwyr. Yn ogystal, mae datblygwyr wedi dechrau defnyddio'r API swyddogol neu APIs trydydd parti i'w optimeiddio. Fodd bynnag, cyhoeddodd platfform agored DeepSeek yn ddiweddar, "Mae adnoddau gweinydd cyfredol yn brin, ac mae ail -wefru gwasanaeth API wedi'u hatal.”

 

Heb os, mae hyn yn agor mwy o gyfleoedd i werthwyr trydydd parti yn y sector seilwaith AI. Yn ddiweddar, mae nifer o gewri cwmwl domestig a rhyngwladol wedi lansio Model APIs Deepseek - roedd Cewri Overseas Microsoft ac Amazon ymhlith y cyntaf i ymuno ddiwedd mis Ionawr. Gwnaeth yr arweinydd domestig, Huawei Cloud, y symudiad cyntaf, gan ryddhau gwasanaethau rhesymu Deepseek R1 a V3 mewn cydweithrediad â Llif yn Silicon ar Chwefror 1. Mae adroddiadau o AI Technology Review yn dangos bod gwasanaethau Flow yn seiliedig ar silicon wedi gweld mewnlifiad o ddefnyddwyr, i bob pwrpas yn "chwalu" y platfform. Cyhoeddodd y tri chwmni technoleg mawr-Bat (Baidu, Alibaba, Tencent) a Bytedance-gynigion cost isel, amser cyfyngedig amser yn cychwyn ar Chwefror 3, yn atgoffa rhywun o ryfeloedd prisiau gwerthwr cwmwl y llynedd a daniwyd gan lansiad model V2 Deepseek, lle dechreuodd Deepseek gael ei alw'n "Butcher Price." Mae gweithredoedd gwyllt gwerthwyr cwmwl yn adleisio'r cysylltiadau cryf cynharach rhwng Microsoft Azure ac Openai, lle yn 2019, gwnaeth Microsoft fuddsoddiad sylweddol o $ 1 biliwn yn Openai a medi budd-daliadau ar ôl lansiad Chatgpt yn 2023. Fodd bynnag, dechreuodd y berthynas agos hon fod yn ddarnio ar ôl i Ecose Meta. Yn yr achos hwn, mae Deepseek nid yn unig wedi rhagori ar ChatGPT o ran gwres cynnyrch ond mae hefyd wedi cyflwyno modelau ffynhonnell agored yn dilyn rhyddhau O1, yn debyg i'r cyffro ynghylch adfywiad Llama o GPT-3.

 

Mewn gwirionedd, mae darparwyr cwmwl hefyd yn lleoli eu hunain fel pyrth traffig ar gyfer cymwysiadau AI, sy'n golygu bod dyfnhau cysylltiadau â datblygwyr yn trosi i fanteision preemptive. Mae adroddiadau'n nodi bod gan Baidu Smart Cloud dros 15,000 o gwsmeriaid yn defnyddio'r model Deepseek trwy'r platfform Qianfan ar ddiwrnod lansio'r model. Yn ogystal, mae sawl cwmni llai yn cynnig atebion, gan gynnwys llif yn seiliedig ar silicon, technoleg Luchen, technoleg Chuanjing, ac amryw o is-ddarparwyr AI sydd wedi lansio cefnogaeth ar gyfer modelau Deepseek. Mae Adolygiad Technoleg AI wedi dysgu bod y cyfleoedd optimeiddio cyfredol ar gyfer lleoli lleol o Deepseek yn bodoli yn bennaf mewn dau faes: mae un yn optimeiddio ar gyfer nodweddion teneurwydd y model MOE gan ddefnyddio dull rhesymu cymysg o ddefnyddio'r model paramedr 671 biliwn MOE yn lleol wrth ddefnyddio casgliad GPU/CPU hybrid. Yn ogystal, mae optimeiddio MLA yn hanfodol. Fodd bynnag, mae dau fodel Deepseek yn dal i wynebu rhai heriau wrth optimeiddio lleoli. "Oherwydd maint y model a nifer o baramedrau, mae optimeiddio yn wir yn gymhleth, yn enwedig ar gyfer lleoli lleol lle bydd sicrhau'r cydbwysedd gorau posibl rhwng perfformiad a chost yn heriol," meddai ymchwilydd o dechnoleg Chuanjing. Y rhwystr mwyaf arwyddocaol yw goresgyn terfynau capasiti cof. "Rydym yn mabwysiadu dull cydweithredu heterogenaidd i ddefnyddio CPUs ac adnoddau cyfrifiadol eraill yn llawn, gan roi dim ond y rhannau heb eu rhannu o'r matrics MOE tenau ar CPU/DRAM i'w prosesu gan ddefnyddio gweithredwyr CPU perfformiad uchel, tra bod y dognau trwchus yn aros ar y GPU," esboniodd ymhellach. Mae adroddiadau'n nodi bod Ktransformers fframwaith ffynhonnell agored Chuanjing yn chwistrellu amrywiol strategaethau a gweithredwyr yn bennaf i weithrediad gwreiddiol y trawsnewidyddion trwy dempled, gan wella cyflymder casglu yn sylweddol gan ddefnyddio dulliau fel CUDAGRAPH. Mae DeepSeek wedi creu cyfleoedd ar gyfer y busnesau cychwynnol hyn, gan fod buddion twf yn dod yn amlwg; Mae llawer o gwmnïau wedi nodi twf amlwg i gwsmeriaid ar ôl lansio API Deepseek, gan dderbyn ymholiadau gan gleientiaid blaenorol sy'n chwilio am optimeiddiadau. Mae mewnwyr y diwydiant wedi nodi, "Yn y gorffennol, roedd grwpiau cleientiaid a sefydlwyd braidd yn aml yn cael eu cloi i wasanaethau safonedig cwmnïau mwy, wedi'u rhwymo'n dynn gan eu manteision cost oherwydd graddfa. Fodd bynnag, ar ôl cwblhau defnyddio Deepseek-R1/V3 cyn gŵyl y gwanwyn, yn sydyn cawsom geisiadau cydweithredu gan nifer o gleientiaid blaenorol i gyflwyno i gleientiaid da." Ar hyn o bryd, mae'n ymddangos bod DeepSeek yn gwneud perfformiad casglu modelau yn fwyfwy beirniadol, a chyda mabwysiadu modelau mawr yn ehangach, bydd hyn yn parhau i ddylanwadu ar ddatblygiad yn y diwydiant AI is -ddiwydiant yn sylweddol. Pe bai modd defnyddio model ar lefel DeepSeek yn lleol am gost isel, byddai'n cynorthwyo ymdrechion trawsnewid digidol y llywodraeth a menter yn fawr. Fodd bynnag, mae heriau'n parhau, oherwydd gall rhai cleientiaid fod â disgwyliadau uchel o ran galluoedd model mawr, gan ei gwneud yn fwy amlwg bod cydbwyso perfformiad a chost yn dod yn hanfodol wrth eu defnyddio'n ymarferol. 

Er mwyn gwerthuso a yw DeepSeek yn well na Chatgpt, mae'n hanfodol deall eu gwahaniaethau, eu cryfderau a'u hachosion defnyddio allweddol. Dyma gymhariaeth gynhwysfawr:

Nodwedd/agwedd Deepseek Chatgpt
Berchnogaeth Wedi'i ddatblygu gan gwmni Tsieineaidd Datblygwyd gan Openai
Model Ffynhonnell Ffynhonnell agored Berchnogol
Gost Am ddim i'w ddefnyddio; opsiynau mynediad API rhatach Tanysgrifio neu brisio talu-fesul-defnydd
Haddasiadau Yn hynod addasadwy, gan ganiatáu i ddefnyddwyr newid ac adeiladu arno Addasu cyfyngedig ar gael
Perfformiad mewn tasgau penodol Yn rhagori mewn rhai meysydd fel dadansoddeg data ac adfer gwybodaeth Amlbwrpas gyda pherfformiad cryf mewn ysgrifennu creadigol a thasgau sgyrsiol
Cefnogaeth Iaith Ffocws cryf ar iaith a diwylliant Tsieineaidd Cefnogaeth iaith eang ond yr Unol Daleithiau-ganolog
Cost hyfforddi Costau hyfforddi is, wedi'u optimeiddio ar gyfer effeithlonrwydd Costau hyfforddi uwch, sy'n gofyn am adnoddau cyfrifiadol sylweddol
Amrywiad ymateb Gall gynnig ymatebion gwahanol, o bosibl yn cael eu dylanwadu gan gyd -destun geopolitical Atebion cyson yn seiliedig ar ddata hyfforddi
Cynulleidfa darged Wedi'i anelu at ddatblygwyr ac ymchwilwyr sydd eisiau hyblygrwydd Wedi'i anelu at ddefnyddwyr cyffredinol sy'n chwilio am alluoedd sgyrsiol
Defnyddio achosion Yn fwy effeithlon ar gyfer cynhyrchu cod a thasgau cyflym Yn ddelfrydol ar gyfer cynhyrchu testun, ateb ymholiadau, a chymryd rhan mewn deialog

Persbectif Beirniadol ar "Amharu ar Nvidia"

Ar hyn o bryd, ar wahân i Huawei, mae sawl gweithgynhyrchydd sglodion domestig fel Moore Threads, Muxi, Biran Technology, a Tianxu Zhixin hefyd yn addasu i ddau fodel Deepseek. Dywedodd gwneuthurwr sglodion wrth AI Technology Review, "Mae strwythur Deepseek yn dangos arloesedd, ac eto mae'n parhau i fod yn LLM. Mae ein haddasiad i Deepseek yn canolbwyntio'n bennaf ar gymwysiadau rhesymu, gan wneud gweithredu technegol yn weddol syml a chyflym." Fodd bynnag, mae angen gofynion uwch ar y dull MOE o ran storio a dosbarthu, ynghyd â sicrhau cydnawsedd wrth ei ddefnyddio â sglodion domestig, gan gyflwyno nifer o heriau peirianneg y mae angen eu datrys wrth eu haddasu. "Ar hyn o bryd, nid yw pŵer cyfrifiadol domestig yn cyfateb i NVIDIA mewn defnyddioldeb a sefydlogrwydd, sy'n gofyn am gyfranogiad gwreiddiol y ffatri ar gyfer gosod amgylchedd meddalwedd, datrys problemau, ac optimeiddio perfformiad sylfaenol," meddai ymarferydd diwydiant yn seiliedig ar brofiad ymarferol. Ar yr un pryd, "Oherwydd graddfa baramedr mawr Deepseek R1, mae pŵer cyfrifiadol domestig yn gofyn am fwy o nodau ar gyfer cyfochrog. Yn ogystal, mae'r manylebau caledwedd domestig yn dal i fod ychydig ar ei hôl hi; er enghraifft, ar hyn o bryd ni all yr Huawei 910b gefnogi'r casgliad FP8 a gyflwynwyd gan Deepseek." Un o uchafbwyntiau model Deepseek V3 yw cyflwyno fframwaith hyfforddi manwl gywirdeb cymysg FP8, sydd wedi'i ddilysu'n effeithiol ar fodel mawr iawn, gan nodi cyflawniad sylweddol. Yn flaenorol, awgrymodd prif chwaraewyr fel Microsoft a Nvidia waith cysylltiedig, ond mae amheuon yn gorwedd yn y diwydiant ynghylch dichonoldeb. Deallir, o'i gymharu ag Int8, brif fantais FP8 yw y gall meintioli ôl-hyfforddiant gyflawni manwl gywirdeb bron yn ddi-golled wrth wella cyflymder casglu yn sylweddol. Wrth gymharu â FP16, gall FP8 wireddu cyflymiad hyd at ddwywaith ar H20 NVIDIA a thros 1.5 gwaith cyflymiad ar yr H100. Yn nodedig, gan fod trafodaethau sy'n ymwneud â thuedd pŵer cyfrifiadol domestig ynghyd â modelau domestig yn ennill momentwm, mae dyfalu ynghylch a ellid tarfu ar Nvidia, ac a ellid osgoi ffos y CUDA, yn dod yn fwyfwy cyffredin. Un ffaith ddiymwad yw bod Deepseek yn wir wedi achosi cwymp sylweddol yng ngwerth marchnad Nvidia, ond mae'r newid hwn yn codi cwestiynau ynghylch cyfanrwydd pŵer cyfrifiadol pen uchel NVIDIA. Mae naratifau a dderbynnir yn flaenorol ynghylch cronni cyfrifiadol sy'n cael eu gyrru gan gyfalaf yn cael eu herio, ac eto mae'n parhau i fod yn anodd i Nvidia gael ei ddisodli'n llawn mewn senarios hyfforddi. Mae dadansoddiad o ddefnydd dwfn Deepseek o CUDA yn dangos nad yw hyblygrwydd - fel defnyddio SM ar gyfer cyfathrebu neu drin cardiau rhwydwaith yn uniongyrchol - yn ymarferol i GPUs rheolaidd ddarparu ar ei gyfer. Mae safbwyntiau'r diwydiant yn pwysleisio bod ffos Nvidia yn cwmpasu ecosystem gyfan CUDA yn hytrach na dim ond CUDA ei hun, ac mae'r cyfarwyddiadau PTX (dienyddiad edau cyfochrog) y mae Deepseek yn eu cyflogi yn dal i fod yn rhan o ecosystem CUDA. "Yn y tymor byr, ni ellir osgoi pŵer cyfrifiadol Nvidia - mae hyn yn arbennig o glir wrth hyfforddi; fodd bynnag, bydd defnyddio cardiau domestig ar gyfer rhesymu yn gymharol haws, felly bydd y cynnydd yn debygol o fod yn gyflymach. Mae addasu cardiau domestig yn canolbwyntio'n bennaf ar gasgliad; nid oes unrhyw un eto wedi llwyddo i hyfforddi i hyfforddi ar raddfa Deepseek," At ei gilydd, o safbwynt casglu, mae'r amgylchiadau'n galonogol ar gyfer sglodion model mawr domestig. Mae'r cyfleoedd i weithgynhyrchwyr sglodion domestig o fewn cylch y casgliad yn fwy amlwg oherwydd gofynion rhy uchel hyfforddiant, sy'n rhwystro mynediad. Mae dadansoddwyr yn dadlau bod harneisio cardiau casglu domestig yn ddigonol; Os oes angen, mae caffael peiriant ychwanegol yn ymarferol, ond mae modelau hyfforddi yn gosod heriau unigryw - gall rheoli nifer uwch o beiriannau ddod yn feichus, a gall cyfraddau gwallau uwch effeithio'n negyddol ar ganlyniadau hyfforddi. Mae gan hyfforddiant hefyd ofynion graddfa clwstwr, tra nad yw'r gofynion ar glystyrau ar gyfer casglu mor llym, gan leddfu gofynion GPU. Ar hyn o bryd, nid yw perfformiad cerdyn H20 sengl NVIDIA yn rhagori ar berfformiad Huawei na Cambrian; Mae ei gryfder yn gorwedd mewn clystyru. Yn seiliedig ar yr effaith gyffredinol ar y farchnad bŵer gyfrifiadol, nododd sylfaenydd Luchen Technology, You Yang, mewn cyfweliad ag AI Technology Review, "gall Deepseek danseilio dros dro y sefydliad a rhentu clystyrau cyfrifiadol hyfforddi uwch-fawr. galw parhaus yn y farchnad bŵer gyfrifiadol. " Yn ogystal, "mae galw uwch Deepseek am resymu a gwasanaethau mireinio yn fwy cydnaws â'r dirwedd gyfrifiadol ddomestig, lle mae galluoedd lleol yn gymharol wan, gan helpu i liniaru gwastraff o sefydliad ôl-glystyru adnoddau segur; mae hyn yn creu cyfleoedd hyfyw i weithgynhyrchwyr ar draws gwahanol lefelau o ecosystem gyfrifiadol domestig." "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" Mae Luchen Technology wedi cydweithio â Huawei Cloud i lansio APIs Rhesymu Cyfres R1 Deepseek a Gwasanaethau Delweddu Cloud yn seiliedig ar bŵer cyfrifiadol domestig. Mynegodd Yang optimistiaeth am y dyfodol: "Mae Deepseek yn ennyn hyder mewn atebion a gynhyrchwyd yn ddomestig, gan annog mwy o frwdfrydedd a buddsoddiad mewn galluoedd cyfrifiadol domestig wrth symud ymlaen."

微信图片 _20240614024031.jpg1

Nghasgliad

Mae p'un a yw DeepSeek yn "well" na Chatgpt yn dibynnu ar anghenion ac amcanion penodol y defnyddiwr. Ar gyfer tasgau sydd angen hyblygrwydd, cost isel ac addasu, gall Deepseek fod yn rhagori. Ar gyfer ysgrifennu creadigol, ymholiad cyffredinol, a rhyngwynebau sgyrsiol hawdd eu defnyddio, gall Chatgpt gymryd yr awenau. Mae pob offeryn yn cyflawni gwahanol ddibenion, felly bydd y dewis yn dibynnu'n fawr ar y cyd -destun y cânt eu defnyddio ynddo.

Dod o hyd i ddatrysiad cebl elv

Rheoli ceblau

Ar gyfer BMS, bws, diwydiannol, cebl offeryniaeth.

System ceblau strwythuredig

Rhwydwaith a data, cebl ffibr-optig, llinyn patsh, modiwlau, faceplate

2024 Adolygiad Arddangosfeydd a Digwyddiadau

Ebrill.16fed-18fed, 2024 Ynni'r Dwyrain Canol yn Dubai

Ebrill.16fed-18fed, 2024 Securika ym Moscow

Mai.9fed, 2024 Digwyddiad Lansio Cynhyrchion a Thechnolegau Newydd yn Shanghai

Hydref.22nd-25th, 2024 Diogelwch China yn Beijing

Tachwedd.19-20, 2024 Cysylltiedig y Byd KSA


Amser Post: Chwefror-10-2025