A DeepSeek-V3 a rajongók és szkeptikusok táborát is növelte

MI-lázban ég Kína és az Egyesült Államok is, miután hétfőn berobbant a legújabb kínai mesterségesintelligencia-modell, a DeepSeek-V3. Miután több százmilliárd dolláros esést okozott az amerikai tőzsdén és meghódította a különböző online áruházak népszerűségi listáit, az Egyesült Államok techszektora továbbra sem adott választ a DeepSeek-V3 térnyerésére. Azonban többen kétkedők a kínai MI-vel kapcsolatban és úgy gondolják, hogy a DeepSeek-sztori túl szép, hogy igaz legyen.

2025. 01. 31. 6:27
VéleményhírlevélJobban mondva - heti véleményhírlevél - ahol a hét kiemelt témáihoz fűzött személyes gondolatok összeérnek, részletek itt.

Elsöprő erővel tarolta le a hét elején a DeepSeek-V3 kínai fejlesztésű mesterséges intelligencia a nemzetközi piacokat. A kínai MI különlegessége, hogy rendkívül olcsón, mindössze 5,6 millió dollárból lett kifejlesztve, ami eltörpül a Szilícium-völgy óriáscégeinek hasonló irányú ráfordításaival szemben. Amennyiben a DeepSeek költséghatékony modellje reprodukálható, az új távlatokat nyithat a techszektorban. A csodálók tábora mellett azonban megjelentek a szkeptikusok is, akik szerint valami nem stimmel a kínai startup körül.

A DeepSeek-V3 a szkeptikusok figyelmét is felkeltette
A DeepSeek-V3 a szkeptikusok figyelmét is felkeltette
Fotó: AFP

Mennyibe is került valójában a DeepSeek?

A DeepSeek azzal keltett szenzációt, hogy azt állítja: DeepSeek-R1-es modellje mindössze 5,6 millió dollárból készült el. Ez elképesztően alacsony összeg, ha figyelembe vesszük, hogy az OpenAI és más amerikai techóriások milliárdokat költenek saját nagy nyelvi modelljeik fejlesztésére.

Összehasonlításképpen az OpenAI GPT–4 fejlesztési költségeit több mint százmillió dollárra becsülik.

Nemcsak az alacsony fejlesztési költség, hanem az MI modell üzemeltetési ára is óriási különbséget mutat a versenytársakkal szemben. A DeepSeek-R1 ára mindössze 55 cent egymillió bevitt token (nyelvi egység, például szó, szóelem, írásjel) után, és 2,19 dollár egymillió kibocsátott tokenért. Ezzel szemben az OpenAI legújabb o1-es modellje 15 dollárt számol fel egymillió bevitt tokenért, míg a kibocsátott tokenek ára 60 dollár. Az OpenAI kisebb, költséghatékonyabb GPT–4o mini modellje esetén 15 centbe kerül egymillió bevitt token.

A két technológia közötti árkülönbség miatt sokan elkezdték vizsgálni, hogyan képes a DeepSeek ilyen alacsony költségekkel üzemelni, és vajon minden állításuk valós-e.

Csipvita: valóban tiltott technológiát használt a DeepSeek-V3?

A DeepSeek sikere azért is okozott felháborodást az amerikai techszektorban, mert Kína jelenleg szigorú exportkorlátozásokkal szembesül az MI-hez szükséges fejlett csipek beszerzése terén. Az Egyesült Államok korlátozta az Nvidia H100-as csúcsteljesítményű GPU-inak exportját Kínába, ami kulcsfontosságú a fejlett mesterséges intelligencia modellek tanításához.

A DeepSeek azonban azt állítja, hogy nem ezekkel, hanem az Nvidia H800 és A100 csipekkel képezték a modellt. Ezek olyan, Kínában elérhető verziók, amelyek kevésbé fejlettek, mint az amerikai piacon használt változatok. Az Nvidia megerősítette, hogy ezek a csipek exportkompatibilisek, így Kína valóban hozzáférhetett ezekhez.

Ennek ellenére Alexandr Wang, a Scale AI vezérigazgatója azt állította, hogy szerinte a DeepSeek mégis hozzájutott a tiltott H100 csipekhez, és valójában azokat használta a fejlesztéshez. A DeepSeek határozottan tagadja ezt a vádat, de az ügy körüli vita továbbra is fennáll.

Másolt technológia?

Egy másik komoly vád, hogy a DeepSeek MI fejlesztése nem teljesen saját innováció eredménye. Egyesek szerint a cég „distillációs” technikát használhatott, amely során más nyelvi modellek, például az OpenAI fejlesztéseinek válaszait dolgozták fel, és használták a saját modelljük betanítására. 

Vinod Khosla, a Khosla Ventures milliárdos befektetője úgy véli, hogy a DeepSeek az OpenAI által kifejlesztett technológiát „lopta el” és módosította saját céljaira.

Az OpenAI szerdán bejelentette, hogy vizsgálatot indít annak kiderítésére, hogy a DeepSeek jogosulatlanul használta-e fel az OpenAI adatait. Egy szóvivőjük szerint minden rendelkezésre álló eszközzel védeni fogják az amerikai technológiai fejlesztéseket, és az ügyet az Egyesült Államok kormányával is egyeztetik.

Az MI-piac demokratizálódása vagy technológiai háború kezdete?

Bár a DeepSeek-V3 sikere számos kérdést felvetett, egyes szakértők szerint a kínai áttörés nem feltétlenül az Egyesült Államok veresége, hanem egy nagyobb trend része. Yann LeCun, a Meta vezető AI kutatója szerint a DeepSeek-V3 sikerét nem Kína, hanem az open-source modellek győzelmeként kell értelmezni.

„Azok, akik azt hiszik, hogy a DeepSeek sikerével Kína előzött az MI-fejlesztésben, tévednek” – írta LeCun a LinkedInen. „A valódi tanulság az, hogy a nyílt forráskódú modellek kezdik utolérni a zárt fejlesztéseket.”

A DeepSeek óriási figyelmet kapott az elmúlt napokban, de az igazi kérdés az, hogy a kínai MI-forradalom mennyire lesz fenntartható. Az amerikai technológiai cégek, köztük az OpenAI, a Google és a Meta, jelenleg is dolgoznak saját következő generációs modelljeiken, és nem kizárt, hogy hamarosan újabb fordulat következik az MI-háborúban.

Az biztos, hogy a DeepSeek-V3 nemcsak a rajongókat nyűgözte le, hanem a szkeptikusokat is arra késztette, hogy közelebbről megvizsgálják, vajon tényleg megtörtént-e az áttörés vagy csak egy jól felépített kínai marketingfogásról van szó.

Borítókép: Illusztráció (Fotó: AFP)

 

A téma legfrissebb hírei

Tovább az összes cikkhez chevron-right

Ne maradjon le a Magyar Nemzet legjobb írásairól, olvassa őket minden nap!

Google News
A legfrissebb hírekért kövess minket az Magyar Nemzet Google News oldalán is!

Címoldalról ajánljuk

Tovább az összes cikkhez chevron-right

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.