Elsöprő erővel tarolta le a hét elején a DeepSeek-V3 kínai fejlesztésű mesterséges intelligencia a nemzetközi piacokat. A kínai MI különlegessége, hogy rendkívül olcsón, mindössze 5,6 millió dollárból lett kifejlesztve, ami eltörpül a Szilícium-völgy óriáscégeinek hasonló irányú ráfordításaival szemben. Amennyiben a DeepSeek költséghatékony modellje reprodukálható, az új távlatokat nyithat a techszektorban. A csodálók tábora mellett azonban megjelentek a szkeptikusok is, akik szerint valami nem stimmel a kínai startup körül.
Mennyibe is került valójában a DeepSeek?
A DeepSeek azzal keltett szenzációt, hogy azt állítja: DeepSeek-R1-es modellje mindössze 5,6 millió dollárból készült el. Ez elképesztően alacsony összeg, ha figyelembe vesszük, hogy az OpenAI és más amerikai techóriások milliárdokat költenek saját nagy nyelvi modelljeik fejlesztésére.
Összehasonlításképpen az OpenAI GPT–4 fejlesztési költségeit több mint százmillió dollárra becsülik.
Nemcsak az alacsony fejlesztési költség, hanem az MI modell üzemeltetési ára is óriási különbséget mutat a versenytársakkal szemben. A DeepSeek-R1 ára mindössze 55 cent egymillió bevitt token (nyelvi egység, például szó, szóelem, írásjel) után, és 2,19 dollár egymillió kibocsátott tokenért. Ezzel szemben az OpenAI legújabb o1-es modellje 15 dollárt számol fel egymillió bevitt tokenért, míg a kibocsátott tokenek ára 60 dollár. Az OpenAI kisebb, költséghatékonyabb GPT–4o mini modellje esetén 15 centbe kerül egymillió bevitt token.
A két technológia közötti árkülönbség miatt sokan elkezdték vizsgálni, hogyan képes a DeepSeek ilyen alacsony költségekkel üzemelni, és vajon minden állításuk valós-e.
Csipvita: valóban tiltott technológiát használt a DeepSeek-V3?
A DeepSeek sikere azért is okozott felháborodást az amerikai techszektorban, mert Kína jelenleg szigorú exportkorlátozásokkal szembesül az MI-hez szükséges fejlett csipek beszerzése terén. Az Egyesült Államok korlátozta az Nvidia H100-as csúcsteljesítményű GPU-inak exportját Kínába, ami kulcsfontosságú a fejlett mesterséges intelligencia modellek tanításához.
A DeepSeek azonban azt állítja, hogy nem ezekkel, hanem az Nvidia H800 és A100 csipekkel képezték a modellt. Ezek olyan, Kínában elérhető verziók, amelyek kevésbé fejlettek, mint az amerikai piacon használt változatok. Az Nvidia megerősítette, hogy ezek a csipek exportkompatibilisek, így Kína valóban hozzáférhetett ezekhez.
Ennek ellenére Alexandr Wang, a Scale AI vezérigazgatója azt állította, hogy szerinte a DeepSeek mégis hozzájutott a tiltott H100 csipekhez, és valójában azokat használta a fejlesztéshez. A DeepSeek határozottan tagadja ezt a vádat, de az ügy körüli vita továbbra is fennáll.
Másolt technológia?
Egy másik komoly vád, hogy a DeepSeek MI fejlesztése nem teljesen saját innováció eredménye. Egyesek szerint a cég „distillációs” technikát használhatott, amely során más nyelvi modellek, például az OpenAI fejlesztéseinek válaszait dolgozták fel, és használták a saját modelljük betanítására.
Vinod Khosla, a Khosla Ventures milliárdos befektetője úgy véli, hogy a DeepSeek az OpenAI által kifejlesztett technológiát „lopta el” és módosította saját céljaira.
Az OpenAI szerdán bejelentette, hogy vizsgálatot indít annak kiderítésére, hogy a DeepSeek jogosulatlanul használta-e fel az OpenAI adatait. Egy szóvivőjük szerint minden rendelkezésre álló eszközzel védeni fogják az amerikai technológiai fejlesztéseket, és az ügyet az Egyesült Államok kormányával is egyeztetik.
Az MI-piac demokratizálódása vagy technológiai háború kezdete?
Bár a DeepSeek-V3 sikere számos kérdést felvetett, egyes szakértők szerint a kínai áttörés nem feltétlenül az Egyesült Államok veresége, hanem egy nagyobb trend része. Yann LeCun, a Meta vezető AI kutatója szerint a DeepSeek-V3 sikerét nem Kína, hanem az open-source modellek győzelmeként kell értelmezni.
„Azok, akik azt hiszik, hogy a DeepSeek sikerével Kína előzött az MI-fejlesztésben, tévednek” – írta LeCun a LinkedInen. „A valódi tanulság az, hogy a nyílt forráskódú modellek kezdik utolérni a zárt fejlesztéseket.”
A DeepSeek óriási figyelmet kapott az elmúlt napokban, de az igazi kérdés az, hogy a kínai MI-forradalom mennyire lesz fenntartható. Az amerikai technológiai cégek, köztük az OpenAI, a Google és a Meta, jelenleg is dolgoznak saját következő generációs modelljeiken, és nem kizárt, hogy hamarosan újabb fordulat következik az MI-háborúban.
Az biztos, hogy a DeepSeek-V3 nemcsak a rajongókat nyűgözte le, hanem a szkeptikusokat is arra késztette, hogy közelebbről megvizsgálják, vajon tényleg megtörtént-e az áttörés vagy csak egy jól felépített kínai marketingfogásról van szó.
Borítókép: Illusztráció (Fotó: AFP)