Elsöprő erővel tarolta le a hét elején a DeepSeek-V3 kínai fejlesztésű mesterséges intelligencia a nemzetközi piacokat. A kínai MI különlegessége, hogy rendkívül olcsón, mindössze 5,6 millió dollárból lett kifejlesztve, ami eltörpül a Szilícium-völgy óriáscégeinek hasonló irányú ráfordításaival szemben. Amennyiben a DeepSeek költséghatékony modellje reprodukálható, az új távlatokat nyithat a techszektorban. A csodálók tábora mellett azonban megjelentek a szkeptikusok is, akik szerint valami nem stimmel a kínai startup körül.

Fotó: AFP
Mennyibe is került valójában a DeepSeek?
A DeepSeek azzal keltett szenzációt, hogy azt állítja: DeepSeek-R1-es modellje mindössze 5,6 millió dollárból készült el. Ez elképesztően alacsony összeg, ha figyelembe vesszük, hogy az OpenAI és más amerikai techóriások milliárdokat költenek saját nagy nyelvi modelljeik fejlesztésére.
Összehasonlításképpen az OpenAI GPT–4 fejlesztési költségeit több mint százmillió dollárra becsülik.
Nemcsak az alacsony fejlesztési költség, hanem az MI modell üzemeltetési ára is óriási különbséget mutat a versenytársakkal szemben. A DeepSeek-R1 ára mindössze 55 cent egymillió bevitt token (nyelvi egység, például szó, szóelem, írásjel) után, és 2,19 dollár egymillió kibocsátott tokenért. Ezzel szemben az OpenAI legújabb o1-es modellje 15 dollárt számol fel egymillió bevitt tokenért, míg a kibocsátott tokenek ára 60 dollár. Az OpenAI kisebb, költséghatékonyabb GPT–4o mini modellje esetén 15 centbe kerül egymillió bevitt token.
A két technológia közötti árkülönbség miatt sokan elkezdték vizsgálni, hogyan képes a DeepSeek ilyen alacsony költségekkel üzemelni, és vajon minden állításuk valós-e.
Csipvita: valóban tiltott technológiát használt a DeepSeek-V3?
A DeepSeek sikere azért is okozott felháborodást az amerikai techszektorban, mert Kína jelenleg szigorú exportkorlátozásokkal szembesül az MI-hez szükséges fejlett csipek beszerzése terén. Az Egyesült Államok korlátozta az Nvidia H100-as csúcsteljesítményű GPU-inak exportját Kínába, ami kulcsfontosságú a fejlett mesterséges intelligencia modellek tanításához.