A DeepSeek – egy mindössze egyéves kínai startup – egy olyan mesterségesintelligencia-modellt mutatott be, amely alapjaiban változtathatja meg a technológiai szektort és az Egyesült Államok MI-dominanciáját. A DeepSeek R1 modell az OpenAI, Google és Meta által fejlesztett modellekkel összemérhető képességeket kínál, miközben a fejlesztési költségei töredékét teszik ki azokénak.

Ez a bejelentés nemcsak a globális piacokat rázta meg, hanem az amerikai technológiai szektor dominanciáját is kérdésessé tette.
A vállalatot Liang Wenfeng alapította 2023-ban. Még tavaly júliusban a 36Kr nevű kínai portálnak adott interjújában kifejtette a személyes nézeteit, amit a vállalat építése során is felhasznált. A CNN-nek korábban úgy nyilatkozott, hogy a Kína és az Egyesült Államok közti szakadékot nem években érdemes mérni, hanem abban, hogy melyik ország másol és melyik teremt egyedi dolgokat. Szerinte Kína akkor lesz képes utolérni és megelőzni az Egyesült Államokat innováció terén, ha a másolás helyett a saját útját járja. Ennek az ügynek akar ő, és kevesebb, mint kétszáz fős csapata élharcosa lenni. A DeepSeek már most hatalmas népszerűségnek örvend.
Az Egyesült Államokban a kínai MI mobilverziója a legnépszerűbb alkalmazás lett az App Store-ban, kiütve a dobogóról a ChatGPT-t. De nemcsak az Egyesült Államokban tarolt az új applikáció, hiszen további 51 országban tudhatja magáénak a „legtöbbször letöltött ingyenes alkalmazás” címet. A DeepSeek hatékonyság és pontosság terén felveszi a versenyt a legfőbb riválisának tekintett ChatGPT-vel a matematikai műveletek, kódírás és nyelvi készségek terén, mindezt pedig az amerikai modell árának töredékéből érte el.
Miben jobb a DeepSeek a nyugati vetélytársainál?
A DeepSeek kapcsán Adam Kobeissi, a The Kobeissi Letter piackutató hírlevél alapítója megjegyezte, hogy a kínai startup sikere alapvetően megváltoztathatja az MI-piac szabályait. Kiemelte, hogy
míg a ChatGPT-t készítő OpenAI tíz éve működik, 4500 alkalmazottal és több mint 6,6 milliárd dollár tőkebefektetéssel, a DeepSeek mindössze 200 dolgozóval és kevesebb mint tízmillió dolláros fejlesztési költséggel vált vetélytárssá.
A DeepSeek mindössze kétezer Nvidia H800 csipet használt a modell betanítására, amelyek kevésbé fejlettek, mint az amerikai cégek által alkalmazott csúcstechnológiás csipek. A DeepSeek csapata azonban több specializált modellt kombinált, hogy hatékonyabb adatfeldolgozást érjen el, így kompenzálva a hardveres korlátokat. Ezek olyan csipek, amelyek kikerülik az évek óta érvényben lévő amerikai szankciók által meghatározott exportkorlátozásokat. A DeepSeek ezzel megmutatta, hogy a legfejlettebb hardver nem feltétlenül szükséges a kiemelkedő eredményekhez.