Zuhanó költségek
A DeepSeek fejlesztésének megjelenését követően azonban egymás után látnak napvilágot olyan alternatív, költséghatékonyabbnak tűnő megoldások, amelyekkel elkerülhető a szinte exponenciálisan növekvő energiafelhasználás. Magát az új kínai chatbotot például mindössze hatmillió dollárért „tanították be”, ami kevesebb mint egytizede a Meta Llama nevű modellje esetében felhasznált összegnek. A kaliforniai Stanfordi Egyetem és a Washingtoni Egyetem kutatói pedig néhány hete közzétették egy készülő tanulmányuk részét. Ebben azt állítják: akár hat (!) dollárra is lecsökkenthető egy-egy chatbot betanításának költsége. Nagyon leegyszerűsítve az elképzelés lényege az, hogy az egyre „vízfejűbb” adatközpontoknál alkalmazott gyakorlattól eltérően szelektált, „minőségi”, ezért könnyebben, kisebb energiabefektetéssel kezelhető információhalmazokat táplálnának a nyelvi modellekbe. A tanulmány készítői is hangsúlyozzák, hogy valójában inkább csak finomhangolásról van szó. A meglévő struktúrákra is támaszkodnak, az R1 szenzációja mögött pedig az állhat, hogy a kínaiak a csúcstechnológiájú csipekre a Joe Biden előző amerikai elnök által bevezetett exporttilalom ellenére is nagyobb mennyiségben szerezhettek be ezekből az alkatrészekből.
Mindenesetre a nemzetközi techszektor egészében a hatékonyság javítása lett az új jelszó, s – a nyugati világ szempontjából – öröm az ürömben, hogy a kínai konkurencia költség- és energiatakarékosabb megoldásai a kisebb szereplőket is levegőhöz engedik jutni. Így például a francia Mistral és a hasonló szerényebb méretű cégek talán faraghatnak valamit a lemaradásukon. Az óriások közül pedig az Apple pedig azért dörzsölheti a tenyerét, mert nem fektetett dollármilliárdokat saját MI-rendszerek fejlesztésébe be, s most majd válogathat a jóval olcsóbbá vált kész modellek közül.





















Szóljon hozzá!
Jelenleg csak a hozzászólások egy kis részét látja. Hozzászóláshoz és a további kommentek megtekintéséhez lépjen be, vagy regisztráljon!