A fizikai MI ezzel szemben olyan rendszereket takar, amelyeknek a valódi, háromdimenziós térben kell eligazodniuk és cselekedniük: humanoid robotok, ipari karok, háztartási automaták. Ezek nem az internetből tanulnak, mert az internet nem tartalmaz kézmozdulatokat. Senki nem töltött fel még videót arról, hogy pontosan hogyan fordul a csukló, amikor egy nedves szivacsot kicsavarnak, vagy milyen szögből kell megközelíteni a mosogatóban lévő serpenyőt.
Az ilyen mozgásadatot csak úgy lehet megszerezni, ha valódi emberek valódi otthonokban valódi feladatokat végeznek – és mindezt rögzítik. Ezért kell a fejre szerelt kamera, a csuklóra kötött szenzor, a narráció. Nem az a cél, hogy az MI elolvasson valamit, hanem hogy megtanulja utánozni az emberi kéz mozgását.
Az iparág létrejötte
Az iparág egészét nézve a hagyományos annotáció a régebbi és nagyobb elterjedtségű. Az ausztrál Appen működése az 1990-es évekre nyúlik vissza, és mára több mint egymillió alvállalkozót foglalkoztat 170 országban, 265 nyelven. Az Amazon saját platformja, a Mechanical Turk 2005-től vált az „emberi számítástechnika” szimbólumává – töredékcentekért elvégzett mikrofeladatok millióival. A fordulópontot a Scale AI hozta 2016-ban: a San Franciscó-i startup felismerte, hogy az önvezető autókhoz szükséges képcímkézést ipari méretekben kell megszervezni. Leányvállalata, a Remotasks 90 országban 240 ezer vállalkozóval dolgozik. A Scale AI 2025-ben a Meta 14 milliárd dolláros befektetésével az iparág legértékesebb szereplőjévé vált, ügyfelei között az OpenAI, a Google, a Microsoft és az amerikai hadsereg is szerepel.




















Szóljon hozzá!
Jelenleg csak a hozzászólások egy kis részét látja. Hozzászóláshoz és a további kommentek megtekintéséhez lépjen be, vagy regisztráljon!