Beszélőprogram kétszáz nyelven, az angol kiiktatásával

Szuperkönnyű a fordítás a nagy nyelvek esetén, sokkal nehezebb, ha minőségi tartalmat keresel valamelyik egzotikus nyelven.

2022. 08. 16. 10:40
null
Vélemény hírlevélJobban mondva- heti vélemény hírlevél - ahol a hét kiemelt témáihoz füzött személyes gondolatok összeérnek, részletek itt.

A hétezer beszélt nyelv közül van, amelyet több milliárdan megértenek, de olyan is bőséggel akad, amelyet pár százan, esetleg néhány ezren beszélnek. A különböző nyelvek közötti átmenetet megkönnyítő mesterségesintelligencia-alkalmazások legújabb fejlesztése kétszáz nyelven ért. 

Két adott nyelv közötti fordítás – különösen, ha egyik sem angol – jelentős kihívásnak bizonyult a mesterséges intelligencia nyelvi modelljei számára, mert e fordítórendszerek alapvetően az internetről származó írott adatokra támaszkodnak. Szuperkönnyű a fordítás a nagy nyelvek esetén, sokkal nehezebb, ha minőségi tartalmat keresel valamelyik egzotikus nyelven.

A Facebook, amely tavaly október óta Meta néven ismert, hat hónappal ezelőtt elindította ambiciózus No Language Left Behind (NLLB) projektjét, amelynek célja, hogy a mesterséges intelligencia segítségével zökkenőmentesen fordítson számos nyelv között anélkül, hogy a szöveget először angolra kellene átültetni. 

Azaz egy magyar szöveget az angol közbeiktatása nélkül alakítana át például izlandira. A cég első nagy sikere az NLLB-200 névre keresztelt mesterségesintelligencia-modell, amely elvileg kétszáz nyelven tud beszélni, köztük számos kevésbé széles körben beszélten Ázsiából és Afrikából, például laoszi és kamba nyelven. 

A cég szerint az NLLB-200 egyebek mellett 55 afrikai nyelvet fordít le kiváló minőségben. A Meta fejlesztői azzal büszkélkednek, hogy a modell teljesítménye átlagosan 44 százalékkal, a kiválasztott afrikai és indiai dialektusok esetében pedig hetven százalékkal felülmúlja a meglévő (nyelvátültető) csúcsmodelleket.

A legtöbb nyilvánosan támogatott mesterségesintelligencia-programhoz hasonlóan a Meta is nyílt forráskódúvá, azaz szabadon felhasználhatóvá teszi a programot, valamint kétszázezer dolláros támogatást nyújt nonprofit szervezeteknek, hogy további alkalmazásokat fejlesszenek ki a technológia használatával.

„Képzeld el, hogy felkeresed kedvenc Facebook-csoportod, ahol találkozol egy luganda nyelven írt bejegyzéssel! Egyetlen gombnyomással meg tudod érteni azt a saját nyelveden” – indokolta a kezdeményezést a Meta.

Az új modell működésének megértését demóprogram segíti, amely a No Language Left Behind program legújabb fejlesztéseit használja. A szövegeket származási nyelvükről, például indonézről, szomáliról és burmairól fordítja le – az elkövetkező hónapokban – több száz nyelvre. 

Ezzel a mesterségesintelligencia-eszközzel a családok a világ minden táján mostantól együtt olvashatnak történeteket anyanyelvükön. E cikk írásakor A herceg és a tigris minangkabau nyelven írt mesét – Indonéziában használt nyelvről van szó – angolra fordították, de baszkul, katalánul, portugálul és még néhány nyelven szintén elérhető a szöveg. A magyar még nem szerepelt a kiválasztottak között.

Borítókép: Illusztráció (Fotó: Unsplash)

A téma legfrissebb hírei

Tovább az összes cikkhez chevron-right

Ne maradjon le a Magyar Nemzet legjobb írásairól, olvassa őket minden nap!

Címoldalról ajánljuk

Tovább az összes cikkhez chevron-right

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.