Áttörés: ezzel minden nyelvet megérthetünk

Saját hangunkon beszélhetünk folyékonyan kínaiul, franciául vagy bármely más, számunkra idegen nyelven a Microsoft új fejlesztésének segítségével.

WA
2012. 11. 12. 8:02
VéleményhírlevélJobban mondva - heti véleményhírlevél - ahol a hét kiemelt témáihoz fűzött személyes gondolatok összeérnek, részletek itt.

A Galaxis útikalauz stoposoknak című Douglas Adams-regény kitalált élőlénye, amelyet bárki a fülébe dugva azonnal megért minden nyelvet, már nem a jövő zenéje. Rick Rashid, a Microsoft szoftveróriás kutatási igazgatójának blogbejegyzéséből kiderül, hogy a program jelenlegi állapotában ugyan még számos hibát ejt, mégis sokkal jobb, mint bármely korábbi hasonló próbálkozás. Rashid az októberi, Tiencsinben tartott bemutatón néhány mondatát mandarin nyelven mondta el a program segítségével.

A fejlesztők számára a legnagyobb kihívást a beszélő megértése jelenti – idézi az igazgatót a TechNewsDaily.com című online magazin. Ezen a problémán már azóta dolgoznak, mióta a számítógép létezik. A több generációnyi fejlesztés mai eredménye például az Egyesült Államok bizonyos bankjaiban működő telebankrendszer, amelyben a komputer ismeri fel a hívó által bemondott bankszámlaszámot. Az ilyen rendszerekben a beszédfelismerés azonban csak a számnevekre és esetenként néhány menüpontra – például „átutalás”, „nyitva tartás” – korlátozódik.

Még nem tökéletes

Sokkal nehezebb azonban a kötetlen beszéd digitális „megértése”. Egészen mostanáig az efféle programok a beszédnek legfeljebb 75-80 százalékát voltak képesek értelmezni – mondta Rashid. A Microsoft ezt az arányt igyekezett javítani a Deep Neural Networks rendszerének segítségével, amelyben a processzorok úgy kapcsolódnak egymáshoz, mint az emberi és állati agysejtek. A Google ugyanezt a technikát használta a nyáron egy olyan számítógép megépítéséhez, amely meg tudja tanulni macskákról készült képek felismerését.

Rashid szerint az új fejlesztés mára a szabad beszélt nyelv 86-88 százalékát felismeri. „Még mindig távol van a tökéletestől, mégis ez a legdrámaibb fejlődés 1979 óta.”

Lebonthatja az emberek közötti nyelvi akadályokat

Miután a rendszer felismeri, hogy mit mond angolul a felhasználó, a Microsoft fordítóprogramja átalakítja azt kínai szavakká, majd a szórendet a nyelvtani szabályok szerint megváltoztatja. A megfelelő hangszín eléréséhez Rashidnak egyórányi beszédére volt szükség, valamint fel kellett vennie egy mandarin anyanyelvű személy néhány órás beszédét is.

„Még sok munka vár ránk, de a technológia nagyon ígéretes. Reméljük, hogy néhány éven belül olyan rendszerek állnak majd rendelkezésünkre, amelyek teljességgel lebontják az emberek közötti nyelvi akadályokat” – mondta az igazgató.

Ne maradjon le a Magyar Nemzet legjobb írásairól, olvassa őket minden nap!

Google News
A legfrissebb hírekért kövess minket az Magyar Nemzet Google News oldalán is!

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.