Amikor visszabeszél a gép

2001. 06. 15. 22:00
VéleményhírlevélJobban mondva - heti véleményhírlevél - ahol a hét kiemelt témáihoz fűzött személyes gondolatok összeérnek, részletek itt.

Emberi hanggal vezérelhető háztartási eszközök, beszélő számítógép, intelligens helyesírás-ellenőrző programok, digitális szinkrontolmács, gépírónőt helyettesítő diktálógép – mindez magyar nyelven, érthetően, helyesen. Huszonegyedik századi álom vagy boltban megvásárolható valóság? És mi az ára? Hogyan változik eközben a nyelv, miként hat egymásra a gép és az ember?Beszélőgéppel már jó ideje nem csak tudományos-fantasztikus filmekben találkozhatunk. Komputer vezérli a vasútállomás hangosbemondóját, bankszámlánk állásáról gépi hangon kapunk tájékoztatást, s az egyik mobiltársaság olyan szolgáltatást kínál az e-mail címmel rendelkezőknek, amely felolvassa nekik a villanylevél tartalmát. Mivel a beszéd a legelterjedtebb kommunikációs forma, a fejlesztők arra törekednek, hogy amit el lehet mondani, azt mondja is el a számítógép, ne csak írja. A gépi „beszédkeltés” különben magyar műfaj: honfitársunk, Kempelen Farkas volt a világon az első ember, aki beszélőgépet épített a XVIII. század végén. Sokévi megfigyelő- és kutatómunka után beszédhangok és rövid mondatok megszólaltatására képes masinát fabrikált, megalkotva ezzel a fonetika és a beszédszintézis alapjait.Mai utódainak nem kell szégyenkezniük, hiszen a számítógépre épült beszédiparág élvonalában vannak ma is a magyar fejlesztők. (Kempelennek az emberi hangképző szerveket utánzó masináját az eredeti rajzok alapján újjáépítették az MTA szakemberei, a beszélő szerkezetet augusztustól a nagyközönség is láthatja a millenniumi kiállítás- és rendezvényközpontban a „leleményes magyarok” munkacímű tárlaton.)A korszerű beszédszintetizátor sok szakember munkáját igényli: nyelvtudósok, programozók, fonetikusok, jelfeldolgozók kellenek a csapatba. A jó beszélőgépnek egyáltalán nincs robothangja: a kellemes hangszín, a megfelelő hangsúlyozás és a jól tagolt beszéd ma már alapkövetelmény. A legkorszerűbb felolvasók egy nyolcéves gyermek szintjén tudnak olvasni. Persze sok függ a felolvasandó szöveg jellegétől. Egy bankszámla-tájékoztató például kötött szótárú rendszert használ, így itt jobban oda lehet figyelni a minőségre, hiszen gyakorlatilag bármilyen szám összerakható kilencvenöt számelemből (egy elemből hét különböző hangsúllyal ejtett formát tárol a gép).A rossz beszédminőségű rendszerek azonban visszahatnak (károsan) az emberi beszédre is. Ha gyakran hallunk rosszul hangúlyozott szavakat, magunk is hajlamosak vagyuk megtanulni a hibát.– Ma még nem jellemző a magyar megrendelőkre az akusztikai igényesség – fogalmazza meg a problémát Németh Géza, a Budapesti Műszaki Egyetem távközlési és telematikai tanszékének docense. – Míg a nagyvállalatok jelentős összegeket áldoznak a vizuális arculatra, a beszédszintetizátorok esetében csak az a fontos, hogy érthető legyen a szöveg. Ez körülbelül olyan szintű igénytelenség, mint ha egy cég toalettpapírra nyomtatná a reklámanyagait, arra hivatkozva, hogy azon is jól el lehet olvasni. A hangpostafiókok zöme úgy olvas fel, ahogyan magyar ember nem beszél. Ebből látszik, hogy angol rendszereket vesznek át a magyar nyelvre való alkalmazás nélkül. Pedig nem teljesíthetetlen kérés a műszaki igényesség, ma már vannak olyan szövegfelolvasók, amelyek egységes dallamszerkezettel, jó hangsúllyal, magyar kifejezésekkel operálva dolgoznak.A kutató hangpéldával illusztrálja állítását: az egyik bank berendezése géphangon, az egyes számok között szünetekkel összesen öt és fél másodperc alatt olvassa fel a számla állását, míg az általuk fejlesztett, világszínvonalú program kellemesen artikulálva, feleannyi idő alatt hibátlanul oldja meg a feladatot. Ám itt is pontosan tudni kell, milyen célt szolgál az alkalmazás, mert ha egy számfelolvasónál túl élethű a hang, akkor gyakran előfordul, hogy a kliens – arra gondolva, hogy ember van a vonal másik végén – visszabeszél, újabb kérdéseket tesz fel, és ezzel foglalja a vonalat.Németh Géza 1983 óta dolgozik ezen a területen az MTA kutatójával, Olaszy Gáborral. Világszerte elsőként készítettek általános felhasználású számítógépre beszédszintetizátort, ezzel például beszédsérült embereknek adták vissza a kommunikációs lehetőséget magyar, német, portugál és spanyol nyelven. Az 1992-ben üzembe állított intelligens számváltozás-bemondó rendszerük a világon a legjobbak közé tartozott. Az emberi hang hullámformáját utánozó beszédgeneráló rendszerük 1999-re készült el, s az egyik mobilszolgáltató azonnal megvásárolta, és létrehozta a mail-mondót, amely a hangposta áráért felolvassa a kliens villanyleveleit. A rendszer annyira intelligens, hogy felismeri, milyen nyelven íródott a levél, a jellegzetes magánhangzók nélkül gépelt magyar szöveget pedig visszamagyarítja, tehát szükség esetén ö-nek olvassa az o-t.Az újfajta technológiához megfelelő befogadói kultúra szükséges, ellenkező esetben a sokéves kutatás eredménye nem piacosítható. A fejlesztés infrastruktúra-igényes, és a drága gépek gyorsan elavulnak, a kockázatot pedig kevesen vállalják. Állami támogatás nélkül nehezen jön össze az a szakemberekből, felszerelésből és jó ötletekből álló kritikus tömeg, amely világszintű eredményekre képes. Magyarország kis piac, így nehéz megfelelő ár/érték arányú terméket fejleszteni erre a nyelvre, ezért mindenki egyszerre több lehetőségen dolgozik, hogy a világnyelvekre írt termékével a nagyobb piacokra is kijusson. Hazánkban júliusban kezdődik Gordos Géza vezetésével egy két és fél éves, államilag is finanszírozott projekt, amely a beszédkeltési technológiák és a nyelvi elemzések területén kecsegtet jó eredménnyel. A negyedmilliárd forintos költségvetésű elképzelés felét állja a költségvetés.A folyamat két irányba mutat: a beszélőgépek mellett az emberi beszédet értő gépekre is egyre nagyobb az igény. Ma már nem újdonság az olyan mobiltelefon, amelynek elég, ha kimondjuk a hívott nevét, máris tárcsázza a számát, de egyre több autóban találni a tulajdonos hangját felismerő, hangos utasításainak engedelmeskedő ketyerét. A látványos eredmények ellenére a géppel való beszélgetés egyelőre csak utópia. A legjobban várt fejlesztés, a gépi szinkrontolmácsolás is csak gyermekcipőben jár annak ellenére, hogy például Németországban 1993-tól sok egyetem és sok százmillió márka dolgozik a cél érdekében. A gyermekcipő közelebbről annyit jelent, hogy egyes kifejezéseket már oda-vissza fordítanak a nagy teljesítményű gépek, de messze még az idő, amikor átlagos mondatokkal is meg tudnak birkózni valós időben (azaz úgy, hogy a lefordítandó mondat elhangzása után már kész is az átültetett változat). A nagyközönség számára készült beszédértő szolgáltatások csúcsát ma Kanada jelenti, ahol a telefonon hívható személyi asszisztens hanggal vezérelve kezeli a kilens hangpostafiókját, elektronikus leveleit és határidőnaplóját. Amerikában tőzsdei adatokat kérdezhetünk meg a géptől, de erre nekünk, magyaroknak még sokat kell várnunk, mivel nyelvünk nem kötött szórendű, ezért sokkal bonyolultabb megtanítani „magyarul” a gépet.Hasonló a helyzet a diktálás területén is. Ha valaki angolul akarja gépbe mondani a szövegét, már két-háromszáz dollárért vásárolhat erre a célra jól használható programot. Ugyanezt magyarul hiába keressük, mert nyelvünk nagyságrendekkel bonyolultabb az angolnál. Míg az utóbbi esetében két-háromezer szóalak ismerete elegendő a köznapi beszélgetéshez, és a nagy szótárú adatbázisok sem tartalmaznak húszezernél többet, a magyar nyelvhez akár kilencszázezer szóalakot is be kell táplálni a gépbe.A másik gond a fentebb említett szórend: az angolnál statisztikai módszerekkel jó hatásfokkal meg lehet állapítani, hogy egy szó után mi következik, ez a magyarnál egyáltalán nem lehetséges. Ki kell találni egy más elven működő megoldást, ám ehhez sok kutatóidő és még több pénz szükséges, a piaci siker pedig egyáltalán nem garantált, mert kevés a potenciális vásárló.Nem elhanyagolható az új technológiának a beszélt és írott nyelvre gyakorolt hatása sem. A külföldön készült szövegszerkesztő programokba beépített automatikus javításoknak tulajdoníthatóan terjedt el például a hónapok nevének nagybetűs változata – mindez annak köszönhető, hogy a program minden pontot (így az évszám után használandót is) mondatzáró írásjelnek értelmezi, ezért nagybetűvel kezdi a következő szót.– Ha az ember sokszor lát valamit ugyanúgy írva, akkor egy idő után elhiszi, hogy így jó. Ez még akkor is igaz, ha korábban tudta, hogy például kisbetűvel írandó a hónapok neve – mondja Prószéky Gábor, a nyelvészeti programokban világhírnévre szert tett magyar vállalkozás, a MorphoLogic tudományos vezetője.A nyelvész szerint elgondolkodtató helyzet, hogy a gyakorlatban egy tizenegy fős magáncég kezében van a magyar helyesírás jövője, talán még inkább, mint a Tudományos Akadémiáéban – még akkor is, ha ezen a kijelentésen sokan mosolyognak. A MorphoLogic több mint egymillió felhasználója ugyanis ma már számítógépen ír, és az általuk készített programmal ellenőrzi a szöveg helyességét. A nyelvi programok hatása oly nagy, hogy egy idő után a felhasználók egy része akár azt a zöldséget is elfogadná, ha mondjuk az „asztal” szó végére mindig két l-t javasolnánk. Természetesen az épp most tízéves MorphoLogic cég kutatói-fejlesztői átérzik ezt a felelősséget, ugyanakkor hivatalos oldalról is komoly figyelmet igényelne ez a kérdés, hiszen a minőségi munkához szükséges alapkutatásoknak megfelelő támogatásra van szüksége, másképp nem várható el a nyelvművelő közfeladat egy magáncégtől.Prószéky Gábor egyébként nem tart az „ékezetgyilkos” SMS társadalmi hatásától, mert úgy véli: míg számítógépen szövegeket gyártunk, mobiltelefonon csak fecniket írunk százhatvan karakterben. A rövidítések, az ékezettelen írásmód csak egy szubkultúra eszköztára, nincs esély a köznyelvben való elterjedésére. Különben tíz-tizenöt éve még a kisbetűk sorsát is féltették a számítógéptől, nemhogy a magyar ékezeteket – mondja Prószéky, aki szerint csak a magyar nyelvű diktálógép megjelenése után lehet elkezdeni a visszaszámlálást a hazai tolmácsgép megalkotásához.

Ne maradjon le a Magyar Nemzet legjobb írásairól, olvassa őket minden nap!

Google News
A legfrissebb hírekért kövess minket az Magyar Nemzet Google News oldalán is!

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.