A könnyű hozzáférhetőség a lexikális tudás tiszteletének csökkenésével jár

Megrázta az egyetemi világot a ChatGPT megjelenése. Egyesek szerint a nyelvi modell egyenes út az elhülyüléshez, mások inkább lehetőséget látnak benne. A nagy techcégek biztosan. Könnyen kideríthető-e az „idegenkezűség”?

2023. 02. 06. 15:00
VéleményhírlevélJobban mondva - heti véleményhírlevél - ahol a hét kiemelt témáihoz fűzött személyes gondolatok összeérnek, részletek itt.

A ChatGPT segítségével a diákok könnyedén hozzáférhetnek információkhoz, amelyek segíthetnek a tanulásban és a tanulmányokban. Például a diákok kérdezhetnek a ChatGPT-től a témával kapcsolatban, kérhetnek segítséget a házi feladatok megoldásához, vagy kérhetnek tanácsot a tanulási technikákkal kapcsolatban, gyorsabban és könnyebben találhatnak információkat, amelyek segítenek a tanulásban és a tanulmányokban.

Rabló-pandúr játék

A ChatGPT használata a házi feladatok megírására etikátlan, mert ez a tanulók saját tudásának és képességeinek a kihasználása. A tanulóknak saját maguknak kell megérteniük az anyagot, és saját szavakkal kell megfogalmazniuk a feladatokat. A házi feladatok megírása saját munka, és elvárás, hogy a diákok saját maguk írják meg azokat. Amennyiben a diák más személy munkáját használja fel a sajátjaként, ez plagiátusnak minősülhet, és az iskolában szigorú intézkedéseket vethetnek érte.

Következzék a leleplezés: a fenti két bekezdés az egyetemi világot és a szöveg-, illetve kódgenerálásra épülő munkaerőpiacot felforgató ChatGPT műve. Tény, hogy a nyelvi szoftver magyarul sem mondattanilag, sem helyesírásilag nem tökéletes. Angolul inkább a tartalmi összefüggések okoznak gondot.

Írni nem könnyű – ezt bármely profi tollforgató vagy vizsgaidőszakban beadandókat gyártó diák megmondhatja. Ahogy Harvey Keitel karaktere fogalmaz az Árnyak toszkán verőfényben ikonikus jelenetében: „Szavakat használni bárki tud. Ezt hívják beszédnek. De az író szépségüket kiemelve rendezi őket sorba.” Ez utóbbi hiányzik a nagy méretű nyelvi modellek esetén, de sokszor a közölt információk sem helyesek.

Ez azonban ritkán szokta zavarni azokat az egyetemi hallgatókat, akiknek nagy mennyiségű házi dolgozatot kell előállítaniuk sokszor lényegtelennek tekintett tantárgyakból. Az angolszász felsőoktatási rendszer különbözik a hazaitól. Nem vizsgákon és zárthelyiken történik számos tantárgyban a számonkérés, hanem meghatározott témában írt házi dolgozatokra lehet jegyet kapni. Szemeszterenként akár több, harminc-ötvenezer karakteres dolgozatot is kell írni.

A mai egyetemisták az internet világában szocializálódva hozzászoktak, hogy a neten bármilyen dokumentum fellelhető. A könnyű hozzáférhetőség a lexikális tudás tiszteletének csökkenését is hozta, a rohanó környezet pedig előírja a feladatok minél gyorsabb elvégzését. Ezeket az összefüggéseket lovagolták meg az elmúlt években a szöveggyárként működő „tanácsadó” cégek, amelyek rendre írtak a diákok helyett beadandókat, akár szakdolgozatokat is. A mesterséges intelligencia fejlődésével azonban a diákoknak egyre inkább megérte nyelvi modellekre előfizetni. A Jasper negyven dollárba kerül havonta, és 35 ezer szót lehet vele harmincnaponként generáltatni. A Writesonic és Sudo­write olcsóbb, tíz dollárért harmincezer szót kínál. November 30-án pedig megérkezett a ChatGPT, amely ingyenességével felforgatta az egyetemi világot. Ausztráliában a 2022-es őszi vizsgaidőszakban ugyanis felmérések szerint a beadandók egyötöde mesterséges intelligencia segítségével készült.

Az ausztrál Deakin University kommunikációs oktatója, Sally Brandon szerint a „jelentős, észrevehető robotsegítség” aránya most ugrott a legmagasabbra az elmúlt öt évben. Brandon egy, a plágiumfelismerő szoftverekhez hasonló alkalmazást használt, amely kimutatja, hogy a szöveg ember vagy gép által generált-e. A prince­toni végzős, Edward Tian – aki maga is fejlesztett egy robotfelismerő alkalmazást – szerint a rabló-pandúr játék lényege, hogy a mesterséges intelligencia szövegei nem egyediek, és a sablonokat be lehet azonosítani. Így bukott le például az Észak-michigani Egyetem egyik diákja, aki túl koherens és túl hibátlan szöveget adott le a burkatilalomról. Szakértők szerint azonban ha a fifikás hallgatók beleírnak néhány elütést, kicserélnek pár szót, a szűrőszoftverek már nem tudják felismerni a mesterséges intelligenciát. Kérdés, hogy az OpenAI napokban kiadott mesterséges intelligenciát felismerő szoftvere mennyire lesz hatékony.

Lefagyó szöveggyár

– Mint minden eszköz, a ChatGPT-hez hasonló nyelvi modellek is használhatók jól és rosszul. Ha például egy diák azt kéri a programtól, magyarázzon el neki egy statisztikai összefüggést, akkor az a szabályok mellett napestig fogja sorolni a példákat, amiből a hallgató negyedik-ötödik említés után megérti, miről van szó. Ám lehet dolgozatok íratására is használni, ahol szintén kérdés, hogy az adott hallgató mennyi munkát fektet az írásba. Átírja, átszerkeszti, csak első vázként kezeli a kapott szöveget, vagy ész nélkül másolja, mert ilyenkor bukhatnak ki az eltérések. A Wikipédia használatához lehetne leginkább hasonlítani, ahol feltűnik a szó szerinti másolás, de ha valaki csak sorvezetőnek használja a szócikket, akkor rengeteg időt megspórolhat, és innen léphet tovább saját gondolatmenetére – mondja el Rétvári Márton, a Corvinus Egyetem oktatója, akinek jelenleg is van a kezében egy valószínűleg ChatGPT-vel íratott dolgozat. Még nem sikerült minden kétséget kizáróan bizonyítani a mesterséges intelligencia használatát, ám mivel a dolgozatban egymásnak homlokegyenest ellentmondó állítások szerepelnek, ráadásul hibás adatokkal alátámasztva, valószínű az idegenkezűség.

A ChatGPT a Generative Pre-trained Transformer architektúrára épülő nyelvi modell, amely mélytanuló algoritmusokkal analizálja és hozza létre a szöveget. A fejlesztés a legtöbb vállalatnál a hármas típusnál tart, a ChatGPT viszont a 3.5 verziót használja, amely az emberi beszédhez hasonlóbb csevegést tesz lehetővé. Az Open­AI szilícium-völgyi központjában már tesztelik a GPT4-et, amely szakértők szerint áttörést fog jelenteni a nyelvi modellek tekintetében. Egyes szakértők szerint ezért is tették mindenki számára elérhetővé a ChatGPT-t, hogy a milliónyi ingyen tesztalany tapasztalatait beépíthessék a négyes verzióba. Elindult a ChatGPT fizetős szolgáltatása is, a 20 dollárba kerülő prémium verzió, amely az ígéretek szerint az alapverziónál kevesebb hibával fog működni, és mindig elérhető lesz, ugyanis az ingyenes szolgáltatás rendszeresen lefagy a túlterheltség miatt. (Január eleje óta lehetett jelentkezni a várólistára, ahol a felhasználókat az elfogadható árról is megkérdezték.)

Egyelőre még nem tisztázott, hogy a tartalmi hibákat hogyan fogják kijavítani a fejlesztők. Ugyanis hiába kaptak rá az egyetemi hallgatók a ChatGPT-re, a vele íratott dolgozatok nem tökéletesek. Számos netes mém terjed például arról, hogy a program egyszerű logikai kérdéseken elbukik. Például nem tudja megválaszolni, hogy „ha Joe anyjának négy gyereke van, akik közül az idősebbek Anne, Jane és Michael, akkor hogy hívják a legfiatalabbat?”. Továbbá az egyetemi beadandók esetén kötelező hivatkozásokat írni, amelyek mind hiányoznak a generált szövegből. Ha viszont a felhasználó külön adatokat és hivatkozásokat kér, akkor fals információkat jelenít meg a rendszer. Számos diák ezen bukott meg.

A hibás információkon segíthet, ha a ChatGPT összekötődik az internettel. Jelenleg csak az eredetileg beletáplált nagy mennyiségű információval dolgozik, ám a tanítás körülbelül három évvel ezelőtt befejeződött, így például az orosz–ukrán konfliktusról nem tud semmit, illetve országspecifikus információi sincsenek.

A Microsoft azonban komoly együttműködést jelentett be az OpenAI-jal. A cég növelni szeretné a szuperszámítógépes rendszerek fejlesztését, többek között így kíván nagyobb szeletet kihasítani a netes keresők piacán. A ChatGPT és a Bing összegyúrása épp ezért tavaszra várható. Ez utóbbi – a Microsoft várakozása szerint – meg fogja változtatni az internetes keresési élményt, mivel sokkal relevánsabb találatokkal lehet majd találkozni.

Radioaktív adatok

Kérdés ugyanakkor, hogy hogyan fogja tudni kiszűrni a program a helyes információkat. Kutatások azt mutatják, hogy már öt-tíz százalék „radioaktív adat” is elég egy rendszer összeomlásához. Rétvári Márton erre példaként a menstruációs alkalmazások esetét hozta, hogy mikor Amerikában megszületett az abortusztiltó rendelkezés, sokan megijedtek, hogy az alkalmazások naptáradatai alapján fogják őket megbüntetni, ha külföldön elvégeztetik a terhességmegszakítást. Ekkor a felhasználók rengeteg hamis információt tápláltak a rendszerbe (három-, ötnaponta menstruáltak, négy hónapig nem menstruáltak stb.), aminek következtében az alkalmazások használhatatlanná váltak.

További kérdés, mit kezd majd a jogi szabályozás a mesterséges intelligencia generálta szövegekkel. Jelenleg az akadémiai életben nincs megegyezés, hogy az plágiumnak számít-e. Etikátlannak mindenképp, de nem tisztázott, mennyire büntetendő. New York iskoláiban, számos mesterségesintelligencia-konferencián például betiltották. Scott Graham, a Texasi Egyetem professzora szerint azonban nem kell félni az ilyen szövegektől, mivel azok csak az első vázlat előállítását segítik, így hamarosan olyanná válhat a robotok használata, mint a szövegszerkesztő és a helyesírás-ellenőrző programok.

Mese a gyereknek

A világ vezető számítástechnikai újságja, a CNET néhány hónapja pénzügyi tanácsokat oszt a ChatGPT-hez hasonló mesterséges intelligencia által írt cikkekben. Mostanra azonban kiderült, hogy sok esetben alapvető pénzügyi hibákat tartalmaznak, így a CNET kénytelen volt közölni: mostantól hús-vér újságírók fogják ellenőrizni a robot szövegeit. A neves hírügynökség, az Associated Press ugyanakkor 2015 óta probléma nélkül írat mesterséges intelligenciával nyereségriportokat. Bereczki Nóra marketingszakember pedig nemrég azzal lett híres, hogy tizenkét egyperces mesét íratott ChatGPT-vel kisfiának.

 

A téma legfrissebb hírei

Tovább az összes cikkhez chevron-right

Ne maradjon le a Magyar Nemzet legjobb írásairól, olvassa őket minden nap!

Címoldalról ajánljuk

Tovább az összes cikkhez chevron-right

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.