ai szegedi tudományegyetem chatgpt mesterséges intelligencia MI

Magyar nyelven is működik: egyetemista fejlesztett nagy pontosságú MI-szövegfelismerőt

Egyre nehezebb megmondani, hogy egy beadandót, cikket, posztot vagy akár egy álláspályázatot ember írt-e vagy a mesterséges intelligencia (MI) alkotta. Miközben az angol nyelvű MI-detektorok gombamód szaporodnak, magyar nyelven eddig nem igazán volt megbízható megoldás.

2026. 01. 17. 11:10

Kiss Mihály, SZTE-s hallgató, a szövegfelismerő fejlesztője Fotó: Sahin-Tóth István Forrás: SZTE NKI

Kiss Mihály, a Szegedi Tudományegyetem programtervező informatikus mesterszakos hallgatója olyan magyar nyelvű MI-szövegfelismerőt hozott létre, amely a tesztek alapján kiemelkedően pontosan képes megkülönböztetni az ember által írt és a nagy nyelvi modellek által generált szövegeket. A projekt elnyerte az SZTE Hallgatói Innovációs Díját.

A szakdolgozattól a működő termékig

A fejlesztés ötlete 2023 közepén született, amikor a ChatGPT és más nagy nyelvi modellek látványosan elkezdtek beszivárogni a köztudatba. Az ötletet Kiss Mihály témavezetője vetette fel szakdolgozati kutatásként, de hamar kiderült: nem kizárólag elméleti kérdésről van szó.

– Egyre többen használják ezeket az eszközöket, és hosszú távon ez biztosan problémát jelent majd az oktatásban és azon túl is – mondja a fejlesztő. Innen indult az a kutatás, amely mára egy önálló, magyar nyelvre optimalizált MI-detektorhoz vezetett. – Manapság még működni tudnak ezek a felismerőmodellek, mert a nagy nyelvi modellek hagynak lábnyomokat maguk után, nem adaptálódtak teljesen az emberi íráshoz. Angolul sem igazán, de magyar nyelven meg végképp nem – teszi hozzá.

Nem azért nem létezett korábban minőségi MI-detektor magyar nyelvre, mert az „bonyolultabb”, mint az angol, hanem mert nincs hozzá megfelelő adat. Míg angol nyelven hatalmas, jól tisztított tanítóadatbázisok állnak rendelkezésre, magyar szövegekből ilyen korábban nem létezett. Kiss Mihály ezért több mint 350 ezer szövegből álló adathalmazt hozott létre: irodalmi művekből, szakdolgozatokból, cikkekből, fórumokról, közösségi médiából és általános internetes forrásokból. A cél az volt, hogy a rendszer valódi, sokféle nyelvhasználattal találkozzon, ne csak „tankönyvi” példákkal.

Nem szöveget ír: döntést hoz

Noha a felismerés is MI-alapú megoldásra épül, az architektúrája alapján nem tartalmat generál, hanem döntéseket hoz. A megoldás encoderalapú modellt használ. Ezek kifejezetten osztályozási feladatokban erősek, hasonlóan ahhoz, ahogyan egy spamszűrő működik. A szöveget egy magas dimenziós térben reprezentálja, majd megbecsüli, mekkora eséllyel készült mesterséges intelligenciával. A felhasználó így végül egy százalékos értéket kap: mennyire valószínű, hogy a szöveg MI-generált. Az eszközt bárki használhatja, napi három detektálás ingyenes, akár egy Facebook-poszt szövege is kielemezhető egy pillanat alatt.

Jelenleg csak elenyésző számú weboldal ígér magyar nyelvű támogatást. Ezek alapvetően elég gyengék, de hogy ez az állítás bizonyítva is legyen, ezért a modell teljesítményét ezer különböző magyar nyelvű szövegen vetette össze olyan detektorokkal, amelyek saját állításuk szerint támogatják a magyart is. Az eredmények alapján a saját modellje (Preds): 0,98 pontossággal dolgozik, míg a többi eszköz 0,6 körüli pontosságú.

Különösen fontos a nagyon alacsony fals pozitív arány: a rendszer ritkán mondja emberi szövegre azt, hogy MI írta, ami az oktatásban kulcskérdés, hiszen veszélyes lenne azzal gyanúsítani egy hallgatót, hogy beadandóját a mesterséges intelligencia írta, miközben ez nem igaz.

Jellegzetes fordulatok az MI generálásban

Talán sokan szeretnék tudni, melyek azok a szófordulatok, kifejezések, melyek használata MI-generált szövegre utal. Ez nem jelenti, hogy emberi kommunikációban nem találhatóak meg ezek a kifejezések, ám ezeket a szavakat/szóketteseket/szóhármasokat gyakrabban láthatjuk a szintetikus szövegekben. A teljesség igénye nélkül íme néhány konkrét példa: kutatás újszerűsége; átfogó képet nyújt; jelen kutatás célja; újszerűségét; a kulcsfontosságú; komplex módon; számol be róla; már nem pusztán; ez a gondolkodásmód; a cél nem.

Nem tiltani, érteni

A fejlesztő szerint az MI használata nem kerülhető meg, de nem is kell démonizálni. „A cél nem az, hogy betiltsuk, hanem hogy tudjuk, mikor és hogyan használták” – fogalmaz Kiss Mihály.

Bár az elsődleges felhasználók az oktatás szereplői lehetnek, nemcsak egyetemi környezetben lehet hasznos az eszköz: a médiában, szerkesztőségekben, könyvkiadóknál is használhatják, egyrészt minőség-ellenőrzési céllal, ha felmerül az MI-használata akkor egyfajta fake news detektorként is felfogható, mivel ezek a nagy nyelvi modellek sokszor hallucinálnak hamis információkat. Használhatják jogi területek, ahol egy MI által generált, pontatlan szöveg komoly kockázatot jelenthet, de akár HR-részlegek is bevethetik az MI eszközzel írt jelentkezések megjelölésére. Hasznosítása tehát szinte bárhol elképzelhető, ahol szövegekkel, dokumentumokkal foglalkoznak.

Az SZTE Hallgatói Innovációs Díja fontos visszajelzés volt Kiss Mihálynak. Úgy látja, az egyetemek lehetnek a rendszer legfontosabb felhasználói, és a jövőben szívesen működne együtt felsőoktatási intézményekkel. A fejlesztés jelenleg is zajlik, az éles indulást 2026 elejére tervezi. Hosszabb távon további funkciók és akár más nyelvek bevonása is szóba kerülhet – elsőként a környező országok nyelvei.

A Szegedi Tudományegyetem számára kiemelten fontos, hogy a hallgatói és kutatói ötletek ne az egyetemi falakon belül maradjanak, hanem piacképes megoldásokká váljanak. Az SZTE tudatosan támogatja azokat a fejlesztéseket és innovációkat, amelyek valós problémákra adnak választ, és ipari együttműködésekben, üzleti környezetben is megállják a helyüket. Az ilyen projektek nemcsak a hallgatók szakmai fejlődését segítik, hanem hozzájárulnak ahhoz is, hogy az egyetemen születő tudás kézzelfogható társadalmi és gazdasági hatást érjen el.

Komment

Összesen 0 komment

A kommentek nem szerkesztett tartalmak, tartalmuk a szerzőjük álláspontját tükrözi. Mielőtt hozzászólna, kérjük, olvassa el a kommentszabályzatot.

Jelenleg nincsenek kommentek.

Szóljon hozzá!

Jelenleg csak a hozzászólások egy kis részét látja. Hozzászóláshoz és a további kommentek megtekintéséhez lépjen be, vagy regisztráljon!

A téma legfrissebb hírei

Tovább az összes cikkhez

rák

Címoldalról ajánljuk

Tovább az összes cikkhez

rák

Magyar nyelven is működik: egyetemista fejlesztett nagy pontosságú MI-szövegfelismerőt

Egyre nehezebb megmondani, hogy egy beadandót, cikket, posztot vagy akár egy álláspályázatot ember írt-e vagy a mesterséges intelligencia (MI) alkotta. Miközben az angol nyelvű MI-detektorok gombamód szaporodnak, magyar nyelven eddig nem igazán volt megbízható megoldás.

A szakdolgozattól a működő termékig

Nem szöveget ír: döntést hoz

Jellegzetes fordulatok az MI generálásban

Nem tiltani, érteni

Komment

Szóljon hozzá!

A téma legfrissebb hírei

Új fegyver a rákos sejtek ellen

Az Ararát jelentése három nézőpontból

Kozmikus kettős törés: újabb döbbenetes kérdőjel az univerzum keletkezéséről

Egy fiatal nő esete mutatja, milyen könnyű tönkretenni valakit MI-vel

Címoldalról ajánljuk

Új fegyver a rákos sejtek ellen

Az Ararát jelentése három nézőpontból

Kozmikus kettős törés: újabb döbbenetes kérdőjel az univerzum keletkezéséről

Egy fiatal nő esete mutatja, milyen könnyű tönkretenni valakit MI-vel

Fontos híreink

Tóth Alex majdnem nyerőember lett, csapattársa másképp gondolkodott

Érzékeny veszteséget szenvedtek az ukránok

Komárom-Esztergomban a cél a háromharmad

Bizony…

Belföldi híreink

Ha az olaj megáll, a rezsicsökkentésre sem lesz pénz

„Mindenki végezze a kampányban a feladatát, akkor le fogjuk őket tolni a pályáról”+ videó

Orbán Viktor: Az iráni háború miatt a Barátság kőolajvezeték fontossága kétszeresére nő + videó

Már online is kitölthető a nemzeti petíció + videó

Külföldi híreink

Szijjártó Péter: Háborús körülmények kezdenek eluralkodni az egész közel-keleti térségben

Spanyolország a nemzetközi jog tiszteletben tartására hívta fel a figyelmet

Szlovénia vezetői párbeszédre szólítottak fel az iráni ügyben

Nem könnyű…

Viktoria Ferenc: Prolongation of the War Is Causing Growing Number of Human Tragedies

Slot döntött a Liverpool meccse előtt, Szoboszlai visszatér a régi posztjára

Befejeződött a Bászna Gabona Zrt. károsultjainak állami kárrendezése

Magyar nyelven is működik: egyetemista fejlesztett nagy pontosságú MI-szövegfelismerőt

Egyre nehezebb megmondani, hogy egy beadandót, cikket, posztot vagy akár egy álláspályázatot ember írt-e vagy a mesterséges intelligencia (MI) alkotta. Miközben az angol nyelvű MI-detektorok gombamód szaporodnak, magyar nyelven eddig nem igazán volt megbízható megoldás.

A szakdolgozattól a működő termékig

Nem szöveget ír: döntést hoz

Jellegzetes fordulatok az MI generálásban

Nem tiltani, érteni

Komment

Szóljon hozzá!

A téma legfrissebb hírei

Új fegyver a rákos sejtek ellen

Az Ararát jelentése három nézőpontból

Kozmikus kettős törés: újabb döbbenetes kérdőjel az univerzum keletkezéséről

Egy fiatal nő esete mutatja, milyen könnyű tönkretenni valakit MI-vel

Ne maradjon le a Magyar Nemzet legjobb írásairól, olvassa őket minden nap!

Címoldalról ajánljuk

Új fegyver a rákos sejtek ellen

Az Ararát jelentése három nézőpontból

Kozmikus kettős törés: újabb döbbenetes kérdőjel az univerzum keletkezéséről

Egy fiatal nő esete mutatja, milyen könnyű tönkretenni valakit MI-vel

Fontos híreink

Tóth Alex majdnem nyerőember lett, csapattársa másképp gondolkodott

Érzékeny veszteséget szenvedtek az ukránok

Komárom-Esztergomban a cél a háromharmad

Bizony…

Legolvasottabb

A Galatasaray edzője nem kertelt, ezért cserélte le Sallai Rolandot a Juventus ellen

Robbie Keane nem tudott sokáig örülni a továbbjutásnak, a fejét fogta, majd ismét kiakadt

Nyista áram, lehet náci tempóban őrjöngeni

Barbár állatok lepték el Európát…

Bulgáriában súlyos vádakkal álltak elő a Fradi sikere miatt, dühöng a helyi sajtó

A Liverpoolra régi ismerős, a PSG-re rangadó vár a BL nyolcaddöntőjében

Nagy botrány készül, leleplező dokumentum került elő, egy közéleti ikon karrierje érhet ma véget

Magyar Péter ismét elveszítette a fejét, látványosan kiborult a kellemetlen kérdésektől

Belföldi híreink

Ha az olaj megáll, a rezsicsökkentésre sem lesz pénz

„Mindenki végezze a kampányban a feladatát, akkor le fogjuk őket tolni a pályáról”+ videó

Orbán Viktor: Az iráni háború miatt a Barátság kőolajvezeték fontossága kétszeresére nő + videó

Már online is kitölthető a nemzeti petíció + videó

Külföldi híreink

Szijjártó Péter: Háborús körülmények kezdenek eluralkodni az egész közel-keleti térségben

Spanyolország a nemzetközi jog tiszteletben tartására hívta fel a figyelmet

Szlovénia vezetői párbeszédre szólítottak fel az iráni ügyben

Ne maradjon le a Magyar Nemzet legjobb írásairól, olvassa őket minden nap!

Nem könnyű…

Viktoria Ferenc: Prolongation of the War Is Causing Growing Number of Human Tragedies

Slot döntött a Liverpool meccse előtt, Szoboszlai visszatér a régi posztjára

Befejeződött a Bászna Gabona Zrt. károsultjainak állami kárrendezése