A ChatGPT 2022. novemberi nyilvános indulása óta a mesterséges intelligencia tartalmak özönét zúdítja ránk. A Graphite SEO cég 65 000, 2020 januárja és 2025 májusa között megjelent angol nyelvű cikket elemzett. A Surfer MI-detektor minden olyan cikket mesterséges intelligencia által generáltnak tekintett, melynek tartalma 50 vagy annál magasabb százalékban MI-vel (valamelyik nagy nyelvi modellel) íródott. Kiderült, hogy a ChatGPT indulása után mindössze 12 hónappal MI-cikkek adták a publikált írások közel felét. Mára a cikkek több mint 50%-a mesterséges intelligencia által generált tartalom.
A Surfer ingyenes, bárki által használható MI-detektor. Egyszerűen illesszük be az elemezni kívánt szöveget, és felleli a mesterséges intelligencia által generált tartalmakat az írásokban.
Tehát a várakozásoknak megfelelően az elemzés az MI által generált tartalmak számának gyors növekedését mutatta ki. De a detektált cikkek aránya csak kezdetben emelkedett drámaian, idén megállt.

Ez a jó hír: úgy tűnik, az MI-generált cikkek áramlása közelít a plafonhoz. Miután 2024 novemberében elérte a csúcsot, az újonnan publikált mesterséges intelligencia kontra ember által írt tartalom fele-fele arány körül mozog.
Még az is lehet, hogy az emberi tartalom aránya ennél magasabb. A kutatók egy több száz milliárd weboldalt tartalmazó nyílt forráskódú adathalmazt, a Common Crawlt használták.
A Common Crawl ingyenes, nyitott webfeltérképezési adattár, amelyet bárki használhat. 2007 óta több mint 300 milliárd oldalt vizsgálnak, adatbázisuk havonta 3–5 milliárd új oldallal bővül.
Mivel a mesterséges intelligencia cégei ezt a kincsesbányát fosztogatták LLM-jeik betanításához, sok fizetős weboldal elkezdte blokkolni a Common Crawl számára az oldalaik indexelését, hívja fel a figyelmet az Axios. Ezek a szinte biztosan emberek által írt cikkek tehát kimaradhattak a Graphite elemzéséből. És hát az MI-detektorok sem tökéletesek, néha hibáznak.
A kígyó és az ő farka
Mindenesetre a mesterséges intelligencia által ömlesztett cikkek száma mára szinte stagnál. A Graphite egy másik kutatásra alapozva feltételezi, az lehet a jelenség oka, hogy az MI-tartalmat gyártó farmok silány munkáját a keresőmotorok és a chatbotok nem veszik tudomásul:
az MI okosan felismeri, hogy az MI által generált tartalom gyenge minőségű.
Így hiába döntik a webre a tartalmat, a Google (szintén mesterséges intelligenciával működő) keresője mégis 86 százalékban olyan cikkeket tár az olvasó elé, melyeket emberek írtak, és csak 14 százalékban hajlandó MI által összegyúrt információkat mutatni. Itt harap a kígyó a saját farkába.