Halovány arcok – Pistike, vagy Brad Pitt?

Legyen szó családfakutatásról, vagy régi cikkekről, már lehetővé vált, hogy kép alapján a kereshetünk az adott személyről különböző életkorában megjelent cikkeket, fényképeket – az Arcanum Digitális Tudománytárnak (ADT) archívumának köszönhetően. De az arcfelismerő rendszernek nehézségei is akadnak.

2020. 09. 07. 9:31
VéleményhírlevélJobban mondva - heti véleményhírlevél - ahol a hét kiemelt témáihoz fűzött személyes gondolatok összeérnek, részletek itt.

Nagy divat ma a családfakutatás, és az ezzel foglalkozó amatőr kutatók az Arcanum archívumának, az Arcanum Digitális Tudománytárnak (ADT) évek óta lelkes felhasználói. A június óta a honlapon elérhető arcfelismerő rendszer segítségével még könnyebb bővíteni vagy a valósággal összhangba hozni a családi legendáriumot. Lengyelfi Editet például gyerekkora óta foglalkoztatta családjának története, felnőve pedig egyenesen megszállottjává vált a múlt felderítésének. Az Arcanum adatbázisának segítségével derítette ki, hogy dédnagyanyjának nemcsak kettő, hanem egy harmadik testvére is volt, akit a család egyszerűen letagadott egy 1927-es gyilkosság és vagyonügyi vita után.

Biszak Sándor, az Arcanum alapító-tulajdonosa vezetésével azért hozták létre a digitális tudománytárat, hogy a kutatók, az újságírók vagy a lelkes amatőrök a lehető legtöbb történeti forráshoz és tudományos publikációhoz juthassanak hozzá, de saját bevallásuk szerint nem gondolták, hogy valaha elérik az ötszáz előfizetőt, akik ma már több mint hétezren vannak. Az Arcanum dolgozói minden hónapban egy-másfél millió oldalt digitalizálnak, ebből legalább félmillió újságoldal kerül az ADT-be, így az Esti Hírlap, a Pesti Hírlap, a Magyar Ifjúság, az Ország-Világ és a Magyar Nemzet összes lapszáma megtekinthető, és folyamatosan bővül az archívum.

A többi oldal a Hungaricana ingyenes közgyűjteményi portálba, a Szaktárs kiadókat összefogó adatbázisba kerül, illetve egyéb rendszereket gazdagít.

Eddig csak szövegesen lehetett keresni a digitális tudománytárban, ami gondot okozhatott, ha a kutató nem ismerte a keresett személy pontos nevét, vagy az túlzottan hétköznapi volt. A régi újságoknál az is gyakori, hogy a képek alól hiányoznak a leírások, így hiába volt például valakinek fényképe a dédapáról, ha ő csak illusztrációként szerepelt a sajtóban. A TensorFlow (a Google Brain Team által 2015-ben kifejlesztett nyílt forráskódú szoftverkönyvtár) azonban most már a képek alapján való keresést is lehetővé teszi. Az algoritmus gépi tanulás nyomán hálózatot hoz létre a feltöltött képekből, és ezt futtatja le az Arcanum teljes adatbázisában, közel harmincmillió újságoldalon. A gépi tanulás az elmúlt évek egyik számítástechnikai slágerének számít, a mesterséges intelligencia robbanó növekedése számtalan iparágat forradalmasított már. Magyarországon is egyre több olyan cég van, amely a robotika, a prediktív analitika, az önvezető autók, a videójátékok, a gyártásautomatizálás, a gyógyszerkutatás vagy az orvosi diagnosztika területén használja a mesterséges intelligencia eszközeit. Hasonló archívumot azonban csak az Arcanum kapcsolt össze a gépi tanulással. Így lehetővé vált, hogy adott kép alapján a keresett személyről különböző életkorokban megjelent cikkeket sorjázza a rendszer, továbbá, hogy csoportképek kapcsán is lehessen keresni. Ez esetben az algoritmus a legjobb állapotban lévő arcot kezdi el futtatni, így ha haloványabb arcra lennénk kíváncsiak, akkor érdemes körbevágni a képet, és csak azt feltölteni.

Rendszer persze nincs hiba nélkül. Komoly gondot okoz például, hogy a régi fényképek sokszor elmosódottak, a szkennelés pedig tovább ronthat a felvételek minőségén. Ilyenkor az algoritmus pontatlan eredményt hozhat. Hasonló élő emberek esetén is előfordulhat, mivel, ha valakiről nem készült fényképes újságcikk, akkor a rendszer a leghasonlóbb személyhez köti, például egy hollywoodi hírességhez. Ez utóbbi azonban sokak szerint legalább olyan izgalmas lehet, mint a késő esti netflixezés…

A téma legfrissebb hírei

Tovább az összes cikkhez chevron-right

Ne maradjon le a Magyar Nemzet legjobb írásairól, olvassa őket minden nap!

Címoldalról ajánljuk

Tovább az összes cikkhez chevron-right

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.