Egy új arcfelismerő algoritmust mutatott be a Yahoo Labs és a Stanford Egyetem az előző héten – írja a Vice.com. Első hallásra a bejelentés nem tűnik nagy durranásnak, hiszen évek óta megtalálható az arcfelismerő funkció a fényképezőgépekben, kamerákban, de még az okostelefonokban is. A technológiát egyébként 15 éve találták ki, és azon alapszik, hogy a képen látható bizonyos, előre meghatározott formák és azok egymáshoz való elhelyezkedése alapján az eszköz képes felismerni, hogy amit érzékel, az egy arc. A könnyebb érthetőség kedvéért: egy világosabb folt két sötét folt között arra enged következtetni, hogy az egy orr, egy világosabb sáv feletti sötétebb sáv pedig az orcák és a szemek együttese. Ez a technológia egészen addig jól működik, míg az arcot szemből nézzük, és azt semmi nem takarja el.
A konvolúciós ideghálózat egy olyan szoftver, ami a valós, biológiai értelemben vett neuronokhoz hasonlóan működik. A „digitális idegsejtek” mindegyike egyetlen eldöntendő kérdést hivatott megválaszolni. Példának okáért: egy arckép esetében míg az egyik neuron azt figyeli, hogy vastag-e a fotón látható szemöldök, egy másik arra keresi a választ, hogy a haj színe barna-e. A számítógép a kilenc rétegen futó neurontömegek közötti 120 millió kapcsolatot elemzi, majd a tanulási folyamat végeztével létrehoz egy egyedi, jó eséllyel összetéveszthetetlen „digitális ujjlenyomatot”.
Ez az új technológia, ami a Deep Dense Face Detection (DDFD) elnevezést kapta – magyarra talán legegyértelműbben nagy sűrűségű arcfelismerésként fordítható – a konvolúciós ideghálózaton alapul. A cikk példáját használva: ha az ember meg akar tanítani valamit egy átlagos mesterséges intelligenciának (MI) – és itt most nem a terminátorra kell gondolni, hanem egy rendszerre, ami többek között olyan feladatok ellátására képes, mint a vizuális észlelés, hangfelismerés vagy idegen nyelvű szöveg fordítása –, mondjuk, hogy felismerje a különbséget egy macska és egy gyík között, egy halom macskás és gyíkos képet kell az MI rendelkezésére bocsátani. Ezután az minden egyes képet összehasonlít egy általa nagy vonalakban „elképzelt” macskával és gyíkkal, és kiszűri a leginkább megegyezőket. Tehát a hétköznapi mesterséges intelligenciák vagy-vagy alapon „gondolkodnak a világról”, jelen esetben úgy, hogy valami vagy macska, vagy gyík (vagy egyik sem, és azt nem értelmezi).
Ezzel szemben a DDFD a legapróbb alkotóelemekig képes lebontani a képet. A korábbi példánál maradva: a rendszer nemcsak kategorizálni próbálja az adott képet, hogy azon gyík vagy macska látható-e, hanem megvizsgálja például, hogy vannak-e pikkelyek vagy szőr, ellenőrzi a lábakat, szemeket, füleket, orrot. Bizonyos jeleket keres – mondjuk a láb formájára vagy a szőr mintázatára utalókat –, majd ezeket összeteszi, és csak ezután dönti el, hogy mit is érzékel tulajdonképpen.
A Daily Mail azt írja, az algoritmus egy olyan kétszázezer arcképet tartalmazó adatbázisból dolgozik, amelyeket különböző szögből fotóztak, illetve további húszmillió olyan képet használ, amin nincs arc. A cikk megemlékezik a GoogLeNet csoportosító algoritmusról is, ami képes kiszúrni egy képet a képben, tehát egy kalapos kutyáról készült fotón felismeri a fejfedőt az állat fején.
Ez azt jelenti, hogy a DDFD akkor is képes felismerni egy arcot – akár egy fejjel lefelé fordított felvételen is –, ha az el van fordulva, részben hiányzik a képről, vagy mondjuk csak a fotó hátterében tűnik fel. Természetesen ez az érzékelés nem ugyanaz, mintha az algoritmus megmondaná, hogy kinek az arcát „látja”, de ez hamarosan megváltozhat, ugyanis a Facebook épp ezen a technológián dolgozik.
Az ExtremeTech cikke szerint a DeepFace nevű szoftver, amin Zuckerberg oldalának fejlesztői dolgoznak, majdnem olyan pontosan képes felismerni az arcokat, mint az emberi agy. Ha összehasonlít két fotót, bizonyos tényezők számbavétele mellett 97,25 százalékos pontossággal képes megmondani, hogy a két képen ugyanaz az arc látható-e. Az emberi agy ugyanezt a feladatot 97,53 százalékos pontossággal hajtja végre.
A Vice-cikk szerzője felhívja a figyelmet arra, hogy e két rendszer együttese a jövőben komoly személyiségi jogi problémákat vethet fel. A térfigyelő kamerák így le tudják követni az ember mozgását és listázni tudják, hol és kivel találkoztunk. Ha betérünk egy ügyvédi irodába vagy egy magánorvosi rendelőbe, miközben a „nagy testvér” figyeli minden lépésünket, kellő szabályozás hiányában vége lehet az ügyvédi vagy az orvosi titoktartásnak. Ha pedig feltűnünk egy szelfi hátterében, ami aztán felkerül a Facebookra, és a közösségi oldal – miután a DeepFace felismerte arcunkat – automatikusan megjelöl minket a fotón és megjeleníti azt ismerőseink hírfolyamában (amennyiben elfelejtettük beállítani, hogy ezt automatikusan tiltsuk), szélsőséges esetben nemcsak egy meglepetésbulit tehet gallyra, de kínos magyarázkodások elé is nézhetünk. Tény, hogy ez még csak a jövő, de a technológia ilyetén rohamos fejlődésével egyre közelebb kerülünk ahhoz, hogy a jelenünkké váljon.