Az eljárás azonban a biológiai, kémiai szerkezetek és képletek esetében nem működik: erre a problémára kerestek megoldást a magyar kutatók. Az ELTE Matematikai Intézete PIT bioinformatikai csoportjának kutatói – Keresztes László, Szögi Evelin és Varga Bálint Grolmusz Vince professzor vezetésével – kidolgozták a Newton-elmosás módszerét, amellyel nem csak képi adatokat lehet megsokszorozni.
Az új, Newton-elmosás az adatok javítási mechanizmusát variálja: a nagyobb megbízhatóság kedvéért többször mérünk vagy számolunk ki valamilyen mennyiséget, és ezeket átlagolva használjuk. Ha valamit például tízszer mérünk meg, és a tíz mérésből minden lehetséges módon kiválasztunk mondjuk hetet, és ezeket külön-külön átlagoljuk, akkor az adatokat megsokszorozhatjuk annyiszor, ahányszor tíz adatból hetet ki lehet választani, a példában ez éppen 120.
Az ELTE-s kutatók módszere nem visz be mesterséges homályosítást, mint a Gauss-elmosás, hanem az adatjavításba avatkozik bele: a megsokszorozott adatok minősége jobb, mint az egyedi adatoké, hiszen – a példánkban – hét mérés eredményeit átlagoltuk
– magyarázzák a kutatók.
A kutatók a Newton-elmosást először az emberi agy kapcsolatait leíró, 1 053 alanytól származó agygráfokra alkalmazták, és így az adathalmaz méretét százhússzorosára növelték, azaz, mint írják, 126 360 agygráfot készítettek az adathalmazból.
A kutatók minden agygráfot öt különböző felbontásban számoltak ki, így ötször 126 360, azaz 631 800 agygráfot tehettek közzé. A megnövelt adathalmazon igazolták a módszer használhatóságát a gépi tanulásban.
Az új agygráfok kiszámítása mintegy három hetet vett igénybe a kutatócsoport 36 számítógépén. Az új, a szerzők által Newton-elmosásnak nevezett módszer nem csak agygráfokra, de sok más, köztük kémiai és biológiai adathalmazra is használható.
Az ELTE kutatóinak tanulmánya a Scientific Reports című szaklapban jelent meg februárban.
Az eredeti cikk IDE kattintva érhető el.
Borítókép: Illusztráció (Fotó: Pexels)