DALL-E-2 képgenerátor mesterséges intelligencia

A mesterséges intelligencia képet alkot

A mesterséges intelligencia ma már verset és esszét ír, de az utóbbi időkben le is doktorált. Az OpenAI DALL–E 2 egy MI-alapú képalkotó program, és számos gyerekbetegsége ellenére mégis figyelemre méltó. Bármit generáltathatunk vele, amit elgondolunk. Veszélyben van-e a grafikusok munkája, és honnan veszi a képek alapját az MI?

2023. 02. 28. 12:30

Miután már elég verset írattam a mesterséges intelligenciával a festészet mibenlétéről, a zenéről, a jövőnket fenyegető potenciális természeti katasztrófákról, figyelmem az OpenAI DALL–E 2 számú program felé irányult. A szóban forgó program a nevét a világ egyik legismertebb szürrealista alkotójáról, Salvador Dalíról kapta. 2022 szeptemberétől egy rövid regisztrációt követően bárki használhatja, azaz – nagy vonalakban – leírások alapján generáltathat valósághű, különböző stílusú képeket. A határ pedig, mondhatnánk, majdnem a csillagos ég, ami jelen esetben a képzeletünk és az interneten lévő tudás.

Habár a képzeletnek nem szabhat határt az OpenAI DALL–E 2 nevezetű programja, az ingyenes próbálkozások számát korlátozza. Elsőként ötven kreditet kap egy-egy felhasználó, vagyis ötven – és ennek négy-négy változatát – képet tudunk készíteni. Ezt követően 115 kreditet 15 dollárért, 230 kreditet harminc dollárért vehetünk és így tovább. Ha nem szeretnénk fizetni, de hajt a kíváncsiság, ne csüggedjünk: havonta ugyanis plusz 15 kreditet kapunk szinten ingyen. Eddig ez volt a DALL–E 2 prózai része, ennél azonban némileg izgalmasabb az, hogy mire használhatjuk.

A programban angol nyelven generálhatunk képeket. A képlet roppant egyszerű: írjunk be szavakat, amelyek lehetnek tárgyak, gondolatok, stílusok, szinte bármi.

Első találkozásom alkalmával a DALL–E 2-től hétköznapi tárgy, környezet és hangulatok összességéből kértem képet: működő hajszárító a ködös erdőben, sötét stílusban. Nos, lenyűgözően élethű fotót generált a rendszer. De érdekesebbnek találtam a meglévő fényképek vagy éppen festmények kiegészítését. Így elsőként Munkácsy Mihály Műteremben (1876, olaj, vászon, 161×221 cm, Magyar Nemzeti Galéria) című festményének kiegészítésére tettem kísérletet. Ez a Munkácsy-alkotás voltaképpen egy kettős önarckép, ami egyben egy zsánerkép is. Ennek tudatában kértem a programot, hogy egészítse ki, pontosabban folytassa a mester alkotását: a bal oldalra egy vágyakozó, nézelődő, két kezét összekulcsoló, szőke hajú, fehér bőrű nőalakot helyezett, míg jobb oldalra egy tipikus műtermi cselekvést és figurát tett a mesterséges intelligencia. Az eredmény megdöbbentő, hiszen, ha nem ismerném az eredeti művet, a DALL–E által készítettről akár el is hinném, hogy így teljes a kompozíció. De a program gyerekbetegségei felett mégsem lehet szemet hunynunk: ha alaposabban megnézünk egy-egy kiegészített fotót, láthatjuk, néhol sete-suta az emberi arc ábrázolása.
Egy-egy képet a visszatérő hibák ellenére valóban profin kivitelez a DALL–E, így biztosan volt már olyan, aki megspórolta ezzel azt, hogy felkérjen egy grafikust az adott munkára.

Bár mi mind tanítjuk az MI-t – hiszen folyamatosan újabb képek kerülnek fel az „adatbázisba” –, kreatívabbak aligha leszünk tőle.

Alkalmaztatjuk vele különböző hívószavak alapján a már meglévő tudások összegyúrását, azaz alkot egy nem egyedit, mondhatni egy sokadikat. A grafikusoknak inspirációt adhat az adott munkafolyamat első pár lépésében, de ne feledjük, az amatőr és a profi között hatalmas különbség van. Egy grafikus esetében például a mű létrejöttével automatikusan keletkezik a szerzői jog. De a DALL–E-nál ez sem egyértelmű. Hiszen ha az interneten meglévő képanyagokból dolgozik, kit illetnek meg végül a szerzői jogok? Ahogy azt már több helyütt megírták, az európai és az amerikai szerzői jog csak a természetes jogi személyeket tekinti szerzőknek, a megoldás pedig az esetjogban lehet – ám eddig MI-vel alkotott képre szerzői jogok nem terjesztettek ki. Jól átgondolva tehát – habár szórakoztató és rácsodálkozhatunk technika fejlődésére –, a szöveges leírás alapján létrehozott képeknek igenis van határuk: az interneten lévő tudás. Igaz, okíthatjuk az MI-t, újabb és újabb ismeretmorzsákat adhatunk számára, a segítségünkre lehet, de egyvalamit ne feledjünk: az emberi kreativitást (még) nem tudja helyettesíteni.

Borítókép: MI-vel kiegészített Munkácsy-festmény (Fotó: DALL-E 2)