A mesterséges intelligencia a zeneszerzésbe is belekontárkodik

Azt hiszi, meg tudná mondani, melyik zenét írta egy zseni, és melyiket egy algoritmus? Ne legyen biztos benne!

Molnár Csaba
2017. 08. 27. 16:29
VéleményhírlevélJobban mondva - heti véleményhírlevél - ahol a hét kiemelt témáihoz fűzött személyes gondolatok összeérnek, részletek itt.

Bach zenéje régóta lázba hozza a matematikusokat, hiszen a bennük rejlő rendszer akár fraktálok segítségével is leírható. Különösen a korálok kötött formái alkalmassá tehetik őket arra, hogy a mesterséges intelligencia „mély tanuló” (deep learning) algoritmusai kiismerjék törvényszerűségeiket, és új, esetleg az emberek számára megkülönböztethetetlen minőségű zenét hozzanak létre a tanultak alapján, írja a Quartz.

A bachi korálok mindig négy részből állnak: egy melódiából és a hozzá kapcsolódó három harmóniából. A Sony párizsi komputertudományi kutatóközpontjában (Computer Science Laboratories, CSL) működő számítógép 352 Bach-korált elemzett, megkereste a melódiákat és a harmóniákat összekötő törvényszerűségeket, majd a szabályokat alkalmazva új harmóniákat alkotott az eredeti melódiákhoz. A gépi zeneszerző munkáját nagyjából úgy lehet elképzelni, hogy követve a melódia hangjait, a tanultak alapján megpróbálja kitalálni, Bach vajon milyen hangot illesztett volna hozzá harmóniaként. Az elkészített zenékkel több mint 1200 embert teszteltek, akiknek feladata az volt, hogy megmondják, az adott darabot Bach vagy a számítógép szerezte. Noha a résztvevők háromnegyede klasszikuszene-rajongó volt, ötven százalékuk rosszul tippelt. Ahogy bonyolultabb darabokat hallottak, hajlamosak voltak azt hinni, hogy az eredeti Bach, noha nem mindig volt ez a helyzet.

Itt tehát egy híres zeneszerző által írt melódiákhoz szerzett a számítógép harmóniákat. De ennél sokkal többre is képesek: a semmiből is alkothatnak új zenét.

Daddy’s Car (Apa kocsija) – egy eddig ismeretlen Beatles-szám, amelyet tavaly publikáltak először. Talán nem a legjobb, és néhol kísértetiesen hasonlít az And I Love Her című dalra, de egyértelműen felismerhető, hogy Lennon–McCartney. A születése azonban jelentősen eltért a nagy klasszikusoktól. Valójában a híres szerzőpárosnak semmi köze hozzá, annál több a mesterséges intelligenciának. A korábban említett Sony CSL-ben hozta létre a számítógép az évek óta futó Flow Machine elnevezésű kutatóprogram eredményeként.

A mesterségeszene-kutatás központi figurája, François Pachet vezette program során megszámlálhatatlanul sok kottát, ritmust, melódiát tápláltak a komputerbe, majd azt kérték tőle, hogy alkosson valami újat a hatvanas évek popstílusában. És létrejött a Daddy’s Car (bár a folyamat végén azért még szükség volt az emberi utómunkára, és természetesen az énekszólam sem a komputer szüleménye). Nem sokkal később egy másik dalt is megjelentettek, The Ballad of Mr Shadow címmel, ezúttal olyan amerikai szerzők stílusában, mint Irving Berlin, Duke Ellington vagy George Gershwin.

Könnyű – és szenzációs – lenne e fejleményeket úgy értelmezni, hogy a komputer hamarosan elveszi a zeneszerzők és a zenészek kenyerét, hiszen mi szükség lenne méregdrágán és művészi rigolyáktól terhelten dolgozó dalszerzőket foglalkoztatni, amikor ugyanezt a feladatot elláthatja egy szoftver is. A valóság persze elég távol áll ettől, a slágerlistákon vélhetően még sokáig emberi dalok fognak állni, de ez nem jelenti azt, hogy a kevésbé felemelő munkát végző, kevesebb sikert, pénzt, csillogást megtapasztaló zeneszerzők nyugodtan aludhatnának.

Sokan észre sem vesszük, hogy fél életünket valamilyen zenei aláfestés mellett éljük le. Lágy zene szól a liftben, az áruházban, az automata telefonközpontból, miközben várjuk, hogy az ügyfélszolgálatos végre fogadja a hívásunkat, de a reklámok, tájékoztató videók alatt vagy a telefonos játékok közben is. Ezek a dallamok hatnak ránk (az áruházak például tudományos kutatást végeztetnek a célból, hogy rátaláljanak a leginkább pénzköltésre ösztönző melódiára), de mégsem figyelünk rájuk igazán, nem várjuk el tőlük, hogy befutó helyen álljanak a Grammy-díjak átadásán. Ettől még embereknek kell létrehozniuk őket, és ha valaki engedély nélkül használja őket, drága szerzői jogi pert varrnak a nyakába. Nos, e zenék szerzőinek van mostanság félnivalójuk.

Persze maguk a mesterséges zene kutatói (és, mint látni fogjuk, egyre több profitorientált cég foglalkozik effélével)

nem győzik nyugtatni a kedélyeket, azt állítván, hogy semmi sem állhat távolabb céljaiktól, mint elavulttá tenni az emberi zenészeket.

– Egyáltalán nem [ez a célunk], pont ellenkezőleg! – válaszolta a zeneszerzők ellehetetlenítését firtató kérdésünkre François Pachet, a Sony CSL volt igazgatója. Pachet sok éve kutatja a mesterséges intelligencia és a hangok kapcsolatát. Tíz évvel ezelőtt azzal került be a hírekbe világszerte, hogy az Eötvös Loránd Tudományegyetem etológia tanszékének kutatóival együttműködve kutyaugatás-felismerő algoritmust fejlesztett. – [Az algoritmusaink] olyan új eszközök, amelyek új lehetőségeket nyitnak a zeneszerzésben. De ezek az eszközök, ahogy minden eszköz, igényli az embert, hogy ő megfelelő módon használja őket.

Ezen a videón François Pachet gitározik, miközben a Sony SCL egy másik, ugyancsak mesterséges intelligencián alapuló programja, a Reflexive Looper valós időben kíséri őt a játéka alapján létrehozott szólamokkal. 

 

– Mindig lenyűgözött az az elképzelés, hogy olyan tevékenységeket automatizálhatunk, amiről az emberek azt gondolják, hogy csak ők képesek rá. És ma a kreativitást látjuk ember voltunk utolsó bástyájának – nyilatkozta Siavash Mahdavi, az AI Music nevű cég vezetője a The Guardiannek (az AI a mesterséges intelligencia angol rövidítése). Az interjúra szimbolikus módon a londoni Abbey Road stúdióban került sor. – De aztán gyorsan elvetettem eredeti ötletemet, azt, hogy alkossunk egy programot, amely gombnyomásra ír egy szimfóniát. Hogy miért? Egyrészt nehéz, másrészt nincs is sok értelme. A zenészek sorban állnak, hogy eladják a zenéiket. A legutolsó dolog, amire szükségük van, az egy ilyen gép lenne.

Pachet egyetért abban, hogy még nem tartunk ott, hogy mesterséges zene szóljon a rádióból.

– A mesterséges intelligencia jelenleg még nem olyan jó (és a közeljövőben nem is lesz az), hogy teljesen autonóm módon, mindenféle emberi beavatkozás nélkül popslágert szerezzen – tartja a szakember, aki maga is zenél. Ezután az improvizációról kérdeztük. – Léteznek egészen jó improvizációs algoritmusok.

De hogy az ember mely képessége egyedi tényleg? Talán az az érzéke, hogy tudja, mikor és hogyan kell reagálnia a többi zenész viselkedésére, és hogyan érdemes befolyásolni a zenét.

Ez a képesség még mindig nagyon távol áll az algoritmusok tudásától.

A klasszikussá válásra joggal számító slágert tehát belátható időn belül talán nem fognak számítógépek írni. De tucatmelódiákat már ma is szereznek, sőt bárki meg is vásárolhatja az így alkotott dallamokat. A Jukedeck nevű cég például az interneten kínálja a szolgáltatását. Állításuk szerint már félmillió zenét szerzett a mesterséges intelligenciájuk, a világ gyakorlatilag összes országából érkezett ügyfelek számára. Azokat a Youtube-videósokat célozzák, akiknek szükségük van aláfestő zenére a filmecskéikhez, de az eddig általánosan használt, jogvédett (és ellopott) zenéket a Google mesterséges intelligenciája egyre csalhatatlanabbul észreveszi, és automatikusan törli, az egész videóval együtt. Ez a funkció már-már félelmetesen hatékony. Előfordult, hogy egy családi videónkat azért törölték, mert a háttérben alig hallhatóan véletlenül ment a rádió, az algoritmus pedig felismerte a zeneszámot.

Aki nem szeretne efféle kellemetlenségeket, az most már szereztethet magának teljesen új zenét, és azt magánszemélyként 99 centért fel is használhatja (ha a dal teljes szerzői jogaira tart igényt, az már 199 dollárt kóstál). Persze ezek nem „jó” zenék, de e cégeknek nem is céljuk ez, és az ügyfeleiknek sem fontos. Nekik elég, ha a dallam nem annyira rossz, hogy zavaró legyen, és legálisan használhatják. A zeneipari befektetők szerint e cégek használható zenéket gyártanak. Ha az emberi fül számára kellemes harmóniákat tartalmaz, kellő szakértelemmel vannak hangszerelve, az akkordok megfelelnek az emberek (nem túl kifinomult) elvárásainak, akkor a zene fogyasztható lesz. Amint látjuk, a „használható zene” kritériumai nem feltételeznek különösebb zenei géniuszt, mindössze az évszázadok zenekutatása során felhalmozott tudás célszerű alkalmazását. Bár e háttérzenék gyakran fel sem tűnnek nekünk, rengeteg zeneszerző él belőlük, és ők biztosan többet kérnek a munkájukért, mint a mesterségesen intelligens algoritmusok fejlesztői. Illetve többet kérhettek eddig.

A mesterséges zenében egyre nagyobb fantáziát látnak a legnagyobb kiadók is.

A Sony, a Warner Music után minden jel arra mutat, hogy a világ legnagyobb zenestreaming-szolgáltatója, a Spotify is beszállni készül a gépi zene egyre reménytelibbnek tűnő világába.

(A streaming afféle internetes rádiót jelent, amelynek segítségével az előfizetők anélkül hallgathatnak korlátlanul sok zenét, hogy hangfájlok tartósan a birtokukba kerülnének.) Néhány hete szerződött át François Pachet a Sonytól a Spotifyhoz, de kérdésünkre – természetesen – cáfolta, hogy hamarosan mesterségesen generált csatornák jelennének meg a Spotifyon (amit egyébként sokan biztosra vesznek az átigazolás láttán). – Mi csak új, online zeneszerző eszközöket fogunk létrehozni, szó sincs efféle scifibe illő fantazmagóriákról – válaszolta a komputertudós.

A zeneszerzést kóstolgató algoritmusok átlagemberek számára sokkal hasznosabb felhasználási területe lehet az AI Music programja, amely már meglévő (ember alkotta) dalokat alakít pillanatnyi kívánságunknak megfelelően. Módosítja a tempót, hogy illeszkedjen futásunk üteméhez, áthangszereli a számot, ha éppen akusztikus vagy épp elektronikus zenét akarunk hallgatni. A lehetőségek beláthatatlanok, de a következmények is.

Ma még senki nem tudja, hogy egy mesterséges intelligencia alkotta zeneszám szerzői jogai kit fognak illetni, de azt sem, hogy hogyan alakul a közönség ízlése a jövőben. Az optimisták szerint az új konkurencia még jobb darabok alkotására sarkallja majd a zeneszerzőket, így a verseny termékenyítőleg fog hatni. Mások nem ennyire derűlátók. Vannak zenei stílusok, amelyek minősége (kritikusaik szerint) már ma is hihetetlenül mélyen van a hajdani klasszikusokhoz képest. Mégis megvan a maguk rajongói tábora. Semmi sem garantálja hát, hogy a ma még esetlennek hangzó gépi dalok ne válnának hamarosan egy generáció slágereivé, és akkor az emberi zeneszerzők nem lesznek többek technikusoknál.

Ne maradjon le a Magyar Nemzet legjobb írásairól, olvassa őket minden nap!

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.