Mesterséges intelligencia a zenében
Hallgassuk meg a következő zeneszámokat: Daddy’s Car, Mr. Shadow. Milyen a hangzásuk? Milyen stílusúak? Mikor készülhettek? A dalok különlegessége, hogy mindkettőt egy Flowmachine névre hallgató mesterséges intelligencia hozta létre. Sokszor fel sem tűnik, de ezek az algoritmusok jelen vannak a mindennapi életünkben ugyanúgy, mint az orvosi diagnosztikában vagy a termelésben. A megosztó informatikai újítás azonban az elmúlt években kilépett a tudományos kísérletezés és a praktikum kereteiből. A számítógépek szerepet játszanak olyan alkotó folyamatok területén, mint az építészet, képzőművészet vagy akár a zene.
Beavatkozhat-e a gép az alkotási folyamatokba?
A mesterséges intelligencia úgy fejlődik, hogy a gép először mintákat tanulmányoz, amelyeket aztán felismer és alkalmaz. Ha megmutatják neki egy író összes művét, akkor megtanul mondatokat alkotni, és képes olyan szöveget létrehozni, amely az eredeti írásokban nem szerepelt.
A történelem során a társadalomnak nehezére esett megbékélni az intelligensnek kikiáltott gépekkel, azt pedig még nehezebb elismerni, hogy akár kreatív területen is jelentőset alkothatnak. A dilemma oda vezetett, hogy a mesterséges intelligencia kutatásain belül új részterülettel, a számítógépes kreativitással is elkezdtek foglalkozni a kutatók.
Maga az alkotásvágy nem ébred fel egy gépben, a folyamatot mindig ember indítja el. Mégis akadnak, akik megpróbálják bebizonyítani, hogy a kreativitás nem valami misztikus ajándék, amely meghaladja a tudományos tanulmányozást, hanem vizsgálható, szimulálható és hasznosítható a társadalom érdekében.
Mivel a technológia fejlődésével a hétköznapi életnek is egyre inkább részese a mesterséges intelligencia, egyre többen használják az általa nyújtott lehetőségeket. Leginkább úgy, hogy megkeresik az arany középutat: az ember számára megmarad az alkotás öröme, de bizonyos folyamatokban kisegíti, felgyorsítja a munkát a gép.
A mesterséges intelligencia olyan helyzetekben nyújthat többet, ahol több száz órás, szituációra szabott zenére van szükség. Az ide sorolható videójátékok közben körülbelül 2 órás aláfestés ismétlődik. Mesterséges intelligenciával viszont végtelen hosszúságú háttérzene generálható.
Honnan indult?
Az 1950-es évektől kezdve foglalkoztatja a tudósokat, zeneszerzőket, hogy miként lehet bevonni a mesterséges intelligenciát a zeneszerzésbe. Lejaren Hiller és Leonard Isaacson matematikai alapon „programozott” zenét 1957-ben a Markov valószerűségi átmenetek segítségével. A két amerikai zeneszerző vonósnégyesre készített kompozíciót.
Szintén az első számítógéppel alkotó zeneszerzők között említhetjük Iannis Xenakist, aki 1962-ben olyan eszköz megalkotását tűzte ki célul, amely számítógép segítségével képes zenét szerezni. Rendszerével a mesterséges intelligencia pillanatok alatt elemez egy rajzot, és azonnal bemutatja zenei megfelelőjét.
David Cope, amerikai zeneszerző, tudós, fő kutatási területe a zene és a mesterséges intelligencia kapcsolata. Olyan algoritmusokat ír a 90-es évek óta, amelyek elemzik a meglévő zenét, és újat hoznak létre a tanultak alapján. A matematikai alapelvek jól azonosíthatók a nagy klasszikusok: Bach, Beethoven, Mozart, Vivaldi műveiben, így a mesterséges intelligencia segítségével megpróbált hasonló műveket komponálni.
Az elkészült alkotásokat nagyközönséggel tesztelték. Egy zongorista három darabot játszott Bach stílusában, amelyek közül csak egy származott a zeneszerzőtől, a másik kettőt gép, illetve egy zeneszerző alkotta. Az eredmény a hallgatóságot is meglepte, mivel azt a szerzeményt tulajdonították Bachnak, amelyiket a mesterséges intelligencia komponálta.
A kizárólag matematikai alapokra épülő alkotásokból azonban sokszor hiányzik a harmónia. A problémát ideghálózatok működési mintáját követő rendszerek fejlesztésével és vizsgálatával igyekeznek kiküszöbölni. A párizsi Sony Computer Science Laboratories évek óta kísérletezik a zene és a mesterséges intelligencia ötvözésével. Legfrissebb újításuk a DeepBach nevet kapta: a deep learning, azaz mélytanulás technológia és Bach műveinek találkozását elemzi. Saját bevallásuk szerint azért választották Bachot, mert kórusművei lépésenként feldolgozhatók és algoritmikusan könnyen értelmezhetők. 389 kórusművéből 352-t használtak fel a mesterséges intelligencia tanításához, ami elegendőnek bizonyult a DeepBach neurális hálójának kialakításához.
A kutatást egy online teszt is segítette, bárki kipróbálhatta, felismeri-e Bach műveit. A résztvevők között professzionális zenészek is voltak, akik azonosították az eredeti Bach-zenét. A kísérlet megerősítette, hogy a gépek egyelőre nem veszik át a zeneszerzők szerepét, azonban a mesterséges intelligencia fejlődése jelentős zenei téren is.
Fennállnak azonban korlátok, amelyek nehezen átléphetők, ilyen a kifejezőképesség, a „gesztus” hiánya. A gesztus az, amit a zenészek az előadás árnyalatainak neveznek. Különböző zenészek egyedien adják elő ugyanazt a dalt, ami finoman hozzátesz a művészeti értékhez.
Miként hódítja meg a popkultúrát?
Csak idő kérdése volt, hogy a popzenében is szerephez jusson a mesterséges intelligencia. Történelmileg is nagyot alkotott 2017-ben Taryn Southern amerikai énekesnő, mivel elsőként készített úgy poplemezt, hogy az éneklésen kívül mindent a mesterséges intelligenciára hagyott. Az I am AI című albumhoz összesen 4 programot használt: az Amper Music, a Watson Beat (IBM), a Magenta (Google) és az AIVA segítségével készült a produkciós munka, a hangszerelés, a szöveg, az akkordmenetek. Az albumon szereplő Break Free című dalhoz még a videóklipet is mesterséges intelligencia „álmodta meg”.
Szövege pedig külön figyelmet érdemel, elbeszélője szeretné jobban megismerni a világot. Kitörésre, szabadságra vágyik, meg akarja haladni önmagát. A dal több mint 2 millió megtekintéssel rendelkezik a YouTube-on, és zenei toplistákra is felkerült megjelenése évében: 48. volt a Billboard Indicator Charton, és 2. helyig menetelt az Euro Indie Charton. Az énekesnő az album sikeres fogadtatásakor úgy nyilatkozott, hogy véleménye szerint húsz év múlva teljesen természetes lesz dalokat kódolni mesterséges intelligenciával.
2018-ban Skygge és Kiesza Hello World című albuma a Flowmachine nevet viselő mesterséges intelligenciára támaszkodva jött létre.
A készítők szerint hibás a mesterséges intelligencia kapcsán emlegetett elgondolás, miszerint az ember feladata csak annyi, hogy megnyom néhány gombot, és ettől összeáll valami egészen rendkívüli. A gép nem veszi át az alkotó szerepét, csak néhány munkafolyamatot felgyorsít. Kell valaki, aki irányítja, szükséges az emberi kreativitás és kontroll.
Más zenei műfajok is kísérleteznek a mesterséges intelligenciával. A Dadabots nevű formáció extrém mértékben, hiszen napi 24 órában közvetítettek a YouTube-on kizárólag mesterséges intelligencia alkotta death metalt és rockzenét. Szlogenjük szerint el kell tüntetni az embereket a death metal zenéből. Az általuk használt rendszer úgy működik, hogy először csak rövidebb dallamokat, részleteket mutatnak az algoritmusnak. Minél több mintát ismer, annál komplexebb zenét generál. Ennek viszont az a következménye, hogy olyan gitártémákat is létrehoz, amit élő ember képtelen lenne lejátszani, a vokálban pedig halandzsa szöveg hallható.
Gép alkot vagy ember?
Számos zeneszerző aggálya, hogy a mostani generáció egyre több mesterségesen komponált zenét hall, és ahogy a jelenség megszokottá, népszerűvé válik, rövidesen nem is lesz szükség valódi zeneszerzőkre. A mesterséges intelligencia készítette zenék esetében szerzői jogi kérdések is felmerülnek, nem tisztázott, hogy a gép vagy a programozó az alkotójuk. Európában és az angolszász országokban szerző hagyományosan csak ember lehet. Az európai uniós szabályozás alapján szerzői védelmet olyan művek kaphatnak, amelyekben megmutatkozik a szerzői kreativitás, kifejeződik a szerző személyes érintettsége is.
Azokban az esetekben, amikor a komponálást a mesterséges intelligencia végzi, és az emberre csak a válogatás hárul, nehezebb a kérdés. Az ilyen művek nem esnek szerzői védelem alá.Azonban ilyenkor is találkozhatunk kivételes esetekkel. Előfordult, hogy kimondták: maga az ember által végzett válogatás művészi, így már ismét a kreativitás kifejezéséről beszélhetünk, és nem kizárt a szerzői jogi oltalom sem. Bár Amerikában a vonatkozó szabályok között nem szerepel az „ember” kitétel, a mesterséges intelligencia ott sem igazán illeszthető be a szerzői jogi keretekbe.
A Jukebox nevű mesterséges intelligenciát többek közt Elon Musk hozta létre. A rendszer mélytanulásos neuronhálózatok alkalmazásával dalokat generál. Mindenféle stílussal dolgozik, a hip-hoptól a heavy metalig. Meghatározzák számára a műfajt, előadót és a dalszövegeket, majd elemzés után előállítja a dalt, ami kísértetiesen hasonlít az eredeti művész stílusához. Megoszlanak a vélemények, hogy az eredmények lenyűgözőek, vagy az így készített dalok még mindig csak másolatok.
Az írásaiban a zene és a technológia kérdéseit vizsgáló Cherie Hu felhívta a figyelmet, hogy az olyan projektek, mint a Jukebox, igazi katasztrófát jelenthetnek a szerzői jogok tekintetében. Az ilyen mesterséges intelligenciával kísérletező tudósok gyakran a betáplált zenék szerzőit vagy műveik jogutódjait sem tájékoztatják a zenék felhasználásáról.
Bár még sokat fejlődhet a tudomány ezen a terén, a neurális hálózatok meglepő pontossággal tudnak embereket utánozni, elmosva a határokat eredeti és mesterséges között. A mesterséges intelligencia nem helyettesítheti teljesen az emberi tevékenységet, és egyelőre nem is képes túlmutatni az emberi kreativitáson. Most még viszont nem tudhatjuk biztosan, hogy milyen új távlatokat nyit a jövőben.
Források:
- Artificial Intelligence and the Arts: Toward Computational Creativity
- Mesterséges intelligencia (MI) és művészet
- Ez a kreativitás 14 összetevője
- Napi 24 órában tolja a metált egy mesterséges intelligencia a YouTube-on
- A zene és a mesterséges intelligencia
- Zene az algoritmusokon keresztül?
- Megjelent az első olyan poplemez, aminek egy mesterséges intelligencia volt a producere
- Mesterséges intelligencia írt popszámot
- Hogyan ír személyre szóló zenét egy mesterséges intelligencia?
- AIVA által komponált zenék különböző stílusban
- Hátborzongató dalokat írt az Openai mesterséges intelligenciája a legnagyobb sztárok stílusában
Feladatok:
- Informatika órára: Ismerkedjünk meg olyan mesterséges intelligenciával, ami kitanulta a zeneszerzés mesterségét, úgy, hogy elolvasott több mint 30.000 zeneművet. Látogassunk el az AIVA nevű mesterséges intelligencia oldalára.
(A regisztrációnak van ingyenes része, amely során bizonyos funkcióit ki lehet próbálni a programnak, pl. megadhatunk különböző zenei műfajokat, stílusokat, és ezekből készít a program egy zeneszámot. - Ki lehet az előadó? Felismeritek? Híres zenészek munkáit tanulmányozta a Jukebox nevű mesterséges intelligencia, mielőtt a vizsgált zenékre építve elkészítette az adott stílusban, az előadó karakterének megfelelő, saját zenéjét. Sikerül megfejtenetek ki lehetett a „múzsa”?
- https://soundcloud.com/openai_audio/rock-in-the-style-of-elvis-4
- Megfejtés: Elvis Presley
- https://soundcloud.com/openai_audio/jukebox-novel_lyrics-78968609
- Megfejtés: Katy Perry
- https://soundcloud.com/openai_audio/jukebox-265820820
- Megfejtés: Frank Sinatra
- https://jukebox.openai.com/?song=787754377
- Megfejtés: Michael Jackson
- https://jukebox.openai.com/?song=807313705
- Megfejtés: Nirvana