Princeton Undergrad létrehozza a Google Deep Dream-Inspired Deepjazz A.I-t. Music Maker

Princeton President Christopher L. Eisgruber - 2020 Commencement remarks

Princeton President Christopher L. Eisgruber - 2020 Commencement remarks
Anonim

Ji-Sung Kim az április első hétvégéjének kora reggeli óráit töltött a koffeinre vezetve és a számítógépén kódolva, miközben mélyen tanult zenei generátort fejlesztett ki. A 20 éves Princeton informatika szekunder hallgatója csak 36 órát töltött be, hogy az első hackathon, HackPrinceton, az egyetemen tartott első hackathonja alatt teljesítsen. Miután befejezte a kódolás maratonát, létrehozott egy weboldalt a deepjazz számára, és elküldte a forráskódot a GitHub-on.

De Kim meglepetésére a program leállt. A Deepjazz folyamatosan a Pythonon és a GitHubon halad - elérve a GitHub általános hetedik programját. A HackerNews első oldalán is megjelent, és még mindig élénk vitát generál.

„Soha nem vártam el, hogy az első oldali projektem a népszerűség szempontjából ez a robbanóanyag” - mondja Kim Inverz. - Nagyon őrült és szórakoztató volt.

deepjazz - mély tanulásvezérelt jazz generáció Keras és Theano használatával! http://t.co/G5wscglzO7 #python

- Python Trending (@pythontrending) 2016. április 11.

Az evés, alvás és más tanfolyamok befejezése között Kim elmondta, hogy körülbelül 12 órát vett igénybe a deepjazz forráskódjának kifejlesztéséhez. Azonban a HackPrinceton előtt sokáig jött létre egy mesterséges intelligencia zenei generátor ötlete. A Chicagói Egyetem nyári gyakorlatában a Google Deep Dream-jében találkozott, amely egy fotógenerátor, amely a képmintákat értelmezi, és más tárgyakká alakítja. Az eredmény lenyűgöző kép, amely úgy néz ki, mintha egy vad álom jött volna ki.

„A művészet értelmezésének mélyreható tanulásának ötlete nagyon érdekes volt számomra” - mondja Kim. „Ez a fajta Deep Dream keretrendszer, amelyet a Google bemutatott és közzétett, tényleg lenyűgöző volt, mert új műalkotásokat hoz létre a meglévő művekből.”

Deepjazz gépi tanulást használ a jazzzene létrehozására - „egy A.I. úgy épült, hogy jazz legyen ”, mint a SoundCloud profilja. Kim, aki nem vett részt zenei elméleti órákban, de hét éve játszott a klarinét, a hagyományos zenéi miatt a jazz zenét választotta. A. A. a rendszer zenéje, „lehet, hogy szokatlan kimenetei vannak, így úgy gondolom, hogy a jazz különösen jól illeszkedik a zene készítésének idejére” - mondja.

Egy már létező zenei generátort visszatért a jazz zene számára, amelyet barátja, Evan Chow JazzML néven fejlesztett ki, a megfelelő adatok felhasználásával, de bináris mátrixgá alakította, amely kompatibilis a Keras és Theano két mély tanulási könyvtárral.

Maga a deepjazz keretrendszer egy kétrétegű LSTM, amely egyfajta mesterséges neurális hálózati architektúra, Kim leírja. Miután megtanulja a zenei jegyzetek kezdeti alapvonali sorrendjét (Kim a Pat Metheny „És aztán tudtam” részeit használta), valószínűségeket rendel a jegyzetekhez, és a következő jegyzetet generálja ezen valószínűségek alapján. Például, ha a programot az A, B, C skálán táplálja, nagy a valószínűsége annak, hogy a következő megjegyzés a deepjazz lesz D, Kim elmagyarázza.

Történelmileg a kritikusok azt mondták, hogy a mesterséges intelligencia-zenei generátorokat olyan robotok készítésével sújtja, amelyek túl robosztusak és sterilek - az emberek által alkotott zenében hallott színek hiányában. Jeffrey Bilmes, egy korábbi MIT-hallgató, aki 1993-ban a zenei ritmusokat reprodukáló számítógépeken dolgozott, elmondta: fordítottja novemberben:

„Amikor megtanul zenét játszani, és megtanulja a jazz-t játszani, hasznos egy intuitív megértés arról, hogy mi az a zene, ami emberré teszi” - mondta Bilmes. „Az emberek intuitív lények, és az emberek gyakran nem képesek leírni, hogyan képesek emberi dolgokat tenni. Abban az időben éreztem, hogy talán megsértettem egy szent esküt, amikor ezeket a dolgokat definiáltam a számítógépes programok számára. ”

Amikor Kim a deepjazz-t kutatta, sok olyan rendszeren keresztül találkozott, amelyek robotot generáltak.

„A zene és a művészet olyan dolgok, amelyeket mélyen emberinek tartunk” - mondja Kim. „Ahhoz, hogy emberi és élethűbbé váljon, nagyon nehéz kategorizálni.” Kim azt sugallja, hogy a generátorok olyan embereket létrehozó dalokat hozhatnak létre, amelyek sokkal kevésbé hasonlítanak össze az eredeti zeneszámhoz.

Más fejlesztők felvették a kapcsolatot Kim-vel és érdekeltek a deepjazz bővítésében, így több ember léphet kapcsolatba vele. Kim láthatja, hogy egy nap egy olyan improvizációs partnerként fejlődik, amely mesterségesen képes visszaadni egy zenész számára, hogy riffet nyújtson. Még a jövőben is láthat olyan alkalmazásokat, amelyek új, hasonló hangzású zenét hoznak létre a kedvenc műsorszámokhoz, vagy új zeneszerzést és progressziót sugallhatnak a zenészeknek.

Kim elismeri, hogy még mindig messze van attól, hogy a mélytudás szakértője legyen, de tapasztalata a deepjazz és a gyakornoki képzés, valamint a Princeton képzésében értékes képet adott a területről.

„Hatóanyagot már nem egy sci-fi álom. Ez valami nagyon valóságos, és nagyon gyors ütemben közeledik - mondja Kim. „Remélhetőleg látva, hogy ez a főiskolai hallgató, aki még nem is egy felső osztályú, képes volt valamit a hackathonon belül létrehozni, arra ösztönözni a többi diákot, aki küzd a számítógép-tudományba.”