Princeton Undergrad creează Deepjazz A.I. Music Maker

Princeton Innovation: AI-based motion capture for animals

Princeton Innovation: AI-based motion capture for animals
Anonim

Ji-Sung Kim a petrecut orele de dimineață devreme în primul weekend din aprilie conectat la cofeină și a codat pe computerul său, pe măsură ce dezvoltă deepjazz, un generator de muzică de învățare profundă. Sophomore de 20 de ani, Princeton, avea doar 36 de ore pentru a termina adâncurile în timpul primului său hackathon, HackPrinceton, care a avut loc la 1-3 aprilie la universitate. După finalizarea unui maraton de codificare, a creat un site web pentru deepjazz și a postat codul sursă pe GitHub.

Dar mult spre surpriza lui Kim, programul a fost împușcat. Deepjazz este în mod constant trendy pe Python și GitHub - ajungând la fel de mare ca cel de-al șaptelea program de top pe GitHub în ansamblu. A fost chiar prezentat pe prima pagină a lui HackerNews și generează încă o discuție plină de viață.

"Nu m-am așteptat niciodată ca primul meu proiect să fie exploziv în ceea ce privește popularitatea", spune Kim Invers. "A fost cam nebun și distractiv".

deepjazz - Învățarea profundă bazată pe jazz, folosind Keras & Theano! http://t.co/G5wscglzO7 #python

- Python Trending (@pythontrending) 11 aprilie 2016

Între mâncare, somn și terminarea altor cursuri, Kim a motivat că ia luat aproximativ 12 ore pentru a dezvolta codul sursă pentru adâncime. Cu toate acestea, a venit cu ideea unui generator de muzică inteligentă artificială cu mult înainte de HackPrinceton. În timpul unui stagiu de vară de la Universitatea din Chicago, a descoperit Google Deep Dream, un generator foto care interpretează modelele într-o imagine și le transformă în alte obiecte pe care le cunoaște. Rezultatul este o imagine care pare a fi ca un vis sălbatic.

"Ideea folosirii învățării profunde pentru a interpreta arta a fost cu adevărat interesantă pentru mine", spune Kim. "Acest tip de cadru Deep Dream, pe care Google la prezentat și a publicat, a fost cu adevărat fascinant, deoarece creați opere de artă noi din lucrări de artă existente".

Deepjazz folosește învățarea de mașină pentru a genera muzică de jazz - "un A.I. construit pentru a face jazz ", după cum indică profilul său SoundCloud. Kim, care nu a luat clase de teoria muzicii, dar a jucat clarinetul timp de șapte ani, a ales muzică de jazz datorită melodiilor sale neconvenționale. Un A.I. sistemul muzical ", poate avea unele ieșiri neobișnuite, așa că cred că jazz-ul a fost deosebit de potrivit pentru ideea de a genera muzică în zbor", spune el.

El a repopulat un generator muzical existent optimizat pentru muzica de jazz pe care prietenul său Evan Chow la dezvoltat numit JazzML, folosind codul pentru a obține date relevante, dar transformându-l într-o matrice binară compatibilă cu cele două biblioteci profunde de învățare Keras și Theano.

Cadrul deepjazz însuși este un LSTM cu două straturi, care este un tip de arhitectură neurală artificială, Kim descrie. Dupa ce a invatat o secventa initiala a semintelor de baza a notelor muzicale (Kim a folosit partile lui Pat Metheny "And Then I Know"), asociaza probabilitatile notelor si genereaza urmatoarea nota bazata pe acele probabilitati. De exemplu, dacă alimentați programul pe scara A, B, C, există o mare probabilitate ca următoarea notă de adâncime care va genera să fie D, explică Kim.

Din punct de vedere istoric, criticii au spus că inteligenŃa artificială generează muzici generaŃi de producŃia de melodii care sună prea robotizate și sterile - fără culoarea ascultată în muzica compusă de oameni. Jeffrey Bilmes, fost student la MIT, care a scris o teză despre computerele care reproduc ritmuri muzicale în 1993, a declarat Invers in noiembrie:

"Când învățați să jucați muzică și învățați să jucați jazz, există un utilitar pentru a înțelege intuitiv ce este vorba despre muzică care o face om", a spus Bilmes. "Oamenii sunt ființe intuitive, iar oamenii de multe ori nu pot descrie modul în care sunt capabili să facă lucrurile umane. M-am simțit la acea vreme că poate am încălcat un jurământ sacru în definirea acestor lucruri pentru programele de calculator ".

Cand Kim facea cercetari pentru deepjazz, a descoperit multe sisteme care genereaza muzica robotica.

"Muzica și arta sunt lucruri pe care le considerăm profund umane", spune Kim. "Pentru ca sunetul să fie mai uman și mai realist, este foarte greu de clasificat." Kim sugerează că generatorii ar putea crea melodii care să fie mai umane, programându-le să pară mai puțin asemănătoare piesei originale.

Alți dezvoltatori au contactat-o ​​pe Kim și sunt interesați să-și extindă profundul, astfel încât mai mulți oameni să interacționeze cu el. Kim poate vedea într-o bună zi un deepjazz care evoluează într-un partener de improvizație, care poate genera în mod artificial un backtrack pentru un muzician de la care să riffă. Chiar mai departe în viitor, el poate vedea aplicații care creează muzică sonoră nouă, similară melodiilor preferate sau care pot sugera noi corzi și progrese pentru muzicieni.

Kim admite că este încă departe de a fi un expert în învățarea profundă, dar experiența sa de a dezvolta adâncime și de formare la stagii și Princeton ia dat o perspectivă valoroasă în domeniu.

„A.I. nu mai este un vis SF. Este ceva foarte real și este ceva care se apropie într-un ritm foarte rapid ", spune Kim. "Sperandu-ne sa vedem ca acest colegiu, care nici macar nu este un elev superior, a fost capabil sa faca ceva intr-un hackathon este incurajator pentru alti studenti care se lupta sa intre in stiinta calculatoarelor".