Statistical machine learning with applications in music
Statistické strojové učení s aplikacemi v hudbě
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/116651Identifikátory
SIS: 214630
Kolekce
- Kvalifikační práce [10678]
Autor
Vedoucí práce
Oponent práce
Hlávka, Zdeněk
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Pravděpodobnost, matematická statistika a ekonometrie
Katedra / ústav / klinika
Katedra pravděpodobnosti a matematické statistiky
Datum obhajoby
4. 2. 2020
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Velmi dobře
Klíčová slova (česky)
strojové učení, tensor flow, hudební skladba, neuronové sítě s LSTM, hodnocení hudbyKlíčová slova (anglicky)
machine learning, tensor flow, music composition, neural networks with LSTM, evaluation of musicCílem této práce je vytvořit strojově generovanou hudbu na základě písní od Beatles s využitím výzkumného projektu Magenta od týmu Google Brain, odvodit vzorce pro backpropagaci v rekurentní neuronové síti s LSTM buňkami, kterou Magenta využívá, přiblížit techniky strojového učení a srovnat je s metodami matematické statistiky. Pro podrobnější rozbor uměle vytvořených skladeb se omezíme pouze na monofonní melodie. Natrénujeme tři modely hlubokého učení se třemi různými konfiguracemi (Basic, Lookback, and Atten- tion) a porovnáme jednotlivé výsledky. I přes to, že uměle vytvořené skladby nejsou tak poutavé jako původní Beatles, jsou docela líbivé. Na základě analýzy založené na hudebně informačních metrikách se uměle vygenerované melodie liší od těch originálních zejména v délce not a rozdílech výšek mezi po sobě jdoucími notami. Umělé vytvořené melodie používají kratší noty a rozdíly ve výškách po sobě jdoucích not jsou větší. 1
The aim of this thesis is to train a computer on Beatles' songs using the re- search project Magenta from the Google Brain Team to produce its own music, to derive backpropagation formulas for recurrent neural networks with LSTM cells used in the Magenta music composing model, to overview machine learning techniques and discuss its similarities with methods of mathematical statistics. In order to explore the qualities of the artificially composed music more thor- oughly, we restrict ourselves to monophonic melodies only. We train three deep learning models with three different configurations (Basic, Lookback, and At- tention) and compare generated results. Even though the artificially composed music is not as interesting as the original Beatles, it is quite likeable. According to our analysis based on musically informed metrics, artificial melodies differ from the original ones especially in lengths of notes and in pitch differences be- tween consecutive notes. The artificially composed melodies tend to use shorter notes and higher pitch differences. 1