Statistical machine learning with applications in music
Statistické strojové učení s aplikacemi v hudbě
diplomová práce (NEOBHÁJENO)

Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/107174Identifikátory
SIS: 205954
Kolekce
- Kvalifikační práce [10357]
Autor
Vedoucí práce
Oponent práce
Hlávka, Zdeněk
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Pravděpodobnost, matematická statistika a ekonometrie
Katedra / ústav / klinika
Katedra pravděpodobnosti a matematické statistiky
Datum obhajoby
12. 6. 2019
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Neprospěl/a
Klíčová slova (česky)
strojové učení, tensor flow, hudební skladba, neuronové sítě s LSTM, hodnocení hudbyKlíčová slova (anglicky)
machine learning, tensor flow, music composition, neural networks with LSTM, evaluation of musicCílem této práce je shrnout současný stav strojového učení pro skládání hudby a natrénovat model na písních od Beatles s využitím výzkumného pro- jektu Magenta od Google Brain týmu k tvorbě vlastní hudby. Abychom mohli provést důkladný rozbor vygenerované hudby, omezili jsme se pouze na mono- fonní melodie Natrénujeme celkem tři různé modely na základě tří různých konfigurací (Basic, Lookback a Attention) a porovnáme vygenerované výsledky. I přes to, že se vygenerovaná hudba původním Beatles příliš nepodobá, je docela líbivá. Podle naší analýzy založené na hudebně informativních metrikách se vygenerované melodie liší od těch původních zejména v délce not a v rozdílech výšky po sobě jdoucích tónů. Vygenerované melodie obsahují kratší noty a větší rozdíly mezi jednotlivými výškami. V teoretickém pozadí se věnujeme nejčastěji používaným algoritmům stro- jového učení, zavádíme neuronové sítě a shrnujeme důležité milníky strojového učení pro generování hudby. 1
The aim of this thesis is to review the current state of machine learning in music composition and to train a computer on Beatles' songs using research project Magenta from the Google Brain Team to produce its own music. In order to explore the qualities of the generated music more thoroughly, we restrict our- selves to monophonic melodies only. We train three deep learning models with three different configurations (Basic, Lookback, and Attention) and compare generated results. Even though the generated music is not as interesting as the original Beatles, it is quite likable. According to our analysis based on musically informed metrics, generated melodies differ from the original ones especially in lengths of notes and in pitch differences between consecutive notes. Generated melodies tend to use shorter notes and higher pitch differences. In theoretical background, we cover the most commonly used machine learning algorithms, introduce neural networks and review related work of music generation. 1