Statistical machine learning with applications in music
Statistické strojové učení s aplikacemi v hudbě
diploma thesis (NOT DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/107174Identifiers
Study Information System: 205954
Collections
- Kvalifikační práce [11242]
Author
Advisor
Referee
Hlávka, Zdeněk
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Probability, mathematical statistics and econometrics
Department
Department of Probability and Mathematical Statistics
Date of defense
12. 6. 2019
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Fail
Keywords (Czech)
strojové učení, tensor flow, hudební skladba, neuronové sítě s LSTM, hodnocení hudbyKeywords (English)
machine learning, tensor flow, music composition, neural networks with LSTM, evaluation of musicCílem této práce je shrnout současný stav strojového učení pro skládání hudby a natrénovat model na písních od Beatles s využitím výzkumného pro- jektu Magenta od Google Brain týmu k tvorbě vlastní hudby. Abychom mohli provést důkladný rozbor vygenerované hudby, omezili jsme se pouze na mono- fonní melodie Natrénujeme celkem tři různé modely na základě tří různých konfigurací (Basic, Lookback a Attention) a porovnáme vygenerované výsledky. I přes to, že se vygenerovaná hudba původním Beatles příliš nepodobá, je docela líbivá. Podle naší analýzy založené na hudebně informativních metrikách se vygenerované melodie liší od těch původních zejména v délce not a v rozdílech výšky po sobě jdoucích tónů. Vygenerované melodie obsahují kratší noty a větší rozdíly mezi jednotlivými výškami. V teoretickém pozadí se věnujeme nejčastěji používaným algoritmům stro- jového učení, zavádíme neuronové sítě a shrnujeme důležité milníky strojového učení pro generování hudby. 1
The aim of this thesis is to review the current state of machine learning in music composition and to train a computer on Beatles' songs using research project Magenta from the Google Brain Team to produce its own music. In order to explore the qualities of the generated music more thoroughly, we restrict our- selves to monophonic melodies only. We train three deep learning models with three different configurations (Basic, Lookback, and Attention) and compare generated results. Even though the generated music is not as interesting as the original Beatles, it is quite likable. According to our analysis based on musically informed metrics, generated melodies differ from the original ones especially in lengths of notes and in pitch differences between consecutive notes. Generated melodies tend to use shorter notes and higher pitch differences. In theoretical background, we cover the most commonly used machine learning algorithms, introduce neural networks and review related work of music generation. 1