Statistical machine learning with applications in music

Janásková, Eliška

Statistické strojové učení s aplikacemi v hudbě

diplomová práce (NEOBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (153.1Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/107174

Identifikátory

SIS: 205954

Oponent práce

Hlávka, Zdeněk

Fakulta / součást

Matematicko-fyzikální fakulta

Obor

Pravděpodobnost, matematická statistika a ekonometrie

Katedra / ústav / klinika

Katedra pravděpodobnosti a matematické statistiky

Datum obhajoby

12. 6. 2019

Nakladatel

Univerzita Karlova, Matematicko-fyzikální fakulta

Jazyk

Angličtina

Známka

Neprospěl/a

Klíčová slova (česky)

strojové učení, tensor flow, hudební skladba, neuronové sítě s LSTM, hodnocení hudby

Klíčová slova (anglicky)

machine learning, tensor flow, music composition, neural networks with LSTM, evaluation of music

Cílem této práce je shrnout současný stav strojového učení pro skládání hudby a natrénovat model na písních od Beatles s využitím výzkumného pro- jektu Magenta od Google Brain týmu k tvorbě vlastní hudby. Abychom mohli provést důkladný rozbor vygenerované hudby, omezili jsme se pouze na mono- fonní melodie Natrénujeme celkem tři různé modely na základě tří různých konfigurací (Basic, Lookback a Attention) a porovnáme vygenerované výsledky. I přes to, že se vygenerovaná hudba původním Beatles příliš nepodobá, je docela líbivá. Podle naší analýzy založené na hudebně informativních metrikách se vygenerované melodie liší od těch původních zejména v délce not a v rozdílech výšky po sobě jdoucích tónů. Vygenerované melodie obsahují kratší noty a větší rozdíly mezi jednotlivými výškami. V teoretickém pozadí se věnujeme nejčastěji používaným algoritmům stro- jového učení, zavádíme neuronové sítě a shrnujeme důležité milníky strojového učení pro generování hudby. 1

Abstrakt (anglicky)

The aim of this thesis is to review the current state of machine learning in music composition and to train a computer on Beatles' songs using research project Magenta from the Google Brain Team to produce its own music. In order to explore the qualities of the generated music more thoroughly, we restrict our- selves to monophonic melodies only. We train three deep learning models with three different configurations (Basic, Lookback, and Attention) and compare generated results. Even though the generated music is not as interesting as the original Beatles, it is quite likable. According to our analysis based on musically informed metrics, generated melodies differ from the original ones especially in lengths of notes and in pitch differences between consecutive notes. Generated melodies tend to use shorter notes and higher pitch differences. In theoretical background, we cover the most commonly used machine learning algorithms, introduce neural networks and review related work of music generation. 1

Citace dokumentu

Metadata

Zobrazit celý záznam