Computational analysis and synthesis of song lyrics
Automatická analýza a syntéza písňových textů
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/147665Identifiers
Study Information System: 227817
Collections
- Kvalifikační práce [11322]
Author
Advisor
Referee
Rosa, Rudolf
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Artificial Intelligence
Department
Institute of Formal and Applied Linguistics
Date of defense
2. 9. 2021
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Very good
Keywords (Czech)
texty písní|automatická evaluce|detekce rýmů|generování textů|GPT-2Keywords (English)
song lyrics|automatic evaluation|rhyme detection|lyrics generation|GPT-2V této práci zkoumáme datovou sadu téměř půl milionu anglických textů písní třemi způsoby - automatickým vyhodnocováním, vizualizací a generováním. Vytváříme vlastní detektor rýmů pomocí EM algoritmu s několika vylepšeními a nastavitelnými parametry. Tento algoritmus může v některých případech nahradit lidské hodnotitele, které nelze použít k vyhodnocení zlepšení generátoru textů po každé jeho modifikaci. Vytvořením vizualizace výsledků na webové stránce s maticovým vyznačením rýmů zpřístupníme naše hodnocení veřejnosti. Diskutujeme o zajímavých rozdílech mezi hudebními žánry, které odhalilo automatické vyhodnocení celého souboru dat naším evaluátorem. Nakonec zkoumáme generování textů pomocí state-of-the-art algoritmu GPT-2.
We explore a dataset of almost half a million English song lyrics through three different processes - automatic evaluation, visualization, and generation. We create our own rhyme detector, using the EM algorithm with several improvements and adjustable parameters. This may, in some cases, replace human evaluators that cannot be used, for example, after each iteration of the lyrics generator to evaluate its improvement. By creating a web-page visualization of the results with interesting matrix rhyme highlighting, we make our evaluation accessible to the public. We discuss interesting genre differences discovered by applying our automatic evaluation on the entire dataset. Finally, we explore lyrics generation using state-of-the-art GPT-2.