Computational analysis and synthesis of song lyrics
Automatická analýza a syntéza písňových textů
diplomová práce (OBHÁJENO)

Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/147665Identifikátory
SIS: 227817
Kolekce
- Kvalifikační práce [10066]
Autor
Vedoucí práce
Oponent práce
Rosa, Rudolf
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Umělá inteligence
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
2. 9. 2021
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Velmi dobře
Klíčová slova (česky)
texty písní|automatická evaluce|detekce rýmů|generování textů|GPT-2Klíčová slova (anglicky)
song lyrics|automatic evaluation|rhyme detection|lyrics generation|GPT-2V této práci zkoumáme datovou sadu téměř půl milionu anglických textů písní třemi způsoby - automatickým vyhodnocováním, vizualizací a generováním. Vytváříme vlastní detektor rýmů pomocí EM algoritmu s několika vylepšeními a nastavitelnými parametry. Tento algoritmus může v některých případech nahradit lidské hodnotitele, které nelze použít k vyhodnocení zlepšení generátoru textů po každé jeho modifikaci. Vytvořením vizualizace výsledků na webové stránce s maticovým vyznačením rýmů zpřístupníme naše hodnocení veřejnosti. Diskutujeme o zajímavých rozdílech mezi hudebními žánry, které odhalilo automatické vyhodnocení celého souboru dat naším evaluátorem. Nakonec zkoumáme generování textů pomocí state-of-the-art algoritmu GPT-2.
We explore a dataset of almost half a million English song lyrics through three different processes - automatic evaluation, visualization, and generation. We create our own rhyme detector, using the EM algorithm with several improvements and adjustable parameters. This may, in some cases, replace human evaluators that cannot be used, for example, after each iteration of the lyrics generator to evaluate its improvement. By creating a web-page visualization of the results with interesting matrix rhyme highlighting, we make our evaluation accessible to the public. We discuss interesting genre differences discovered by applying our automatic evaluation on the entire dataset. Finally, we explore lyrics generation using state-of-the-art GPT-2.