Generování českých poetických slok a jejich evaluace
Generation of Czech poetic strophes and their evaluation
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/190611Identifiers
Study Information System: 266468
Collections
- Kvalifikační práce [11242]
Author
Advisor
Consultant
Musil, Tomáš
Referee
Popel, Martin
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Computer Science - Artificial Intelligence
Department
Institute of Formal and Applied Linguistics
Date of defense
10. 6. 2024
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Keywords (Czech)
česká poezie|zpracování přirozeného jazyka|neuronové sítě|automatická evaluaceKeywords (English)
Czech poetry|natural language processing|neural networks|automatic evaluationV současné době jsou velké jazykové modely stále úspěšnější v otevřené doméně a jsou schopny interagovat ve velkém množství úloh. Úlohy a jazyky řidčeji zastoupené v datech, takový úspěch ale nemají. Ještě horší výsledky lze pozorovat u úloh, které jsou zaměřeny na nesémantické aspekty textu. Takovou úlohou je, jak bylo pozorováno, česká poezie. Poezie zahrnuje nestandardní aspekty, jako je fonetika a rýmování, které se obvykle ne- zohledňují. Její následná kombinace s českým jazykem, který není v trénovacích datech výrazně zastoupen, vytváří prostředí pro modely neznámé. Byla proto vyvinuta snaha zavést takový model, který by tuto problematiku českého básnického textu uspokojil. 1
Currently, Large Language Models are increasingly more successfully in open domain, being able to interact in a large number of tasks. But tasks and languages more sparsely represented in data the models where trained on do not enjoy such success. Even worse performance can be observed on tasks that are aimed at non-semantic aspects of text. Czech poetry is observed to be such task, as it involves non-standard aspects like phonetics and rhyming, which are usually not accounted for, in a language that is not common. Effort was therefore done to introduce such a model that could satisfy this problem of Czech poetic text. 1