Quote Attribution and Character Networks in Novels
Přiřazování mluvčích a vztahy mezi postavami v knihách
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/127970Identifiers
Study Information System: 235073
Collections
- Kvalifikační práce [10926]
Author
Advisor
Referee
Kyjánek, Lukáš
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Computer Science
Department
Institute of Formal and Applied Linguistics
Date of defense
2. 7. 2021
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
síť vztahů|NLP|přiřazování mluvčíchKeywords (English)
character networks|NLP|quote attributionTato práce se zaměřuje na extrakci informací z literárních děl, s použitím nástrojů pro jazykovou analýzu. Naším cílem je automaticky extrahovat síť konverzací mezi postavami v knize. Práci jsme rozdělili do tří podproblémů, které řešíme samostatně: extrakce postav, přiřazování mluvčích a tvorba sítě. Výsledkem je end-to-end nástroj, který z anglického textu knihy na vstupu vytvoří vizuální reprezentaci sítě mezi postavami. Naše práce je založena na existující literatuře. Pro každou ze tří částí prezentuje nové myšlenky a porovnává přesnost různých metod. 1
This thesis focuses on extracting information from literary works using tools for language analysis. Our goal is to automatically extract a conversational network of the characters in a novel. We divide the work into three subproblems and solve them separately: Character Extraction, Quote Attribution and Network Creation. The result is an end-to-end tool that gets a text of a novel in English and outputs a visual representation of the character network. Our work is based on existing literature. It presents new ideas and compares the accuracy of various methods for each subproblem. 1