Automatic extraction of the main characters from books and their interactions
Automatická extrakce hlavních postav z knihy a jejich interakcí
bachelor thesis (DEFENDED)
![Document thumbnail](/bitstream/handle/20.500.11956/176000/thumbnail.png?sequence=8&isAllowed=y)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/176000Identifiers
Study Information System: 212007
Collections
- Kvalifikační práce [10862]
Author
Advisor
Referee
Rosa, Rudolf
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Computer Science with specialisation in Artificial Intelligence
Department
Institute of Formal and Applied Linguistics
Date of defense
12. 9. 2022
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
extrakce postav|pojmenované entity|beletrieKeywords (English)
extraction of characters|named entities|fictionCieľom tejto práce bolo automaticky nájsť pomenované postavy v knihách, nájsť všetky ich výskyty a určiť všetky miesta v texte, na ktorých spolu interagovali dve alebo viacero postáv. Jedným z výstupov tejto práce je nástroj na zobrazovanie interaktívnych grafov, na ktorom môžeme vidieť výskyty a interakcie postáv v knihe. Pomocou tohto nástroja môžeme hľadať a analyzovať miesta v texte, na ktorých je výskyt alebo inte- rakcia postáv, keďže grafy sú prepojené s textom knihy. Tiež sme vyhodnotili použité metódy na dátach, ktoré sme predtým nevideli, analyzovali sme chyby a navrhli sme možné vylepšenia, ktoré by mohli byť v budúcnosti preskúmané. 1
The goal of this work is to automatically find named characters in the books, detect all occurrences of these characters and determine places in the text where two or more characters interact together. One of the outputs of this work is the tool for display- ing interactive graphs that show us the occurrences and interactions of the characters throughout the book. We can search and analyze the places of occurrences and inte- ractions using this tool, since the graphs are connected to the text of the book. We also evaluated our methods on the unseen texts, analyzed errors, and proposed improvements that could be explored in future work. 1