Automatic extraction of the main characters from books and their interactions

Brezinová, Viktória

Automatická extrakce hlavních postav z knihy a jejich interakcí

bakalářská práce (OBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (347.5Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/176000

Identifikátory

SIS: 212007

Oponent práce

Rosa, Rudolf

Fakulta / součást

Matematicko-fyzikální fakulta

Obor

Informatika se specializací Umělá inteligence

Katedra / ústav / klinika

Ústav formální a aplikované lingvistiky

Datum obhajoby

12. 9. 2022

Nakladatel

Univerzita Karlova, Matematicko-fyzikální fakulta

Jazyk

Angličtina

Známka

Výborně

Klíčová slova (česky)

extrakce postav|pojmenované entity|beletrie

Klíčová slova (anglicky)

extraction of characters|named entities|fiction

Cieľom tejto práce bolo automaticky nájsť pomenované postavy v knihách, nájsť všetky ich výskyty a určiť všetky miesta v texte, na ktorých spolu interagovali dve alebo viacero postáv. Jedným z výstupov tejto práce je nástroj na zobrazovanie interaktívnych grafov, na ktorom môžeme vidieť výskyty a interakcie postáv v knihe. Pomocou tohto nástroja môžeme hľadať a analyzovať miesta v texte, na ktorých je výskyt alebo inte- rakcia postáv, keďže grafy sú prepojené s textom knihy. Tiež sme vyhodnotili použité metódy na dátach, ktoré sme predtým nevideli, analyzovali sme chyby a navrhli sme možné vylepšenia, ktoré by mohli byť v budúcnosti preskúmané. 1

Abstrakt (anglicky)

The goal of this work is to automatically find named characters in the books, detect all occurrences of these characters and determine places in the text where two or more characters interact together. One of the outputs of this work is the tool for display- ing interactive graphs that show us the occurrences and interactions of the characters throughout the book. We can search and analyze the places of occurrences and inte- ractions using this tool, since the graphs are connected to the text of the book. We also evaluated our methods on the unseen texts, analyzed errors, and proposed improvements that could be explored in future work. 1

Citace dokumentu

Metadata

Zobrazit celý záznam