Vývoj anotačního nástroje pro Universal Dependencies
Development of an Annotation Tool for Universal Dependencies
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/108320Identifikátory
SIS: 205108
Kolekce
- Kvalifikační práce [10932]
Autor
Vedoucí práce
Oponent práce
Mírovský, Jiří
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové a datové inženýrství
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
27. 6. 2019
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
anotace, morfologie, syntaktické závislostiKlíčová slova (anglicky)
annotation, morphology, syntactic dependenciesÚčelem práce bylo vyvinout uživatelsky příjemný nástroj pro rozbor věty. Jedná o aplikaci, v níž má uživatel možnost editovat lingvisticky anotovaná data, konkrétně texty anotované podle pravidel Universal Dependencies. Aplikace umí pracovat s formátem souboru CoNLL- U, lze tedy takový soubor načíst a později do něj úpravy uložit. Vizualizace přehledně a srozumitelně zachycuje strukturu a ostatní anotace věty, které lze jednoduchým způsobem editovat. Nástroj také podporuje vyhledávání v souboru na základě části věty či hodnot atributů slova. Cílem práce bylo zamyslet se nad možnostmi, jak data tohoto druhu nejlépe vizualizovat a upravovat.
The purpose of the work was to develop a user-friendly tool for sentence analysis. It is an application in which the user has the possibility to edit linguistically annotated data, specifically texts annotated according to the Universal Dependencies rules. The application works with the CoNLL-U file format, so you can load such a file and save it later. Visualization clearly and comprehensibly captures the structure and other annotations of a sentence that can be easily edited. The tool also supports file search based on the sentence or word attribute values. The aim of this work was to think about the possibilities how to visualize and modify the data of this kind.