dc.contributor.advisor | Novák, Michal | |
dc.creator | Faryad, Ján | |
dc.date.accessioned | 2018-09-25T08:25:43Z | |
dc.date.available | 2018-09-25T08:25:43Z | |
dc.date.issued | 2018 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/100911 | |
dc.description.abstract | Title: Coreference resolution for Universal Dependencies Author: Ján Faryad Department: Institute of Formal and Applied Linguistics Supervisor: Mgr. Michal Novák Abstract: Coreference is an important tool for maintaining of the text coherence. Up to now, there has been no possibility to mark it in Universal Dependencies (UD), which is a project for universal description of morphology and dependency syntax. This work presents a way how to mark coreference in the UD project. It also includes a conversion of data with coreference annotation from the corpora PDT 3.0 and OntoNotes 5.0 with using a tool UDPipe for an automatic analysis of text in the UD style. This work is also aimed to implement a system for automatic resolution of pronoun coreference using machine learning. Finally, the quality of the system is evaluated by simple way. The design of the program emphasizes the language independence and compatibility with the Udapi interface, which is used for processing of the UD data. Keywords: coreference resolution, coreference, anaphora, Universal Dependencies, UD | en_US |
dc.description.abstract | Název práce: Rozpoznávání koreference pro Universal Dependencies Autor: Ján Faryad Ústav: Ústav formální a aplikované lingvistiky Vedoucí bakalářské práce: Mgr. Michal Novák Abstrakt: Koreference je důležitým prostředkem pro udržení soudržnosti textu. V univerzálním popisu morfologie a závislostní syntaxe Universal Dependencies (UD) však dosud chyběla možnost jejího vyznačení. Práce představuje způsob, jak koreferenci v projektu UD značit. Součástí práce je i převod dat s anotací koreference z korpusů PDT 3.0 a OntoNotes 5.0 za pomoci nástroje UDPipe pro automatickou analýzu textu ve stylu UD. Práce se dále zabývá implementací systému pro automatické rozpoznávání koreference zájmen pomocí strojového učení. Nakonec je jednoduchým způsobem vyhodnocena úspěšnost systému. Při návrhu programu je kladen důraz na jazykovou nezávislost a kompatibilitu s rozhraním Udapi používaným pro práci s UD. Klíčová slova: rozpoznávání koreference, koreference, anafora, Universal Dependencies, UD | cs_CZ |
dc.language | Čeština | cs_CZ |
dc.language.iso | cs_CZ | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | coreference resolution | en_US |
dc.subject | coreference | en_US |
dc.subject | anaphora | en_US |
dc.subject | Universal Dependencies | en_US |
dc.subject | UD | en_US |
dc.subject | rozpoznávání koreference | cs_CZ |
dc.subject | koreference | cs_CZ |
dc.subject | anafora | cs_CZ |
dc.subject | Universal Dependencies | cs_CZ |
dc.subject | UD | cs_CZ |
dc.title | Rozpoznávání koreference pro Universal Dependencies | cs_CZ |
dc.type | bakalářská práce | cs_CZ |
dcterms.created | 2018 | |
dcterms.dateAccepted | 2018-06-22 | |
dc.description.department | Institute of Formal and Applied Linguistics | en_US |
dc.description.department | Ústav formální a aplikované lingvistiky | cs_CZ |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.identifier.repId | 192305 | |
dc.title.translated | Coreference resolution for Universal Dependencies | en_US |
dc.contributor.referee | Rosa, Rudolf | |
thesis.degree.name | Bc. | |
thesis.degree.level | bakalářské | cs_CZ |
thesis.degree.discipline | General Computer Science | en_US |
thesis.degree.discipline | Obecná informatika | cs_CZ |
thesis.degree.program | Computer Science | en_US |
thesis.degree.program | Informatika | cs_CZ |
uk.thesis.type | bakalářská práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Ústav formální a aplikované lingvistiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Institute of Formal and Applied Linguistics | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Obecná informatika | cs_CZ |
uk.degree-discipline.en | General Computer Science | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Computer Science | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Název práce: Rozpoznávání koreference pro Universal Dependencies Autor: Ján Faryad Ústav: Ústav formální a aplikované lingvistiky Vedoucí bakalářské práce: Mgr. Michal Novák Abstrakt: Koreference je důležitým prostředkem pro udržení soudržnosti textu. V univerzálním popisu morfologie a závislostní syntaxe Universal Dependencies (UD) však dosud chyběla možnost jejího vyznačení. Práce představuje způsob, jak koreferenci v projektu UD značit. Součástí práce je i převod dat s anotací koreference z korpusů PDT 3.0 a OntoNotes 5.0 za pomoci nástroje UDPipe pro automatickou analýzu textu ve stylu UD. Práce se dále zabývá implementací systému pro automatické rozpoznávání koreference zájmen pomocí strojového učení. Nakonec je jednoduchým způsobem vyhodnocena úspěšnost systému. Při návrhu programu je kladen důraz na jazykovou nezávislost a kompatibilitu s rozhraním Udapi používaným pro práci s UD. Klíčová slova: rozpoznávání koreference, koreference, anafora, Universal Dependencies, UD | cs_CZ |
uk.abstract.en | Title: Coreference resolution for Universal Dependencies Author: Ján Faryad Department: Institute of Formal and Applied Linguistics Supervisor: Mgr. Michal Novák Abstract: Coreference is an important tool for maintaining of the text coherence. Up to now, there has been no possibility to mark it in Universal Dependencies (UD), which is a project for universal description of morphology and dependency syntax. This work presents a way how to mark coreference in the UD project. It also includes a conversion of data with coreference annotation from the corpora PDT 3.0 and OntoNotes 5.0 with using a tool UDPipe for an automatic analysis of text in the UD style. This work is also aimed to implement a system for automatic resolution of pronoun coreference using machine learning. Finally, the quality of the system is evaluated by simple way. The design of the program emphasizes the language independence and compatibility with the Udapi interface, which is used for processing of the UD data. Keywords: coreference resolution, coreference, anaphora, Universal Dependencies, UD | en_US |
uk.file-availability | V | |
uk.publication.place | Praha | cs_CZ |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky | cs_CZ |
thesis.grade.code | 1 | |