Named Entity Recognition and Linking
Rozpoznávání a propojování pojmenovaných entit
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/82789Identifikátory
SIS: 176335
Katalog UK: 990021252450106986
Kolekce
- Kvalifikační práce [11978]
Autor
Vedoucí práce
Oponent práce
Kliegr, Tomáš
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Umělá inteligence
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
1. 2. 2017
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
pojmenované entity, rozpoznávání pojmenovaných entit, propojování pojmenovaných entitKlíčová slova (anglicky)
named entities, named entity recognition, named entity linkingCílem této diplomové práce je navrhnout a naimplementovat algoritmus pro rozpoznávání a propojování pojmenovaných entit. Součástí tohoto cíle je také navrhnutí a vytvoření báze znalostí, která je v algoritmu použita. Vzhledem k omezenému množství dat pro jiné jazyky než pro angličtinu chceme, aby naši metodu bylo možné natrénovat na jednom jazyku a naučené parametry přenést na jiné jazyky (ve kterých není tolik trénovacích dat). Práce se skládá z popisu dostupných bází znalostí, existujicích metod, navrhnutí a implementace vlastní báze znalostí a metody pro propojování pojmenovaných entit. Na několika variantách tradičního datasetu AIDA CoNLL-YAGO dosahuje implementovaný algoritmus nejlepších známých výsledků. Na vzorku českých anotovaných dat z datasetu PDT dosahuje algoritmus pomocí parametrů natrénovaných na anglickém CoNLL datasetu srovnatelných výsledků. Powered by TCPDF (www.tcpdf.org)
The goal of this master thesis is to design and implement a named entity recognition and linking algorithm. A part of this goal is to propose and create a knowledge base that will be used in the algorithm. Because of the limited amount of data for languages other than English, we want to be able to train our method on one language, and then transfer the learned parameters to other languages (that do not have enough training data). The thesis consists of description of available knowledge bases, existing methods and design and implementation of our own knowledge base and entity linking method. Our method achieves state of the art result on a few variants of the AIDA CoNLL-YAGO dataset. The method also obtains comparable results on a sample of Czech annotated data from the PDT dataset using the parameters trained on the English CoNLL dataset. Powered by TCPDF (www.tcpdf.org)
Citace dokumentu
Metadata
Zobrazit celý záznamSouvisející záznamy
Zobrazují se záznamy příbuzné na základě názvu, autora a předmětu.
-
Entity Relationship Extraction
Výsledek obhajoby: OBHÁJENOŠimečková, Zuzana (Univerzita Karlova, Matematicko-fyzikální fakulta, 2020)Datum obhajoby: 14. 9. 2020Úkol hledání sémantických vztahů mezi entitami na základě předloženého textu oz- načujeme jako extrakci vztahů (relationship extraction). Metodou distant supervision, která spočívá ve spojení báze znalostí (Wikidata) a ... -
Fikční jména, fikční entity a role předstírání: chvála abstinence
Koťátko, Petr (Univerzita Karlova v Praze, Filozofická fakulta, 2016) -
České a francouzské koncernové právo
Výsledek obhajoby: OBHÁJENODitrych, Tomáš (Univerzita Karlova, Právnická fakulta, 2016)Datum obhajoby: 27. 9. 2016Předkládaná disertační práce na téma "České a francouzské koncernové právo" analyzuje francouzskou právní úpravu skupin společností a rozhodovací praxi francouzských soudů, která vytvořila tzv. Rozenblumův koncept - sadu ...
