Entity Relationship Extraction
Extrakce vztahů mezi entitami
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/121031Identifikátory
SIS: 223143
Kolekce
- Kvalifikační práce [10690]
Autor
Vedoucí práce
Oponent práce
Straňák, Pavel
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Umělá inteligence
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
14. 9. 2020
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
entity, pojmenované entity, vztahy mezi entitami, extrakce vztahů mezi entitami, čeština, BERTKlíčová slova (anglicky)
entities, named entities, entity relationship, entity relationship extraction, Czech, BERTÚkol hledání sémantických vztahů mezi entitami na základě předloženého textu oz- načujeme jako extrakci vztahů (relationship extraction). Metodou distant supervision, která spočívá ve spojení báze znalostí (Wikidata) a korpusu (české Wikipedie), jsme vytvořili Český dataset pro extrakci vztahů (CERED). Použitou metodiku a problémy, na které jsme narazili, důkladně rozebíráme. CERED využíváme při tréninku neuronové sítě pro extrakci vztahů. Základem této sítě je BERT - lingvistický model předtrénovaný na velkém množství prostého textu. Navržený model vyhodnocujeme na anglických dat- ech (Semeval 2010 Task 8, TACRED) a porovnáváme jeho kvalitu s ostatními výsledky v oblasti extrakce vztahů. Přikládáme i výsledky naměřené na CEREDu. 1
Relationship extraction is the task of extracting semantic relationships between en- tities from a text. We create a Czech Relationship Extraction Dataset (CERED) using distant supervision on Wikidata and Czech Wikipedia. We detail the methodology we used and the pitfalls we encountered. Then we use CERED to fine-tune a neural network model for relationship extraction. We base our model on BERT - a linguistic model pre-trained on extensive unlabeled data. We demonstrate that our model performs well on existing English relationship datasets (Semeval 2010 Task 8, TACRED) and report the results we achieved on CERED. 1
Citace dokumentu
Metadata
Zobrazit celý záznamSouvisející záznamy
Zobrazují se záznamy příbuzné na základě názvu, autora a předmětu.
-
Fikční jména, fikční entity a role předstírání: chvála abstinence
Koťátko, Petr (Univerzita Karlova v Praze, Filozofická fakulta, 2016) -
Named Entity Recognition and Linking
Výsledek obhajoby: OBHÁJENOTaufer, Pavel (Univerzita Karlova, Matematicko-fyzikální fakulta, 2017)Datum obhajoby: 1. 2. 2017Cílem této diplomové práce je navrhnout a naimplementovat algoritmus pro rozpoznávání a propojování pojmenovaných entit. Součástí tohoto cíle je také navrhnutí a vytvoření báze znalostí, která je v algoritmu použita. ... -
České a francouzské koncernové právo
Výsledek obhajoby: OBHÁJENODitrych, Tomáš (Univerzita Karlova, Právnická fakulta, 2016)Datum obhajoby: 27. 9. 2016Předkládaná disertační práce na téma "České a francouzské koncernové právo" analyzuje francouzskou právní úpravu skupin společností a rozhodovací praxi francouzských soudů, která vytvořila tzv. Rozenblumův koncept - sadu ...