Entity Relationship Extraction
Extrakce vztahů mezi entitami
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/121031Identifiers
Study Information System: 223143
Collections
- Kvalifikační práce [11325]
Author
Advisor
Referee
Straňák, Pavel
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Artificial Intelligence
Department
Institute of Formal and Applied Linguistics
Date of defense
14. 9. 2020
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
entity, pojmenované entity, vztahy mezi entitami, extrakce vztahů mezi entitami, čeština, BERTKeywords (English)
entities, named entities, entity relationship, entity relationship extraction, Czech, BERTÚkol hledání sémantických vztahů mezi entitami na základě předloženého textu oz- načujeme jako extrakci vztahů (relationship extraction). Metodou distant supervision, která spočívá ve spojení báze znalostí (Wikidata) a korpusu (české Wikipedie), jsme vytvořili Český dataset pro extrakci vztahů (CERED). Použitou metodiku a problémy, na které jsme narazili, důkladně rozebíráme. CERED využíváme při tréninku neuronové sítě pro extrakci vztahů. Základem této sítě je BERT - lingvistický model předtrénovaný na velkém množství prostého textu. Navržený model vyhodnocujeme na anglických dat- ech (Semeval 2010 Task 8, TACRED) a porovnáváme jeho kvalitu s ostatními výsledky v oblasti extrakce vztahů. Přikládáme i výsledky naměřené na CEREDu. 1
Relationship extraction is the task of extracting semantic relationships between en- tities from a text. We create a Czech Relationship Extraction Dataset (CERED) using distant supervision on Wikidata and Czech Wikipedia. We detail the methodology we used and the pitfalls we encountered. Then we use CERED to fine-tune a neural network model for relationship extraction. We base our model on BERT - a linguistic model pre-trained on extensive unlabeled data. We demonstrate that our model performs well on existing English relationship datasets (Semeval 2010 Task 8, TACRED) and report the results we achieved on CERED. 1
Citace dokumentu
Metadata
Show full item recordRelated items
Showing items related by title, author, creator and subject.
-
Named Entity Recognition and Linking
Defence status: DEFENDEDTaufer, Pavel (Univerzita Karlova, Matematicko-fyzikální fakulta, 2017)Date of defense: 1. 2. 2017Cílem této diplomové práce je navrhnout a naimplementovat algoritmus pro rozpoznávání a propojování pojmenovaných entit. Součástí tohoto cíle je také navrhnutí a vytvoření báze znalostí, která je v algoritmu použita. ... -
Fikční jména, fikční entity a role předstírání: chvála abstinence
Koťátko, Petr (Univerzita Karlova v Praze, Filozofická fakulta, 2016) -
České a francouzské koncernové právo
Defence status: DEFENDEDDitrych, Tomáš (Univerzita Karlova, Právnická fakulta, 2016)Date of defense: 27. 9. 2016Předkládaná disertační práce na téma "České a francouzské koncernové právo" analyzuje francouzskou právní úpravu skupin společností a rozhodovací praxi francouzských soudů, která vytvořila tzv. Rozenblumův koncept - sadu ...