Konfigurovatelné vyhledávání entit
Configurable Entity Extraction
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/11818Identifikátory
SIS: 43036
Kolekce
- Kvalifikační práce [10678]
Autor
Vedoucí práce
Oponent práce
Kopecký, Michal
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Programování
Katedra / ústav / klinika
Katedra teoretické informatiky a matematické logiky
Datum obhajoby
31. 1. 2008
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Velmi dobře
Predložená bakalárská práce se zabývá úlohou extrakce informací. Predmetem práce je implementace systému pro extrakci informací, který bude zameren na ceské texty. Vytvorený systém nejprve na základe tréninkových príkladu automaticky zkonstruuje množinu extrakcních vzoru. Následne je systém schopen s využitím získaných extrakcních vzoru nalézt relevantní entity v predložených kolekcích textu. Návrh systému umožnuje využít vytvorenou množinu extrakcních vzoru jak pri doménovém vyhledávání, tak i pri vyhledávání bez doménového rozlišení. Práce rovnež obsahuje popis obdobných systému pracujících s anglickými texty.
In the present work we deal with the task of the Information Extraction. The task of this work is to implement a system for Information Extraction working with Czech texts. At first, created system constructs automatically a set of extraction patterns. The construction of this set is based on training examples. Then the system is able to find relevant entities in the present collections of texts. Design of our system enables to use the created set of extraction patterns both for domain searching and for searching without domain specification. This work contains description of similar systems working with English texts.