| dc.contributor.advisor | Vidová Hladká, Barbora | |
| dc.creator | Kríž, Vincent | |
| dc.date.accessioned | 2021-05-20T12:02:41Z | |
| dc.date.available | 2021-05-20T12:02:41Z | |
| dc.date.issued | 2019 | |
| dc.identifier.uri | http://hdl.handle.net/20.500.11956/112190 | |
| dc.description.abstract | Tato dizertační práce se zabývá automatickou extrakcí sémantických vztahů z textů. Jsou zkoumány jak metody strojového učení tak i pravidlový přístup. Pro každý přístup se experimentálně ověřuje vliv různých nástrojů pro zpracování přirozeného jazyka na úspěšnost systému. V práci implementujeme systém RExtractor, a vylepšujeme několik nástrojů pro zpracování přirozeného jazyka: od větné segmentace a tokenizace až ke automatickým syntaktickým parserům. Kromě toho, představujeme Český korpus právních textů s několika vrstvami anotací. Korpus byl použit na trénování a testování všech komponent systému RExtractor. Výsledky a nástroje v předkládané práci byli publikovány jako nové zdroje v projektu Sémantického webu. | cs_CZ |
| dc.description.abstract | We present a strategy to automate the extraction of semantic relations from texts. Both machine learning and rule-based techniques are investigated and the impact of different linguistic knowledge is analyzed for the various approaches. To implement the extraction system RExtractor, several natural language processing tools have been improved: from sentence splitting and tokenization modules to dependency syntax parsers. Furthermore, we created the Czech Legal Text Treebank with several layers of linguistic annotation, which is used to train and test each stage of the proposed system. As a result of the performed work, new Semantic Web resources and tools are available for automatic processing of texts. | en_US |
| dc.language | English | cs_CZ |
| dc.language.iso | en_US | |
| dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
| dc.subject | Information Extraction | en_US |
| dc.subject | Linked Data | en_US |
| dc.subject | Legal Texts | en_US |
| dc.subject | Dependency Treebank | en_US |
| dc.subject | Dependency Parsing | en_US |
| dc.subject | extrakce informací | cs_CZ |
| dc.subject | Linked Data | cs_CZ |
| dc.subject | právní texty | cs_CZ |
| dc.subject | závislostní korpus | cs_CZ |
| dc.subject | závislostní parsing | cs_CZ |
| dc.title | Detecting semantic relations in texts and their integration with external data resources | en_US |
| dc.type | rigorózní práce | cs_CZ |
| dcterms.created | 2019 | |
| dcterms.dateAccepted | 2019-11-11 | |
| dc.description.department | Ústav formální a aplikované lingvistiky | cs_CZ |
| dc.description.department | Institute of Formal and Applied Linguistics | en_US |
| dc.description.faculty | Faculty of Mathematics and Physics | en_US |
| dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
| dc.identifier.repId | 219055 | |
| dc.title.translated | Detekce sémantických vazeb v textech a jejich integrace s externími datovými zdroji | cs_CZ |
| dc.identifier.aleph | 002303234 | |
| thesis.degree.name | RNDr. | |
| thesis.degree.level | rigorózní řízení | cs_CZ |
| thesis.degree.discipline | Computational Linguistics | en_US |
| thesis.degree.discipline | Matematická lingvistika | cs_CZ |
| thesis.degree.program | Computer Science | en_US |
| thesis.degree.program | Informatika | cs_CZ |
| uk.thesis.type | rigorózní práce | cs_CZ |
| uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Ústav formální a aplikované lingvistiky | cs_CZ |
| uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Institute of Formal and Applied Linguistics | en_US |
| uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
| uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
| uk.faculty-abbr.cs | MFF | cs_CZ |
| uk.degree-discipline.cs | Matematická lingvistika | cs_CZ |
| uk.degree-discipline.en | Computational Linguistics | en_US |
| uk.degree-program.cs | Informatika | cs_CZ |
| uk.degree-program.en | Computer Science | en_US |
| thesis.grade.cs | Uznáno | cs_CZ |
| thesis.grade.en | Recognized | en_US |
| uk.abstract.cs | Tato dizertační práce se zabývá automatickou extrakcí sémantických vztahů z textů. Jsou zkoumány jak metody strojového učení tak i pravidlový přístup. Pro každý přístup se experimentálně ověřuje vliv různých nástrojů pro zpracování přirozeného jazyka na úspěšnost systému. V práci implementujeme systém RExtractor, a vylepšujeme několik nástrojů pro zpracování přirozeného jazyka: od větné segmentace a tokenizace až ke automatickým syntaktickým parserům. Kromě toho, představujeme Český korpus právních textů s několika vrstvami anotací. Korpus byl použit na trénování a testování všech komponent systému RExtractor. Výsledky a nástroje v předkládané práci byli publikovány jako nové zdroje v projektu Sémantického webu. | cs_CZ |
| uk.abstract.en | We present a strategy to automate the extraction of semantic relations from texts. Both machine learning and rule-based techniques are investigated and the impact of different linguistic knowledge is analyzed for the various approaches. To implement the extraction system RExtractor, several natural language processing tools have been improved: from sentence splitting and tokenization modules to dependency syntax parsers. Furthermore, we created the Czech Legal Text Treebank with several layers of linguistic annotation, which is used to train and test each stage of the proposed system. As a result of the performed work, new Semantic Web resources and tools are available for automatic processing of texts. | en_US |
| uk.file-availability | V | |
| uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky | cs_CZ |
| thesis.grade.code | U | |
| uk.publication-place | Praha | cs_CZ |
| uk.thesis.defenceStatus | U | |
| dc.identifier.lisID | 990023032340106986 | |