Dependency Parsing beyond Simple Trees
Závislostní syntaktická analýza nad rámec jednoduchých stromů
dizertační práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/204872Identifikátory
SIS: 110717
Kolekce
- Kvalifikační práce [11978]
Autor
Vedoucí práce
Oponent práce
Pagano, Adriana Silvina
Candito, Marie
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Matematická lingvistika
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
22. 9. 2025
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Prospěl/a
Klíčová slova (česky)
Universal Dependencies|Ellipsa|Augmentace dat|Hluboké syntaktické vztahy|Deep Universal Dependencies|Univerzální sémantické role|Překlad anotačních schématKlíčová slova (anglicky)
Universal Dependencies|Ellipsis|Data augmentation|Deep syntactic relations|Deep Universal Dependencies|Universal semantic roles|Cross-framework mappingUniversal Dependencies ("univerzální závislosti"; UD) se staly široce přijímaným rám- cem a de facto standardem pro mezijazykovou anotaci. Přesto však zůstávají omezené ve schopnosti zachytit hlubší sémantické struktury. Tato disertace si klade za cíl obohatit UD začleněním hlubších syntaktických a sémantických vrstev a tím zaplnit mezeru mezi povrchovou syntaxí a významem. Na úvod disertace představuje pozadí UD a motivuje potřebu jednotnějších hlubších anotací napříč jazyky. Jako výchozí bod se práce zaměřuje na elipsu, konkrétně na gapping, tedy případy, kdy jsou vynechány predikáty. Vytvářením poloumělých treebanků UD a aplikací metod samoučení a trojitého učení práce zvyšuje výkon parserů na eliptických strukturách a přináší cenné vícejazyčné datasety pro budoucí výzkum. Dalším krokem k prohloubení UD je představení prototypu hluboké vrstvy UD (Deep UD), která automaticky odvozuje normalizované struktury predikátů a argumentů z povrchových stromů UD. Tento přístup rozšiřuje stávající anotaci UD tím, že vytváří grafy 'Enhanced UD' pro treebanky, které je postrádají, a k nim dále přidává normalizo- vané struktury predikátů a argumentů škálovatelným a vícejazyčným způsobem - včetně jazyků s nedostatečnými zdroji. V poslední části práce navrhuje jednotnou taxonomii hloubkových syntaktických relací, která...
Universal Dependencies (UD) has become a widely adopted framework, the de-facto standard, for cross-linguistic annotation. Yet, it remains limited in capturing deeper se- mantic structures. This dissertation aims to enrich UD by incorporating deeper syntactic and semantic layers, addressing the gap between surface syntax and meaning. To begin, the dissertation outlines UD's background and motivates the need for more uniform deep annotations across languages. As a starting point, it explores and analyses ellipsis, focusing on gapping, where predicates are omitted. By constructing semi-artificial UD treebanks and applying self- training and tri-training methods, this work enhances parser performance on elliptical structures and contributes valuable multilingual datasets for future research. A further step toward deepening UD is introducing a prototype Deep UD layer, which automatically derives normalized predicate-argument structures from surface UD trees. This approach extends UD's existing annotation by producing Enhanced UD graphs for treebanks that lack them, and then adding normalized predicate-argument structures on top in a scalable and multilingual manner, ensuring coverage even for resource-poor languages. Going even further, the work proposes a unified taxonomy of deep syntactic relations,...
Citace dokumentu
Metadata
Zobrazit celý záznamSouvisející záznamy
Zobrazují se záznamy příbuzné na základě názvu, autora a předmětu.
-
Syntaktická analýza textů se střídáním kódů
Výsledek obhajoby: OBHÁJENORavishankar, Vinit (Univerzita Karlova, Matematicko-fyzikální fakulta, 2018)Datum obhajoby: 11. 9. 2018Vinit Ravishankar Červenec 2018 Tato diplomová práce si klade dva cíle. Za prvé, snažíme se zkonstruovat závislostní syntaktický analyzátor (parser), který lze aplikovat na korpusy se střídáním kódů, přestože byl natrénován ... -
Extrakce vícejazyčných valenčních rámců ze závislostních korpusů
Výsledek obhajoby: OBHÁJENOFaryad, Ján (Univerzita Karlova, Matematicko-fyzikální fakulta, 2024)Datum obhajoby: 6. 2. 2024Multilingual valency dictionaries provide helpful information about correspon- dence of valency frames (verbs and their arguments) across various languages. This work aims at developing a program that automatically creates ... -
Rozpoznávání koreference pro Universal Dependencies
Výsledek obhajoby: OBHÁJENOFaryad, Ján (Univerzita Karlova, Matematicko-fyzikální fakulta, 2018)Datum obhajoby: 22. 6. 2018Title: Coreference resolution for Universal Dependencies Author: Ján Faryad Department: Institute of Formal and Applied Linguistics Supervisor: Mgr. Michal Novák Abstract: Coreference is an important tool for maintaining ...
