Joint Learning of Syntax and Semantics
Joint Learning of Syntax and Semantics
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/59316Identifikátory
SIS: 131739
Katalog UK: 990015584680106986
Kolekce
- Kvalifikační práce [11978]
Autor
Vedoucí práce
Oponent práce
Mareček, David
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Matematická lingvistika
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
21. 1. 2013
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Dobře
Klíčová slova (česky)
semantics, syntax, joint learning, latent variables, language-independentKlíčová slova (anglicky)
sémantika, syntaxe, joint learning, latentní proměnné, jazyková nezávislostDiplomová práce se zabývá problémem strojového učení nepozorovaných úrovní abstrakce mělké sémantické reprezentace. Odstraňujeme předpoklady, které se při sémantické anotaci lingvistických zdrojů obvykle činí, např. pevný počet sémantických rolí v PropBanku, a učíme se klíčové lingvistické prvky této ano- tace (sémantické rámce, slovesa, lexikální a syntaktické třídy) s různou mírou ab- strakce. Model implementujeme pomocí latentních gramatik a získané struktury je možné použít pro úlohu značkování sémantických rolí (semantic role labeling, SRL) v několika jazycích s přesností srovnatelnou s jinými současnými přístupy. Navíc ukazujeme, že tyto struktury jsou velmi blízké abstrakcím, které je možné pozorovat ve FrameNetu. Celkovým výsledkem je tak jazykově-nezávislý model sémantické informace bez rysů, který produkuje interpretovatelné struktury a jeho použitelnost je na úloze SRL empiricky ověřena.
Diplomová práce se zabývá problémem strojového učení nepozorovaných úrovní abstrakce mělké sémantické reprezentace. Odstraňujeme předpoklady, které se při sémantické anotaci lingvistických zdrojů obvykle činí, např. pevný počet sémantických rolí v PropBanku, a učíme se klíčové lingvistické prvky této ano- tace (sémantické rámce, slovesa, lexikální a syntaktické třídy) s různou mírou ab- strakce. Model implementujeme pomocí latentních gramatik a získané struktury je možné použít pro úlohu značkování sémantických rolí (semantic role labeling, SRL) v několika jazycích s přesností srovnatelnou s jinými současnými přístupy. Navíc ukazujeme, že tyto struktury jsou velmi blízké abstrakcím, které je možné pozorovat ve FrameNetu. Celkovým výsledkem je tak jazykově-nezávislý model sémantické informace bez rysů, který produkuje interpretovatelné struktury a jeho použitelnost je na úloze SRL empiricky ověřena.
