Grafové algoritmy a závislostní parsing
Graph-based dependency parsing
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/12951Identifikátory
SIS: 45228
Kolekce
- Kvalifikační práce [11234]
Autor
Vedoucí práce
Oponent práce
Schlesinger, Pavel
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná informatika
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
11. 9. 2007
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
V předložené práci studujeme praktické řešení problému závislostního parsingu pomocí grafového algoritmu hledání maximální kostry v orientovaném grafu (multigrafu). Výhodou tohoto přístupu je velmi snadné parsování jak projektivních, tak i neprojektivních větných konstrukcí. Parsovanou větu reprezentujeme orientovaným multigrafem, jehož vrcholy představují slova dané věty a hrany označují (potenciální) vazby mezi jednotlivými dvojicemi slov. Ohodnocení hran se získá z trénovacích dat, vypočítá se například jako pravděpodobnost vazby mezi danou dvojicí slov, případně v kombinaci s dalšími pokročilejšími metodami. Výslednou maximální kostru potom považujeme za závislostní strom dané věty.
In the present work we study practical solution of dependency parsing's problem with help of graph algorithm for finding maximal spanning tree in oriented graph (multigraph). Advantage of this approach is very easily parsing of non-projective constructions. We represent the parsing sentence as an oriented multigraph, which vertices constitutes words of our sentence and edges symbolize (potential) relation between single pairs of words. Evaluation of edges we get from training data, it can be count for example as probability of relation between given two words, possibly in combination with other more advanced methods. Resulting maximal spanning tree gives then the dependency tree of our sentence.