Adaptace nových metrik strojového překladu pro češtinu
Adaptace nových metrik strojového překladu pro češtinu
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/18545Identifiers
Study Information System: 48576
CU Caralogue: 990010295320106986
Collections
- Kvalifikační práce [11969]
Author
Advisor
Referee
Žabokrtský, Zdeněk
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Computer Science
Department
Institute of Formal and Applied Linguistics
Date of defense
8. 9. 2008
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
In the present work we study semi-automatic evaluation techniques of machine translation (MT) systems based on comparison of the MT system's out-put to human translations of the same text. Various metrics were proposed in the past years, ranging from metrics using only unigram comparison to metrics that try to take advantage of additional syntactic or semantic information. The main goal of this thesis is to compare these metrics with respect to their correlation with human judgments and to propose the most suitable ones for evaluation of MT systems with Czech as target language. An implementation of a tool that computes the MT metrics is part of this work.
V předložené práci studujeme poloautomatické způsoby hodnocení systémů strojového překladu, které jsou založeny na porovnávání výstupu systému s lidskými překlady zdrojového textu. V minulých letech byly navrženy rozličné metriky. Některé používají pouze porovnávání unigramů, jiné se snaží využít i syntaktické nebo sémantické informace. Cílem této práce je porovnat korelaci vybraných metrik s lidskými hodnoceními a navrhnout nejvhodnější metriky pro hodnocení systémů strojového překladu, které překládají z cizího jazyka do češtiny. Součástí práce je implementace nástroje, který dané metriky počítá.
