Large-Scale Discriminative Training for Machine Translation into Morphologically-Rich Languages
Large-Scale Discriminative Training for Machine Translation into Morphologically-Rich Languages
diploma thesis (NOT DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/40828Identifiers
Study Information System: 116782
Collections
- Kvalifikační práce [11322]
Author
Advisor
Referee
Žabokrtský, Zdeněk
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Computational Linguistics
Department
Institute of Formal and Applied Linguistics
Date of defense
7. 9. 2012
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Fail
Název práce: Využití diskriminativních metod ve strojovém překladu do jazyků s bohatou morfologií Autor: Miloš Stanojević Katedra: Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University in Prague, Czech Republic Vedoucí diplomové práce: RNDr. Ondřej Bojar Ph.D. Abstrakt: Práce představuje teoretické základy pro diskriminativní metody trénování s mnoha rysy a jejich aplikaci ve strojovém překladu do jazyků s bohatou morfologií. Výzkum se zaměřuje zejména na dva aspekty diskriminativních metod s mnoha rysy. Prvním z nich je vliv řídkosti rysů na výběr slovních tvarů a slovosledu. Druhým je využití různých metrik na úrovni věty jako účelových funkcí k optimalizaci parametrů.
Title: Large-Scale Discriminative Training for Machine Translation into Morphologically-Rich Languages Author: Miloš Stanojević Department: Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University in Prague, Czech Republic Supervisor: RNDr. Ondřej Bojar Ph.D. Abstract: We present the theoretical foundations for large-scale discriminative training and their application on the machine translation into MRL languages. The research is concentrated mostly on the two aspects of large-scale discriminative training. The first aspect is the effect of sparse features on the choice of word form and word order. The second aspect is application of different sentence-level metrics as an objective function in the parameter optimization.