Large-Scale Discriminative Training for Machine Translation into Morphologically-Rich Languages
Large-Scale Discriminative Training for Machine Translation into Morphologically-Rich Languages
diplomová práce (NEOBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/40828Identifikátory
SIS: 116782
Kolekce
- Kvalifikační práce [11211]
Autor
Vedoucí práce
Oponent práce
Žabokrtský, Zdeněk
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Matematická lingvistika
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
7. 9. 2012
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Neprospěl
Název práce: Využití diskriminativních metod ve strojovém překladu do jazyků s bohatou morfologií Autor: Miloš Stanojević Katedra: Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University in Prague, Czech Republic Vedoucí diplomové práce: RNDr. Ondřej Bojar Ph.D. Abstrakt: Práce představuje teoretické základy pro diskriminativní metody trénování s mnoha rysy a jejich aplikaci ve strojovém překladu do jazyků s bohatou morfologií. Výzkum se zaměřuje zejména na dva aspekty diskriminativních metod s mnoha rysy. Prvním z nich je vliv řídkosti rysů na výběr slovních tvarů a slovosledu. Druhým je využití různých metrik na úrovni věty jako účelových funkcí k optimalizaci parametrů.
Title: Large-Scale Discriminative Training for Machine Translation into Morphologically-Rich Languages Author: Miloš Stanojević Department: Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University in Prague, Czech Republic Supervisor: RNDr. Ondřej Bojar Ph.D. Abstract: We present the theoretical foundations for large-scale discriminative training and their application on the machine translation into MRL languages. The research is concentrated mostly on the two aspects of large-scale discriminative training. The first aspect is the effect of sparse features on the choice of word form and word order. The second aspect is application of different sentence-level metrics as an objective function in the parameter optimization.