Large-Scale Discriminative Training for Machine Translation into Morphologically-Rich Languages

Stanojevic, Milos

Large-Scale Discriminative Training for Machine Translation into Morphologically-Rich Languages

diplomová práce (NEOBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (134.9Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/40828

Identifikátory

SIS: 116782

Katalog UK: 990014994970106986

Oponent práce

Žabokrtský, Zdeněk

Fakulta / součást

Matematicko-fyzikální fakulta

Obor

Matematická lingvistika

Katedra / ústav / klinika

Ústav formální a aplikované lingvistiky

Datum obhajoby

7. 9. 2012

Nakladatel

Univerzita Karlova, Matematicko-fyzikální fakulta

Jazyk

Angličtina

Známka

Neprospěl

Název práce: Využití diskriminativních metod ve strojovém překladu do jazyků s bohatou morfologií Autor: Miloš Stanojević Katedra: Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University in Prague, Czech Republic Vedoucí diplomové práce: RNDr. Ondřej Bojar Ph.D. Abstrakt: Práce představuje teoretické základy pro diskriminativní metody trénování s mnoha rysy a jejich aplikaci ve strojovém překladu do jazyků s bohatou morfologií. Výzkum se zaměřuje zejména na dva aspekty diskriminativních metod s mnoha rysy. Prvním z nich je vliv řídkosti rysů na výběr slovních tvarů a slovosledu. Druhým je využití různých metrik na úrovni věty jako účelových funkcí k optimalizaci parametrů.

Abstrakt (anglicky)

Title: Large-Scale Discriminative Training for Machine Translation into Morphologically-Rich Languages Author: Miloš Stanojević Department: Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University in Prague, Czech Republic Supervisor: RNDr. Ondřej Bojar Ph.D. Abstract: We present the theoretical foundations for large-scale discriminative training and their application on the machine translation into MRL languages. The research is concentrated mostly on the two aspects of large-scale discriminative training. The first aspect is the effect of sparse features on the choice of word form and word order. The second aspect is application of different sentence-level metrics as an objective function in the parameter optimization.

Citace dokumentu

Metadata

Zobrazit celý záznam