Large-Scale Discriminative Training for Machine Translation into Morphologically-Rich Languages
Large-Scale Discriminative Training for Machine Translation into Morphologically-Rich Languages
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/59301Identifiers
Study Information System: 131738
CU Catalogue: 990015584330106986
Collections
- Kvalifikační práce [11987]
Author
Advisor
Referee
Žabokrtský, Zdeněk
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Computational Linguistics
Department
Institute of Formal and Applied Linguistics
Date of defense
21. 1. 2013
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
Název práce: Rozsáhlé diskriminativní modely pro trénování strojového překladu do morfologicky bohatých jazyků Autor: Miloš Stanojevi'c Katedra: Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University in Prague, Czech Republic Vedoucí diplomové práce: RNDr. Ondřej Bojar Ph.D. Abstrakt: Diplomová práce se zabývá diskriminativními modely ve strojovém překladu do jazyků s bohatou morfologií. Shrnujeme současné přístupy a vypichu- jeme problém výběru slovních tvarů v cílovém jazyce a problém automatického odhadu kvality překladu jednotlivých vět. V našich pokusech s překladem z ang- ličtiny do češtiny a srbštiny pak používáme morfologické i syntaktické rysy. Pro tento účel řešíme technické překážky, jak potřebné informace doručit k diskrimi- nativnímu modelu: používáme jednoduchý tagging v průběhu překladu a promí- táme zdrojové závislostní stromy na cílovou stranu. Klíčová slova: diskriminativní modely, MIRA, řídké rysy, strojový překlad, vy- hodnocování strojového překladu, ROUGE-S, projekce závislostní stromů Title: Large-Scale Discriminative Training for Machine Translation into Morpholo- gically-Rich Languages Author: Miloš Stanojevi'c Department: Institute of Formal...
Název práce: Rozsáhlé diskriminativní modely pro trénování strojového překladu do morfologicky bohatých jazyků Autor: Miloš Stanojevi'c Katedra: Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University in Prague, Czech Republic Vedoucí diplomové práce: RNDr. Ondřej Bojar Ph.D. Abstrakt: Diplomová práce se zabývá diskriminativními modely ve strojovém překladu do jazyků s bohatou morfologií. Shrnujeme současné přístupy a vypichu- jeme problém výběru slovních tvarů v cílovém jazyce a problém automatického odhadu kvality překladu jednotlivých vět. V našich pokusech s překladem z ang- ličtiny do češtiny a srbštiny pak používáme morfologické i syntaktické rysy. Pro tento účel řešíme technické překážky, jak potřebné informace doručit k diskrimi- nativnímu modelu: používáme jednoduchý tagging v průběhu překladu a promí- táme zdrojové závislostní stromy na cílovou stranu. Klíčová slova: diskriminativní modely, MIRA, řídké rysy, strojový překlad, vy- hodnocování strojového překladu, ROUGE-S, projekce závislostní stromů Title: Large-Scale Discriminative Training for Machine Translation into Morpholo- gically-Rich Languages Author: Miloš Stanojevi'c Department: Institute of Formal...
