Large-Scale Discriminative Training for Machine Translation into Morphologically-Rich Languages
Large-Scale Discriminative Training for Machine Translation into Morphologically-Rich Languages
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/59301Identifikátory
SIS: 131738
Kolekce
- Kvalifikační práce [10690]
Autor
Vedoucí práce
Oponent práce
Žabokrtský, Zdeněk
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Matematická lingvistika
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
21. 1. 2013
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Název práce: Rozsáhlé diskriminativní modely pro trénování strojového překladu do morfologicky bohatých jazyků Autor: Miloš Stanojevi'c Katedra: Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University in Prague, Czech Republic Vedoucí diplomové práce: RNDr. Ondřej Bojar Ph.D. Abstrakt: Diplomová práce se zabývá diskriminativními modely ve strojovém překladu do jazyků s bohatou morfologií. Shrnujeme současné přístupy a vypichu- jeme problém výběru slovních tvarů v cílovém jazyce a problém automatického odhadu kvality překladu jednotlivých vět. V našich pokusech s překladem z ang- ličtiny do češtiny a srbštiny pak používáme morfologické i syntaktické rysy. Pro tento účel řešíme technické překážky, jak potřebné informace doručit k diskrimi- nativnímu modelu: používáme jednoduchý tagging v průběhu překladu a promí- táme zdrojové závislostní stromy na cílovou stranu. Klíčová slova: diskriminativní modely, MIRA, řídké rysy, strojový překlad, vy- hodnocování strojového překladu, ROUGE-S, projekce závislostní stromů Title: Large-Scale Discriminative Training for Machine Translation into Morpholo- gically-Rich Languages Author: Miloš Stanojevi'c Department: Institute of Formal...
Název práce: Rozsáhlé diskriminativní modely pro trénování strojového překladu do morfologicky bohatých jazyků Autor: Miloš Stanojevi'c Katedra: Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University in Prague, Czech Republic Vedoucí diplomové práce: RNDr. Ondřej Bojar Ph.D. Abstrakt: Diplomová práce se zabývá diskriminativními modely ve strojovém překladu do jazyků s bohatou morfologií. Shrnujeme současné přístupy a vypichu- jeme problém výběru slovních tvarů v cílovém jazyce a problém automatického odhadu kvality překladu jednotlivých vět. V našich pokusech s překladem z ang- ličtiny do češtiny a srbštiny pak používáme morfologické i syntaktické rysy. Pro tento účel řešíme technické překážky, jak potřebné informace doručit k diskrimi- nativnímu modelu: používáme jednoduchý tagging v průběhu překladu a promí- táme zdrojové závislostní stromy na cílovou stranu. Klíčová slova: diskriminativní modely, MIRA, řídké rysy, strojový překlad, vy- hodnocování strojového překladu, ROUGE-S, projekce závislostní stromů Title: Large-Scale Discriminative Training for Machine Translation into Morpholo- gically-Rich Languages Author: Miloš Stanojevi'c Department: Institute of Formal...