Feature Selection for Factored Phrase-Based Machine Translation
Feature Selection for Factored Phrase-Based Machine Translation
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/40759Identifikátory
SIS: 62748
Katalog UK: 990014994950106986
Kolekce
- Kvalifikační práce [11978]
Autor
Vedoucí práce
Oponent práce
Popel, Martin
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Matematická lingvistika
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
7. 9. 2012
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
strojový překlad, faktorové modely, výběr rysůKlíčová slova (anglicky)
machine translation, factored models, feature selectionV předkládané práci zkoumáme problematiku faktorových modelů ve strojovém překladu. Podáváme důkladný teoretický popis této oblasti strojového překladu. Popisujeme metodu sloužící ke zkoumání složitosti faktorových modelů a ověřujeme její fungování v praxi. Představujeme softwarový nástroj pro automatické vytváření experimentů strojového překladu a pro prohledávání prostoru možných konfigurací. V experimentální části pak ověřujeme svoje analýzy a podáváme obraz možností faktorových systémů. Naznačujeme směry, kterými lze dosáhnout zlepšení kvality strojového překladu, avšak shledáváme, že tyto možnosti nelze zkoumat zcela automaticky.
In the presented work we investigate factored models for machine translation. We provide a thorough theoretical description of this machine translation paradigm. We describe a method for evaluating the complexity of factored models and verify its usefulness in practice. We present a software tool for automatic creation of machine translation experiments and search in the space of possible configurations. In the experimental part of the work we verify our analyses and give some insight into the potential of factored systems. We indicate some of the possible directions that lead to improvement in translation quality, however we conclude that it is not possible to explore these options in a fully automatic way.
