Hledat
Zobrazují se záznamy 1-4 z 4
Automatické hodnocení kvality paralelních dvojjazyčných dat
Automatic Evaluation of Parallel Bilingual Data Quality
Diplomová práce (OBHÁJENO)
Vedoucí práce: Kuboň, Vladislav
Datum publikování: 2007
Datum obhajoby: 31. 05. 2007
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Statistický strojový překlad je metoda závislá zejména na velkém množství paralelních dvojjazyčných dat. Ty se používa jí pro trénování překladového modelu. Ten pak zastupuje úlohu pravidlového transferu, v některých ...
Statistical machine translation is an approach dependent particularly on huge amount of parallel bilingual data. It is used to train a translation model. The translation model works instead of a rule-based transfer; in ...
Statistical machine translation is an approach dependent particularly on huge amount of parallel bilingual data. It is used to train a translation model. The translation model works instead of a rule-based transfer; in ...
Využití lingvistických informací při EBMT
The Exploitation of Linguistic Information in EBMT
Diplomová práce (OBHÁJENO)
Vedoucí práce: Kuboň, Vladislav
Datum publikování: 2007
Datum obhajoby: 11. 09. 2007
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Metoda strojového překladu založená na příkladech (EBMT) je korpusová metoda strojového překladu, která se pokouší získat překlad vstupního textu pomocí analogie s překladem textu podobného již hotového. Tato práce zkoumá ...
Example-based machine translation (EBMT) is a corpus-driven method of machine translation. It builds the translation using analogy of the input text with a translation already made. The benefit of using linguistic knowledge ...
Example-based machine translation (EBMT) is a corpus-driven method of machine translation. It builds the translation using analogy of the input text with a translation already made. The benefit of using linguistic knowledge ...
Shluky silně podobných textů
Clusters of closely related documents
Diplomová práce (OBHÁJENO)
Vedoucí práce: Holub, Martin
Datum publikování: 2007
Datum obhajoby: 05. 02. 2007
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: This thesis focuses on automatic searching for clusters of topically similar texts in large text collection. We introduce an algorithm for nding the clusters and a method of optimizing its parameters using machine learning ...
Práce se věnuje automatizovanému hledání shluků tématicky podobných textových dokumentů v rozsáhlých textových kolekcích. V práci je navržen algoritmus pro nalezení těchto shluků a metoda pro optimalizaci jeho parametrů ...
Práce se věnuje automatizovanému hledání shluků tématicky podobných textových dokumentů v rozsáhlých textových kolekcích. V práci je navržen algoritmus pro nalezení těchto shluků a metoda pro optimalizaci jeho parametrů ...
Rozhraní v mluveném jazyce pro korpusové anotační nástroje
Speech Interface for Corpus Annotation Tools
Diplomová práce (OBHÁJENO)
Vedoucí práce: Hajič, Jan
Datum publikování: 2007
Datum obhajoby: 31. 05. 2007
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Práce se zabývá návrhem a implementací rozhraní ke korpusovým anotačním nástrojům využívaným na ÚFALu (TrEd a jeho přídavné moduly) v přirozeném jazyce (mluvené řeči). Využity jsou již existující moduly pro rozpoznávání ...
The thesis considers design and implementation of the interface for the corpus annotation tools used at the Institute of Formal and Applied Linguistics (TrEd and its additional modules) in the natural language (speech). ...
The thesis considers design and implementation of the interface for the corpus annotation tools used at the Institute of Formal and Applied Linguistics (TrEd and its additional modules) in the natural language (speech). ...