Hledat

Zobrazují se záznamy 1-4 z 4

Automatické hodnocení kvality paralelních dvojjazyčných dat

Automatic Evaluation of Parallel Bilingual Data Quality

Diplomová práce (OBHÁJENO)

Autor: Kolovratník, David

Vedoucí práce: Kuboň, Vladislav

Datum publikování: 2007

Datum obhajoby: 31. 05. 2007

Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics

Abstrakt: Statistický strojový překlad je metoda závislá zejména na velkém množství paralelních dvojjazyčných dat. Ty se používa jí pro trénování překladového modelu. Ten pak zastupuje úlohu pravidlového transferu, v některých ...

Statistical machine translation is an approach dependent particularly on huge amount of parallel bilingual data. It is used to train a translation model. The translation model works instead of a rule-based transfer; in ...

Využití lingvistických informací při EBMT

The Exploitation of Linguistic Information in EBMT

Diplomová práce (OBHÁJENO)

Autor: Týnovský, Miroslav

Vedoucí práce: Kuboň, Vladislav

Datum publikování: 2007

Datum obhajoby: 11. 09. 2007

Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics

Abstrakt: Metoda strojového překladu založená na příkladech (EBMT) je korpusová metoda strojového překladu, která se pokouší získat překlad vstupního textu pomocí analogie s překladem textu podobného již hotového. Tato práce zkoumá ...

Example-based machine translation (EBMT) is a corpus-driven method of machine translation. It builds the translation using analogy of the input text with a translation already made. The benefit of using linguistic knowledge ...

Shluky silně podobných textů

Clusters of closely related documents

Diplomová práce (OBHÁJENO)

Autor: Diviš, Jiří

Vedoucí práce: Holub, Martin

Datum publikování: 2007

Datum obhajoby: 05. 02. 2007

Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics

Abstrakt: This thesis focuses on automatic searching for clusters of topically similar texts in large text collection. We introduce an algorithm for nding the clusters and a method of optimizing its parameters using machine learning ...

Práce se věnuje automatizovanému hledání shluků tématicky podobných textových dokumentů v rozsáhlých textových kolekcích. V práci je navržen algoritmus pro nalezení těchto shluků a metoda pro optimalizaci jeho parametrů ...

Rozhraní v mluveném jazyce pro korpusové anotační nástroje

Speech Interface for Corpus Annotation Tools

Diplomová práce (OBHÁJENO)

Autor: Přikryl, Leoš

Vedoucí práce: Hajič, Jan

Datum publikování: 2007

Datum obhajoby: 31. 05. 2007

Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics

Abstrakt: Práce se zabývá návrhem a implementací rozhraní ke korpusovým anotačním nástrojům využívaným na ÚFALu (TrEd a jeho přídavné moduly) v přirozeném jazyce (mluvené řeči). Využity jsou již existující moduly pro rozpoznávání ...

The thesis considers design and implementation of the interface for the corpus annotation tools used at the Institute of Formal and Applied Linguistics (TrEd and its additional modules) in the natural language (speech). ...

Filtry

Automatické hodnocení kvality paralelních dvojjazyčných dat

Automatic Evaluation of Parallel Bilingual Data Quality

Diplomová práce (OBHÁJENO)

Využití lingvistických informací při EBMT

The Exploitation of Linguistic Information in EBMT

Diplomová práce (OBHÁJENO)

Shluky silně podobných textů

Clusters of closely related documents

Diplomová práce (OBHÁJENO)

Rozhraní v mluveném jazyce pro korpusové anotační nástroje

Speech Interface for Corpus Annotation Tools

Diplomová práce (OBHÁJENO)