Hledat

Zobrazují se záznamy 1-10 z 29

Neural networks for automatic speaker, language, and sex identification

Použití rekurentních neuronových sítí pro automatické rozpoznávání řečníka, jazyka a pohlaví

Diplomová práce (OBHÁJENO)

Autor: Do, Ngoc

Vedoucí práce: Jurčíček, Filip

Datum publikování: 2016

Datum obhajoby: 03. 02. 2016

Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics

Abstrakt: Název: Neuronové sítě pro automatické rozpoznávání řečníka, jazyka a pohlaví Autorka: Bich-Ngoc Do Katedra: Ústav formální a aplikované lingvistiky Vedoucí práce: Ing. Mgr. Filip Jurek, Ph.D., Ústav formální a aplikované ...

Title: Neural networks for automatic speaker, language, and sex identifica- tion Author: Bich-Ngoc Do Department: Institute of Formal and Applied Linguistics Supervisor: Ing. Mgr. Filip Jurek, Ph.D., Institute of Formal ...

Detection and Correction of Inconsistencies in the Multilingual Treebank HamleDT

Diplomová práce (OBHÁJENO)

Autor: Mašek, Jan

Vedoucí práce: Žabokrtský, Zdeněk

Datum publikování: 2015

Datum obhajoby: 05. 06. 2015

Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics

Abstrakt: Prostudovali jsme závislostní korpusy, jež jsou součástí projektu HamleDT, a částečně jsme sjednotili soubor značek užitých pro anotaci syntaktické roviny. Následně jsme použili metodu založenou na variačních n-gramech pro ...

We studied the treebanks included in HamleDT and partially unified their label sets. Afterwards, we used a method based on variation n-grams to automatically detect errors in morphological and dependency annotation. Then ...

Exploring Higher Order Dependency Parsers

Diplomová práce (OBHÁJENO)

Autor: Madhyastha, Pranava Swaroop

Vedoucí práce: Zeman, Daniel

Datum publikování: 2012

Datum obhajoby: 30. 01. 2012

Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics

Abstrakt: Syntakticka analyza jejednim z nejdulezitejsich kroku pocitacoveho zpracovani pfirozenych jazyku. V teto praci se zamefujeme na formalismus zavislostni gramatiky, protoze jeho hlavnf principy, zejmena vztah fidiciho a ...

Most of the recent efficient algorithms for dependency parsing work by factoring the dependency trees. In most of these approaches, the parser loses much of the contextual information during the process of factorization. ...

Methods for Creating Subjectivity Lexicon for Indonesian

Metody vytváření subjektivního slovníku pro indonézštinu

Diplomová práce (OBHÁJENO)

Autor: Franky,

Vedoucí práce: Bojar, Ondřej

Datum publikování: 2013

Datum obhajoby: 02. 09. 2013

Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics

Abstrakt: Cílem naší práce byla tvorba slovníků subjektivity pro indonéštinu překladem již existujících anglických slovníků a jejich následnou kombinací průnikem a sjed- nocením. Porovnali jsme efektivnost výsledných slovníků pomocí ...

In this work, we created subjectivity lexicons of positive and negative expres- sions for Indonesian language by automatically translating English lexicons, and by intersecting and unioning the translation results. We ...

Velký mnohojazyčný korpus

Diplomová práce (OBHÁJENO)

Autor: Majliš, Martin

Vedoucí práce: Žabokrtský, Zdeněk

Datum publikování: 2011

Datum obhajoby: 06. 09. 2011

Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics

Abstrakt: V této diplomové práci je popsán webový korpus W2C. Tento korpus obsahuje 97 jazyku a pro každý z nich alespoň 10 milionů slov. Celková velikost je 10,5 miliardy slov. Aby bylo možné takovýto korpus vytvořit, bylo nutné ...

This thesis introduces the W2C Corpus which contains 97 languages with more than 10 million words for each of these languages, with the total size 10.5 billion words. The corpus was built by crawling the Internet. This ...

Neural Language Models with Morphology for Machine Translation

Neuronové jazykové modely zohledňující morfologii pro strojový překlad

Diplomová práce (OBHÁJENO)

Autor: Musil, Tomáš

Vedoucí práce: Bojar, Ondřej

Datum publikování: 2017

Datum obhajoby: 07. 09. 2017

Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics

Abstrakt: Language models play an important role in many natural language processing tasks. In this thesis, we focus on language models built on artificial neural net- works. We examine the possibilities of using morphological ...

Jazykové modely hrají důležitou roli v mnoha oblastech zpracování přirozeného jazyka. V této práci se zaměřujeme na jazykové modely tvořené umělou neuronovou sítí. Zkoumáme možnosti použití morfologické anotace v těchto ...

Vícejazyčná databáze kolokací

Diplomová práce (OBHÁJENO)

Autor: Helcl, Jindřich

Vedoucí práce: Hajič, Jan

Datum publikování: 2014

Datum obhajoby: 08. 09. 2014

Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics

Abstrakt: Kolokace jsou skupiny slov, které se v daném jazyce vyskytují častěji spolu, nežli odděleně. Patří mezi ně také spojení, která dávají několika nezávislým slovům nový význam. Tato práce se zabývá nalezením kolokací v objemných ...

Collocations are groups of words which are co-occurring more often than appearing separately. They also include phrases that give a new meaning to a group of unrelated words. This thesis is aimed to find collocations in ...

Processing of Turkic Languages

Zpracování turkických jazyků

Diplomová práce (OBHÁJENO)

Autor: Ciddi, Sibel

Vedoucí práce: Zeman, Daniel

Datum publikování: 2014

Datum obhajoby: 03. 02. 2014

Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics

Abstrakt: Název: Zpracování turkických jazyků Autor: Sibel Ciddi Katedra: Ústav formální a aplikované lingvistiky, Matematicko-fyzikální fakulta, Univerzita Karlova v Praze Vedoucí diplomové práce: RNDr. Daniel Zeman, Ph.D. Abstrakt: ...

Title: Processing of Turkic Languages Author: Sibel Ciddi Department: Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University in Prague Supervisor: RNDr. Daniel Zeman, Ph.D. ...

Machine Translation of Related Asian Languages

Diplomová práce (OBHÁJENO)

Autor: Larasati, Septina Dian

Vedoucí práce: Kuboň, Vladislav

Datum publikování: 2010

Datum obhajoby: 06. 09. 2010

Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics

Abstrakt: This thesis presents the development of an MT system between Indonesian and Malaysian. The system uses a method of almost a direct translation exploiting the similarity of both languages. This method was previously used ...

Hybrid Machine Translation Approaches for Low-Resource Languages

Diplomová práce (OBHÁJENO)

Autor: Kamran, Amir

Vedoucí práce: Popel, Martin

Datum publikování: 2011

Datum obhajoby: 06. 09. 2011

Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics

Abstrakt: V poslední době poskytují systémy automatického překladu založené na korpusových datech dobré výsledky pro celou řadu jazykových párů. Ty jazyky, pro které není k dispozici dostatek dat (jako např. Urdu), však při použití ...

In recent years, corpus based machine translation systems produce significant results for a number of language pairs. However, for low-resource languages like Urdu the purely statistical or purely example based methods are ...

Filtry

Neural networks for automatic speaker, language, and sex identification

Použití rekurentních neuronových sítí pro automatické rozpoznávání řečníka, jazyka a pohlaví

Diplomová práce (OBHÁJENO)

Detection and Correction of Inconsistencies in the Multilingual Treebank HamleDT

Detection and Correction of Inconsistencies in the Multilingual Treebank HamleDT

Diplomová práce (OBHÁJENO)

Exploring Higher Order Dependency Parsers

Diplomová práce (OBHÁJENO)

Methods for Creating Subjectivity Lexicon for Indonesian

Metody vytváření subjektivního slovníku pro indonézštinu

Diplomová práce (OBHÁJENO)

Velký mnohojazyčný korpus

Velký mnohojazyčný korpus

Diplomová práce (OBHÁJENO)

Neural Language Models with Morphology for Machine Translation

Neuronové jazykové modely zohledňující morfologii pro strojový překlad

Diplomová práce (OBHÁJENO)

Vícejazyčná databáze kolokací

Vícejazyčná databáze kolokací

Diplomová práce (OBHÁJENO)

Processing of Turkic Languages

Zpracování turkických jazyků

Diplomová práce (OBHÁJENO)

Machine Translation of Related Asian Languages

Diplomová práce (OBHÁJENO)

Hybrid Machine Translation Approaches for Low-Resource Languages

Hybrid Machine Translation Approaches for Low-Resource Languages

Diplomová práce (OBHÁJENO)