Hledat
Zobrazují se záznamy 1-10 z 29
Neural networks for automatic speaker, language, and sex identification
Použití rekurentních neuronových sítí pro automatické rozpoznávání řečníka, jazyka a pohlaví
Diplomová práce (OBHÁJENO)
Vedoucí práce: Jurčíček, Filip
Datum publikování: 2016
Datum obhajoby: 03. 02. 2016
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Název: Neuronové sítě pro automatické rozpoznávání řečníka, jazyka a pohlaví Autorka: Bich-Ngoc Do Katedra: Ústav formální a aplikované lingvistiky Vedoucí práce: Ing. Mgr. Filip Jurek, Ph.D., Ústav formální a aplikované ...
Title: Neural networks for automatic speaker, language, and sex identifica- tion Author: Bich-Ngoc Do Department: Institute of Formal and Applied Linguistics Supervisor: Ing. Mgr. Filip Jurek, Ph.D., Institute of Formal ...
Title: Neural networks for automatic speaker, language, and sex identifica- tion Author: Bich-Ngoc Do Department: Institute of Formal and Applied Linguistics Supervisor: Ing. Mgr. Filip Jurek, Ph.D., Institute of Formal ...
Detection and Correction of Inconsistencies in the Multilingual Treebank HamleDT
Detection and Correction of Inconsistencies in the Multilingual Treebank HamleDT
Diplomová práce (OBHÁJENO)
Vedoucí práce: Žabokrtský, Zdeněk
Datum publikování: 2015
Datum obhajoby: 05. 06. 2015
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Prostudovali jsme závislostní korpusy, jež jsou součástí projektu HamleDT, a částečně jsme sjednotili soubor značek užitých pro anotaci syntaktické roviny. Následně jsme použili metodu založenou na variačních n-gramech pro ...
We studied the treebanks included in HamleDT and partially unified their label sets. Afterwards, we used a method based on variation n-grams to automatically detect errors in morphological and dependency annotation. Then ...
We studied the treebanks included in HamleDT and partially unified their label sets. Afterwards, we used a method based on variation n-grams to automatically detect errors in morphological and dependency annotation. Then ...
Exploring Higher Order Dependency Parsers
Diplomová práce (OBHÁJENO)
Vedoucí práce: Zeman, Daniel
Datum publikování: 2012
Datum obhajoby: 30. 01. 2012
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Syntakticka analyza jejednim z nejdulezitejsich kroku pocitacoveho zpracovani pfirozenych jazyku. V teto praci se zamefujeme na formalismus zavislostni gramatiky, protoze jeho hlavnf principy, zejmena vztah fidiciho a ...
Most of the recent efficient algorithms for dependency parsing work by factoring the dependency trees. In most of these approaches, the parser loses much of the contextual information during the process of factorization. ...
Most of the recent efficient algorithms for dependency parsing work by factoring the dependency trees. In most of these approaches, the parser loses much of the contextual information during the process of factorization. ...
Methods for Creating Subjectivity Lexicon for Indonesian
Metody vytváření subjektivního slovníku pro indonézštinu
Diplomová práce (OBHÁJENO)
Vedoucí práce: Bojar, Ondřej
Datum publikování: 2013
Datum obhajoby: 02. 09. 2013
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Cílem naší práce byla tvorba slovníků subjektivity pro indonéštinu překladem již existujících anglických slovníků a jejich následnou kombinací průnikem a sjed- nocením. Porovnali jsme efektivnost výsledných slovníků pomocí ...
In this work, we created subjectivity lexicons of positive and negative expres- sions for Indonesian language by automatically translating English lexicons, and by intersecting and unioning the translation results. We ...
In this work, we created subjectivity lexicons of positive and negative expres- sions for Indonesian language by automatically translating English lexicons, and by intersecting and unioning the translation results. We ...
Velký mnohojazyčný korpus
Velký mnohojazyčný korpus
Diplomová práce (OBHÁJENO)
Vedoucí práce: Žabokrtský, Zdeněk
Datum publikování: 2011
Datum obhajoby: 06. 09. 2011
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: V této diplomové práci je popsán webový korpus W2C. Tento korpus obsahuje 97 jazyku a pro každý z nich alespoň 10 milionů slov. Celková velikost je 10,5 miliardy slov. Aby bylo možné takovýto korpus vytvořit, bylo nutné ...
This thesis introduces the W2C Corpus which contains 97 languages with more than 10 million words for each of these languages, with the total size 10.5 billion words. The corpus was built by crawling the Internet. This ...
This thesis introduces the W2C Corpus which contains 97 languages with more than 10 million words for each of these languages, with the total size 10.5 billion words. The corpus was built by crawling the Internet. This ...
Neural Language Models with Morphology for Machine Translation
Neuronové jazykové modely zohledňující morfologii pro strojový překlad
Diplomová práce (OBHÁJENO)
Vedoucí práce: Bojar, Ondřej
Datum publikování: 2017
Datum obhajoby: 07. 09. 2017
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Language models play an important role in many natural language processing tasks. In this thesis, we focus on language models built on artificial neural net- works. We examine the possibilities of using morphological ...
Jazykové modely hrají důležitou roli v mnoha oblastech zpracování přirozeného jazyka. V této práci se zaměřujeme na jazykové modely tvořené umělou neuronovou sítí. Zkoumáme možnosti použití morfologické anotace v těchto ...
Jazykové modely hrají důležitou roli v mnoha oblastech zpracování přirozeného jazyka. V této práci se zaměřujeme na jazykové modely tvořené umělou neuronovou sítí. Zkoumáme možnosti použití morfologické anotace v těchto ...
Vícejazyčná databáze kolokací
Vícejazyčná databáze kolokací
Diplomová práce (OBHÁJENO)
Vedoucí práce: Hajič, Jan
Datum publikování: 2014
Datum obhajoby: 08. 09. 2014
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Kolokace jsou skupiny slov, které se v daném jazyce vyskytují častěji spolu, nežli odděleně. Patří mezi ně také spojení, která dávají několika nezávislým slovům nový význam. Tato práce se zabývá nalezením kolokací v objemných ...
Collocations are groups of words which are co-occurring more often than appearing separately. They also include phrases that give a new meaning to a group of unrelated words. This thesis is aimed to find collocations in ...
Collocations are groups of words which are co-occurring more often than appearing separately. They also include phrases that give a new meaning to a group of unrelated words. This thesis is aimed to find collocations in ...
Processing of Turkic Languages
Zpracování turkických jazyků
Diplomová práce (OBHÁJENO)
Vedoucí práce: Zeman, Daniel
Datum publikování: 2014
Datum obhajoby: 03. 02. 2014
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Název: Zpracování turkických jazyků Autor: Sibel Ciddi Katedra: Ústav formální a aplikované lingvistiky, Matematicko-fyzikální fakulta, Univerzita Karlova v Praze Vedoucí diplomové práce: RNDr. Daniel Zeman, Ph.D. Abstrakt: ...
Title: Processing of Turkic Languages Author: Sibel Ciddi Department: Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University in Prague Supervisor: RNDr. Daniel Zeman, Ph.D. ...
Title: Processing of Turkic Languages Author: Sibel Ciddi Department: Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University in Prague Supervisor: RNDr. Daniel Zeman, Ph.D. ...
Machine Translation of Related Asian Languages
Diplomová práce (OBHÁJENO)
Vedoucí práce: Kuboň, Vladislav
Datum publikování: 2010
Datum obhajoby: 06. 09. 2010
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: This thesis presents the development of an MT system between Indonesian and Malaysian. The system uses a method of almost a direct translation exploiting the similarity of both languages. This method was previously used ...
Hybrid Machine Translation Approaches for Low-Resource Languages
Hybrid Machine Translation Approaches for Low-Resource Languages
Diplomová práce (OBHÁJENO)
Vedoucí práce: Popel, Martin
Datum publikování: 2011
Datum obhajoby: 06. 09. 2011
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: V poslední době poskytují systémy automatického překladu založené na korpusových datech dobré výsledky pro celou řadu jazykových párů. Ty jazyky, pro které není k dispozici dostatek dat (jako např. Urdu), však při použití ...
In recent years, corpus based machine translation systems produce significant results for a number of language pairs. However, for low-resource languages like Urdu the purely statistical or purely example based methods are ...
In recent years, corpus based machine translation systems produce significant results for a number of language pairs. However, for low-resource languages like Urdu the purely statistical or purely example based methods are ...