Hledat
Zobrazují se záznamy 1-10 z 23
Framework pro extrakci informací z velkého množství jazykových dat
Framework for information extraction from the large language data sets
Bakalářská práce (OBHÁJENO)
Vedoucí práce: Križ, Vincent
Datum publikování: 2014
Datum obhajoby: 16. 06. 2014
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Tato práce popisuje program FAFEFI sloužící k extrakci n-gramů a skip-gramů z velkého množství jazykových dat. Řeší možnosti předání vstupních dat programu, návrh datových struktur pro reprezentaci n-gramů a skip-gramů v ...
This thesis describes the FAFEFI program that focuses on n-gram and skip-gram extraction from large data sets. The thesis presents two different approaches to passing input data to the program. It also describes the design ...
This thesis describes the FAFEFI program that focuses on n-gram and skip-gram extraction from large data sets. The thesis presents two different approaches to passing input data to the program. It also describes the design ...
Automatické zpracování českých soudních rozhodnutí
Processing of Czech court decisions
Diplomová práce (OBHÁJENO)
Vedoucí práce: Vidová Hladká, Barbora
Datum publikování: 2015
Datum obhajoby: 15. 06. 2015
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Název práce: Automatické zpracování českých soudních rozhodnutí Autor: Bohdan Maslowski Katedra / Ústav: Ústav formální a aplikované lingvistiky Vedoucí diplomové práce: Mgr. Barbora Vidová Hladká, Ph.D. Abstrakt: Cílem ...
Title: Processing of Czech court decisions Author: Bohdan Maslowski Department: Institute of Formal and Applied Linguistics Supervisor: Mgr. Barbora Vidová Hladká, Ph.D. Abstract: The objective of this thesis is a comparison ...
Title: Processing of Czech court decisions Author: Bohdan Maslowski Department: Institute of Formal and Applied Linguistics Supervisor: Mgr. Barbora Vidová Hladká, Ph.D. Abstract: The objective of this thesis is a comparison ...
Popularita osob automaticky
Popularity Meter
Bakalářská práce (OBHÁJENO)
Vedoucí práce: Bojar, Ondřej
Datum publikování: 2011
Datum obhajoby: 07. 09. 2011
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Možnost automaticky sledovat popularitu osob v~novinách by jistě uvítaly nejen tyto osoby samotné. Počítačové zpracovávání subjektivity je sice rychle se rozvíjející podobor komputační lingvistiky, v~češtině ovšem vůbec ...
Having the possibility of automatically tracking a person's popularity in the newspapers is an idea appealing not just to those in the media spotlight. While sentiment (subjectivity) analysis is a rapidly growing subfield ...
Having the possibility of automatically tracking a person's popularity in the newspapers is an idea appealing not just to those in the media spotlight. While sentiment (subjectivity) analysis is a rapidly growing subfield ...
Unsupervised and Semi-Supervised Multilingual Learning for Resource-Poor Languages
Unsupervised and Semi-Supervised Multilingual Learning for Resource-Poor Languages
Diplomová práce (OBHÁJENO)
Vedoucí práce: Zeman, Daniel
Datum publikování: 2012
Datum obhajoby: 07. 09. 2012
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Pra ce se zaměřuje na neř zenou morfologickou segmentaci, jednu ze za kladn ch u loh poč tačov eho zpracov an přirozen eho jazyka. V t eto u loze je c lem rozložit slova na morf emy. Popisuji a reim- plementuji model ...
This thesis focuses on unsupervised morphological seg- mentation, the fundamental task in NLP which aims to break words into morphemes. I describe and re-implement a model proposed in Lee et al. (2011) and evaluate it on ...
This thesis focuses on unsupervised morphological seg- mentation, the fundamental task in NLP which aims to break words into morphemes. I describe and re-implement a model proposed in Lee et al. (2011) and evaluate it on ...
Detekce podezřelých anotací
Detekce podezřelých anotací
Bakalářská práce (OBHÁJENO)
Vedoucí práce: Vidová Hladká, Barbora
Datum publikování: 2011
Datum obhajoby: 20. 06. 2011
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Tato práce popisuje způsob kontroly morfologické anotace pomocí strojového učení a představuje implementaci tohoto přístupu - aplikaci MissTagger. Procedura kontroly zahrnuje jak detekci chyb, tak jejich opravu. Tento ...
This work describes a machine learning approach for checking the part-of-speech annotation, and presents its implementation - a system called MissTagger. The checking procedure covers both error detection and error correction. ...
This work describes a machine learning approach for checking the part-of-speech annotation, and presents its implementation - a system called MissTagger. The checking procedure covers both error detection and error correction. ...
Sledování aktivovanosti objektů v textech
Sledování aktivovanosti objektů v textech
Diplomová práce (NEOBHÁJENO)
Vedoucí práce: Vidová Hladká, Barbora
Datum publikování: 2014
Datum obhajoby: 08. 09. 2014
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: V kontextu analýzy diskurzu stupeň aktivovanosti (salience) modeluje aktuální míru zapojenosti odkazovaných objektů a její vývoj v průběhu textu. Algoritmus pro určování aktivovanosti a vizualizaci jejího průběhu již byl ...
The notion of salience in the discourse analysis models how the activation of referred objects evolves in the flow of text. The salience algorithm was already defined and tested briefly in an earlier research, we present ...
The notion of salience in the discourse analysis models how the activation of referred objects evolves in the flow of text. The salience algorithm was already defined and tested briefly in an earlier research, we present ...
User simulation for statistical dialogue systems
Simulace uzivatele pro statisticke dialogove systemy
Diplomová práce (OBHÁJENO)
Vedoucí práce: Jurčíček, Filip
Datum publikování: 2015
Datum obhajoby: 09. 09. 2015
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Cílem této práce je vytvořit a evaluovat simulátory uživatele pro statistický di- alogový stystém. Simulátory pracují na úrovni dialogových aktů. Jako baseline systém jsme implementovali bigramový simulátor. Tento simulátor ...
The purpose of this thesis is to develop and evaluate user simulators for a spoken dialogue system. Created simulators are operating on dialogue act level. We implemented a bigram simulator as a baseline system. Based on ...
The purpose of this thesis is to develop and evaluate user simulators for a spoken dialogue system. Created simulators are operating on dialogue act level. We implemented a bigram simulator as a baseline system. Based on ...
Comparison of approaches to text classification
Porovnání přístupů ke klasifikaci textu
Bakalářská práce (OBHÁJENO)
Vedoucí práce: Hana, Jiří
Datum publikování: 2019
Datum obhajoby: 05. 09. 2019
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: The focus of this thesis is short text classification. Short text is the prevailing form of text on e-commerce and review platforms, such as Yelp, Tripadvisor or Heureka. As the popularity of the online communication is ...
Semantic information from FrameNet and the possibility of its transfer to Czech data
Sémantická informace ze sítě FrameNet a možnosti jejího využití pro česká data
Diplomová práce (OBHÁJENO)
Vedoucí práce: Lopatková, Markéta
Datum publikování: 2016
Datum obhajoby: 08. 09. 2016
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Tématem práce je převod anotace z databáze FrameNet do češtiny a možnost využití takto vzniklých dat pro automatické předpovídání rámců. První část tohoto úkolu, převod anotace z angličtiny do češtiny, byla provedena dvěma ...
The thesis focuses on transferring FrameNet annotation from English to Czech and the possibilities of using the resulting data for automatic frame prediction in Czech. The first part, annotation transfer, has been performed ...
The thesis focuses on transferring FrameNet annotation from English to Czech and the possibilities of using the resulting data for automatic frame prediction in Czech. The first part, annotation transfer, has been performed ...
Predikce vývoje ceny ropy na základě textových zpravodajských informací
Crude Oil Price Forecast based on Text News
Bakalářská práce (OBHÁJENO)
Vedoucí práce: Bojar, Ondřej
Datum publikování: 2012
Datum obhajoby: 18. 06. 2012
Fakulta / součást: Matematicko-fyzikální fakulta / Faculty of Mathematics and Physics
Abstrakt: Pro předpověď vývoje ceny ropy existuje celá řada algoritmů. V této práci přinášíme nový pohled na tuto problematiku a představujeme náš projekt COPF. Pomocí klasifikátoru maximální entropie se snažíme předpovídat z textových ...
For crude oil price forecast, there is a whole range of algorithms. In this thesis we bring out a new perspective on this issue and introduce our project COPF. Using a maximum entropy classifier, we try to predict the ...
For crude oil price forecast, there is a whole range of algorithms. In this thesis we bring out a new perspective on this issue and introduce our project COPF. Using a maximum entropy classifier, we try to predict the ...