Implementace metod analýzy struktury českých souvětí.
An Implementation of Methods of Structural Analysis of Czech Complex Sentences
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/40003Identifiers
Study Information System: 95939
Collections
- Kvalifikační práce [11195]
Author
Advisor
Referee
Holan, Tomáš
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Programming
Department
Institute of Formal and Applied Linguistics
Date of defense
18. 6. 2012
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Good
Keywords (Czech)
počítačová lingvistika, syntaxe, struktura souvětí, genetické algoritmy, neuronové sítěKeywords (English)
computational linguistics, syntax, complex sentence structure, genetic algorithms, neural networksNázev práce: Implementace metod analýzy struktury českých souvětí. Autor: Jiří Dutkevič Katedra / Ústav: Ústav formální a aplikované lingvistiky Vedoucí bakalářské práce: doc. RNDr. Vladislav Kuboň, Ph.D., Ústav formální a aplikované lingvistiky Abstrakt: Práce se zabývá automatickou analýzou struktur souvětí v češtině. Shrnuje výsledky předchozího výzkumu, užívá v něm navržené metody rozdělení souvětí do segmentů pomocí přesně definované množiny separátorů a na základě přednesených pravidel navrhuje tři metody automatického určování úrovní jednotlivých segmentů v souvětí a tím i jejich vzájemných vztahů. Jedna metoda přímo využívá pravidel navržených v odkazovaném výzkumu, druhá používá genetický algoritmus a třetí neuronovou síť. Práce obsahuje implementaci těchto metod a vyhodnocení výsledků na ručně anotovaných datech z Pražského závislostního korpusu.
Title: An Implementation of Methods of Structural Analysis of Czech Complex Sentences Author: Jiří Dutkevič Department: Institute of Formal and Applied Linguistics Supervisor: doc. RNDr. Vladislav Kuboň, Ph.D., Institute of Formal and Applied Linguistics Abstract: This paper discusses automated analysis of complex sentences in Czech language. It summarizes the results of preceding research, uses therein described method for splitting complex sentences into segments using well defined set of separators and proposes three methods of automated assignment of levels to segments (which also describe relations between the segments) in sentences based on rules presented in the research. First method directly applies the rules presented in referenced research papers, the second method uses a genetic algorithm and the third makes use of a neural network. This paper includes an implementation of these methods and an analysis of the results using manually annotated data from the Prague Dependency Treebank.