Algoritmy dělení slov na slabiky
Algorithms of decomposing words into syllables
bachelor thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/12972Identifiers
Study Information System: 45730
Collections
- Kvalifikační práce [11322]
Author
Advisor
Referee
Žemlička, Michal
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Computer Science
Department
Department of Software Engineering
Date of defense
10. 9. 2007
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Na kratších a středně dlouhých textech v morfologicky bohatých jazycích se projevila vhodnost komprese na základě slabik. S ohledem na správné dělení je však potřebná relativní variabilita návrhu definic jazyka a algoritmů dělení na slabiky. V této práci představujeme systém SCORP zahrnující jazyk, jeho překladač do podoby pseudokódu a interpret parseru v rámci kompresních algorimů. S jeho pomocí jsme vytvořili český algoritmus dělení na slabiky obsahující znalost jazyka. Jeho výsledky a kompresní poměry slabikových kompresních algoritmů jsou porovnány s odpovídajícími výsledky univerzálních metod dělení.
The syllable-based compression gives good results in small or middle-sized text documents written in the richly morphological languages. The problem of decomposition of the words into syllables requires relative variability of the design of the language denitions and division algorithms. We propose SCORP system for this reason. This system includes program- ming language, compiler and interpret which is incorporated in compression algorithms. In this language we create specic Czech algorithm decomposing words into the syllables. Its result and compression rates are compared with the universal methods of division.