Shlukování textových dokumentů a jejich částí
Shlukování textových dokumentů a jejich částí
diploma thesis (NOT DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/32106Identifiers
Study Information System: 136457
Collections
- Kvalifikační práce [11217]
Author
Advisor
Referee
Skopal, Tomáš
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software Systems
Department
Department of Software Engineering
Date of defense
30. 5. 2011
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Fail
Keywords (Czech)
vektorový model, shlukování, zpracování textu, C#Keywords (English)
vector-space model, clustering, text processing, C#Práce analyzuje možnosti použití vektorového modelu a shlukování aplikované na jednotlivé části dokumentu - kapitoly, odstavce a věty. Součásti práce je rovněž simulační aplikace (SimDIS), napsaná v jazyce C#, která takto upravený model implementuje a nabízí nástroje pro vizualizaci vektorů a shluků.
This thesis analyses use of vector-space model and data clustering approaches on parts of single document - on chapters, paragraphs and sentences. A simulation application (SimDIS), written in C# programming language is also part of this thesis. The application implements the adjusted model and provides tools for visualization of vectors and clusters.