Shlukování textových dokumentů a jejich částí
Shlukování textových dokumentů a jejich částí
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/48281Identifikátory
SIS: 83511
Katalog UK: 990013840200106986
Kolekce
- Kvalifikační práce [11987]
Autor
Vedoucí práce
Oponent práce
Skopal, Tomáš
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
5. 9. 2011
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Velmi dobře
Klíčová slova (česky)
vektorový model, shlukování, zpracování textu, C#Klíčová slova (anglicky)
vector-space model, clustering, text processing, C#Práce analyzuje možnosti použití vektorového modelu a shlukování aplikované na jednotlivé části dokumentu - kapitoly, odstavce a věty - z hlediska možnosti usnadnění navigace v dokumentu mezi podobnými částmi. Součásti práce je rovněž simulační aplikace (SimDIS), napsaná v jazyce C#, která model implementuje a nabízí nástroje pro vizualizaci vektorů a shluků.
This thesis analyses use of vector-space model and data clustering approaches on parts of single document - on chapters, paragraphs and sentences - to allow simple navigation between similar parts. A simulation application (SimDIS), written in C# programming language is also part of this thesis. The application implements the described model and provides tools for visualization of vectors and clusters.
