Shlukování textových dokumentů a jejich částí

Zápotocký, Radoslav

Shlukování textových dokumentů a jejich částí

diplomová práce (OBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (146.2Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/48281

Identifikátory

SIS: 83511

Katalog UK: 990013840200106986

Oponent práce

Skopal, Tomáš

Fakulta / součást

Matematicko-fyzikální fakulta

Obor

Softwarové systémy

Katedra / ústav / klinika

Katedra softwarového inženýrství

Datum obhajoby

5. 9. 2011

Nakladatel

Univerzita Karlova, Matematicko-fyzikální fakulta

Jazyk

Angličtina

Známka

Velmi dobře

Klíčová slova (česky)

vektorový model, shlukování, zpracování textu, C#

Klíčová slova (anglicky)

vector-space model, clustering, text processing, C#

Práce analyzuje možnosti použití vektorového modelu a shlukování aplikované na jednotlivé části dokumentu - kapitoly, odstavce a věty - z hlediska možnosti usnadnění navigace v dokumentu mezi podobnými částmi. Součásti práce je rovněž simulační aplikace (SimDIS), napsaná v jazyce C#, která model implementuje a nabízí nástroje pro vizualizaci vektorů a shluků.

Abstrakt (anglicky)

This thesis analyses use of vector-space model and data clustering approaches on parts of single document - on chapters, paragraphs and sentences - to allow simple navigation between similar parts. A simulation application (SimDIS), written in C# programming language is also part of this thesis. The application implements the described model and provides tools for visualization of vectors and clusters.

Citace dokumentu

Metadata

Zobrazit celý záznam