Zobrazit minimální záznam

Dokument clustering
dc.contributor.advisorKopecký, Michal
dc.creatorMaláčová, Jana
dc.date.accessioned2017-04-12T09:55:35Z
dc.date.available2017-04-12T09:55:35Z
dc.date.issued2008
dc.identifier.urihttp://hdl.handle.net/20.500.11956/17237
dc.description.abstractDiplomová práce si klade za cíl usnadnit orientaci v dokumentech s použitím shlukovacích metod. V teoretické části se definují základní pojmy shlukování a popisují dílčí fáze procesu shlukování. V této sekci se klasifikují a popisují jednotlivé metody pro shlukování kolekcí dokumentů. Další částí diplomové práce je rozbor možností použití shlukování jako nástroje pro zlepšení orientace v dokumentech. Práce uvádí možnosti použití přímého shlukování kolekce dokumentů a navázání shlukování na vyhledávací stroj. V rámci práce je také uvedeno několik již existujících implementací shlukování a jejich srovnání. Pro implementaci byl zvolen směr navázání shlukování na vyhledávací stroj. V návaznosti na tuto volbu se provádí diskuze vhodnosti jednotlivých algoritmů pro tento účel použití. Nejvhodnější z uvedených algoritmů byl na základě diskuze zvolen algoritmus hierarchického shlukování. Další sekce se věnuje návrhu implementace systému včetně realizace napojení na již existující vyhledávací stroj Egothor. V poslední fázi je provedeno celkové zhodnocení implementovaného systému a je uvedeno několik možností dalšího rozšíření.cs_CZ
dc.description.abstractThe goal of this diploma thesis is to facilitate the orientation in collection of documents with the assistance of clustering methods. In the theoretical part there are defined the basic definitions of clustering and description of the phases of clustering process. There are also classified and described the basic methods of clustering collection of documents. Next section of diploma thesis analyzes the options to use clustering as an instrument of improvement of orientation in the collection of documents. Our work brings up the following options of using clustering: direct clustering of collection or the option to attach clustering to the search engine. In diploma thesis there are also mentioned some existing implementations of clustering and their comparison. For the implementation there was chosen the direction to join clustering system to the results of search engine. In this context there is a discussion of suitability of previously mentioned algorithms. On the basis of previous discussion results there was chosen the algorithm of hierarchical clustering. Next section is aimed to design the system implementation including realization of connection to existing search engine Egothor. In the last phase there are reported overall evaluations and results of implemented system. And finally, there are listed...en_US
dc.languageČeštinacs_CZ
dc.language.isocs_CZ
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.titleShlukování textových dokumentůcs_CZ
dc.typediplomová prácecs_CZ
dcterms.created2008
dcterms.dateAccepted2008-09-24
dc.description.departmentKatedra softwarového inženýrstvícs_CZ
dc.description.departmentDepartment of Software Engineeringen_US
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.identifier.repId45798
dc.title.translatedDokument clusteringen_US
dc.contributor.refereeGalamboš, Leo
dc.identifier.aleph001037705
thesis.degree.nameMgr.
thesis.degree.levelmagisterskécs_CZ
thesis.degree.disciplineSoftwarové systémycs_CZ
thesis.degree.disciplineSoftware systemsen_US
thesis.degree.programInformatikacs_CZ
thesis.degree.programInformaticsen_US
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Katedra softwarového inženýrstvícs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Department of Software Engineeringen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.faculty-abbr.csMFFcs_CZ
uk.degree-discipline.csSoftwarové systémycs_CZ
uk.degree-discipline.enSoftware systemsen_US
uk.degree-program.csInformatikacs_CZ
uk.degree-program.enInformaticsen_US
thesis.grade.csVýborněcs_CZ
thesis.grade.enExcellenten_US
uk.abstract.csDiplomová práce si klade za cíl usnadnit orientaci v dokumentech s použitím shlukovacích metod. V teoretické části se definují základní pojmy shlukování a popisují dílčí fáze procesu shlukování. V této sekci se klasifikují a popisují jednotlivé metody pro shlukování kolekcí dokumentů. Další částí diplomové práce je rozbor možností použití shlukování jako nástroje pro zlepšení orientace v dokumentech. Práce uvádí možnosti použití přímého shlukování kolekce dokumentů a navázání shlukování na vyhledávací stroj. V rámci práce je také uvedeno několik již existujících implementací shlukování a jejich srovnání. Pro implementaci byl zvolen směr navázání shlukování na vyhledávací stroj. V návaznosti na tuto volbu se provádí diskuze vhodnosti jednotlivých algoritmů pro tento účel použití. Nejvhodnější z uvedených algoritmů byl na základě diskuze zvolen algoritmus hierarchického shlukování. Další sekce se věnuje návrhu implementace systému včetně realizace napojení na již existující vyhledávací stroj Egothor. V poslední fázi je provedeno celkové zhodnocení implementovaného systému a je uvedeno několik možností dalšího rozšíření.cs_CZ
uk.abstract.enThe goal of this diploma thesis is to facilitate the orientation in collection of documents with the assistance of clustering methods. In the theoretical part there are defined the basic definitions of clustering and description of the phases of clustering process. There are also classified and described the basic methods of clustering collection of documents. Next section of diploma thesis analyzes the options to use clustering as an instrument of improvement of orientation in the collection of documents. Our work brings up the following options of using clustering: direct clustering of collection or the option to attach clustering to the search engine. In diploma thesis there are also mentioned some existing implementations of clustering and their comparison. For the implementation there was chosen the direction to join clustering system to the results of search engine. In this context there is a discussion of suitability of previously mentioned algorithms. On the basis of previous discussion results there was chosen the algorithm of hierarchical clustering. Next section is aimed to design the system implementation including realization of connection to existing search engine Egothor. In the last phase there are reported overall evaluations and results of implemented system. And finally, there are listed...en_US
uk.publication.placePrahacs_CZ
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrstvícs_CZ
dc.identifier.lisID990010377050106986


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV