Klasifikace obsahu dokumentů
Classification of document contents
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/26854Identifiers
Study Information System: 49376
Collections
- Kvalifikační práce [10932]
Author
Advisor
Referee
Spoustová, Johanka
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Programming
Department
Department of Applied Mathematics
Date of defense
15. 9. 2009
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Good
Tato práce se zabývá možnostmi automatické klasifikace textových dokumentů a ukazuje výhody této klasifikace i úskalí při její implementaci. Představuje několik metod a podrobněji se zabývá metodami založenými na analýze propojení dokumentů a bayesovském filtrování. Součástí práce jsou testy na reálných webových stránkách, které mají otestovat kvality jednotlivých klasifikačních metod.
This paper deals with automatic classification of text documents, showing advantages of the classification as well as showing difficulty during implementation. It presents several methods in detail, based on analysis of document linking and bayesian filtering. Part of the task is testing on real web pages which should demonstrate the quality of the specific verification methods used.