Klasifikace obsahu dokumentů
Classification of document contents
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/26854Identifikátory
SIS: 49376
Kolekce
- Kvalifikační práce [10678]
Autor
Vedoucí práce
Oponent práce
Spoustová, Johanka
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Programování
Katedra / ústav / klinika
Katedra aplikované matematiky
Datum obhajoby
15. 9. 2009
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Dobře
Tato práce se zabývá možnostmi automatické klasifikace textových dokumentů a ukazuje výhody této klasifikace i úskalí při její implementaci. Představuje několik metod a podrobněji se zabývá metodami založenými na analýze propojení dokumentů a bayesovském filtrování. Součástí práce jsou testy na reálných webových stránkách, které mají otestovat kvality jednotlivých klasifikačních metod.
This paper deals with automatic classification of text documents, showing advantages of the classification as well as showing difficulty during implementation. It presents several methods in detail, based on analysis of document linking and bayesian filtering. Part of the task is testing on real web pages which should demonstrate the quality of the specific verification methods used.