Rozhodovací stromy
Decision trees
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/30665Identifiers
Study Information System: 43071
Collections
- Kvalifikační práce [10678]
Author
Advisor
Referee
Gregor, Petr
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Theoretical computer science
Department
Department of Software Engineering
Date of defense
21. 9. 2009
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Good
Mezi známé metody dobývání znalostí patří neuronové sítě, ILP, asociační pravidla, Bayesovské sítě, klastrování, rozhodovací stromy a další. Tato práce se zabývá právě rozhodovacími stromy, jejich implementací, vizualizací, extrakcí pravidel a také porovnáváním různých rozhodovacích stromů a modelů pro klasifikaci dat vůbec. Nedílnou součástí procesu dobývání znalostí je také předzpracování dat, které hraje důležitou roli a je také rozebíráno v této práci. Součástí této práce je i porovnání různých modelů rozhodovacích stromů jako CART, CHAID, C5.0 (See5) a jiných na množině 3 druhů dat. Nakonec jsou výsledky porovnány s výsledky na předzpracovaných datech pomocí PCA analýzy.
Among the known methods of data mining are neural networks, ILP, associative rules, Bayes networks, clustering, decision trees and others. This thesis is about decision trees, their implementation, visualization, extraction rules and the comparison of different decision trees and models of classification data in general. An integral part of the data mining process is preprocessing of data, which plays an important role and is also discussed in this thesis. Part of this thesis also concerns the comparison of different decision tree models such as CART, CHAID, C5.0 (See5) and others on a set of 3 data kinds. Finally, this model's results are compared to its results when data preprocessed by PCA analysis is used.