Rozhodovací stromy
Decision trees
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/30665Identifikátory
SIS: 43071
Kolekce
- Kvalifikační práce [10688]
Autor
Vedoucí práce
Oponent práce
Gregor, Petr
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Teoretická informatika
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
21. 9. 2009
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Dobře
Mezi známé metody dobývání znalostí patří neuronové sítě, ILP, asociační pravidla, Bayesovské sítě, klastrování, rozhodovací stromy a další. Tato práce se zabývá právě rozhodovacími stromy, jejich implementací, vizualizací, extrakcí pravidel a také porovnáváním různých rozhodovacích stromů a modelů pro klasifikaci dat vůbec. Nedílnou součástí procesu dobývání znalostí je také předzpracování dat, které hraje důležitou roli a je také rozebíráno v této práci. Součástí této práce je i porovnání různých modelů rozhodovacích stromů jako CART, CHAID, C5.0 (See5) a jiných na množině 3 druhů dat. Nakonec jsou výsledky porovnány s výsledky na předzpracovaných datech pomocí PCA analýzy.
Among the known methods of data mining are neural networks, ILP, associative rules, Bayes networks, clustering, decision trees and others. This thesis is about decision trees, their implementation, visualization, extraction rules and the comparison of different decision trees and models of classification data in general. An integral part of the data mining process is preprocessing of data, which plays an important role and is also discussed in this thesis. Part of this thesis also concerns the comparison of different decision tree models such as CART, CHAID, C5.0 (See5) and others on a set of 3 data kinds. Finally, this model's results are compared to its results when data preprocessed by PCA analysis is used.