Využitie genetických algoritmov pri tvorbe rozhodovacích stromov
Applying genetic algorithms for decision trees induction
Využitie genetických algoritmov pri tvorbe rozhodovacích stromov
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/81253Identifiers
Study Information System: 160470
Collections
- Kvalifikační práce [11322]
Author
Advisor
Referee
Šmíd, Jakub
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Theoretical Computer Science
Department
Department of Software and Computer Science Education
Date of defense
8. 9. 2015
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Slovak
Grade
Excellent
Keywords (Czech)
rozhodovací stromy, genetické algoritmyKeywords (English)
decision tree, genetic algorithmRozhodovacie stromy sú úznávanou a široko používanou technikou pri spracovaní a analyzovaní dát. Tieto stromy sú konštruované typickými a všeobecne známymi indukčnými technikami (napr. ID3, C4.5, C5.0, CART, CHAID, MARS). Kvalita takto získaných stromov nie je vždy dokonalá a často má rezervy. Indukcia kvalitných stromov, na ktoré kladieme zložité požiadavky, je ťažkou až nereálnou úlohou. V tejto práci sa budeme zaoberať práve takýmito rozhodovacími stromami, konkrétne ich vytváraním. Spomínanú rezervu sa snažíme využiť na zlepšenie stromov pomocou metaheuristiky, genetických algoritmov, ktorá sa využíva pri rôznych optimalizačných úlohách. Práca taktiež obsahuje implementáciu navrhnutého algoritmu vo forme zásuvného modulu do prostredia Weka. Neoddeliteľnou súčasťou práce je porovnanie novej metódy so známym algoritmom tvorby rozhodovacích stromov C4.5. Powered by TCPDF (www.tcpdf.org)
Decision trees are recognized and widely used technique for processing and analyzing data. These trees are designed with typical and generally known inductive techniques (such as ID3, C4.5, C5.0, CART, CHAID, MARS). Predictive power of created trees is not always perfect and they often provide a room for improvement. Induction of trees with difficult criterias is hard and sometime impossible. In this paper we will deal with decision trees, namely their creation. We use the mentioned room for improvement by metaheuristic, genetic algorithms, which is used in all types of optimalization. The work also includes an implementation of a new proposed algorithm in the form of plug-in into Weka environment. A comparison of the proposed method for induction of decision trees with known algorithm C4.5 is an integral part of this thesis. Powered by TCPDF (www.tcpdf.org)