Metody kontrukce klasifikátorů vhodných pro segmentaci zákazníků
Construction of classifiers suitable for segmentation of clients
Metody kontrukce klasifikátorů vhodných pro segmentaci zákazníků
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/58592Identifiers
Study Information System: 117548
Collections
- Kvalifikační práce [11322]
Author
Advisor
Referee
Zvára, Karel
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Financial and insurance mathematics
Department
Department of Probability and Mathematical Statistics
Date of defense
18. 9. 2013
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Slovak
Grade
Excellent
Keywords (Czech)
Klasifikace, klasifikátory stromového typu, náhodné lesyKeywords (English)
Classification, tree like and forest like classifiers, random forestsNázev práce: Metody konstrukce klasifikátorů vhodných pro segmentaci zákaz- níků Autor: Bc. Jana Hricová Katedra: Katedra pravděpodobnosti a matematické statistiky Vedoucí diplomové práce: prof. RNDr. Jaromír Antoch, CSc., Katedra pravděpo- dobnosti a matematické statistiky Abstrakt: Diplomová práce pojednává o metodách, které jsou součástí široké ob- lasti analýzy dat, zvané klasifikace. V rámci klasifikačních metod jsou v práci představeny metody vhodné pro segmentaci zákazníků, které konstruují klasifiká- tory stromového typu. Podrobně je představena metodologie CART (Klasifikační a regresní stromy) a skupinové modely, vhodné pro konstrukci klasifikačních a re- gresních lesů, jmenovitě Bagging, Boosting, Arcing a Random Forest. Popsané metody byly použity na reálná data z oblasti segmentace zákazníků a na simulované data v prostředí programu RStudio. Klíčová slova: klasifikace, klasifikátory stromového typu, náhodné lesy
Title: Construction of classifiers suitable for segmentation of clients Author: Bc. Jana Hricová Department: Department of Probability and Mathematical Statistics Supervisor: prof. RNDr. Jaromír Antoch, CSc., Department of Probability and Mathematical Statistics Abstract: The master thesis discusses methods that are a part of the data analy- sis, called classification. In the thesis are presented classification methods used to construct tree like classifiers suitable for customer segmentation. Core methodo- logy that is discussed in our thesis is CART (Classification and Regression Trees) and then methodologies around ensemble models that use historical data to cons- truct classification and regression forests, namely Bagging, Boosting, Arcing and Random Forest. Here described methods were applied to real data from the field of customer segmentation and also to simulated data, both processed with RStudio software. Keywords: classification, tree like classifiers, random forests