Comparison of statistical methods for the scoring models development
Srovnání statistických metod pro vývoj skóringových modelů
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/98775Identifiers
Study Information System: 187966
Collections
- Kvalifikační práce [11242]
Author
Advisor
Referee
Kopa, Miloš
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Financial and insurance mathematics
Department
Department of Probability and Mathematical Statistics
Date of defense
8. 6. 2018
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
kreditní riziko, skóringové modely, logistická regrese, neuronové sítě, rozhodovací stromy, náhodné lesyKeywords (English)
credit risk, scoring models, logistic regression, neural networks, decision trees, random forestsCílem práce je představit a shrnout obecný postup vývoje skóringového modelu a základních statistických přístupů používaných k řešení tohoto problému, konkrétně metody logistické regrese, neuronové sítě a rozhodovací stromy (náhodné lesy). Následuje aplikace popsaných metod na reálných datech poskytnutých společností PROFI CREDIT Czech, a.s., včetně diskuze některých implementačních otázek a jejich řešení. Obdržené výsledky jsou diskutovány a porovnávány.
The aim of this thesis is to introduce and summarize the process of scoring model development in general and then basic statistical approaches used to resolve this problem, which are in particular logistic regression, neural networks and decision trees (random forests). Application of described methods on a real dataset provided by PROFI CREDIT Czech, a.s. follows, including discussion of some implementation issues and their resolution. Obtained results are discussed and compared.