Performance Ranking of Czech Credit Scoring Models
Hodnocení výkonnosti českých modelů úvěrového skórování
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/122476Identifiers
Study Information System: 222026
Collections
- Kvalifikační práce [18370]
Author
Advisor
Referee
Jakubík, Petr
Faculty / Institute
Faculty of Social Sciences
Discipline
Economics and Finance
Department
Institute of Economic Studies
Date of defense
16. 9. 2020
Publisher
Univerzita Karlova, Fakulta sociálních vědLanguage
English
Grade
Excellent
Keywords (Czech)
credit scoring, multiple discriminant analysis, logit analysis, probit analysisKeywords (English)
kredit skóring, diskriminanční analýza více proměnných, logit analýza, probit analýzaTato práce srovnává 11 českých a 4 zahraničních kredit skóringových modelů. Toto srovnání je založeno na schopnosti jednotlivých modelů předpovídat úpadky firem na měřené plochou pod ROC křivkou. Srovnání se zakládá na sadě 250 trénovacích dat a testovacích dat. Na základě tohoto základního srovnání, tato práce zkoumá 3 potencionální způsoby zlepšení predikčních schopností skóringových modelů, a to konkrétně metody nahrazení chybějících hodnot, různé statistické metody uplatněné při odhadu modelu a možnost přidání nefinančních proměnných. Po aplikaci těchto způsobů, predikční schopnost modelů byla opět vyčíslena a modely srovnány. Tato práce používá ANOVA a Friedman test, jakož i jim odpovídající post- hoc Tukey a Nememyi testy pro testování hypotéz. Ve své základní podobě jsou zahraniční modely lepší než jejich české protějšky v predikování úpadku společností. Nahrazení chybějících hodnot pomocí OLS a odhad modelů za pomoci probit signifikantně zlepšuje predikční schopnosti srovnaných modelů. Po aplikaci těchto zlepšení je rozdíl v predikčních schopnostech českých a zahraničních modelů marginální. Klasifikace G28, G32, G33, G38 Klíčová slova kredit skóring, diskriminanční analýza více proměnných, logit analýza, probit analýza E-mail autora 71247263@fsv.cuni.cz E-mail vedoucího práce...
This thesis provides a comprehensive ranking of 11 Czech statistical and 4 foreign credit scoring models. The ranking is based on the predictive performance of individual models, as measured by the area under curve, evaluated on a randomly sampled set of 250 training and validation samples. After establishing a baseline comparison, 3 avenues of estimation setup optimization are explored, namely missing value treatment, estimation method and the use of additional non-financial variables. After being optimized, the models are once again ranked based on their predictive performance. Statistical inference is drawn using ANOVA and the Friedman test, along with the corresponding Tukey and Nemeyi pos-hoc tests. In their baseline form, the Czech credit scoring models are found to be outperformed by the foreign benchmark model. Treating the missing values by OLS imputation and estimating the models by probit, significantly is found to significantly improve their predictive performance. In their optimized form, the difference in predictive performance between Czech and foreign credit scoring model is found to be only marginal. JEL Classification G28, G32, G33, G38 Keywords credit scoring, multiple discriminant analysis, logit analysis, probit analysis Author's e-mail 71247263@fsv.cuni.cz Supervisor's e-mail...