Performance Ranking of Czech Credit Scoring Models
Hodnocení výkonnosti českých modelů úvěrového skórování
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/122476Identifikátory
SIS: 222026
Kolekce
- Kvalifikační práce [18159]
Autor
Vedoucí práce
Oponent práce
Jakubík, Petr
Fakulta / součást
Fakulta sociálních věd
Obor
Ekonomie a finance
Katedra / ústav / klinika
Institut ekonomických studií
Datum obhajoby
16. 9. 2020
Nakladatel
Univerzita Karlova, Fakulta sociálních vědJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
credit scoring, multiple discriminant analysis, logit analysis, probit analysisKlíčová slova (anglicky)
kredit skóring, diskriminanční analýza více proměnných, logit analýza, probit analýzaTato práce srovnává 11 českých a 4 zahraničních kredit skóringových modelů. Toto srovnání je založeno na schopnosti jednotlivých modelů předpovídat úpadky firem na měřené plochou pod ROC křivkou. Srovnání se zakládá na sadě 250 trénovacích dat a testovacích dat. Na základě tohoto základního srovnání, tato práce zkoumá 3 potencionální způsoby zlepšení predikčních schopností skóringových modelů, a to konkrétně metody nahrazení chybějících hodnot, různé statistické metody uplatněné při odhadu modelu a možnost přidání nefinančních proměnných. Po aplikaci těchto způsobů, predikční schopnost modelů byla opět vyčíslena a modely srovnány. Tato práce používá ANOVA a Friedman test, jakož i jim odpovídající post- hoc Tukey a Nememyi testy pro testování hypotéz. Ve své základní podobě jsou zahraniční modely lepší než jejich české protějšky v predikování úpadku společností. Nahrazení chybějících hodnot pomocí OLS a odhad modelů za pomoci probit signifikantně zlepšuje predikční schopnosti srovnaných modelů. Po aplikaci těchto zlepšení je rozdíl v predikčních schopnostech českých a zahraničních modelů marginální. Klasifikace G28, G32, G33, G38 Klíčová slova kredit skóring, diskriminanční analýza více proměnných, logit analýza, probit analýza E-mail autora 71247263@fsv.cuni.cz E-mail vedoucího práce...
This thesis provides a comprehensive ranking of 11 Czech statistical and 4 foreign credit scoring models. The ranking is based on the predictive performance of individual models, as measured by the area under curve, evaluated on a randomly sampled set of 250 training and validation samples. After establishing a baseline comparison, 3 avenues of estimation setup optimization are explored, namely missing value treatment, estimation method and the use of additional non-financial variables. After being optimized, the models are once again ranked based on their predictive performance. Statistical inference is drawn using ANOVA and the Friedman test, along with the corresponding Tukey and Nemeyi pos-hoc tests. In their baseline form, the Czech credit scoring models are found to be outperformed by the foreign benchmark model. Treating the missing values by OLS imputation and estimating the models by probit, significantly is found to significantly improve their predictive performance. In their optimized form, the difference in predictive performance between Czech and foreign credit scoring model is found to be only marginal. JEL Classification G28, G32, G33, G38 Keywords credit scoring, multiple discriminant analysis, logit analysis, probit analysis Author's e-mail 71247263@fsv.cuni.cz Supervisor's e-mail...