dc.contributor.advisor | Krištoufek, Ladislav | |
dc.creator | Turlík, Tomáš | |
dc.date.accessioned | 2018-10-10T17:08:09Z | |
dc.date.available | 2018-10-10T17:08:09Z | |
dc.date.issued | 2018 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/102481 | |
dc.description.abstract | The most basic task in credit scoring is to classify potential borrowers as "good" or "bad" based on the probability that they would default in the case they would be accepted. In this thesis we compare widely used lo- gistic regression, neural networks and tree-based ensemble models. During the construction of neural network models we utilize recent techniques and advances in the field of deep learning, while for the tree-based models we use popular bagging, boosting and random forests ensembling algorithms. Performance of the models is measured by ROC AUC metric, which should provide better information value than average accuracy alone. Our results suggest small or even no difference between models, when in the best case scenario neural networks, boosted ensembles and stacked ensembles result in only approximately 1%−2% larger ROC AUC value than logistic regression. Keywords credit scoring, neural networks, decision tree, bagging, boosting, random forest, ensemble, ROC curve | en_US |
dc.description.abstract | Jednou z najzákladnejších úloh kreditného skóringu je klasifikácia poten- cionálnych klientov žiadajúcich o úver na "dobrých" alebo "zlých", na zák- lade pravdedepobnosti, že by neboli schopní splácať úver v prípade, že by im bol odsúhlasený. V tejto práci porovnávame často použivanú logistickú regresiu, neuronové siete a ensemble modely založené na stromových metó- dach. Pri konštrukcii neuronových sietí používame nové metódy a poznatky z oblasti hlbokého učenia, zaťiaľčo v prípade stromov používame populárne ensemble algoritmy bagging, boosting a náhodné lesy. Modely porovnávame na základe ROC AUC miery, ktorá by mala poskytnúť väčšiu informačnú hodnotu ako len samotná presnosť. Výsledky naznačujú malý alebo takmer žiadny rozdiel medzi modelmi. V najlepšom prípade, dosahujú neuronové siete, boosted ensemble modely a zložené ensemble modely len približne o 1% − 2% väčšiu ROC AUC hodnotu ako logistická regresia. Klíčová slova kreditní skóring, neuronové sítě, rozhodovací strom, bagging, boosting, náhodný les, ensemble, ROC křivka | cs_CZ |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Fakulta sociálních věd | cs_CZ |
dc.subject | machine learning | en_US |
dc.subject | loan default model | en_US |
dc.subject | logistic regression | en_US |
dc.subject | random forests | en_US |
dc.subject | neural networks | en_US |
dc.title | Neural networks and tree-based credit scoring models | en_US |
dc.type | bakalářská práce | cs_CZ |
dcterms.created | 2018 | |
dcterms.dateAccepted | 2018-09-11 | |
dc.description.department | Institut ekonomických studií | cs_CZ |
dc.description.department | Institute of Economic Studies | en_US |
dc.description.faculty | Faculty of Social Sciences | en_US |
dc.description.faculty | Fakulta sociálních věd | cs_CZ |
dc.identifier.repId | 191428 | |
dc.title.translated | Neuronové sítě a stromové metody v kreditních skóringových modelech | cs_CZ |
dc.contributor.referee | Fanta, Nicolas | |
thesis.degree.name | Bc. | |
thesis.degree.level | bakalářské | cs_CZ |
thesis.degree.discipline | Economics and Finance | en_US |
thesis.degree.discipline | Ekonomie a finance | cs_CZ |
thesis.degree.program | Ekonomické teorie | cs_CZ |
thesis.degree.program | Economics | en_US |
uk.thesis.type | bakalářská práce | cs_CZ |
uk.taxonomy.organization-cs | Fakulta sociálních věd::Institut ekonomických studií | cs_CZ |
uk.taxonomy.organization-en | Faculty of Social Sciences::Institute of Economic Studies | en_US |
uk.faculty-name.cs | Fakulta sociálních věd | cs_CZ |
uk.faculty-name.en | Faculty of Social Sciences | en_US |
uk.faculty-abbr.cs | FSV | cs_CZ |
uk.degree-discipline.cs | Ekonomie a finance | cs_CZ |
uk.degree-discipline.en | Economics and Finance | en_US |
uk.degree-program.cs | Ekonomické teorie | cs_CZ |
uk.degree-program.en | Economics | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Jednou z najzákladnejších úloh kreditného skóringu je klasifikácia poten- cionálnych klientov žiadajúcich o úver na "dobrých" alebo "zlých", na zák- lade pravdedepobnosti, že by neboli schopní splácať úver v prípade, že by im bol odsúhlasený. V tejto práci porovnávame často použivanú logistickú regresiu, neuronové siete a ensemble modely založené na stromových metó- dach. Pri konštrukcii neuronových sietí používame nové metódy a poznatky z oblasti hlbokého učenia, zaťiaľčo v prípade stromov používame populárne ensemble algoritmy bagging, boosting a náhodné lesy. Modely porovnávame na základe ROC AUC miery, ktorá by mala poskytnúť väčšiu informačnú hodnotu ako len samotná presnosť. Výsledky naznačujú malý alebo takmer žiadny rozdiel medzi modelmi. V najlepšom prípade, dosahujú neuronové siete, boosted ensemble modely a zložené ensemble modely len približne o 1% − 2% väčšiu ROC AUC hodnotu ako logistická regresia. Klíčová slova kreditní skóring, neuronové sítě, rozhodovací strom, bagging, boosting, náhodný les, ensemble, ROC křivka | cs_CZ |
uk.abstract.en | The most basic task in credit scoring is to classify potential borrowers as "good" or "bad" based on the probability that they would default in the case they would be accepted. In this thesis we compare widely used lo- gistic regression, neural networks and tree-based ensemble models. During the construction of neural network models we utilize recent techniques and advances in the field of deep learning, while for the tree-based models we use popular bagging, boosting and random forests ensembling algorithms. Performance of the models is measured by ROC AUC metric, which should provide better information value than average accuracy alone. Our results suggest small or even no difference between models, when in the best case scenario neural networks, boosted ensembles and stacked ensembles result in only approximately 1%−2% larger ROC AUC value than logistic regression. Keywords credit scoring, neural networks, decision tree, bagging, boosting, random forest, ensemble, ROC curve | en_US |
uk.file-availability | V | |
uk.publication.place | Praha | cs_CZ |
uk.grantor | Univerzita Karlova, Fakulta sociálních věd, Institut ekonomických studií | cs_CZ |
thesis.grade.code | A | |