Performance Analysis of Credit Scoring Models on Lending Club Data
Performance Analysis of Credit Scoring Models on Lending Club Data
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/86490Identifikátory
SIS: 185577
Kolekce
- Kvalifikační práce [17123]
Autor
Vedoucí práce
Oponent práce
Pečená, Magda
Fakulta / součást
Fakulta sociálních věd
Obor
Ekonomie a finance
Katedra / ústav / klinika
Institut ekonomických studií
Datum obhajoby
22. 6. 2017
Nakladatel
Univerzita Karlova, Fakulta sociálních vědJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
Kreditní skórování, P2P půjčování, Klasifikace, Žebříček klasifikátorůKlíčová slova (anglicky)
Credit scoring, P2P Lending, Classification, Classifiers' rankingV naší magisterské práci jsme porovnávali deset klasifikačních algoritmů pro kreditní skórování. Jejich prediktivní schopnosti byly měřeny šesti rozdílnými technikami pro měření klasifikační přesnosti. Pro porovnání klasifikátorů jsme použili unikátní datový set z P2P půjčování s více jak 200.000 záznamy a 23 proměnnými. Tento datový set pochází z Lending Clubu. Lending Club je největší platforma pro P2P půjčování ve Spojených státech amerických. Lo- gistická regrese, umělá neuronová sít' a lineární diskriminační analýza jsou tři nejlepší klasifikátory podle našich výsledků. Náhodný les se umístil jako pátý nejlepší klasifikátor. Na druhou stranu, klasifikační a regresní strom a k-nejbližší okolí se umístily jako nejhorší klasifikátory v našem žebříčku. 1
In our master thesis, we compare ten classification algorithms for credit scor- ing. Their prediction performances are measured by six different classification performance measurements. We use a unique P2P lending data set with more than 200,000 records and 23 variables for our classifiers comparison. This data set comes from Lending Club, the biggest P2P lending platform in the United States. Logistic regression, Artificial neural network, and Linear discriminant analysis are the best three classifiers according to our results. Random forest ranks as the fifth best classifier. On the other hand, Classification and regression tree and k-Nearest neighbors are ranked as the worse classifiers in our ranking. 1