dc.contributor.advisor | Witzany, Jiří | |
dc.creator | Nožička, Michal | |
dc.date.accessioned | 2018-06-29T10:03:15Z | |
dc.date.available | 2018-06-29T10:03:15Z | |
dc.date.issued | 2018 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/98782 | |
dc.description.abstract | Credit scoring is very important process in banking industry during which each potential or current client is assigned credit score that in certain way expresses client's probability of default, i.e. failing to meet his or her obligations on time or in full amount. This is a cornerstone of credit risk management in banking industry. Traditionally, statistical models (such as logistic regression model) are used for credit scoring in practice. Despite many advantages of such approach, recent research shows many alternatives that are in some ways superior to those traditional models. This master thesis is focused on introducing ensemble learning models (in particular constructed by using bagging, boosting and stacking algorithms) with various base models (in particular logistic regression, random forest, support vector machines and artificial neural network) as possible alternatives and challengers to traditional statistical models used for credit scoring and compares their advantages and disadvantages. Accuracy and predictive power of those scoring models is examined using standard measures of accuracy and predictive power in credit scoring field (in particular GINI coefficient and LIFT coefficient) on a real world dataset and obtained results are presented. The main result of this comparative study is that... | en_US |
dc.description.abstract | Kreditní skóring je velmi důležitý proces používaný v oblasti bankovnictví, během něhož je každému potenciálnímu nebo stávajícímu klientovi přiřazena hodnota kreditního skóre, které určitým způsobem vyjadřuje pravděpodobnost defaultu klienta, tj. neschopnost klienta dostát svým závazkům včas nebo v plné výši. Ke kreditnímu skóringu se tradičně využívají statistické modely (jako např. model logistické regrese). Navzdory mnoha výhodám, které takovýto přístup poskytuje, nejnovější výzkum ukazuje mnoho alternativních přístupů, které jsou v některých ohledech lepší než tradiční statistické modely. Tato diplomová práce je zaměřena na představení ensemble learning modelů (zejména těch konstruovaných pomocí algoritmů bagging, boosting a stacking) za použití různých základních modelů (zejména modelu logistické regrese, modelu náhodných lesů, support vector machines modelu a modelu umělých neuronových sítí) jako možných alternativ k tradičním statistickým modelům, které jsou obvykle používány pro kreditní skóring, a vzájemně porovnává jejich výhody a nevýhody. Přesnost a prediktivní síla těchto skóringových modelů je zkoumána pomocí měr přesnosti a prediktivní síly standardně používaných v oblasti kreditního skóringu (zejména GINI a LIFT koeficientů) na reálných datech a obdržené výsledky jsou prezentovány. Hlavní... | cs_CZ |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | kreditní riziko | cs_CZ |
dc.subject | ensemble learning | cs_CZ |
dc.subject | boosting | cs_CZ |
dc.subject | bagging | cs_CZ |
dc.subject | stacking | cs_CZ |
dc.subject | credit risk | en_US |
dc.subject | ensemble learning | en_US |
dc.subject | boosting | en_US |
dc.subject | bagging | en_US |
dc.subject | stacking | en_US |
dc.title | Ensemble learning methods for scoring models development | en_US |
dc.type | diplomová práce | cs_CZ |
dcterms.created | 2018 | |
dcterms.dateAccepted | 2018-06-08 | |
dc.description.department | Department of Probability and Mathematical Statistics | en_US |
dc.description.department | Katedra pravděpodobnosti a matematické statistiky | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.identifier.repId | 197114 | |
dc.title.translated | Ensemble learning metody pro vývoj skóringových modelů | cs_CZ |
dc.contributor.referee | Cipra, Tomáš | |
thesis.degree.name | Mgr. | |
thesis.degree.level | navazující magisterské | cs_CZ |
thesis.degree.discipline | Financial and insurance mathematics | en_US |
thesis.degree.discipline | Finanční a pojistná matematika | cs_CZ |
thesis.degree.program | Matematika | cs_CZ |
thesis.degree.program | Mathematics | en_US |
uk.thesis.type | diplomová práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Katedra pravděpodobnosti a matematické statistiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Department of Probability and Mathematical Statistics | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Finanční a pojistná matematika | cs_CZ |
uk.degree-discipline.en | Financial and insurance mathematics | en_US |
uk.degree-program.cs | Matematika | cs_CZ |
uk.degree-program.en | Mathematics | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Kreditní skóring je velmi důležitý proces používaný v oblasti bankovnictví, během něhož je každému potenciálnímu nebo stávajícímu klientovi přiřazena hodnota kreditního skóre, které určitým způsobem vyjadřuje pravděpodobnost defaultu klienta, tj. neschopnost klienta dostát svým závazkům včas nebo v plné výši. Ke kreditnímu skóringu se tradičně využívají statistické modely (jako např. model logistické regrese). Navzdory mnoha výhodám, které takovýto přístup poskytuje, nejnovější výzkum ukazuje mnoho alternativních přístupů, které jsou v některých ohledech lepší než tradiční statistické modely. Tato diplomová práce je zaměřena na představení ensemble learning modelů (zejména těch konstruovaných pomocí algoritmů bagging, boosting a stacking) za použití různých základních modelů (zejména modelu logistické regrese, modelu náhodných lesů, support vector machines modelu a modelu umělých neuronových sítí) jako možných alternativ k tradičním statistickým modelům, které jsou obvykle používány pro kreditní skóring, a vzájemně porovnává jejich výhody a nevýhody. Přesnost a prediktivní síla těchto skóringových modelů je zkoumána pomocí měr přesnosti a prediktivní síly standardně používaných v oblasti kreditního skóringu (zejména GINI a LIFT koeficientů) na reálných datech a obdržené výsledky jsou prezentovány. Hlavní... | cs_CZ |
uk.abstract.en | Credit scoring is very important process in banking industry during which each potential or current client is assigned credit score that in certain way expresses client's probability of default, i.e. failing to meet his or her obligations on time or in full amount. This is a cornerstone of credit risk management in banking industry. Traditionally, statistical models (such as logistic regression model) are used for credit scoring in practice. Despite many advantages of such approach, recent research shows many alternatives that are in some ways superior to those traditional models. This master thesis is focused on introducing ensemble learning models (in particular constructed by using bagging, boosting and stacking algorithms) with various base models (in particular logistic regression, random forest, support vector machines and artificial neural network) as possible alternatives and challengers to traditional statistical models used for credit scoring and compares their advantages and disadvantages. Accuracy and predictive power of those scoring models is examined using standard measures of accuracy and predictive power in credit scoring field (in particular GINI coefficient and LIFT coefficient) on a real world dataset and obtained results are presented. The main result of this comparative study is that... | en_US |
uk.file-availability | V | |
uk.publication.place | Praha | cs_CZ |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra pravděpodobnosti a matematické statistiky | cs_CZ |