Strojové učení pro credit scoring
Machine Learning for Credit Scoring
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/91534Identifikátory
SIS: 177815
Kolekce
- Kvalifikační práce [10957]
Autor
Vedoucí práce
Oponent práce
Neruda, Roman
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra teoretické informatiky a matematické logiky
Datum obhajoby
6. 9. 2017
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Dobře
Klíčová slova (česky)
credit scoring, strojové učení, klasifikaceKlíčová slova (anglicky)
credit scoring, machine learning, classificationNázev práce: Strojové učení pro credit scoring Autor: Elena Myazina Katedra: Katedra teoretické informatiky a matematické logiky Vedoucí: Mgr. Martin Pilát, Ph.D, Katedra teoretické informatiky a matematické logiky Abstract: Banky používají techniku nazývanou credit scoring pro ohodnocení svých klientů, kteří žádají o půjčku. Cílem je předpovědět, jestli klient půjčku splatí, nebo ne. Tradičně se pro credit scoring používají matematické metody jako např. logistická regrese. V této práci se na problém podíváme z hlediska strojového učení. Testujeme řadu metod strojového učení (např. neuronové sítě,support vector machines, náhodné lesy a další) a vyhodnocujeme jejich vhodnost pro credit scoring na třech veřejně dostupných množinách dat. Klíčová slova: strojové učení, credit scoring, logistická regrese, neuronové sítě, náhodné lesy.
Title: Machine Learning for Credit Scoring Author: Elena Myazina Department / Institute: Department of Theoretical Computer Science and Mathematical Logic Supervisor of the master thesis: Mgr. Martin Pilát, Ph.D, Department of Theoretical Computer Science and Mathematical Logic Abstract: Credit scoring is a technique used by banks to evaluate their clients who ask for different types of loan. Its goal is to predict, whether a given client will pay their loan or not. Traditionally, mathematical models based on logistic regression are used for this task. In this thesis, we approach the problem of credit scoring from a machine learning point of view. We investigate several machine learning methods (including neural networks, random forests, support vector machines and other), and evaluate their performance for the credit scoring task on three publicly available datasets.. Keywords: machine learning, credit scoring,logistic regression, neural networks, random forest