Statistické učení a určování rizikovosti klientů
Statistical learning and client risk assessment
bakalářská práce (OBHÁJENO)

Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/147704Identifikátory
SIS: 232288
Kolekce
- Kvalifikační práce [11330]
Autor
Vedoucí práce
Oponent práce
Mazurová, Lucie
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Finanční matematika
Katedra / ústav / klinika
Katedra pravděpodobnosti a matematické statistiky
Datum obhajoby
3. 9. 2021
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Velmi dobře
Klíčová slova (česky)
statistické učení|určování rizikovosti klientů|skóringové modely|logistická regrese|míry diskriminaceKlíčová slova (anglicky)
statistical learning|client risk assessment|scoring models|logistic regression|discrimination measuresPráce popisuje výběr modelu pro klasifikační problém, představuje binární logistickou regresi. Přibližuje odhad parametrů maximalizací věrohodnosti a nutnost numerického vyčíslení, iterativně převažovaná metoda nejmenších čtverců je používána v práci. V práci jsou definovány Waldův a Wilksův test pro test statistické významnosti parametrů. Byly popsány rozdíly mezi kvalitativními a kvantitativními proměnnými a jejich interpretacemi. Popsány byly iterativní strategie konstrukce modelu, grafická analýza residuí, metody měření kvality modelu a odhadu testové chyby. Aplikační část přenáší nabyté poznatky na datový soubor bankovních klientů.
This bachelor thesis tackles model selection for classification problems and presents binary logistic regression. A method of parameter estimation is discussed and the necessity of numerical approach is explained, iteratively reweighted least squares method is used. The Wald and Wilks tests are defined to measure statistical significance of the parameters. The difference between qualitative and quantitative data and their interpretation is discussed. Model selection method of the stepwise selection is defined, residual plots and other methods of the model fit measurement are introduced. Acquired knowledge is applied to a data set of bank clients.