Statistické učení a určování rizikovosti klientů
Statistical learning and client risk assessment
bachelor thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/147704Identifiers
Study Information System: 232288
Collections
- Kvalifikační práce [11327]
Author
Advisor
Referee
Mazurová, Lucie
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Financial Mathematics
Department
Department of Probability and Mathematical Statistics
Date of defense
3. 9. 2021
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Very good
Keywords (Czech)
statistické učení|určování rizikovosti klientů|skóringové modely|logistická regrese|míry diskriminaceKeywords (English)
statistical learning|client risk assessment|scoring models|logistic regression|discrimination measuresPráce popisuje výběr modelu pro klasifikační problém, představuje binární logistickou regresi. Přibližuje odhad parametrů maximalizací věrohodnosti a nutnost numerického vyčíslení, iterativně převažovaná metoda nejmenších čtverců je používána v práci. V práci jsou definovány Waldův a Wilksův test pro test statistické významnosti parametrů. Byly popsány rozdíly mezi kvalitativními a kvantitativními proměnnými a jejich interpretacemi. Popsány byly iterativní strategie konstrukce modelu, grafická analýza residuí, metody měření kvality modelu a odhadu testové chyby. Aplikační část přenáší nabyté poznatky na datový soubor bankovních klientů.
This bachelor thesis tackles model selection for classification problems and presents binary logistic regression. A method of parameter estimation is discussed and the necessity of numerical approach is explained, iteratively reweighted least squares method is used. The Wald and Wilks tests are defined to measure statistical significance of the parameters. The difference between qualitative and quantitative data and their interpretation is discussed. Model selection method of the stepwise selection is defined, residual plots and other methods of the model fit measurement are introduced. Acquired knowledge is applied to a data set of bank clients.