Odhadování a kritéria těsnosti modelu logistické regrese
Estimation and goodness-of-fit criteria in logistic regression model
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/38622Identifiers
Study Information System: 76421
CU Catalogue: 990013710100106986
Collections
- Kvalifikační práce [12078]
Author
Advisor
Referee
Zvára, Karel
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Financial Mathematics
Department
Department of Probability and Mathematical Statistics
Date of defense
27. 6. 2011
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Keywords (Czech)
Binární logistická regrese, metoda maximální věrohodnosti, metoda nejmenších čtverců, Giniho koeficient, koeficient determinaceKeywords (English)
Binary logistic regression, maximum likelihood, ordinary least squares, Gini coefficient, coefficient of determinationV práci je popsán model binární logistické regrese a odhad jeho pa- rametrů metodou maximální věrohodnosti. Dále je navržen algoritmus pro me- todu nejmenších čtverců. V části věnované ukazatelům diverzifikační síly mo- delu je definována Lorenzova křivka, Giniho koeficient, C-statistika, Kolmogorov- Smirnovova statistika a koeficient determinace R2 a je odvozen jejich vztah k růz- ným výběrovým korelačním koeficientům. Pomocí modelu normálně rozdělených skóre špatných a dobrých klientů je odvozen typický vztah mezi Giniho koeficien- tem, Kolmogorov-Smirnovovou statistikou a nově také koeficientem determinace R2 . Odvozené teoretické výsledky jsou ověřeny na třech sadách reálných dat. Klíčová slova: Binární logistická regrese, metoda maximální věrohodnosti, me- toda nejmenších čtverců, Giniho koeficient, koeficient determinace. 1
In this bachelor thesis we describe binary logistic regression model and estimation of model's parameters by maximum likelihood method. Then we propose algorithm for the least squares method. In the goodness-of-fit criteria part we define Lorenz curve, Gini coefficient, C-statistics, Kolmogorov-Smirnov statistics and coefficient of determination R2 . We derive their relation to different sample coefficients of correlation. We derive typical relation between Gini coeffi- cient, Kolmogorov-Smirnov statistics and newly also coefficient of determination R2 via model of normally distributed score of bad and good clients. These derived teoretical results are verified on three real data sets. Keywords: Binary logistic regression, maximum likelihood, ordinary least squa- res, Gini coefficient, coefficient of determination. 1
