Kritéria těsnosti regrese dle typu vysvětlované proměnné
Regression goodness-of-fit criteria according to dependent variable type
bachelor thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/40599Identifiers
Study Information System: 113692
CU Caralogue: 990014987130106986
Collections
- Kvalifikační práce [11335]
Author
Advisor
Referee
Hlubinka, Daniel
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Mathematics
Department
Department of Probability and Mathematical Statistics
Date of defense
4. 9. 2012
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Very good
Keywords (Czech)
Logistická regrese, Giniho koeficient, Lorenzova křivka, koeficient determinaceKeywords (English)
Logistic regression, Gini coefficient, Lorenz curve, coefficient of determinationPráce se věnuje popisu modelů lineární, logistické, ordinální a mul- tinomické regrese a interpretaci jejích parametrů. Dále zavádí různé ukazatele kvality modelu a vztahy mezi nimi. Soustředí se zejména na Giniho koeficient a koeficient determinace R2 . První zmíněný je zaveden pomocí modifikace Lo- renzovy křivky pro ordinální a spojitou proměnnou a na základě porovnávání odhadnutých pravděpodobností pro proměnnou nominální. Koeficient determi- nace R2 je nově definován pro nominální proměnnou, u které je zkoumán jeho vztah k Giniho koeficientu. Za předpokladu normálně rozdělených skóre a chyb modelu je numericky odvozena závislost mezi Giniho koeficientem a koeficien- tem determinace pro různá spojitá rozdělení vysvětlované proměnné. Teoretické výpočty a definice jsou ilustrovány na dvou sadách reálných dat. 1
This work is devoted to the description of linear, logistic, ordinal and multinominal regression models and interpretation of its parameters. Then it introduces a variety of quality indicators of mathematical models and the re- lations between them. It focuses mainly on the Gini coefficient and the coefficient of determination R2 . The first mentioned is established by modifying the Lorenz curve for ordinal and continuous variables and by comparing the estimated proba- bilities for nominal variable. The coefficient of determination R2 is newly defined for the nominal variable and is examined its relationship with Gini coefficient. As- suming normally distributed scores and errors of the model is numerically derived the relation between the Gini coefficient and the coefficient of determiantion for different distribution of continuous dependent variable. Theoretical calculations and definitions are illustrated on two real data sets. 1