dc.contributor.advisor | Hudecová, Šárka | |
dc.creator | Štěpán, Marek | |
dc.date.accessioned | 2022-07-25T14:41:33Z | |
dc.date.available | 2022-07-25T14:41:33Z | |
dc.date.issued | 2022 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/173573 | |
dc.description.abstract | The thesis deals with a beta regression model suitable for analysing data whose range of values is the interval (0, 1). The model assumes a conditional beta distribution for the response given covariates, and its structure is similar to generalised linear models. The model is defined and its basic properties are investigated. The asymptotic distribution of the maximum likelihood estimates is provided. A possible extension to situations where the response in the data attains one of the boundary values is considered and referred to as c-inflated beta regression model. For both models, statistical inference and model diagnostics are discussed. The practical part of the thesis involves two Monte Carlo studies and two real data analyses. The first simulation study compares the performance of the global goodness-of-fit measures for link selection, while the second study explores various approaches to the analysis of the inflated beta distribution response. Alternative initial values are proposed for the cases where the algorithm did not converge. The practical usage of the model is illustrated on a model of proportions of tertiary educated people in European countries, and the proportion of household income spent on education in the Philippines. 1 | en_US |
dc.description.abstract | Tato práce se zabývá modelem beta regrese vhodným pro analýzu dat, jejichž obor hodnot je interval (0, 1). Tento model předpokládá, že odezva má podmíněné beta roz- dělení a jeho struktura je podobná zobecněným lineárním modelům. Model je v práci formálně definován a jsou popsány jeho základní vlastnosti. Dále je odvozen maximálně věrohodný odhad parametrů a jeho asymptotické chování. V práci je uvažováno rozšíření modelu pro situaci, kdy hodnoty vysvětlované proměnné nabývají také krajních bodů in- tervalu (0, 1). Pro oba modely je diskutována statistická inference a diagnostika modelu. Praktická část práce zahrnuje dvě Monte Carlo studie a dvě analýzy reálných dat. První simulační studie porovnává globální míry shody modelu s pozorováními, druhá studie zkoumá různé přístupy k analýze beta rozdělení s nadbytečnými nulami nebo jednič- kami, tedy situaci, kdy pozorování mohou nabývat také krajních bodů. Pro případy, kdy algoritmus nekonvergoval, jsme navrhli alternativní počáteční hodnoty. Praktické vyu- žití modelu je ilustrováno na modelu podílů vysokoškolsky vzdělaných lidí v evropských zemích a na modelu podílu výdajů na vzdělávání z příjmů domácností na Filipínách. 1 | cs_CZ |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | beta rozdělení|beta regrese|intervalová data|beta rozdělení s nadbytečnými nulami či jedničkami | cs_CZ |
dc.subject | beta distribution|beta regression|interval data|inflated distribution | en_US |
dc.title | Beta regression | en_US |
dc.type | diplomová práce | cs_CZ |
dcterms.created | 2022 | |
dcterms.dateAccepted | 2022-06-08 | |
dc.description.department | Department of Probability and Mathematical Statistics | en_US |
dc.description.department | Katedra pravděpodobnosti a matematické statistiky | cs_CZ |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.identifier.repId | 217116 | |
dc.title.translated | Beta regrese | cs_CZ |
dc.contributor.referee | Omelka, Marek | |
thesis.degree.name | Mgr. | |
thesis.degree.level | navazující magisterské | cs_CZ |
thesis.degree.discipline | Pravděpodobnost, matematická statistika a ekonometrie | cs_CZ |
thesis.degree.discipline | Probability, mathematical statistics and econometrics | en_US |
thesis.degree.program | Mathematics | en_US |
thesis.degree.program | Matematika | cs_CZ |
uk.thesis.type | diplomová práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Katedra pravděpodobnosti a matematické statistiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Department of Probability and Mathematical Statistics | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Pravděpodobnost, matematická statistika a ekonometrie | cs_CZ |
uk.degree-discipline.en | Probability, mathematical statistics and econometrics | en_US |
uk.degree-program.cs | Matematika | cs_CZ |
uk.degree-program.en | Mathematics | en_US |
thesis.grade.cs | Velmi dobře | cs_CZ |
thesis.grade.en | Very good | en_US |
uk.abstract.cs | Tato práce se zabývá modelem beta regrese vhodným pro analýzu dat, jejichž obor hodnot je interval (0, 1). Tento model předpokládá, že odezva má podmíněné beta roz- dělení a jeho struktura je podobná zobecněným lineárním modelům. Model je v práci formálně definován a jsou popsány jeho základní vlastnosti. Dále je odvozen maximálně věrohodný odhad parametrů a jeho asymptotické chování. V práci je uvažováno rozšíření modelu pro situaci, kdy hodnoty vysvětlované proměnné nabývají také krajních bodů in- tervalu (0, 1). Pro oba modely je diskutována statistická inference a diagnostika modelu. Praktická část práce zahrnuje dvě Monte Carlo studie a dvě analýzy reálných dat. První simulační studie porovnává globální míry shody modelu s pozorováními, druhá studie zkoumá různé přístupy k analýze beta rozdělení s nadbytečnými nulami nebo jednič- kami, tedy situaci, kdy pozorování mohou nabývat také krajních bodů. Pro případy, kdy algoritmus nekonvergoval, jsme navrhli alternativní počáteční hodnoty. Praktické vyu- žití modelu je ilustrováno na modelu podílů vysokoškolsky vzdělaných lidí v evropských zemích a na modelu podílu výdajů na vzdělávání z příjmů domácností na Filipínách. 1 | cs_CZ |
uk.abstract.en | The thesis deals with a beta regression model suitable for analysing data whose range of values is the interval (0, 1). The model assumes a conditional beta distribution for the response given covariates, and its structure is similar to generalised linear models. The model is defined and its basic properties are investigated. The asymptotic distribution of the maximum likelihood estimates is provided. A possible extension to situations where the response in the data attains one of the boundary values is considered and referred to as c-inflated beta regression model. For both models, statistical inference and model diagnostics are discussed. The practical part of the thesis involves two Monte Carlo studies and two real data analyses. The first simulation study compares the performance of the global goodness-of-fit measures for link selection, while the second study explores various approaches to the analysis of the inflated beta distribution response. Alternative initial values are proposed for the cases where the algorithm did not converge. The practical usage of the model is illustrated on a model of proportions of tertiary educated people in European countries, and the proportion of household income spent on education in the Philippines. 1 | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra pravděpodobnosti a matematické statistiky | cs_CZ |
thesis.grade.code | 2 | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |