Statistické metody pro analýzu dat s chybějícími pozorováními
Statistical analysis of datasets with missing observations
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/82793Identifikátory
SIS: 180970
Kolekce
- Kvalifikační práce [10932]
Autor
Vedoucí práce
Oponent práce
Kulich, Michal
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Pravděpodobnost, matematická statistika a ekonometrie
Katedra / ústav / klinika
Katedra pravděpodobnosti a matematické statistiky
Datum obhajoby
1. 2. 2017
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Dobře
Práce se zabývá mechanismy chybějících dat a metodami, jak se s nimi vypořádat. Rozlišuje tři mechanismy chybějících dat - MCAR, MAR a MNAR. Jsou uvedeny dvě jednoduché metody používající vyřazování neúplných záznamů a ukázány jejich vlastnosti. Dále je popsán princip jednoduchých impu- tací. Odvozeny a porovnány jsou EM algoritmus používající klasickou statistiku a algoritmus augmentace dat používající bayesovskou statistiku. Poslední metodou, které se práce věnuje, je mnohonásobná imputace. Některé odvozené metody jsou aplikovány na reálná data, nejdříve pro spojité veličiny a poté pro dvourozměrnou kontingenční tabulku. 1
Mechanisms of missing data and methods of their treatment are de- scribed in this thesis. Three mechanisms are considered - MCAR, MAR, MNAR. Two simple methods using deletion of incomplete records are introduced and their properties and shortcomings are described. Further, the principle of simple imputations is explained. EM algorithm which uses the classical statistics and the algorithm of data augmentation based on Bayesian framework are derived and compared. The last method included in the thesis is the multiple imputation. The described methods are applied on real data set, first on continuous variables and then on a two dimensional contingency table. 1