Statistické metody pro analýzu dat s chybějícími pozorováními
Statistical analysis of datasets with missing observations
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/82793Identifiers
Study Information System: 180970
CU Caralogue: 990021252480106986
Collections
- Kvalifikační práce [11587]
Author
Advisor
Referee
Kulich, Michal
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Probability, mathematical statistics and econometrics
Department
Department of Probability and Mathematical Statistics
Date of defense
1. 2. 2017
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Good
Práce se zabývá mechanismy chybějících dat a metodami, jak se s nimi vypořádat. Rozlišuje tři mechanismy chybějících dat - MCAR, MAR a MNAR. Jsou uvedeny dvě jednoduché metody používající vyřazování neúplných záznamů a ukázány jejich vlastnosti. Dále je popsán princip jednoduchých impu- tací. Odvozeny a porovnány jsou EM algoritmus používající klasickou statistiku a algoritmus augmentace dat používající bayesovskou statistiku. Poslední metodou, které se práce věnuje, je mnohonásobná imputace. Některé odvozené metody jsou aplikovány na reálná data, nejdříve pro spojité veličiny a poté pro dvourozměrnou kontingenční tabulku. 1
Mechanisms of missing data and methods of their treatment are de- scribed in this thesis. Three mechanisms are considered - MCAR, MAR, MNAR. Two simple methods using deletion of incomplete records are introduced and their properties and shortcomings are described. Further, the principle of simple imputations is explained. EM algorithm which uses the classical statistics and the algorithm of data augmentation based on Bayesian framework are derived and compared. The last method included in the thesis is the multiple imputation. The described methods are applied on real data set, first on continuous variables and then on a two dimensional contingency table. 1