Výpočet a aplikace MCD estimátoru pro robustní statistické analýzy
Computation and applications of the MCD estimator for robust statistical analysis
bachelor thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/80830Identifiers
Study Information System: 171305
Collections
- Kvalifikační práce [11322]
Author
Advisor
Consultant
Kalina, Jan
Referee
Hnětynková, Iveta
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Mathematics
Department
Department of Numerical Mathematics
Date of defense
5. 9. 2016
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Keywords (Czech)
robustni statistika, minimum covariance determinant, fastMCD, C-stepKeywords (English)
robust statistics, minimum covariance determinant, fastMCD, C-stepTato práce popisuje jeden ze základních problémů robustní statistiky, který spočívá v detekci odlehlých hodnot, a jeho možné řešení pomocí Minimum covariance determinant estimátoru pro odhad střední hodnoty a varianční matice mnohorozměrných dat. Vysvětluje fungování tohoto estimátoru a zkoumá jeho vlastnosti. Zaměřuje se pak především na aproximaci pomocí algoritmu fastMCD, pro který upřesňuje numerické vlastnosti s důrazem na výpočtovou náročnost a stabilitu ve standardní implementaci v MATLABu. Diskutuje také možné úpravy algoritmu a jejich vliv na numerické vlastnosti. Na závěr na několika experimentech s reálnými daty ukazuje použítí fastMCD algoritmu. Powered by TCPDF (www.tcpdf.org)
This work describes one of the basic problems of robust statistics con- cerning outlier detection and its possible solution by using the Minimum covariance determinant estimator for estimates of the mean value and the covariance matrix with multivariate data. It explains how the estimator works and analyses its properties. The work concentrates on its approximation based on the fastMCD algorithm and specifies its numerical properties with emphasis on computational costs and stability of the standard implementation in MATLAB. It also discusses possible modifications of the algorithm and its effects on numerical properties. Lastly the work shows the usage of the fastMCD algorithm on a few real data experiments. Powered by TCPDF (www.tcpdf.org)