Geometric approach to the estimation of scatter
Geometrický přístup k odhadování rozptýlenosti
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/108262Identifiers
Study Information System: 205003
Collections
- Kvalifikační práce [10678]
Author
Advisor
Referee
Antoch, Jaromír
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Mathematics
Department
Department of Probability and Mathematical Statistics
Date of defense
26. 6. 2019
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Very good
Keywords (Czech)
MCD odhad, MVE odhad, Mahalanobisova vzdialenosť, matica rozptýlenosti, robustnosť, bod zlomuKeywords (English)
MCD estimator, MVE estimator, Mahalanobis distance, scatter matrix, robustness, breakdown pointV tejto práci popisujeme vylepšené metódy na odhadovanie polohy a rozptýlenosti viacrozmerných dát. Výberový priemer a výberová rozptylová matica sú nerobustné metódy, čo znamená že aj jedno zlé pozorovanie môže tento odhad znehodnotiť. Tento problém rieši MCD odhad (minimum covariance determinant), ktorý spočíta strednú hodnotu a variačnú maticu iba z vhodnej selekcie dát, konkrétne z pozorovaní ktorých variačná matica má najmenší determinant. Vhodná aplikácia je v hľadaní odľahlých pozorovaní. Na záver ukážeme ďalší postup, a to MVE odhad (minimum volume ellipsoid). Budeme diskutovať ich vlastnosti a porovnáme tieto dva odhady.
In this thesis we describe improved methods of estimating mean and scatter from multivariate data. As we know, the sample mean and the sample variance matrix are non-robust estimators, which means that even a small amount of measurement errors can seriously affect the resulting estimate. We can deal with that problem using MCD estimator (minimum covariance determinant), that finds a sample variance matrix only from a selection of data, specifically those with the smallest determinant of this matrix. This estimator can be also very helpful in outlier detection, which is used in many applications. Moreover, we will introduce the MVE estimator (minimum volume ellipsoid). We will discuss some of the properties and compare these two estimators.