Hlavní komponenty
Principal components
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/103440Identifiers
Study Information System: 181070
Collections
- Kvalifikační práce [11196]
Author
Advisor
Referee
Nagy, Stanislav
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Probability, mathematical statistics and econometrics
Department
Department of Probability and Mathematical Statistics
Date of defense
5. 9. 2018
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Very good
Keywords (Czech)
Hlavní komponenty, Tracyho-Widomovo rozdělení, výběrová vlastní číslaKeywords (English)
Principal components, sample eigenvalues, Tracy-Widom distributionPráce představuje hlavní komponenty jako užitečný nástroj pro snížení di- menze datového souboru. V první části jsou uvedeny teoretické vlastnosti hlav- ních komponent a je zde odvozena konstrukce biplotu. Dále jsou shrnuty heu- ristické procedury pro volbu optimálního počtu hlavních komponent. Následně jsou uvedeny asymptotické vlastnosti výběrových vlastních čísel kovarianční a bílé Wishartovy matice, rozliší se případy rovnosti některých vlastních čísel. Ve druhé části je podrobně popsáno asymptotické rozdělení největšího vlastního čísla bílé Wishartovy matice doplněné o grafické ilustrace. Na základě tohoto asymptotic- kého rozdělení odvodíme test počtu signifikantních vlastních čísel a představíme souvislost testu s volbou vhodného počtu hlavních komponent. V závěrečné části práce shrneme pokročilé výpočetní metody pro volbu počtu hlavních komponent. Práce je doplněna grafickými ilustracemi a simulační studií v softwarech Wolfram Mathematica a R.
This thesis presents principal components as a useful tool for data dimensio- nality reduction. In the first part, the basic terminology and theoretical properties of principal components are described and a biplot construction is derived there as well. Besides, heuristic methods for a choice of the optimum number of prin- cipal components are summarised there. Subsequently, asymptotical properties of sample eigenvalues of covariance and white Wishart matrices are described and cases of equality of some eigenvalues are distinguished at the same time. In the second part of the thesis, asymptotic distribution of the largest eigenva- lue of white Wishart matrices is described, completed with graphic illustrations. A test of the number of significant eigenvalues is suggested on the basis of this limiting distribution, and the connection of this test to the number of suitable principal components is presented. The final part of the thesis provides an over- view of advanced computational methods for the choice of an adequate number of principal components. The thesis is completed with graphical illustrations and a simulation study using Wolfram Mathematica and R.