Efektivní implementace metod pro redukci dimenze v mnohorozměrné statistice
Efficient implementation of dimension reduction methods for high-dimensional statistics
diplomová práce (OBHÁJENO)

Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/81250Identifikátory
SIS: 150849
Kolekce
- Kvalifikační práce [11320]
Autor
Vedoucí práce
Oponent práce
Hnětynková, Iveta
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Numerická a výpočtová matematika
Katedra / ústav / klinika
Katedra numerické matematiky
Datum obhajoby
11. 9. 2015
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
klasifikace, redukce dimenze, singulární kovarianční matice, vysoce dimenzionální statistikaKlíčová slova (anglicky)
classification, dimension reduction, singular covariance matrix, high-dimensional statisticsV naší práci si klademe za cíl především zefektivnit implementaci klasifikační metody, která se nazývá lineární diskriminační analýza. Jde o model mnohorozměrné statistiky, který má na základě určitého množství vzorků a jejich příslušnosti k určité skupině zařadit do skupiny vzorek nový. Zaměřujeme se zejména na její vysoce dimenzionální verzi, což znamená, že množství vstupních parametrů je tak velké, že převyšuje počet vzorků a v důsledku toho úloha vede na singulární kovarianční matici. Pro příliš velká data mohou být běžně užívané metody prakticky nepoužitelné z důvodu vysokých výpočetních nákladů. Z toho důvodu nahlížíme na téma z pohledu numerické lineární algebry a vzniklé úlohy upravujeme na jejich ekvivalentní formulaci s mnohem nižší dimenzí. Nabízíme tak nové způsoby řešení, k tomu poskytujeme příklady konkrétních algoritmů a diskutujeme jejich efektivitu. Powered by TCPDF (www.tcpdf.org)
The main goal of our thesis is to make the implementation of a classification method called linear discriminant analysis more efficient. It is a model of multivariate statistics which, given samples and their membership to given groups, attempts to determine the group of a new sample. We focus especially on the high-dimensional case, meaning that the number of variables is higher than number of samples and the problem leads to a singular covariance matrix. If the number of variables is too high, it can be practically impossible to use the common methods because of the high computational cost. Therefore, we look at the topic from the perspective of numerical linear algebra and we rearrange the obtained tasks to their equivalent formulation with much lower dimension. We offer new ways of solution, provide examples of particular algorithms and discuss their efficiency. Powered by TCPDF (www.tcpdf.org)