Statistická analýza intervalových dat

Troshkov, Kirill

Statistical analysis of interval data

diplomová práce (OBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (55.63Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/49470

Identifikátory

SIS: 47742

Oponent práce

Branda, Martin

Fakulta / součást

Matematicko-fyzikální fakulta

Obor

Finanční a pojistná matematika

Katedra / ústav / klinika

Katedra pravděpodobnosti a matematické statistiky

Datum obhajoby

14. 9. 2011

Nakladatel

Univerzita Karlova, Matematicko-fyzikální fakulta

Jazyk

Čeština

Známka

Výborně

Klíčová slova (česky)

intervalová data, střední hodnota, rozptyl, kovariance, korelace, intervalová neurčitost, výpočetní složitost

Klíčová slova (anglicky)

interval data, mean, variance, covariance, correlation, interval uncer- tainty, computational complexity

Tradiční statistická analýza začíná výpočtem základních statistických charakteristik jako je výběrová střední hodnota E, výběrový rozptyl V , kovariance či korelace. Při výpočtu těchto charakteristik se většinou předpokládá, že odpo- vídající hodnoty dat jsou přesně známé. Ve skutečnem světě existují situace, kdy je možné získat více vypovídající informace tím, že soubor statistických dat bude intervalového typu. Například, naměřená denní maximální a minimální teplota dává realističtější pohled na počasí než obyčejné průměrné hodnoty. Při analýze životního prostředí dostáváme naměřené hodnoty znečištění jezera x(t) v různých časových okamžicích t, přičemž bychom potřebovali odhadnout statistické charak- teristiky jako je střední hodnota, rozptyl nebo korelace s jinými měřeními. Jiný příklad je z finančního prostředí. Minimum a maximum cen transakcí, denně za- znamenané pro nějaký soubor akcií poskytuje víc relevantních údajů pro finanční experty, kteří vyhodnocují akcie a volatilitu ve stejný den. Pro tyto a mnohé další případy musíme modifikovat existující statistické postupy, abychom je mohli apli- kovat na data intervalového typu. V této práci se pokusíme rozebrat statistické algoritmy, jejich složitost a modifikace vhodné pro aplikaci na intervalová data v případě výpočtu střední hodnoty,...

Abstrakt (anglicky)

Traditional statistical analysis starts with computing the basic statisti- cal characteristics such as the population mean E, population variance V , cova- riance and correlation. In computing these characteristics, it is usually assumed that the corresponding data values are known exactly. In real life there are many situations in which a more complete information can be achieved by describing a set of statistical units in terms of interval data. For example, daily tempera- tures registered as minimum and maximum values offer a more realistic view on the weather conditions variations with respect to the simple average values. In environmental analysis, we observe a pollution level x(t) in a lake at different mo- ments of time t, and we would like to estimate standard statistical characteristics such as mean, variance and correlation with other measurements. Another exam- ple can be given by financial series. The minimum and the maximum transaction prices recorded daily for a set of stocks represent a more relevant information for experts in order to evaluate the stocks tendency and volatility in the same day. We must therefore modify the existing statistical algorithms to process such interval data. In this work we will analyze algorithms and their modifications for computing various statistics under...

Citace dokumentu

Metadata

Zobrazit celý záznam