L1 regrese
L1 Regression
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/119381Identifiers
Study Information System: 206139
Collections
- Kvalifikační práce [11325]
Author
Advisor
Referee
Hlubinka, Daniel
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Probability, mathematical statistics and econometrics
Department
Department of Probability and Mathematical Statistics
Date of defense
7. 7. 2020
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Keywords (Czech)
L1 norma, mediánová regrese, robustní odhad, odlehlá pozorováníKeywords (English)
L1 norm, median regression, robust estimation, outlying observationsTato práce se zabývá L1 regresí, která je možnou alternativou klasické lineární re- grese. Odhad metodou nejmenších čtverců je u L1 regrese nahrazen odhadem metodou nejmenších absolutních odchylek, což vede k zobecnění výběrového mediánu v lineárním regresním modelu. Oproti klasické lineární regresi umožňuje L1 regrese uvolnit některé předpoklady a je robustnější vůči odlehlým pozorováním. Je dokázána základní teorie včetně asymptotického rozdělení odhadů regresních koeficientů, testů hypotéz, konfidenč- ních intervalů a konfidenčních množin. Metoda je následně porovnána s klasickou lineární regresí v simulační studii, která je zaměřená na data z rozdělení s těžkými chvosty a na data znečištěná odlehlými pozorováními. 1
This thesis is focused on the L1 regression, a possible alternative to the ordinary least squares regression. L1 regression replaces the least squares estimation with the least absolute deviations estimation, thus generalizing the sample median in the linear regres- sion model. Unlike the ordinary least squares regression, L1 regression enables loosening of certain assumptions and leads to more robust estimates. Fundamental theoretical re- sults, including the asymptotic distribution of regression coefficient estimates, hypothesis testing, confidence intervals and confidence regions, are derived. This method is then compared to the ordinary least squares regression in a simulation study, with a focus on heavy-tailed distributions and the possible presence of outlying observations. 1