Regularizace a výběr proměnných v regresních modelech
Regularization and variable selection in regression models
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/91133Identifikátory
SIS: 168203
Kolekce
- Kvalifikační práce [11979]
Autor
Vedoucí práce
Oponent práce
Maciak, Matúš
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Pravděpodobnost, matematická statistika a ekonometrie
Katedra / ústav / klinika
Katedra pravděpodobnosti a matematické statistiky
Datum obhajoby
13. 9. 2017
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Velmi dobře
Klíčová slova (česky)
výběr proměnných v regresních modelech, obecný princip Boostingu, AdaBoost, L2BoostingKlíčová slova (anglicky)
variable selection in regression models, general Boosting algorithm, AdaBoost, L2BoostingTato diplomová práce se zaměřuje na regularizaci a výběr proměnných v re- gresních modelech. Popsány jsou základní pojmy týkající se penalizované věrohod- nosti, zobecněných lineárních modelů a jejich hodnocení a porovnávání na základě predikčních schopností a schopnosti výběru proměnných. Dále jsou krátce před- staveny metody LASSO a LARS pro výběr proměnných v normálním lineárním modelu. Hlavním tématem práce je metoda zvaná Boosting. V práci je uveden zá- kladní princip této metody a algoritmus, který popisuje Boosting jako pokles podle gradientu v prostoru funkcí. Dále se v práci zabýváme volbou bazické procedury, konkrétně metodou nejmenších čtverců aplikované po složkách. Následně jsou před- staveny dvě aplikace obecného algoritmu Boostingu a odvozeny jejich konkrétní vlastnosti. Jedná se o AdaBoost pro náhodný výběr s podmíněným alternativním rozdělením a L2Boosting pro výběr s podmíněným normálním rozdělením. Na závěr byla provedena simulační studie porovnávající metody LASSO, LARS a L2Boosting. Ukazuje se, že pro výběr proměnných se nejvíce hodí metody LASSO a LARS. Me- toda L2Boosting je spíše vhodnější k predikování nových dat.
This diploma thesis focuses on regularization and variable selection in regres- sion models. Basics of penalised likelihood, generalized linear models and their evaluation and comparison based on prediction quality and variable selection are described. Methods called LASSO and LARS for variable selection in normal linear regression are briefly introduced. The main topic of this thesis is method called Boosting. General Boosting algorithm is introduced including functional gradient descent, followed by selection of base procedure, especially the componentwise linear least squares method. Two specific application of general Boosting algorithm are introduced with derivation of some important characteristics. These methods are AdaBoost for data with conditional binomial distribution and L2Boosting for condi- tional normal distribution. As a final point a simulation study comparing LASSO, LARS and L2Boosting methods was conducted. It is shown that methods LASSO and LARS are more suitable for variable selection whereas L2Boosting is more fitting for new data prediction.
Citace dokumentu
Metadata
Zobrazit celý záznamSouvisející záznamy
Zobrazují se záznamy příbuzné na základě názvu, autora a předmětu.
-
Machine Learning in Algorithmic Trading
Výsledek obhajoby: OBHÁJENOBureš, Michal (Univerzita Karlova, Matematicko-fyzikální fakulta, 2021)Datum obhajoby: 4. 2. 2021Tato práce se zabývá aplikací metod strojového učení v algoritmickém obchodování. Inspirováni intraday obchodníky implementujeme systém predikující cenu na základě formací vzorů a technických indikátorů. Na podrobných ... -
Porovnání metod pro diverzifikaci 0-1 proměnných.
Výsledek obhajoby: OBHÁJENOKan, Nikita (Univerzita Karlova, Matematicko-fyzikální fakulta, 2023)Datum obhajoby: 21. 6. 2023The thesis describes and compares possible approaches and their mathematical base for finding a functional prediction model of the dependent variable with the alternative distribution. The first method is logistic regression. ... -
Jet substructure at Future Circular Collider (FCC)
Výsledek obhajoby: OBHÁJENOPetrů, Tadeáš (Univerzita Karlova, Matematicko-fyzikální fakulta, 2022)Datum obhajoby: 9. 6. 2022Title: Jet substructure at Future Circular Collider (FCC) Author: Tadeáš Petrů Department: Institute of Particle and Nuclear Physics Supervisor: Mgr. Jana Faltová, Ph.D., Institute of Particle and Nuclear Physics Abstract: ...
