Noise reduction and feature extraction with principal component analysis for cryptocurrency price modeling
Redukce šumu a extrakce rysů pomocí analýzy hlavních komponent pro modelování cen kryptoměn
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/199636Identifikátory
SIS: 259666
Kolekce
- Kvalifikační práce [19618]
Autor
Vedoucí práce
Oponent práce
Fanta, Nicolas
Fakulta / součást
Fakulta sociálních věd
Obor
Ekonomie a finance
Katedra / ústav / klinika
Institut ekonomických studií
Datum obhajoby
9. 6. 2025
Nakladatel
Univerzita Karlova, Fakulta sociálních vědJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
kryptoměny, PCA, analýza hlavních komponent, časové řady, strojové učeníKlíčová slova (anglicky)
cryptocurrencies, PCA, principal component analysis, time-series, machine learningTato práce se zaměřuje na použití metod strojového učení v oblasti predikování cen a logaritmických výnosů Bitcoinu, Etherea a Litecoinu za použítí několika modelů stro- jového učení s různou mírou komplexity. Jelikož jsou časové řady a zejména u kryp- toměn zašuměná, cílíme na zlepšení predikčních schopností pomocí technik redukce šumu konkrétně pomocí analýzy hlavních komponent. Naše práce ukazuje, že použití analýzy hlavních komponent nemá téměř žádný vliv na predikční schopnosti modelů a že modely nejsou schopny dobře generalizovat na budoucí data i přes silnou regularizaci. Analyzu- jeme důvody tohoto jevu a docházíme k závěru, že týdení granularita spekulativních proxy proměnných a měnící se cenová dynamika jsou hlavními důvody špatné výkonnosti modelů na testovacích datech.
This thesis focuses on the use of machine learning methods in the field of cryptocurrency forecasting. We forecast the price and log-returns of Bitcoin, Ethereum and Litecoin using a variety of machine learning models with different complexity. As time series data and especially cryptocurrency data is often noisy, we aim to improve the forecasting ability by the use of noise reduction techniques particularly principal component analysis. We found that the use of principal component analysis does have little to no effect on the forecasting ability of the models and that the models are not able to generalize well despite strong regularization. We analyze the reasons for this phenomenon and suggest that the weekly granularity of speculative proxies and the changing nature of the pricing dynamics are the main reasons for the poor model out-of-sample performance.
