Machine Learning in Algorithmic Trading
Strojové učení v algoritmickém obchodování
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/124641Identifikátory
SIS: 212975
Kolekce
- Kvalifikační práce [10932]
Autor
Vedoucí práce
Oponent práce
Neruda, Roman
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Umělá inteligence
Katedra / ústav / klinika
Katedra teoretické informatiky a matematické logiky
Datum obhajoby
4. 2. 2021
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
Strojové učení|Algorimtické Obchodování|Svíčkové formace|Extreme Gradient Boosting|Obchodovací strategieKlíčová slova (anglicky)
Machine Learning|Algorithmic Trading|Candlestick Patterns|Extreme Gradient Boosting|Trading StrategiesTato práce se zabývá aplikací metod strojového učení v algoritmickém obchodování. Inspirováni intraday obchodníky implementujeme systém predikující cenu na základě formací vzorů a technických indikátorů. Na podrobných datech o obchodování na forexu a amerických akciích vytvoříme různé agregované datové reprezentace. Z nich poté odvozujeme originální vysvětlující proměnné klastrováním vzorů pomocí K-Means a aplikací dlouhodobějších technických indikátorů. Připravíme si regresní i klasifikační úlohy pro Extreme Gradient Boosting modely. Z jejich predikcí extrahujeme signály k nákupu a prodeji. Provádíme experimenty v osmi různých konfiguracích na několika různých instrumentech a různých obchodovacích strategiích s dopřednou validací. Ve výsledcích uvádíme Sharpe ratio a průměrný zisk ve všech kombinacích. Tyto výsledky analyzujeme a na jejich základě doporučujeme vhodné konfigurace. Ukazujeme, že naše strategie překonávají výsledky náhodných strategií. Poskytujeme několik námětů k navazujícímu výzkumu.
This thesis is dedicated to the application of machine learning methods to algorithmic trading. We take inspiration from intraday traders and implement a system that predicts future price based on candlestick patterns and technical indicators. Using forex and US stocks tick data we create multiple aggregated bar representations. From these bars we construct original features based on candlestick pattern clustering by K-Means and long-term features derived from standard technical indicators. We then setup regression and classification tasks for Extreme Gradient Boosting models. From their predictions we extract buy and sell trading signals. We perform experiments with eight different configurations over multiple assets and trading strategies using walk-forward validation. The results report Sharpe ratios and mean profits of all the combinations. We discuss the results and recommend suitable configurations. In overall our strategies outperform randomly selected strategies. Furthermore, we provide and discuss multiple opportunities for further research.