Anomaly detection for stock market trading data
Detekce anomálií v datech z obchodování na burze
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/120934Identifiers
Study Information System: 219069
Collections
- Kvalifikační práce [11242]
Author
Advisor
Referee
Kliber, Filip
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Computer Science
Department
Department of Distributed and Dependable Systems
Date of defense
14. 9. 2020
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Good
Keywords (Czech)
detekce anomálií, obchodování na burze, časové řady, příznakyKeywords (English)
anomaly detection, stock market trading, time series, feature engineeringObchodování na burze je velmi komplexní téma, které zahrnuje spoustu náročných problémů. Jedním z těchto problémů je detekce anomálií. Detekce anomálií v reálném čase je velice náročný úkol, a proto tento problém zůstává otevřen. Cílem této práce je zkoumat různé modely a algoritmy, které mohou být použity a pokusit se najít ty nejvhodnější pro tento problém. Vytvoříme modely, které detekují anomálie na základě hustoty dat, i statistické modely a neuronové sítě, které detekují anomálie na základě porovnání predikovaných a skutečných dat. Výsledkem této práce je návrh modelů, které mohou být dále zkoumány a použity pro detekci v reálném čase.
Stock trading is a very complex topic that involves a lot of challenging problems. One of these problems is anomaly detection in trading flow. Real-time anomaly detection in time series is a very complicated task and thus this issue is still open. The aim of this thesis is to research various models and algorithms that can be used for this task and try to find the most fitting ones. We develop models that detect anomalies based on the density properties of the data as well as statistical models and neural networks that detect anomalies based on the comparison of predicted data and actual data. As a result we propose models that can be further researched and used in real-time environment.