Prediction of Stock Return Volatility Using Internet Data
Prediction of Stock Return Volatility Using Internet Data
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/91119Identifiers
Study Information System: 185569
Collections
- Kvalifikační práce [17115]
Author
Advisor
Referee
Novák, Jiří
Faculty / Institute
Faculty of Social Sciences
Discipline
Economics and Finance
Department
Institute of Economic Studies
Date of defense
13. 9. 2017
Publisher
Univerzita Karlova, Fakulta sociálních vědLanguage
English
Grade
Very good
Keywords (Czech)
Portfolio Volatilita Výnos Internetová Data General Autoregressive Conditional Heteroscedasticity Capital Asset Pricing ModelKeywords (English)
Portfolio Volatility Return Internet Data General Autoregressive Conditional Heteroscedasticity Capital Asset Pricing ModelTato práce zkoumá vztah mezi denní volatilitou akcií z Dow Jones Industrial Average akciového indexu a daty, které byly získány na známé sociální síti Twitter. Twitter data obsahují počet tweetů a jsou kategorizovaná na základě jejich polarity, a to na pozitivní, negativní a neutrální. V práci jsme využili dva druhy modelů, GARCH a ARFIMA, které jsme zkoumali jak v základním nastavení bez dodatečných proměnných tak s proměnnými, které reprezentují velikost aktivity na této sociální síti. Našim hlavním cílem je zjistit, který z modelů nejpřesněji odhaduje jednodenní predikci realizované volatility. Kromě toho také zkoumáme, jaký efekt mají proměnné získané na Twitteru na budoucí volatilitu. Náš výzkum ukázal, že nejlepším modelem pro predikci volatility je ARFIMA model obohacený o reziduální objem aktivity na Twitteru. V kontextu naší práce je residuální objem na Twitteru chápán jako proměnná, která reprezentuje neočekávanou aktivitu na této sociální síti. Druhým nejlepším v pořadí byl ARFIMA model bez dodatečných proměnných. ARFIMA model s objemem Twitteru byl potom třetím modelem v pořadí. Pořadí modelů odhalilo, že na našich datech je ARFIMA vhodnějším modelem pro predikci volatility. Co se týče jednotlivých efektů u Twitter proměnných, výzkum ukázal, že aktivita na Twitteru pozitivně ovlivňuje...
The thesis investigates relationship between daily stock return volatility of Dow Jones Industrial Average stocks and data obtained on Twitter, the social media network. The Twitter data set contains a number of tweets, categorized according to their polarity, i.e. positive, negative and neutral sentiment of tweets. We construct two classes of models, GARCH and ARFIMA, where for either of them we research basic model setting and setting with additional Twitter variables. Our goal is to compare, which of them predicts the one day ahead volatility most precisely. Besides, we provide commentary regarding the effects of Twitter volume variables on future stock volatility. The analysis has revealed that the best performing model, given the length and structure of our data set, is the ARFIMA model augmented on Twitter volume residuals. In the context of the thesis, Twitter volume residuals represent unexpected activity on the social media network and are obtained as residuals from Twitter volume autoregression. Plain ARFIMA model was the second best and plain volume augmented ARFIMA was in third place. This means that all three ARFIMA models outperformed all three GARCH models in our research. Regarding the Twitter estimation parameters, we found that higher the activity the higher tomorrow's stock...