Srovnání modelů pravděpodobností ve fotbalovém sázení
Comparison of Models for Probabilities in Football Betting
bachelor thesis (NOT DEFENDED)
![Document thumbnail](/bitstream/handle/20.500.11956/116919/thumbnail.png?sequence=8&isAllowed=y)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/116919Identifiers
Study Information System: 206128
Collections
- Kvalifikační práce [11242]
Author
Advisor
Referee
Hlávka, Zdeněk
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
General Mathematics
Department
Department of Probability and Mathematical Statistics
Date of defense
13. 2. 2020
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Fail
Keywords (Czech)
sázkové kurzy, regresní analýza, strojové učeníKeywords (English)
betting odds, regression analysis, machine learningCílem práce je porovnat různé statistické modely pro fotbalové kurzy a předpovědět co nejlépe chování týmu na základě historických výkonů týmu. Jsou zde nejméně tři možnosti, jak počítat pravděpodobnost, a to nelineární regrese, Poissonova regrese a metoda založená na strojovém učení. Myšlenkou je, že historické výkony týmů jsou dobré pro předpověď pro následující zápasy. Tedy můžeme vzít všechny zápasy v celé sezóně v Anglické Lize mistrů (380 zápasů) a použít data pro předpověď pravděpodobností pro další sezónu. Výsledné pravděpodobnosti by měli být porovnány se skutečnými výsledky a dle toho určíme nejlepší model.
The aim of the thesis is to compare different statistical models for football betting odds and determine the best performing once based on the historical performance of sport teams. There are at least three possible approaches for computing the odds, namely logistic regression, Poisson regression and methods based on statistical machine learning. The idea is that the historical performance of teams is a good predictor of the future performance. Thus we can take the past performances, say all matches in the full season of the English Premier League (380 matches), and use these data for predicting the odds for the following season. The resulting odds should be compared with the actual results using the scoring rules, which will identify the best performing model.