Srovnání modelů pravděpodobností ve fotbalovém sázení
Comparison of Models for Probabilities in Football Betting
bakalářská práce (NEOBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/116919Identifikátory
SIS: 206128
Kolekce
- Kvalifikační práce [11244]
Autor
Vedoucí práce
Oponent práce
Hlávka, Zdeněk
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Obecná matematika
Katedra / ústav / klinika
Katedra pravděpodobnosti a matematické statistiky
Datum obhajoby
13. 2. 2020
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Neprospěl/a
Klíčová slova (česky)
sázkové kurzy, regresní analýza, strojové učeníKlíčová slova (anglicky)
betting odds, regression analysis, machine learningCílem práce je porovnat různé statistické modely pro fotbalové kurzy a předpovědět co nejlépe chování týmu na základě historických výkonů týmu. Jsou zde nejméně tři možnosti, jak počítat pravděpodobnost, a to nelineární regrese, Poissonova regrese a metoda založená na strojovém učení. Myšlenkou je, že historické výkony týmů jsou dobré pro předpověď pro následující zápasy. Tedy můžeme vzít všechny zápasy v celé sezóně v Anglické Lize mistrů (380 zápasů) a použít data pro předpověď pravděpodobností pro další sezónu. Výsledné pravděpodobnosti by měli být porovnány se skutečnými výsledky a dle toho určíme nejlepší model.
The aim of the thesis is to compare different statistical models for football betting odds and determine the best performing once based on the historical performance of sport teams. There are at least three possible approaches for computing the odds, namely logistic regression, Poisson regression and methods based on statistical machine learning. The idea is that the historical performance of teams is a good predictor of the future performance. Thus we can take the past performances, say all matches in the full season of the English Premier League (380 matches), and use these data for predicting the odds for the following season. The resulting odds should be compared with the actual results using the scoring rules, which will identify the best performing model.