Prédiction des résultats des tournois sportifs

Commentaires

Transcription

Prédiction des résultats des tournois sportifs
Applications des mathématiques:
Prédiction des résultats des
tournois sportifs
Mathématiques
Appliquées et
Génie Industriel
Résumé
On présente et on justifie un modèle simple pour un match de basketball. On se sert ensuite du modèle pour faire une simulation MonteCarlo du grand tournoi NCAA.
Domaines du génie
Tous
Notions mathématiques
Evénements, Variables aléatoires, Simulation Monte Carlo
Cours pertinents
Probabilités et Statistiques
Auteur(es)
N.Khattabi, S.Forman
Sommaire
1 Introduction
2
2 Modélisation
2.1 Modèle probabiliste pour un seul match . . . . . . . . . . . . . . . . . . . .
2.2 Simulation de Monte-Carlo . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
3
4
3 Interprétation des résultats
7
4 Conclusion
9
Références
9
Le gagnant du tournoi
1
MAGI
Introduction
Tout le monde aimerait pouvoir prédire les résultats des
tournois sportifs tels que : la coupe Stanley, le Mondial de
Football, le Super Bowl etc ...
Même si chaque match peut être facile à prédire, le résultat
d’un tournoi est difficile à prévoir à cause du grand nombre
de combinaisons possibles.
Figure 1: Un tournoi de basket-ball
On va voir comment l’utilisation d’un modèle simple pour
chaque match peut nous permettre de prédire le résultat
d’un tournoi en entier.
Aux États Unis, le NCAA (National Collegiate Athletic Association), une association impliquée dans
les programmes d’athlétisme dans les universités américaines, organise à chaque année un tournoi de
basket-ball entre les universités de division 1. Ce genre de tournoi est très intéressant pour l’application
de notre modèle car la prédiction des résultats des matchs est plus difficile vu que les joueurs sont de
jeunes étudiants qui changent à chaque année.
Les spectateurs possèdent donc peu de données sur les joueurs et les changements fréquents au sein des
équipes ajoutent un élément aléatoire au tournoi.
Le tournoi se fait entre les seize meilleures équipes qui jouent deux à deux. Les gagnants avancent et
jouent encore deux à deux. Après quatre tours, on a le gagnant du tournoi. La figure à la page suivante
illustre ce principe en utilisant des équipes américaines participantes au tournoi du NCAA 2004.
Saint_Joseph's______
|_______________
Liberty_____________|
|
_____|________________
Texas_Tech__________
|
|
|_______________|
|
Charlotte___________|
|
_____|________________
Florida_____________
|
|
|_______________
|
|
Manhattan___________|
|
|
|
_____|_______________|
|
Wake_Forest_________
|
|
|_______________|
|
Va._Commonwealth____|
|
L'équipe gagnante du tournoi
Wisconsin___________
|
|_______________
|
Richmond____________|
|
|
_____|_______________
|
Pittsburgh__________
|
|
|
|_______________|
|
|
UCF_________________|
|
|
_____|_______________|
Memphis_____________
|
|_______________
|
South_Carolina______|
|
|
_____|_______________|
Oklahoma_St.________
|
|_______________|
Eastern_Washington__|
Figure 2: Étapes du tournoi en 2005
2
Le gagnant du tournoi
MAGI
On voudrait, à partir d’un certain indice, trouver l’équipe qui a la plus grande probabilité de gagner le
tournoi.
2
Modélisation
La modélisation se fera en deux étapes : la première étape sera l’application d’un modèle pour un seul
match et la deuxième sera l’application d’un modèle pour tout le tournoi.
2.1
Modèle probabiliste pour un seul match
Les agences de jeux à Las Vegas ont développé un système pour attribuer une cote de succès à chaque
équipe. Ces cotes s’appelle ”Sagarin Ratings”.
À partir des cotes Ci et Cj de deux équipes i et j, on peut estimer de manière raisonnable la probabilité
de victoire ou la défaite, en cas d’affrontement entre les 2 équipes.
Au moment d’un match, Il y a deux événements possibles : {victoire de i , victoire de j}. Durant la saison
#de victoire de i contre j
régulière, on peut comparer la probabilité
en fonction de l’écart Ci − Cj . On
#de match entre i et j
peut voir ceci sur le graphe suivant :
Probabilité de gagner
Probabilité de gagner Vs Ci - Cj
Ci - Cj
Ces données suggèrent qu’on utilise une fonction croisssante, qui prend des valeurs entre 0 et 1, définie
pour tout ∆C = Ci − Cj et tel que f (∆C) − 0.5 = 0.5 − f (−∆C). La fonction la plus simple serait :
3
MAGI
Le gagnant du tournoi
P [i bat j à l’endroit loc] = f (∆) =
1
1 + exp(a · ∆C)
(1)
Où a est une constante et
∆C =
Ci − Cj − 4.1 · loc
 −1 si le match est joué chez l’équipe j,
0 si le match est joué sur un terrain neutre,
loc =

1 si le match est joué chez l’équipe i,
À l’aide de la méthode des moindres carrés, on peut trouver la valeur de a pour laquelle cette fonction
approxime le mieux les donnés empirique. Le résultat est impressionnant. Les triangles blancs dans le
graphe suivant sont des valeurs de cette fonction.
3&"4%4'2',/*.+*5%5)+&
Comparaison entre f et des données recueillies
!"#$%&%'(")*+),&+*-*+,*.+(*."))/+(*&+01+'22'(
!'*6*!7
8+(*9%2+1&(*.+*8+(*."))/+(*&+01+'22'+(
2.2
Simulation de Monte-Carlo
Les méthodes de Monte Carlo reposent sur la loi des grands nombres. En répétant un grand nombre de
fois une expérience, de façon (théoriquement) indépendante, on obtient une approximation de plus en
plus fiable de la vraie valeur de l’espérance (la moyenne) du phénomène observé.
Soit T les résultats d’un tournoi. Pour nous, les résultats incluent non seulement l’équipe qui a gagné
le tournoi mais l’ensemble des victoires intermédiaires dans le tournoi. Il est possible de vérifier qu’un
tournoi avec 16 équipes possède 32768 = 28 · 24 · 22 · 2 différents résultats.
Simulation d’un tournoi
Si on possède un générateur de nombres aléatoires, alors, pour les huit premiers matchs du tournoi, on
peut choisir un nombre θ ∈ [0, 1], θ > 0.5 et si θ = P [i bat j] = f (Ci − Cj) alors on peut considérer
que i a gagné.
4
Le gagnant du tournoi
MAGI
Premier tour
Saint_Joseph's______
Saint_Joseph's______
Liberty_____________|
|
__|_______________
Texas_Tech__________
|
|
Charlotte___________|
|
Charlotte___________|
|
_____|_______________
Florida_____________
|
|
Florida_____________
|
|
Manhattan___________|
|
|
|
__|_______________|
|
Wake_Forest_________
|
|
Va._Commonwealth____|
|
Va._Commonwealth____|
|
_______|________
Wisconsin___________
|
Richmond____________
|
Richmond____________|
|
|
__|_______________
|
Pittsburgh__________
|
|
|
Pittsburgh__________|
|
|
UCF_________________|
|
|
_____|_______________|
Memphis_____________
|
South_Carolina______
|
South_Carolina______|
|
|
__|_______________|
Oklahoma_St.________
|
Oklahoma_St.________|
Eastern_Washington__|
Si on répète ceci pour déterminer les gagnants parmi les quatre matchs de la 2ème ronde on peut obtenir
une famille fictive de quatre gagnants pour la 2ème ronde.
5
Le gagnant du tournoi
MAGI
Deuxième ronde
Saint_Joseph's______
_Saint_Joseph's______
Liberty_____________|
|
_Saint_Joseph's______
Texas_Tech__________
|
|
Charlotte___________|
|
Charlotte___________|
|
_____|_______________
Florida_____________
|
|
Florida_____________
|
|
Manhattan___________|
|
|
|
_Va._Commonwealth____|
|
Wake_Forest_________
|
|
Va._Commonwealth____|
|
Va._Commonwealth____|
|
_______|________
Wisconsin___________
|
Richmond____________
|
Richmond____________|
|
|
_Pittsburgh__________
|
Pittsburgh__________
|
|
|
Pittsburgh__________|
|
|
UCF_________________|
|
|
_____|_______________|
Memphis_____________
|
South_Carolina______
|
South_Carolina______|
|
|
_Oklahoma_St.________|
Oklahoma_St.________
|
Oklahoma_St.________|
Eastern_Washington__|
Répétant ainsi pour les 2 dernières rondes, on peut obtenir un gagnant.
6
Le gagnant du tournoi
MAGI
La finale
Saint_Joseph's______
Saint_Joseph's______
Liberty_____________|
|
Saint_Joseph's______
Texas_Tech__________
|
|
Charlotte___________|
|
Charlotte___________|
|
Saint_Joseph's______
Florida_____________
|
|
Florida_____________
|
|
Manhattan___________|
|
|
|
Va._Commonwealth____|
|
Wake_Forest_________
|
|
Va._Commonwealth____|
|
Va._Commonwealth____|
|
Oklahoma_St
Wisconsin___________
|
Richmond____________
|
Richmond____________|
|
|
Pittsburgh__________
|
Pittsburgh__________
|
|
|
Pittsburgh__________|
|
|
UCF_________________|
|
|
Oklahoma_St.________|
Memphis_____________
|
South_Carolina______
|
South_Carolina______|
|
|
Oklahoma_St.________|
Oklahoma_St.________
|
Oklahoma_St.________|
Eastern_Washington__|
Appelons les résultats de ce tournoi T1 .
P [T = T1 ] ≈
1
· (# de fois que le résultat T1 surviendrait si on répétait la simulation 106 fois)
106
Ceci est le principe de la simulation Monte-Carlo. En général
P [l’équipe i gagne le tournoi] ≈
3
1
(# de fois que le résultat Ti surviendrait si on répétait l’expérience 106 fois)
106
Interprétation des résultats
Sean Forman a répété ces simulations un millions de fois pour les 64 équipes participantes au NCAA. Il
a obtenu les statistiques suivantes qui déterminent très bien l’équipe qui a le plus de chance de gagner :
7
MAGI
Le gagnant du tournoi
When they lost
1:0:Duke
2:1:Saint Joseph's
3:2:Georgia Tech
4:3:Connecticut
5:4:Gonzaga
6:5:Oklahoma St.
7:6:Cincinnati
8:7:North Carolina
9:8:Kentucky
10:9:Louisville
11:a:Wake Forest
12:A:Wisconsin
13:b:No. Carolina St.
14:B:Texas
15:c:Stanford
16:C:Pittsburgh
17:d:Mississippi St.
18:D:Maryland
19:e:Florida
20:E:Illinois
21:f:Vanderbilt
22:F:Nevada
23:g:Kansas
25:G:Arizona
26:h:Providence
27:H:Western Michigan
28:i:Texas Tech
29:I:BYU
30:j:Seton Hall
31:J:Alabama
32:k:South Carolina
33:K:Memphis
34:l:Charlotte
35:L:Xavier-Ohio
36:m:UAB
37:M:Utah
39:n:Southern Illinois
40:N:UTEP
41:o:Michigan St.
42:O:Syracuse
43:p:Boston College
44:P:Richmond
45:q:Air Force
47:Q:Murray St.
54:r:Manhattan
55:R:Washington
64:s:DePaul
70:S:Louisiana-Lafayette
75:t:Illinois-Chicago
77:T:Dayton
79:u:Va. Commonwealth
86:U:Pacific
87:v:Northern Iowa
88:V:East Tennessee St.
111:w:Princeton
112:W:UCF
123:x:Eastern Washington
150:X:Valparaiso
171:y:Vermont
189:Y:Liberty
204:z:Monmouth-NJ
232:Z:Lehigh
243:*:Texas-San Antonio
264:#:Alabama St.
1 /
0.002 /
0.014 /
0.071 /
0.022 /
0.029 /
0.045 /
0.080 /
0.165 /
0.013 /
0.231 /
0.110 /
0.203 /
0.147 /
0.073 /
0.015 /
0.080 /
0.028 /
0.274 /
0.239 /
0.273 /
0.466 /
0.325 /
0.217 /
0.456 /
0.200 /
0.534 /
0.422 /
0.375 /
0.544 /
0.428 /
0.478 /
0.522 /
0.578 /
0.769 /
0.386 /
0.444 /
0.572 /
0.726 /
0.675 /
0.625 /
0.556 /
0.797 /
0.835 /
0.727 /
0.761 /
0.614 /
0.450 /
0.853 /
0.783 /
0.550 /
0.890 /
0.800 /
0.929 /
0.920 /
0.927 /
0.920 /
0.955 /
0.971 /
0.978 /
0.986 /
0.972 /
0.987 /
0.985 /
0.998 /
2 /
0.113 /
0.189 /
0.140 /
0.094 /
0.231 /
0.202 /
0.239 /
0.338 /
0.186 /
0.311 /
0.284 /
0.340 /
0.302 /
0.472 /
0.276 /
0.441 /
0.505 /
0.234 /
0.441 /
0.476 /
0.305 /
0.476 /
0.328 /
0.478 /
0.368 /
0.281 /
0.449 /
0.358 /
0.407 /
0.391 /
0.393 /
0.366 /
0.348 /
0.157 /
0.476 /
0.444 /
0.318 /
0.152 /
0.268 /
0.257 /
0.367 /
0.147 /
0.124 /
0.223 /
0.190 /
0.325 /
0.485 /
0.112 /
0.153 /
0.404 /
0.085 /
0.151 /
0.050 /
0.062 /
0.066 /
0.072 /
0.038 /
0.026 /
0.018 /
0.014 /
0.027 /
0.012 /
0.015 /
0.002 /
3 /
0.190 /
0.260 /
0.321 /
0.285 /
0.335 /
0.283 /
0.466 /
0.206 /
0.226 /
0.219 /
0.331 /
0.233 /
0.308 /
0.219 /
0.264 /
0.263 /
0.263 /
0.233 /
0.211 /
0.206 /
0.154 /
0.132 /
0.280 /
0.043 /
0.275 /
0.129 /
0.081 /
0.162 /
0.033 /
0.102 /
0.087 /
0.077 /
0.052 /
0.055 /
0.080 /
0.086 /
0.070 /
0.085 /
0.045 /
0.084 /
0.061 /
0.044 /
0.031 /
0.046 /
0.042 /
0.042 /
0.052 /
0.030 /
0.054 /
0.038 /
0.023 /
0.042 /
0.019 /
0.017 /
0.006 /
0.007 /
0.006 /
0.003 /
0.004 /
0.001 /
0.001 /
0.001 /
0.001 /
0.000 /
Les probs, ça peut être payant !
8
4 /
0.147 /
0.200 /
0.156 /
0.186 /
0.146 /
0.222 /
0.093 /
0.193 /
0.304 /
0.163 /
0.133 /
0.125 /
0.100 /
0.168 /
0.247 /
0.129 /
0.152 /
0.153 /
0.066 /
0.028 /
0.040 /
0.039 /
0.123 /
0.016 /
0.113 /
0.032 /
0.032 /
0.075 /
0.011 /
0.057 /
0.031 /
0.026 /
0.016 /
0.016 /
0.046 /
0.019 /
0.032 /
0.029 /
0.009 /
0.027 /
0.012 /
0.010 /
0.008 /
0.003 /
0.006 /
0.016 /
0.011 /
0.004 /
0.009 /
0.007 /
0.002 /
0.006 /
0.002 /
0.001 /
0.001 /
0.001 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
5 /
0.120 /
0.138 /
0.135 /
0.238 /
0.120 /
0.115 /
0.053 /
0.044 /
0.138 /
0.036 /
0.075 /
0.055 /
0.096 /
0.035 /
0.136 /
0.051 /
0.029 /
0.076 /
0.027 /
0.011 /
0.027 /
0.019 /
0.036 /
0.005 /
0.032 /
0.019 /
0.011 /
0.025 /
0.003 /
0.018 /
0.008 /
0.006 /
0.004 /
0.002 /
0.009 /
0.006 /
0.008 /
0.007 /
0.003 /
0.006 /
0.003 /
0.002 /
0.001 /
0.001 /
0.001 /
0.002 /
0.003 /
0.001 /
0.001 /
0.001 /
0.000 /
0.001 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
6 /
0.112 /
0.103 /
0.094 /
0.081 /
0.078 /
0.075 /
0.034 /
0.028 /
0.079 /
0.022 /
0.042 /
0.029 /
0.027 /
0.019 /
0.037 /
0.025 /
0.014 /
0.019 /
0.011 /
0.004 /
0.005 /
0.007 /
0.012 /
0.002 /
0.010 /
0.004 /
0.004 /
0.004 /
0.001 /
0.003 /
0.002 /
0.002 /
0.001 /
0.001 /
0.002 /
0.001 /
0.001 /
0.001 /
0.001 /
0.001 /
0.001 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
0.000 /
Never
0.317
0.096
0.083
0.094
0.062
0.057
0.035
0.026
0.053
0.018
0.026
0.016
0.020
0.014
0.025
0.012
0.009
0.012
0.004
0.002
0.002
0.002
0.004
0.001
0.003
0.001
0.001
0.001
0.000
0.001
0.001
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
/
Times won
(316845)
( 95824)
( 82703)
( 93859)
( 61896)
( 56940)
( 35021)
( 26295)
( 52680)
( 18468)
( 25825)
( 16124)
( 19793)
( 13729)
( 25424)
( 11571)
( 8801)
( 11548)
( 4185)
( 2041)
( 2357)
( 2317)
( 3987)
(
787)
( 2940)
( 1343)
(
966)
( 1474)
(
372)
(
891)
(
506)
(
350)
(
252)
(
156)
(
385)
(
285)
(
255)
(
221)
(
93)
(
149)
(
105)
(
48)
(
28)
(
21)
(
24)
(
44)
(
27)
(
10)
(
8)
(
19)
(
2)
(
3)
(
2)
(
1)
(
0)
(
0)
(
0)
(
0)
(
0)
(
0)
(
0)
(
0)
(
0)
(
0)
Le gagnant du tournoi
4
MAGI
Conclusion
On a présenté et justifié un modèle simple pour un match de basket-ball. On a ensuite utiliser ce modèle
pour faire une simulation Monte-Carlo qui nous a permis d’identifier l’équipe qui avait le plus de chance
de gagner le tournoi.
Références
[1] Figure 1. [En ligne] http ://www.mondousa.com/francais/sections/html/olympic2004v3.htm. Page
consultée le 20 mai 2009.
[2] La méthode Monte-Carlo.[En ligne] http ://fr.wikipedia.org/wiki/Methode de Monte-Carlo. Page
consultée le 20 mai 2009.
Auteur : Sean Forman, Dept. of Mathematics and Computer Science, Saint Joseph’s University,
Philadelphia, PA.
http ://www.sju.edu/
9

Documents pareils