Prédiction des résultats des tournois sportifs
Transcription
Prédiction des résultats des tournois sportifs
Applications des mathématiques: Prédiction des résultats des tournois sportifs Mathématiques Appliquées et Génie Industriel Résumé On présente et on justifie un modèle simple pour un match de basketball. On se sert ensuite du modèle pour faire une simulation MonteCarlo du grand tournoi NCAA. Domaines du génie Tous Notions mathématiques Evénements, Variables aléatoires, Simulation Monte Carlo Cours pertinents Probabilités et Statistiques Auteur(es) N.Khattabi, S.Forman Sommaire 1 Introduction 2 2 Modélisation 2.1 Modèle probabiliste pour un seul match . . . . . . . . . . . . . . . . . . . . 2.2 Simulation de Monte-Carlo . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 4 3 Interprétation des résultats 7 4 Conclusion 9 Références 9 Le gagnant du tournoi 1 MAGI Introduction Tout le monde aimerait pouvoir prédire les résultats des tournois sportifs tels que : la coupe Stanley, le Mondial de Football, le Super Bowl etc ... Même si chaque match peut être facile à prédire, le résultat d’un tournoi est difficile à prévoir à cause du grand nombre de combinaisons possibles. Figure 1: Un tournoi de basket-ball On va voir comment l’utilisation d’un modèle simple pour chaque match peut nous permettre de prédire le résultat d’un tournoi en entier. Aux États Unis, le NCAA (National Collegiate Athletic Association), une association impliquée dans les programmes d’athlétisme dans les universités américaines, organise à chaque année un tournoi de basket-ball entre les universités de division 1. Ce genre de tournoi est très intéressant pour l’application de notre modèle car la prédiction des résultats des matchs est plus difficile vu que les joueurs sont de jeunes étudiants qui changent à chaque année. Les spectateurs possèdent donc peu de données sur les joueurs et les changements fréquents au sein des équipes ajoutent un élément aléatoire au tournoi. Le tournoi se fait entre les seize meilleures équipes qui jouent deux à deux. Les gagnants avancent et jouent encore deux à deux. Après quatre tours, on a le gagnant du tournoi. La figure à la page suivante illustre ce principe en utilisant des équipes américaines participantes au tournoi du NCAA 2004. Saint_Joseph's______ |_______________ Liberty_____________| | _____|________________ Texas_Tech__________ | | |_______________| | Charlotte___________| | _____|________________ Florida_____________ | | |_______________ | | Manhattan___________| | | | _____|_______________| | Wake_Forest_________ | | |_______________| | Va._Commonwealth____| | L'équipe gagnante du tournoi Wisconsin___________ | |_______________ | Richmond____________| | | _____|_______________ | Pittsburgh__________ | | | |_______________| | | UCF_________________| | | _____|_______________| Memphis_____________ | |_______________ | South_Carolina______| | | _____|_______________| Oklahoma_St.________ | |_______________| Eastern_Washington__| Figure 2: Étapes du tournoi en 2005 2 Le gagnant du tournoi MAGI On voudrait, à partir d’un certain indice, trouver l’équipe qui a la plus grande probabilité de gagner le tournoi. 2 Modélisation La modélisation se fera en deux étapes : la première étape sera l’application d’un modèle pour un seul match et la deuxième sera l’application d’un modèle pour tout le tournoi. 2.1 Modèle probabiliste pour un seul match Les agences de jeux à Las Vegas ont développé un système pour attribuer une cote de succès à chaque équipe. Ces cotes s’appelle ”Sagarin Ratings”. À partir des cotes Ci et Cj de deux équipes i et j, on peut estimer de manière raisonnable la probabilité de victoire ou la défaite, en cas d’affrontement entre les 2 équipes. Au moment d’un match, Il y a deux événements possibles : {victoire de i , victoire de j}. Durant la saison #de victoire de i contre j régulière, on peut comparer la probabilité en fonction de l’écart Ci − Cj . On #de match entre i et j peut voir ceci sur le graphe suivant : Probabilité de gagner Probabilité de gagner Vs Ci - Cj Ci - Cj Ces données suggèrent qu’on utilise une fonction croisssante, qui prend des valeurs entre 0 et 1, définie pour tout ∆C = Ci − Cj et tel que f (∆C) − 0.5 = 0.5 − f (−∆C). La fonction la plus simple serait : 3 MAGI Le gagnant du tournoi P [i bat j à l’endroit loc] = f (∆) = 1 1 + exp(a · ∆C) (1) Où a est une constante et ∆C = Ci − Cj − 4.1 · loc −1 si le match est joué chez l’équipe j, 0 si le match est joué sur un terrain neutre, loc = 1 si le match est joué chez l’équipe i, À l’aide de la méthode des moindres carrés, on peut trouver la valeur de a pour laquelle cette fonction approxime le mieux les donnés empirique. Le résultat est impressionnant. Les triangles blancs dans le graphe suivant sont des valeurs de cette fonction. 3&"4%4'2',/*.+*5%5)+& Comparaison entre f et des données recueillies !"#$%&%'(")*+),&+*-*+,*.+(*."))/+(*&+01+'22'( !'*6*!7 8+(*9%2+1&(*.+*8+(*."))/+(*&+01+'22'+( 2.2 Simulation de Monte-Carlo Les méthodes de Monte Carlo reposent sur la loi des grands nombres. En répétant un grand nombre de fois une expérience, de façon (théoriquement) indépendante, on obtient une approximation de plus en plus fiable de la vraie valeur de l’espérance (la moyenne) du phénomène observé. Soit T les résultats d’un tournoi. Pour nous, les résultats incluent non seulement l’équipe qui a gagné le tournoi mais l’ensemble des victoires intermédiaires dans le tournoi. Il est possible de vérifier qu’un tournoi avec 16 équipes possède 32768 = 28 · 24 · 22 · 2 différents résultats. Simulation d’un tournoi Si on possède un générateur de nombres aléatoires, alors, pour les huit premiers matchs du tournoi, on peut choisir un nombre θ ∈ [0, 1], θ > 0.5 et si θ = P [i bat j] = f (Ci − Cj) alors on peut considérer que i a gagné. 4 Le gagnant du tournoi MAGI Premier tour Saint_Joseph's______ Saint_Joseph's______ Liberty_____________| | __|_______________ Texas_Tech__________ | | Charlotte___________| | Charlotte___________| | _____|_______________ Florida_____________ | | Florida_____________ | | Manhattan___________| | | | __|_______________| | Wake_Forest_________ | | Va._Commonwealth____| | Va._Commonwealth____| | _______|________ Wisconsin___________ | Richmond____________ | Richmond____________| | | __|_______________ | Pittsburgh__________ | | | Pittsburgh__________| | | UCF_________________| | | _____|_______________| Memphis_____________ | South_Carolina______ | South_Carolina______| | | __|_______________| Oklahoma_St.________ | Oklahoma_St.________| Eastern_Washington__| Si on répète ceci pour déterminer les gagnants parmi les quatre matchs de la 2ème ronde on peut obtenir une famille fictive de quatre gagnants pour la 2ème ronde. 5 Le gagnant du tournoi MAGI Deuxième ronde Saint_Joseph's______ _Saint_Joseph's______ Liberty_____________| | _Saint_Joseph's______ Texas_Tech__________ | | Charlotte___________| | Charlotte___________| | _____|_______________ Florida_____________ | | Florida_____________ | | Manhattan___________| | | | _Va._Commonwealth____| | Wake_Forest_________ | | Va._Commonwealth____| | Va._Commonwealth____| | _______|________ Wisconsin___________ | Richmond____________ | Richmond____________| | | _Pittsburgh__________ | Pittsburgh__________ | | | Pittsburgh__________| | | UCF_________________| | | _____|_______________| Memphis_____________ | South_Carolina______ | South_Carolina______| | | _Oklahoma_St.________| Oklahoma_St.________ | Oklahoma_St.________| Eastern_Washington__| Répétant ainsi pour les 2 dernières rondes, on peut obtenir un gagnant. 6 Le gagnant du tournoi MAGI La finale Saint_Joseph's______ Saint_Joseph's______ Liberty_____________| | Saint_Joseph's______ Texas_Tech__________ | | Charlotte___________| | Charlotte___________| | Saint_Joseph's______ Florida_____________ | | Florida_____________ | | Manhattan___________| | | | Va._Commonwealth____| | Wake_Forest_________ | | Va._Commonwealth____| | Va._Commonwealth____| | Oklahoma_St Wisconsin___________ | Richmond____________ | Richmond____________| | | Pittsburgh__________ | Pittsburgh__________ | | | Pittsburgh__________| | | UCF_________________| | | Oklahoma_St.________| Memphis_____________ | South_Carolina______ | South_Carolina______| | | Oklahoma_St.________| Oklahoma_St.________ | Oklahoma_St.________| Eastern_Washington__| Appelons les résultats de ce tournoi T1 . P [T = T1 ] ≈ 1 · (# de fois que le résultat T1 surviendrait si on répétait la simulation 106 fois) 106 Ceci est le principe de la simulation Monte-Carlo. En général P [l’équipe i gagne le tournoi] ≈ 3 1 (# de fois que le résultat Ti surviendrait si on répétait l’expérience 106 fois) 106 Interprétation des résultats Sean Forman a répété ces simulations un millions de fois pour les 64 équipes participantes au NCAA. Il a obtenu les statistiques suivantes qui déterminent très bien l’équipe qui a le plus de chance de gagner : 7 MAGI Le gagnant du tournoi When they lost 1:0:Duke 2:1:Saint Joseph's 3:2:Georgia Tech 4:3:Connecticut 5:4:Gonzaga 6:5:Oklahoma St. 7:6:Cincinnati 8:7:North Carolina 9:8:Kentucky 10:9:Louisville 11:a:Wake Forest 12:A:Wisconsin 13:b:No. Carolina St. 14:B:Texas 15:c:Stanford 16:C:Pittsburgh 17:d:Mississippi St. 18:D:Maryland 19:e:Florida 20:E:Illinois 21:f:Vanderbilt 22:F:Nevada 23:g:Kansas 25:G:Arizona 26:h:Providence 27:H:Western Michigan 28:i:Texas Tech 29:I:BYU 30:j:Seton Hall 31:J:Alabama 32:k:South Carolina 33:K:Memphis 34:l:Charlotte 35:L:Xavier-Ohio 36:m:UAB 37:M:Utah 39:n:Southern Illinois 40:N:UTEP 41:o:Michigan St. 42:O:Syracuse 43:p:Boston College 44:P:Richmond 45:q:Air Force 47:Q:Murray St. 54:r:Manhattan 55:R:Washington 64:s:DePaul 70:S:Louisiana-Lafayette 75:t:Illinois-Chicago 77:T:Dayton 79:u:Va. Commonwealth 86:U:Pacific 87:v:Northern Iowa 88:V:East Tennessee St. 111:w:Princeton 112:W:UCF 123:x:Eastern Washington 150:X:Valparaiso 171:y:Vermont 189:Y:Liberty 204:z:Monmouth-NJ 232:Z:Lehigh 243:*:Texas-San Antonio 264:#:Alabama St. 1 / 0.002 / 0.014 / 0.071 / 0.022 / 0.029 / 0.045 / 0.080 / 0.165 / 0.013 / 0.231 / 0.110 / 0.203 / 0.147 / 0.073 / 0.015 / 0.080 / 0.028 / 0.274 / 0.239 / 0.273 / 0.466 / 0.325 / 0.217 / 0.456 / 0.200 / 0.534 / 0.422 / 0.375 / 0.544 / 0.428 / 0.478 / 0.522 / 0.578 / 0.769 / 0.386 / 0.444 / 0.572 / 0.726 / 0.675 / 0.625 / 0.556 / 0.797 / 0.835 / 0.727 / 0.761 / 0.614 / 0.450 / 0.853 / 0.783 / 0.550 / 0.890 / 0.800 / 0.929 / 0.920 / 0.927 / 0.920 / 0.955 / 0.971 / 0.978 / 0.986 / 0.972 / 0.987 / 0.985 / 0.998 / 2 / 0.113 / 0.189 / 0.140 / 0.094 / 0.231 / 0.202 / 0.239 / 0.338 / 0.186 / 0.311 / 0.284 / 0.340 / 0.302 / 0.472 / 0.276 / 0.441 / 0.505 / 0.234 / 0.441 / 0.476 / 0.305 / 0.476 / 0.328 / 0.478 / 0.368 / 0.281 / 0.449 / 0.358 / 0.407 / 0.391 / 0.393 / 0.366 / 0.348 / 0.157 / 0.476 / 0.444 / 0.318 / 0.152 / 0.268 / 0.257 / 0.367 / 0.147 / 0.124 / 0.223 / 0.190 / 0.325 / 0.485 / 0.112 / 0.153 / 0.404 / 0.085 / 0.151 / 0.050 / 0.062 / 0.066 / 0.072 / 0.038 / 0.026 / 0.018 / 0.014 / 0.027 / 0.012 / 0.015 / 0.002 / 3 / 0.190 / 0.260 / 0.321 / 0.285 / 0.335 / 0.283 / 0.466 / 0.206 / 0.226 / 0.219 / 0.331 / 0.233 / 0.308 / 0.219 / 0.264 / 0.263 / 0.263 / 0.233 / 0.211 / 0.206 / 0.154 / 0.132 / 0.280 / 0.043 / 0.275 / 0.129 / 0.081 / 0.162 / 0.033 / 0.102 / 0.087 / 0.077 / 0.052 / 0.055 / 0.080 / 0.086 / 0.070 / 0.085 / 0.045 / 0.084 / 0.061 / 0.044 / 0.031 / 0.046 / 0.042 / 0.042 / 0.052 / 0.030 / 0.054 / 0.038 / 0.023 / 0.042 / 0.019 / 0.017 / 0.006 / 0.007 / 0.006 / 0.003 / 0.004 / 0.001 / 0.001 / 0.001 / 0.001 / 0.000 / Les probs, ça peut être payant ! 8 4 / 0.147 / 0.200 / 0.156 / 0.186 / 0.146 / 0.222 / 0.093 / 0.193 / 0.304 / 0.163 / 0.133 / 0.125 / 0.100 / 0.168 / 0.247 / 0.129 / 0.152 / 0.153 / 0.066 / 0.028 / 0.040 / 0.039 / 0.123 / 0.016 / 0.113 / 0.032 / 0.032 / 0.075 / 0.011 / 0.057 / 0.031 / 0.026 / 0.016 / 0.016 / 0.046 / 0.019 / 0.032 / 0.029 / 0.009 / 0.027 / 0.012 / 0.010 / 0.008 / 0.003 / 0.006 / 0.016 / 0.011 / 0.004 / 0.009 / 0.007 / 0.002 / 0.006 / 0.002 / 0.001 / 0.001 / 0.001 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 5 / 0.120 / 0.138 / 0.135 / 0.238 / 0.120 / 0.115 / 0.053 / 0.044 / 0.138 / 0.036 / 0.075 / 0.055 / 0.096 / 0.035 / 0.136 / 0.051 / 0.029 / 0.076 / 0.027 / 0.011 / 0.027 / 0.019 / 0.036 / 0.005 / 0.032 / 0.019 / 0.011 / 0.025 / 0.003 / 0.018 / 0.008 / 0.006 / 0.004 / 0.002 / 0.009 / 0.006 / 0.008 / 0.007 / 0.003 / 0.006 / 0.003 / 0.002 / 0.001 / 0.001 / 0.001 / 0.002 / 0.003 / 0.001 / 0.001 / 0.001 / 0.000 / 0.001 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 6 / 0.112 / 0.103 / 0.094 / 0.081 / 0.078 / 0.075 / 0.034 / 0.028 / 0.079 / 0.022 / 0.042 / 0.029 / 0.027 / 0.019 / 0.037 / 0.025 / 0.014 / 0.019 / 0.011 / 0.004 / 0.005 / 0.007 / 0.012 / 0.002 / 0.010 / 0.004 / 0.004 / 0.004 / 0.001 / 0.003 / 0.002 / 0.002 / 0.001 / 0.001 / 0.002 / 0.001 / 0.001 / 0.001 / 0.001 / 0.001 / 0.001 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / 0.000 / Never 0.317 0.096 0.083 0.094 0.062 0.057 0.035 0.026 0.053 0.018 0.026 0.016 0.020 0.014 0.025 0.012 0.009 0.012 0.004 0.002 0.002 0.002 0.004 0.001 0.003 0.001 0.001 0.001 0.000 0.001 0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / Times won (316845) ( 95824) ( 82703) ( 93859) ( 61896) ( 56940) ( 35021) ( 26295) ( 52680) ( 18468) ( 25825) ( 16124) ( 19793) ( 13729) ( 25424) ( 11571) ( 8801) ( 11548) ( 4185) ( 2041) ( 2357) ( 2317) ( 3987) ( 787) ( 2940) ( 1343) ( 966) ( 1474) ( 372) ( 891) ( 506) ( 350) ( 252) ( 156) ( 385) ( 285) ( 255) ( 221) ( 93) ( 149) ( 105) ( 48) ( 28) ( 21) ( 24) ( 44) ( 27) ( 10) ( 8) ( 19) ( 2) ( 3) ( 2) ( 1) ( 0) ( 0) ( 0) ( 0) ( 0) ( 0) ( 0) ( 0) ( 0) ( 0) Le gagnant du tournoi 4 MAGI Conclusion On a présenté et justifié un modèle simple pour un match de basket-ball. On a ensuite utiliser ce modèle pour faire une simulation Monte-Carlo qui nous a permis d’identifier l’équipe qui avait le plus de chance de gagner le tournoi. Références [1] Figure 1. [En ligne] http ://www.mondousa.com/francais/sections/html/olympic2004v3.htm. Page consultée le 20 mai 2009. [2] La méthode Monte-Carlo.[En ligne] http ://fr.wikipedia.org/wiki/Methode de Monte-Carlo. Page consultée le 20 mai 2009. Auteur : Sean Forman, Dept. of Mathematics and Computer Science, Saint Joseph’s University, Philadelphia, PA. http ://www.sju.edu/ 9