TD sur le poker

Transcription

TD sur le poker
Théorie des jeux - IF 222 - ENSEIRB - 2011 - Hugo Gimbert
TD 2 - Bluff et Poker
Ce TD est une initiation à la théorie des jeux à information incomplète.
Le poker à trois cartes. On considère la forme la plus simple et nontriviale de poker : le poker à trois cartes et sans relance. Deux joueurs, appelés
le dealer et l’ouvreur jouent avec un jeu de trois cartes qui contient un as,
un deux et un trois. L’as est considéré comme la carte la plus faible.
Déroulement d’une partie. La partie se déroule comme suit :
Constitution du pot. Chaque joueur met 100 euros dans le pot. Une carte
est distribuée au hasard à chaque joueur. L’ouvreur peut miser soit 0 (check)
soit 100 (raise) euros.
Si l’ouvreur check, le dealer peut soit coller (call) (et verser 0 euros
au pot) soit miser 100 euros (raise). Si le dealer choisit de miser 100 euros,
l’ouvreur peut soit coller (et verser 100 euros au pot) soit se coucher (fold).
Si l’ouvreur raise, le dealer peut soit coller (et verser 100 euros au pot)
soit se coucher (fold).
Showdown. Si un joueur s’est couché, son adversaire gagne le pot. Si personne ne s’est couché, on compare les jeux et le gagnant gagne le pot.
Exercice 1.
Dessiner l’arbre de jeu.
Espaces de stratégies. Par la suite on s’intéresse aux quatres choix d’actions {or, df, dr, of } qui signifient respectivement“ouvreur raise”, “dealer fold”,”dealer raise” et ”ouvreur fold”.
Une stratégie pour l’ouvreur est une fonction σ : {or, of } × {1, 2, 3} →
[0, 1] qui associe une probabilité à chaque action et carte privée de l’ouvreur.
Une stratégie pour le dealer est une fonction τ : dr, df }×{1, 2, 3} → [0, 1]
qui associe une probabilité à chaque action et carte privée de l’ouvreur.
Notre but est de calculer l’ensemble des stratégies optimales des deux
joueurs, et l’espérance de gain de l’ouvreur.
Exercice 2. SquarePants openers. Choisissez une stratégie pure de l’ouvreur, c’est à dire une stratégie qui joue chaque action (a, c) avec proba 0 ou
1. Donner une meilleure réponse du dealer et l’espérance de gain associée.
Exercice 3. SquarePants dealers. Même question pour le dealer.
Exercice 4. Existence de stratégies optimales. Donnez la définition
de stratégies optimales. Prouver qu’il existe des stratégies optimales pour
l’ouvreur et le dealer.
1
Théorie des jeux - IF 222 - ENSEIRB - 2011 - Hugo Gimbert
Calcul de stratégies optimales. La suite du TD consiste à calculer un
couple de stratégies optimales.
Exercice 5. Montrer qu’il existe une stratégie optimale σ pour l’ouvreur
telle que σ(of, 1) = 1 et σ(of, 3) = 0. Même question pour le dealer.
Exercice 6. Trouver deux autres “simplifications" de l’espace des stratégies
optimales du dealer et une autre pour l’ouvreur.
Exercice 7. Combien de paramètres sont suffisants pour décrire un ensemble de stratégies qui contient les stratégies optimales de l’ouvreur et du
suiveur ?
Une stratégie optimale du dealer. On peut calculer une stratégie optimale du dealer.
Exercice 8. Donner une condition nécessaire et suffisante pour que l’ouvreur soit indifférent entre bluffer ou non quand il a un as.
Exercice 9. Donner une condition nécessaire et suffisante pour que l’ouvreur soit indifférent entre suivre avec un deux ou non.
Exercice 10. Montrer que les deux conditions précédentes simpliquent que
l’ouvreur est indifférent entre raiser ou pas avec un trois.
Exercice 11.
Donner une stratégie optimale du dealer.
Exercice 12.
Quelle est la valeur du jeu de poker à trois cartes ?
Exercice 13. La stratégie calculée précédemment est-elle l’unique stratégie
optimale du dealer ?
Des stratégies optimale de l’ouvreur En suivant le même type de raisonnement, on peut calculer toute une classe de stratégies optimales pour
l’ouvreur.
Bibliographie : “Game Theory and Poker, Jason Swanson, document de
travail.”
2