Jeux sous forme normale: stratégies mixtes - Educnet

Transcription

Jeux sous forme normale: stratégies mixtes - Educnet
Jeux sous forme normale: stratégies mixtes
Bruno Ziliotto
Cours de Théorie des Jeux de l’ENPC
4 octobre 2016
Bruno Ziliotto
1
Motivation
2
Extension mixte d’un jeu et équilibres de Nash
3
Stratégies dominantes et stratégies dominées
4
Calcul des équilibres de Nash en stratégies mixtes
Bruno Ziliotto
1
Motivation
2
Extension mixte d’un jeu et équilibres de Nash
3
Stratégies dominantes et stratégies dominées
4
Calcul des équilibres de Nash en stratégies mixtes
Bruno Ziliotto
Concepts vus dans le chapitre précédent :
équilibres en stratégies dominantes,
résolution par élimination des stratégies strictement
dominées,
équilibres de Nash en stratégies pures...
Problème : ces solutions n’existent pas toujours, même sur des
jeux très simples, comme le Penalty :
G
D
G
1, −1
−1, 1
Bruno Ziliotto
D
−1, 1
1, −1
Pourquoi les Nash n’existent pas toujours ?
Dans certains jeux, un joueur n’a pas intérêt à ce que sa
stratégie soit connue à l’avance.
Idée des stratégies mixtes
On autorise les joueurs à introduire de l’aléatoire dans leurs
choix.
Jeu du Penalty
Exemple de stratégie mixte : chaque joueur joue G avec
probabilité 1/2, et D avec probabilité 1/2.
Bruno Ziliotto
1
Motivation
2
Extension mixte d’un jeu et équilibres de Nash
3
Stratégies dominantes et stratégies dominées
4
Calcul des équilibres de Nash en stratégies mixtes
Bruno Ziliotto
Soit (N, S, g) un jeu sous forme normale. On supposera dans
tout ce chapitre que pour tout i, Si est fini.
Définition
Une stratégie mixte du Joueur i est une distribution de
probabilités sur Si .
Bruno Ziliotto
Quel sens donner aux stratégies mixtes ?
Une stratégie mixte peut être interprétée comme :
Une croyance sur la façon dont joue un joueur,
Une façon dont les stratégies pures sont distribuées au
sein d’une population.
Certains joueurs utilisent vraiment un générateur
(pseudo)-aléatoire pour jouer : poker, jeu du
Pierre-Feuille-Ciseau...
Bruno Ziliotto
Vocabulaire et formalisme
On note ∆(Si ) l’ensemble des stratégies mixtes.
∆(Si ) est convexe, et s’identifie à
(
p∈R
|Si |
| ∀k , pk ≥ 0,
)
X
pk = 1 .
k
Les éléments de Si seront désormais appelés stratégies
pures du Joueur i.
Une stratégie pure si ∈ Si s’identifie à la Dirac δsi ∈ ∆(Si ) :
Si ⊂ ∆(Si ), donc une stratégie pure est un cas
particulier de stratégie mixte.
Bruno Ziliotto
Paiement espéré
On étend chaque fonction de paiement gi en une fonction
n
Y
∆(Sj ) → R :
gi :
j=1


N
X Y
 σj (sj ) gi (s).
gi (σ1 , ..., σN ) :=
s∈S
j=1
Proposition
∀σi ∈ ∆(Si ), ∀σ−i ∈
Y
∆(Sj ) gi (σi , σ−i ) =
j6=i
X
σi (si )gi (si , σ−i )
si ∈Si
Exemple : jeu du Penalty
Exprimer le paiement en stratégies mixtes du jeu du Penalty.
Bruno Ziliotto
Extension mixte d’un jeu
Notations :
pour i ∈ [|1, N|],
Σi = ∆(Si )
et
Σ−i =
Y
Σj
j6=i
Σ=
N
Y
Σj .
j=1
Définition
L’extension mixte du jeu (N, S, g) est le jeu sous forme normale
(N, Σ, g).
Bruno Ziliotto
Equilibre de Nash en stratégies mixtes
Définition
Un équilibre de Nash en stratégies mixtes de (N, S, g) est un
équilibre de Nash de son extension mixte (N, Σ, g), c’est-à-dire
un profil σ ∈ Σ tel que pour tout i ∈ [|1, N|], pour tout τi ∈ Σi ,
gi (σi , σ−i ) ≥ gi (τi , σ−i ).
Exemple :
1
1
1
1
· G + · D, · G + · D
2
2
2
2
est un Nash du jeu
du Penalty.
On appellera désormais un équilibre de Nash de (N, S, g)
équilibre de Nash en stratégies pures.
Bruno Ziliotto
Proposition
σ ∈ Σ est un équilibre de Nash en stratégies mixtes équivaut à
∀i ∈ [|1, N|],
∀si ∈ Si ,
gi (σi , σ−i ) ≥ gi (si , σ−i ).
Corollaire
Tout équilibre de Nash en stratégies pures est un équilibre de
Nash en stratégies mixtes.
Bruno Ziliotto
Le théorème de Nash
Théorème (Nash)
Tout jeu fini admet un équilibre de Nash en stratégies mixtes.
Bruno Ziliotto
1
Motivation
2
Extension mixte d’un jeu et équilibres de Nash
3
Stratégies dominantes et stratégies dominées
4
Calcul des équilibres de Nash en stratégies mixtes
Bruno Ziliotto
Stratégies dominantes, stratégies dominées
L’extension mixte d’un jeu est aussi un jeu ! On peut donc
réutiliser les concepts du cours précédent. Par exemple :
Définition
Une stratégie σi ∈ Σi est strictement dominée s’il existe τi ∈ Σi
tel que
∀σ−i ∈ Σ−i , gi (σi , σ−i ) < gi (τi , σ−i ).
On dit alors que σi est strictement dominée par τi , et que τi
domine strictement σi .
Proposition
σi ∈ Σi est strictement dominée par τi ∈ Σi si et seulement si
∀s−i ∈ S−i ,
gi (σi , s−i ) < gi (τi , s−i ).
Bruno Ziliotto
Une stratégie non strictement dominée par une stratégie pure
peut être strictement dominée par une stratégie mixte.
H
M
B
G
1, 1
0, 2
0, 2
Bruno Ziliotto
C
0, 2
5, 0
1, 1
D
0, 4
1, 6
2, 1
Elimination des stratégies (pures) strictement
dominées
On pose Γ1 = Γ. A chaque étape k ≥ 1 :
Si Γk n’a pas de stratégies pures strictement dominées par
une stratégie mixte, la procédure s’arrête.
Sinon, soit i ∈ [|1, N|] et si ∈ Sik une stratégie pure
strictement dominée. On pose Γk +1 := (N, S k +1 , g) avec
k +1
k et S k +1 = S k +1 \ {s }.
S−i
= S−i
i
i
i
Bruno Ziliotto
Proposition
Soit (Γk ) la suite de jeux obtenue par une procédure
d’élimination des stratégies (pures) strictement dominées.
Alors pour tout k ≥ 1, NEmix (Γk ) = NEmix (Γ).
Bien sûr on a aussi pour tout k ≥ 1, NEpur (Γk ) = NEpur (Γ).
Bruno Ziliotto
1
Motivation
2
Extension mixte d’un jeu et équilibres de Nash
3
Stratégies dominantes et stratégies dominées
4
Calcul des équilibres de Nash en stratégies mixtes
Bruno Ziliotto
Principe d’indifférence faible
Soit i ∈ [|1, N|], σ−i ∈ Σ−i et σi ∈ BRi (σ−i ). Alors
∀si , ti ∈ supp (σi ),
gi (si , σ−i ) = gi (ti , σ−i ).
Principe d’indifférence fort
Soit i ∈ [|1, N|] et σ−i ∈ Σ−i . Alors σi ∈ BRi (σ−i ) équivaut à
1
∀si , ti ∈ supp (σi ),
gi (si , σ−i ) = gi (ti , σ−i ),
2
∀si ∈
/ supp (σi ),
Bruno Ziliotto
gi (si , σ−i ) ≤ gi (σi , σ−i ).
Méthode générale pour calculer les Nash mixtes
Rechercher les stratégies strictement dominantes,
Éliminer les stratégies strictement dominées,
Identifier les équilibres de Nash purs,
Utiliser les principes d’indifférence pour trouver les Nash
non purs.
Bruno Ziliotto