Partie I : Jeux et équilibre de Nash

Transcription

Partie I : Jeux et équilibre de Nash
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Partie I : Jeux et équilibre de Nash
Nicolas Carayol
M1 MIMSE
Information incomplète
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Introduction
• La théorie des jeux peut se concevoir comme une theorie des
comportement d’agents rationnels en situation d’interaction.
• Les joueurs sont rationnels : ils poursuivent des objectifs
exogènes et indépendants (ici jeux non-coopératifs vs jeux
coopératifs) ;
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Jeu en forme normale
Définition
Un jeu en forme normale I , (Si )i∈I , (ui (·))i∈I est donné par :
• Un ensemble I de n ≥ 1 joueurs, indexés par i = 1, 2, . . . n ;
• Un ensemble de stratégies Si pour chaque joueur i qui peut
choisit une stratégie (pure) si . Le vecteur s ≡ (s1 , s2 , . . . , sn )
est le résultat (ou profil de stratégies) avec s ∈ S,
l’ensembe des profils de stratégies.
• Une fonction de gain pour chaque joueur i, ui : S → R
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Le dilemme du prisonnier
• Un jeu non–coopératif avec n = 2 joueurs, I = {1, 2}
• L’ensemble de stratégies de chaque joueur : S1 = S2 = {C , D}
Définition
• 4 résultats possibles du jeu :
S = {(C , C ) , (C , D) , (D, D) , (D, C )} .
• Gains symétriques :
•
•
•
•
u1 (C , C ) = u2 (C , C ) = −1,
u1 (C , D) = −10, u2 (C , D) = 0,
u1 (D, C ) = 0, u2 (D, C ) = −10,
u1 (D, D) = u2 (D, D) = −8.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
DP - Matrice du jeu II
2
1
C
D
C
(−1, −1)
(0, −10)
D
(−10, 0)
(−8, −8)
Table: Dilemme du prisonnier
Information incomplète
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Notation
Le profil de stratégies s = (si , s−i ) (∀i ∈ I ) avec
s−i = (s1 , s2 , . . . , si−1 , si+1 , . . . , sn ) ,
s−i ∈ X Sj .
j6=i
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Définition
La stratégie si du joueur i est strictement dominée par la
stratégie si0 si et seulement si, quel que soit le comportement
des autres joueurs, le joueur i obtient avec si une utilité
strictement inférieure à celle obtenue avec si0
∀s−i ∈ S−i , ui (si , s−i ) < ui si0 , s−i
Définition
La stratégie si est faiblement dominée par si0 si l’inégalité est
faible pour toutes les stratégies des autres joueurs et qu’il existe au
moins un profil de stratégies des autres joueurs pour lequel l’utilité
avec pi est strictement inférieure à celle avec si0 :
∀s−i ∈ S−i , ui (si , s−i ) ≤ ui si0 , s−i
et ∃s−i ∈ S−i | ui (si , s−i ) < ui si0 , s−i
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Dilemme du prisonier
2
1
N
D
N
(−1, −1)
(0, −10)
D
(−10, 0)
(−8, −8)
Information incomplète
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Stratégies dominantes
Définition
Une stratégies si0 est une stratégies strictement dominante si
∀si ∈ Si , ∀s−i ∈ S−i , ui (si , s−i ) < ui si0 , s−i
Définition
Une stratégies si0 est une stratégies faiblement dominante si :
∀si ∈ Si :
∀s−i ∈ S−i , ui (si , s−i ) ≤ ui si0 , s−i
et ∃s−i ∈ S−i | ui (si , s−i ) < ui si0 , s−i
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Equilibre en stratégies dominantes
Définition
Un profil de stratégies s 0 est un équilibre en stratégies dominantes
strict si
∀i ∈ I , ∀si ∈ Si , ∀s−i ∈ S−i , ui (si , s−i ) < ui si0 , s−i
Définition
Un profil de stratégies s 0 est un équilibre en stratégies (faiblement)
dominantes si :
∀i ∈ I : ∀si ∈ Si ,
∀s−i ∈ S−i , ui (si , s−i ) ≤ ui si0 , s−i
et ∃s−i ∈ S−i | ui (si , s−i ) < ui si0 , s−i
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Equilibre de Nash
Définition
Un profil s ∗ = (s1∗ , . . . , sn∗ ) (si∗ ∈ Si , i = 1...n) est un équilibre de
Nash si aucun joueur n’a intérêt à dévier unilatéralement de sa
stratégie pi∗ (quand les autres joueurs continuent à jouer le profil
∗ ) :
p−i
∗
∗
ui si∗ , s−i
≥ ui si , s−i
, ∀si ∈ Si , ∀i = 1 . . . n.
Définition
p ∗ est un équilibre de Nash strict si
∗
∗ , ∀s ∈ S \ {s ∗ } , ∀i = 1 . . . n.
ui si∗ , s−i
> ui si , s−i
i
i
i
• Si l’équilibre de Nash est strict, en dévier doit avoir un coût
pour les joueurs.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
2
1
C
D
C
(−1, −1)
(0, −10)
D
(−10, 0)
(−8, −8)
Table: Dilemme du prisonnier
Information incomplète
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
La Bataille des sexes
2
1
B
b
B
(2, 1)
(0, 0)
b
(0, 0)
(1, 2)
Information incomplète
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Définition
Une stratégie mixte du joueur i est une mesure de probabilités pi
définie
sur l’ensemble des stratégies pures du joueur i
P
( si pi,si = 1). On note Pi l’ensemble des stratégies mixtes du
joueur i. pi,si est la probabilité que i joue le stratégie pure si .
pi ∈ Pi correspond donc à une stratégie mixte du joueur i.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Stratégies mixtes
Stratégies mixtes : p1 = (q, 1 − q) et p2 = (t, 1 − t) avec
q, t ∈ [0, 1].
→ q est la fréquence du choix de la stratégie N par 1
→ t est la fréquence du choix de N par 2.
Information incomplète
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Equilibre de Nash
Définition
Un profil p ∗ = (p1∗ , . . . , pn∗ ) (pi∗ ∈ Pi , i = 1...n) est un équilibre
de Nash en stratégies mixtes si
∗
∗
, ∀pi ∈ Pi , ∀i = 1 . . . n.
(1)
ui pi∗ , p−i
≥ ui pi , p−i
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Fonctions de meilleures réponses
Déterminer les stratégies du joueur i qui correspondent à la plus
grande satisfaction pour lui face à tout profil s−i .
Definition
Dans un jeu à n joueurs, la fonction de meilleure réponse du
joueur i, Ri (p−i ) associe, à chaque combinaison de stratégies des
autres joueurs p−i , la (les) stratégie(s) du joueur i qui
maximise(nt) son gain :
ui (Ri (p−i ) , p−i ) ≥ ui (pi , p−i ) , ∀pi ∈ Pi , p−i ∈ P−i .
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Illustration en strategies pures avec la Dilemme du
prisonnier
2
1
C
D
C
(−1, −1)
(0, −10)
D
(−10, 0)
(−8, −8)
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Illustration en strategies pures avec la Bataille des sexes
2
1
B
b
B
(2, 1)
(0, 0)
b
(0, 0)
(1, 2)
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
De manière plus générale :
Proposition
p ∗ est un équilibre
de Nash si et seulmement si
∗
pi∗ ∈ Ri p−i
, ∀i = 1...n.
∗
∗
Preuve : Par définition, Ri p−i
maximise ui pi , p−i
, pour tout
joueur i → Aucun joueur n’a intérêt à dévier unilatéralement de sa
stratégie pi∗ .
• Recherche des équilibres de Nash est opérée en pratique par la
recherche des points d’intersection entre les fonctions de
meilleures réponses de tous les joueurs (comme dans
l’oligopole de Cournot).
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Meilleures réponses en stratégies mixtes
Stratégies mixtes des deux joueurs : p1 = (q, 1 − q) et
p2 = (t, 1 − t) avec q, t ∈ [0, 1] .
2
1
q
1−q
B
b
t
B
(2, 1)
(0, 0)
1−t
b
(0, 0)
(1, 2)
Table: Bataille des sexes et stratégies mixtes
Comparons alors l’espérance d’utilité de 1 pour ses deux stratégies :
si B : U1B (p1 , p2 ) = U1 ((1, 0) , (t, 1 − t)) = 2t + 0 (1 − t) = 2t
si b : U1b (p1 , p2 ) = U1 ((0, 1) , (t, 1 − t)) = 0t + 1 (1 − t) = 1 − t
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Meilleures réponses en stratégies mixtes
Face à la stratégie mixte p2 de 2, 1 choisira B si :
1
2t > 1 − t ⇒ t > .
3
→ La fonction de meilleure réponse de 1

Si
 1
[0, 1] Si
R1 (t) = q ∗ (t) =

0
Si
:
t > 1/3
t = 1/3
t < 1/3.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Et pour 2 :
B : U2B (p1 , p2 ) = U2 ((q, 1 − q) , (1, 0)) = 1q + 0(1 − q) = q
b : U2b (p1 , p2 ) = U2 ((q, 1 − q) , (0, 1)) = 0q + 2 (1 − q) = 2 − 2q
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Meilleures réponses en stratégies mixtes
Face à la stratégie mixte p1 de 1, 2 choisira B (t = 1) si :
U2B (p1 , p2 ) > U2b (p1 , p2 )
C’est à dire si :
2
q > 2 − 2q ↔ q > .
3
La fonction de meilleure réponse de 2

 1
[0, 1]
R2 (q) = t ∗ (q) =

0
est :
Si q > 2/3
Si q = 2/3
Si q < 2/3.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Représentation graphique
Tp : représentation graphique des fonctions de meilleures réponse.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Meilleures réponses en stratégies mixtes : autre exemple
Autre exemple
2
1
a
b
a
(2, 2)
(3, 1)
b
(1, 3)
(0, 0)
Table: Stratégies mixtes
Ensemble des EN en stratégies mixtes ?
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Meilleures réponses en stratégies mixtes : autre exemple
Autre exemple
2
1
a
b
a
(3, 3)
(0, 1)
b
(0, 2)
(1, 1)
Table:
Exercice : Calculer le(s) équilibre(s) de Nash en stratégies mixtes
de ce jeu (s’il en existe).
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Jeu en forme extensive
Définition
Un
jeu en forme extensive
I , A, ψ (·) , Λ, (λi )i∈I , (Si )i∈I , ρ, (ui (·))i∈I est donné par
• Un ensemble I de n ≥ 1 joueurs, indexés par i = 1, 2, . . . n.
• Un ensemble de noeuds A, comprenant la racine a0 . Le sous
ensemble Aw ⊂ A rassemble les noeuds terminaux. Les autres
noeuds Ad sont les noeuds de décision.
• Une fonction donnant le prédécesseur (unique) pour tout
noeud différent de la racine ψ : A\ {a0 } → Ad .
• Une partition de l’ensemble des noeuds de décision Ad sur
l’ensemble des joueurs indiquant, pour chaque noeud de
décision, le joueur qui joue : Λ = (Λ1 , ..., Λn ). Λ1 = ensemble
des noeuds de décision du joueur 1.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Jeu en forme extensive
Définition
• Pour chaque joueur i, une partition λi (λi1 , ..., λini ) de son Λi
en ni ensembles d’information hj (hj ∈ Hi l’ensemble des
ensembles d’information du joueur i) avec la condition que
tous les noeuds d’un même ensemble d’information aient le
même nombre de branches.
• Des probabilités sur d’éventuels mouvements aléatoires (joués
par la Nature) : ρ.
• La spécification des gains de chaque joueur à chaque noeud
terminal : Une fonction de gain pour chaque joueur
i, ui : Aw → R
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Information imparfaite
• Si un joueur ne connaı̂t pas les choix effectués par les joueurs
qui ont joué avant lui, il ne connaı̂t pas parfaitement le noeud
sur lequel il se situe.
• Si, à un moment donné, il ne peut distinguer deux noeuds, ces
deux noeuds appartiennent au même ensemble
d’information.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Définition
Un jeu en forme extensive est
1. un jeu avec information imparfaite si au moins un ensemble
d’information contient plus d’un noeud ;
2. un jeu avec information parfaite si chaque ensemble
d’information est réduit à un seul noeud.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Stratégies pures
• Une stratégie pure : spécification d’une action pour un
joueur chaque fois qu’il est susceptible de j
ouer.
• Dans un jeu en forme normale : une stratégie d’un joueur i
consiste en la détermination d’un si .
• Dans un jeu en forme extensive : une stratégie d’un joueur i
est une application si qui attribue à chaque ensemble
d’information hj (∈ Hi ) du joueur i une action qu’il est
susceptible de choisir dans cet ensemble d’information.
• Un profil de stratégies (résultat) → spécification d’un
déroulement complet du jeu en précisant une stratégie par
joueur.
omplètement le jeu quand on les combine (on considère donc un profil de stratégies). Par conséque
Forme normale et équilibre de Nash
forme extensive
de l’EN et optimum
Information incomplète
concept
de stratégie de la théorieLades
jeux est plus Existence
complet
que celui du langage
courant. Consid
ons une version plus détaillée du jeu de l’entrée afin de développer la définition des différents typ
e stratégies.
emple 3 : Le Jeu de l’entrée II
Prenons le jeu représenté dans la Figure 2.3.
Strategies pures dans un jeu sequentiel : Exemple
(uE , uI )
Produire (−50,
40)
Augmenter capacité
Installer
capacité
Non (−10, 120)
E1
Produire (50, 60)
I
E0
Non
Non
Non
(−10, 100)
(0, 100)
Figure:
Le jeu de l’entrée II
Fig. 2.3: Le jeu de l’entrée II
Il s’agit d’une analyse plus fine des interactions concernant le problème d’entrée sur un marché.
Tiré par
de la
Yildizoglu
u commence
décision de(2011)
l’entrant potentiel (E) : il doit choisir s’il met en place les capaci
e production nécessaires à son entrée sur ce nouveau marché. Ayant observé cette décision, la firm
nstallée (I)
doit choisir
si elle augmentesours
ses propres
production
Donnez
la représentation
formecapacités
normaledede
ce jeu ?ou non. L’entrant d
ors prendre sa décision de procéder effectivement à la production du bien ou non et cela, sa
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Stratégies dans un jeu en forme extensive - II
Définition
Une stratégie locale du joueur i est similaire à une stratégie
mixte, sauf qu’elle est définie au niveau d’un ensemble
d’information (au lieu du jeu global). Pour un joueur i, elleéfinit d
par conséquent, pour un ensemble d’information hj , une mesure de
probabilités sur l’ensemble des actions disponibles en cet ensemble
d’information. On la note par πihj (la stratégie locale du joueur i à
son ensemble d’information hj ) et Πihj est l’ensemble des stratégies
locales de i pour l’ensemble d’information hj .
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Stratégies dans un jeu en forme extensive - III
Définition
Une stratégie comportementale du joueur i est un vecteur de
stratégies locales de ce joueur, contenant une stratégie locale pour
chaque ensemble d’information de ce joueur. On la note par πi et
Πi est l’ensemble des stratégies comportementales du joueur i.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Concepts de stratégies :
• stratégies pures (pour jeux en forme stratégique et extensive) ;
• stratégies mixtes (pour jeux en forme stratégique et
extensive) ;
• stratégies locales (pour jeux en forme extensive) ;
• stratégies comportementales (pour jeux en forme extensive).
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Non-existence de l’équilibre de Nash en stratégies pures
• Il n’existe pas nécessairement un équilibre de Nash en
stratégies pures.
• Exemple
2
1
B
b
B
(2, 0)
(0, 1)
b
(0, 2)
(1, 0)
Table: Bataille des sexes II
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Conditions d’existence
Théorème
Tout jeu sous forme normale I , (Si )i∈I , (ui )i∈I a au moins un
équilibre de Nash en stratégies pures s’il vérifie les conditions
suivantes
• L’ensemble des stratégies est un sous espace Euclidien
(Si ⊆ RK , K ∈ N) non vide, compact et convexe
• Les fonctions d’utilité ui (·) : S → R sont continues
• Les fonctions d’utilité ui (·, s−i ) : Si → R sont quasi-concaves
∀s−i ∈ S−i .
Démonstration.
Le théorème du point fixe (Kakutani, 1941) s’applique à la
correspondance des meilleures réponses R : S → S
•
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Théorème
(Nash) Tout jeu sous forme normale fini possède au moins un
équilibre de Nash si les stratégies mixtes sont autorisées.
Démonstration.
Stratégies mixtes dans un jeu fini → elles sont définies dans
l’intervalle fermée [0, 1], et sur un support fini (Si ) → compacité et
convexité → Théorème de Nash.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Bien-être social
• Un concept d’équilibre implique un mécanisme particulier de
coordination des stratégies individuelles. Dans l’équilibre de
Nash, chaque joueur cherche à améliorer sa situation
individuelle unilatéralement.
• L’équilibre de Nash est-il un mécanisme de coordination
efficace au sens de Pareto ?
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Optimum de Pareto
Définition
Efficacité au sens de Pareto.
1. Le résultat ŝ Pareto-domine le résultat s si :
ui (ŝ) ≥ ui (s) , ∀i
et
∃ j, uj (ŝ) > uj (s) .
2. Un résultat s ∗ est un optimum de Pareto s’il n’existe pas un
autre résultat qui le Pareto-domine.
3. Les résultats ŝ et s ne sont pas Pareto-comparable si
∃i,
ui (ŝ) > ui (s) et ∃ j 6= i, uj (ŝ) < uj (s) .
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Exemple
2
1
C
D
Optimum de Pareto ?
C
(−1, −1)
(0, −10)
D
(−10, 0)
(−8, −8)
Information incomplète
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Exemple
2
1
C
D
C
(−1, −1)
(0, −10)
D
(−10, 0)
(−8, −8)
Dilemme du prisonnier : (D, D) est un équilibre de Nash mais
(N, N) Pareto-domine cet équilibre.
Proposition
Un équilibre de Nash n’est pas nécessairement un optimum de
Pareto.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Application : Jeu de pollution
• Jeu de pollution simultané avec stratégies (si )i∈N continues
∈ R+ et la fonction de paiement :
ui (s1 , ..., sn )) = v (si ) −
avec v 0 > 0, v 00 < 0 et v 0 (0) > 1.
X
j
sj ,
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Application : Jeu de pollution
• Solution : chaque agent max son paiement individuellement :

max v (si ) −
si

X
j
sj  → v 0 (si ) = 1.
• Chaque agent a une (unique) action dominante.
• Le profil de stratégies caractérisé par v 0 (si ) = 1, ∀i ∈ N est
donc son unique EN.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Application : Jeu de pollution
• Si l’objectif est de maximiser le bien être social :

max
si,∀i∈N
X
i
v (si ) −

X
j
sj  → v 0 (si ) = n
• Les EN ne maximisent pas le bien-être social
• Les EN ne sont pas des optimas de pareto.
• Quel mécanisme pour implémenter la solution optimale à
l’EN ?
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Application : Jeu de pollution
• Si l’on introduit un taux θ de taxe (dite pigouvienne) linéaire
en si →
ûi (s1 , ..., sn )) = v (si ) −
X
j
sj − θsi +
θX
sj
n
j
• A l’équilibre de Nash :
0
v (si ) = 1 + θ
n−1
n
• Or maximiser le bien être social implique : v 0 (si ) = n
• Le mécanisme : fixer la taxe telle que
n =1+θ
n−1
n
.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Application : compétition spatiale
Application : compétition spatiale
• N=2
• S1 = S2 = [0; 1]


(x1 + x2 )/2 si x1 < x2
[1 − (x1 + x2 )] /2 si x1 > x2

1/2 si x1 = x2
• u2 (x1 , x2 ) symétrique
• u1 (x1 , x2 ) =
• EN ?
Information incomplète
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Information incomplète et jeux Bayesiens
• L’hypothèse de base des jeux à information complète est que
tous les joueurs sont parfaitement informés des règles du jeu.
• Or, les joueurs ont souvent une connaissance imparfaite des
caracteristiques des autres joueurs ou même de certaines
conditions du jeu.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
L’idée de base
Exemple : mais qui est votre partenaire ?
1
B
b
2.a
B
b
(2, 3) (0, 0)
(1, 2) (3, 1)
1
B
b
2.b
B
b
(2, 1) (0, 2)
(1, 2) (3, 3)
Table: Bataille des sexes en info incomplete
• Le joueur 1 ignore l’identité du joueur 2.
• Le joueur 2 connaı̂t ses préférences et a une stratégie
dominante.
• Le joueur 1 attribue la probabilité p à l’éventualité que le
joueur 2 soit de type 2.a et 1 − p qu’il soit de type 2.b.
• si : 2p + 0(1 − p) > 1p + 3(1 − p) → 1 joue B.
• C’est le principe du Bayesian Nash Equilibrium.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
L’idée de base
• Tout jeu en information incomplète peut être représenté
comme un jeu à infomation imparfaite dans lequel la nature
joue en premier un coup qu’un agent au moins ne peut pas
observer.
• Exemple : information asymetrique privé d’un joueur =
situation dans laquelle la nature à attribué un type à un
joueur que l’autre ne peut observer.
• Exemple : transformer le jeu de la bataille des sexes à
information incomplète !
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Remarque
• Harsanyi (1973) montre que tout équilibre de Nash
(notamment en stratégies mixtes) d’un jeu sous forme
normale peut “presque toujours” être obtenu comme la limite
d’un équilibre de Nash en stratégies pures d’un jeu perturbé à
information incomplète (où les joueurs sont incertains sur les
paiements des autres) quand les perturbations (incertitudes a
priori, types) tendent vers 0.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Jeux bayésiens
• Lorsque l’incertitude porte sur une caractéristique d’un joueur,
les différents états de la nature portent sur les types des
joueurs.
• Quand l’incertitude porte sur une autre caractéristique du jeu,
il est quand même le plus souvent possible d’écrire les gains
du jeu comme dépendant de types des joueurs.
• Les types de i, ti , et des autres joueurs t−i
• La distribution de probabilités sur les types des autres sachant
son propre type et ses croyances pi (t−i |ti )
• Si les attributions des types sont indépendants :
pi (t−i |ti ) = pi (t−i )
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Jeux bayésiens
Definition
Un jeu bayésien statique en forme normale est décrit par : · Un
ensemble de n joueurs : I = {1, 2, . . . , n} . · Pour chaque joueur i,
i ∈ I , un ensemble d’actions Ai et un ensemble de types possibles
Ti . A = X Ai et T = X Ti . · Pour chaque joueur i, une fonction
i∈I
i∈I
de gain, ui → les préférences (VNM) du joueur i :
ui : S = A × T → R
s ≡ (a1 , a2 , . . . , an , t1 , t2 , . . . , tn ) 7→ ui (a, t) .
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Jeux bayésiens
Definition
(suite) · Une distribution de probabilité a priori pi pour tout i ∈ I
qui donne les croyances des agents quant aux types des autres
agents :
pi : T → [0, 1]
(t1 , t2 , . . . , tn ) 7→ pi (t−i |ti ) .
qui résulte de la règle de bayes lorsque celle-ci peut être appliquée
Pr(b|a)
(memo : Pr(a|b) = Pr(a)
)
Pr(b)
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Jeux bayésiens
Definition
Une stratégie (pure) si du joueur i précise une action pour chaque
type :
si : Ti → Ai
ti 7→ si (ti ) = ai .
Le profil de stratégies (pures) est donné par s = (s1 , s2 , . . . , sn ).
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Jeux bayésiens
• Une stratégie pour i est
• séparatrice si si (ti ) 6= si (ti0 ) , ∀ti 6= ti0 ∈ Ti ,
• mélangeante (pooling) si si (ti ) = si (ti0 ) , ∀ti 6= ti0 ∈ Ti
• Les déductions que l’on peut inférer quant à leurs types au vu
de leurs choix sont très différentes.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Equilibre de Nash bayésien
Definition
L’équilibre de Nash en stratégies pures d’un jeu bayésien est un
profil de stratégies s ∗ P
= (s1∗ , s2∗ , . . . , sn∗ ) tel que, ∀i ∈ I , ∀ti ∈ Ti :
∗ (t ), s ; t × p (t |t ) ,
si∗ (ti ) = arg maxsi ∈Si t−i ∈T−i ui s−i
−i
i
i −i i
avec :
s−i (t−i ) = (s1 (t1 ), s2 (t2 ), . . . si−1 (ti−1 ), si+1 (ti+1 ), ..., sn (tn )) .
• Notion que l’on peut étendre aux stratégies mixtes σi∗ (ti ) .
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Bataille des sexes avec information incomplète
Equilibre :
• s2∗ (t2.a ) = B; s2∗ (t2.b ) = b (stratégie séparatrice)

• s1∗ (t1 ) =
 B si p > 3/4
(x, 1 − x), ∀x ∈ [0, 1] si p = 3/4

b si p < 3/4
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Duopole de Cournot en information incomplète
• Q = A − p,
• πi (q1 , q2 ) = (p − ci ) qi = (A − q1 − q2 − ci ) qi .
• I = {1, 2} .
• T1 = {t1 } , T2 = {t2.a , t2.b }
• Pr(t2.a ) = P (c2 = c) = α = 1 − Pr(t2.b ) = 1 − P (c2 = c)
avec c < c1 < c.
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Duopole de Cournot en information incomplète
• La fonction de réaction de la firme 2 :
• maxq2 (A − q1 − q2 − c) q2 , si t2 = t2.a ou
• maxq2 (A − q1 − q2 − c) q2 , t2 = t2.b
• → q2∗ (q1 , c) = A−q21 −c
• → q2∗ (q1 , c) = A−q21 −c
• Stratégie séparatrice
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Duopole de Cournot en information incomplète
• La fonction de réaction de la firme 1 incorpore une incertitude
sur la fonction de réaction de 1 :
maxq1 α (A − q1 − q2∗ (q1 , c) − c1 ) q1
+ (1 − α) (A − q1 − q2∗ (q1 , c) − c1 ) q1
ou maxq1 (A − q1 − E1 (q2∗ ) − c1 ) q1
avec E1 (q2∗ ) = α A−q21 −c + (1 − α) A−q21 −c =
A−q1 −E1 (c2 )
2
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Duopole de Cournot en information incomplète
L’équilibre
2 )−c1
• q1∗ (q2 ) = A−E1 (q
2
1 (c2 )
• E1 (q2∗ ) = A−q1 −E
2
• Donne q1 = A+q1 +E41 (c2 )−2c1 → q1∗ = A+E1 (c32 )−2c1
• La quantité proposée par 1 tient compte de ses croyances sur 2
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Duopole de Cournot en information incomplète
L’équilibre
• q2∗ (c) =
A−
• q2∗ (c) =
A−
A+E1 (c2 )−2c1
−c
3
2
A+E1 (c2 )−2c1
• q2∗ (c) < q2∗ (c)
3
2
−c
=
2A−E1 (c2 )+2c1 −3c
6
=
2A−E1 (c2 )+2c1 −3c
6
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Duopole de Cournot en information incomplète
L’équilibre
• q2∗ (c) > q2∗∗ (c) en information complète
• q2∗ (c) < q2∗∗ (c) en information complète
Forme normale et équilibre de Nash
La forme extensive
Existence de l’EN et optimum
Information incomplète
Duopole de Cournot en information incomplète
• Dans l’EN avec information incomplète, la firme 2 :
• si elle a des coûts élevés, elle produit plus que ses quantités de
cournot en information complète,
• si elle a des coûts faibles, elle produit moins que ses quantités
de cournot en information complète

Documents pareils