Eléménts de correction TD 1

Transcription

Eléménts de correction TD 1
ELEMENTS DE CORRECTION DE L’EXERCICE 3 du TD 1
La théorie des jeux
I- Résolution des jeux
a) Le Dilemne du Prisonnier
Joueur 2
G
Gagner G
Joueur 1
Perdre P
Case I
Gain pour 1 = 1
Gain pour 2 = 1
Case III
Gain pour 1= 0
Gain pour 2= 3
P
Case II
Gain pour 1= 3
Gain pour 2 = 0
Case IV
Gain pour 1= 2
Gain pour 2= 2
-
L’équilibre (2,2) est pareto-optimal. Aucun des joueurs ne peut améliorer sa position
sans détériorer celle de l’autre.
o Ex 1: J1 peut passer de 2 à 3 met J2 y perd. Donc J2 passe de la case II à la
case I et voit ses gains passer de 2 à 1 tandis que ceux de J1, après avoir
fugacement été de 3 retombent à 1.
o Nous sommes à présent dans la case I. L’équilibre (1,1) est un équilibre de
Nash, c’est-à-dire que les deux joueurs n’ont pas intérêt à dévier de leur
stratégie lorsqu’ils connaissent celle de l’autre. Cet équilibre est sous-optimal.
-
L’équilibre (3,0) est un Pareto-Optimal (case III). Aucun des joueurs ne peut améliorer
sa position sans détériorer celle de l’autre.
o Ex 2 : J2 peut passer de 0 à 2 met J1 y perd. On se retrouve dans l’équilibre
(2,2) et donc on reprend le raisonnement qui lui est associé (cf.ci-dessus).
-
L’équilibre (0,3) est Pareto-Optimal (case III). Aucun des joueurs ne peut améliorer sa
position sans détériorer celle de l’autre.
o Ex 3 : J1 peut passer de 0 à 2 met J2 y perd. On se retrouve dans l’équilibre
(2,2) et donc on reprend le raisonnement qui lui est associé.
Dans ce jeu, le résultat (P, P) Pareto-domine l’équilibre de Nash (G, G).
Un équilibre de Nash n’est pas nécessairement un optimum de Pareto. En outre, certaines
situations peuvent conduire à des équilibres de Nash également vraisemblables ne pouvant
être comparés selon le critère d’efficacité parétienne.
b) Matching Pennies
Il n’y a aucun équilibre mais toutes les issues sont des optima de Pareto. Ce jeu est à somme
nulle.
Ex : En case I, le couple de gain est -1 pour le joueur J1 et 1 pour le joueur 2. J1 décide de
passer de la case I à la case II afin d’augmenter ses gains de -1 à 1. Mais J2 y perd donc il
passe de la case III à la case IV. Dans ce cas, J1 passe de 1 à -1 et souhaite à nouveau changer
de case pour obtenir un gain positif etc. Nous n’atteignons pas d’équilibre de Nash mais
chaque couple de stratégie est un optimum de Pareto.
Bien que nous ne trouvions pas d’équilibre de Nash dans le jeu des Matching Pennies, il
existe d’autres équilibres en stratégies mixtes. Tout jeu fini admet au moins un équilibre en
stratégie mixte.
c) Bataille des sexes
Il y a deux équilibres de Nash (A, A) et (S, S) qui sont aussi des optima de Pareto car on ne
peut dévier de stratégie sans diminuer le gain de l’autre joueur dans ces deux cas.
II- Définitions
1) Stratégie Dominante
Une stratégie dominante pour un joueur est une stratégie qui lui donne toujours un gain
supérieur ou égal au gain qu’il peut attendre de toutes ses autres stratégies (quelles que
soient les stratégies des autres joueurs).
- Une stratégie dominante domine toutes les autres stratégies.
- Si chacun des joueurs possède une stratégie dominante, alors il existe au moins un équilibre
de Nash consistant pour les joueurs à choisir leur stratégie dominante
• Un équilibre en stratégies dominantes est un équilibre de Nash (réciproque non vérifiée)
2) Stratégies dominées
Une stratégie dominée pour un joueur est une stratégie qui lui donne toujours un gain
inférieur à celui d’au moins une des autres stratégies à sa disposition (quelles que soient
les stratégies des autres joueurs).
- Une stratégie peut n'être dominée que par une seule stratégie. Une stratégie dominée n’est
jamais jouée
- On recherche des équilibres de Nash par élimination des stratégies dominées.
3) Equilibre en stratégie mixte
Une stratégie mixte pour un joueur est une distribution de probabilité sur l’ensemble de ses
stratégies pures :
–
Si m stratégies pures possibles, (p1,p2, …,ps,…, pm-1, pm ) stratégies mixtes telles
∑ni=1 ps = 1où ps est la probabilité de jouer la sième stratégie.
Dans un équilibre en stratégies mixtes, chacun des joueurs est indifférent entre jouer sa
stratégie mixte ou jouer l’une de ses stratégies pures support de sa stratégie mixte. Les gains
attendus sont les même.
Exemple 1 :
H\V
A
R
A
-3, -3
-1, 2
R
2, -1
0,0
En gras sont représentés les deux équilibres en stratégies pures.
On construit l’équilibre en stratégies mixtes en notant p et q les probabilités de jouer A pour le
joueur horizontal et vertical, respectivement.
On doit avoir
UH(A/q) = UH(R/q) -> −3q +2(1 − q) = −q
UV(A/p) = UV (R/p) -> −3p+2(1 − p) = −p
d’où
p = q = 1/2
Ce jeu présente une forme ”d’envie” : prendre l’action A n’a de valeur que si l’autre ne la
prend pas ; celui qui n’a pas pris l’action est moins bien que si aucun des deux ne l’avait prise,
il ”envie” son rival.
On remarque que l’équilibre en stratégies mixtes offre des paiements égaux à -1/2 aux deux
joueurs.
Exemple 2 : Equilibre Mixte dans un jeu de standardisation
A\B
Standard 1
Standard 2
-
Standard 1
(2,1)
(0,0)
Standard 2
(0,0)
(1,2)
Deux équilibres en stratégies pures : (S1, S1) et (S2, S2)
On note p et q les probabilités de jouer S1 pour le joueur A et B, respectivement.
o UA (S1/q)= U A (S2/q) -> 2*q + 0*(1-q)= 1*(1-q)
o UB (S1/p)= U B (S2/p) -> 1*p + 0*(1-p)= 2*(1-p)
D’où p=q =1/3
-
Un équilibre en stratégie mixte : (2/3, 1/3) pour A et (1/3, 2/3) pour B
Gain espéré en stratégie mixte = 2/3
o Soit (1-p)= 2/3
o Soit 2*(1-p)= 2/3