Eléménts de correction TD 1
Transcription
Eléménts de correction TD 1
ELEMENTS DE CORRECTION DE L’EXERCICE 3 du TD 1 La théorie des jeux I- Résolution des jeux a) Le Dilemne du Prisonnier Joueur 2 G Gagner G Joueur 1 Perdre P Case I Gain pour 1 = 1 Gain pour 2 = 1 Case III Gain pour 1= 0 Gain pour 2= 3 P Case II Gain pour 1= 3 Gain pour 2 = 0 Case IV Gain pour 1= 2 Gain pour 2= 2 - L’équilibre (2,2) est pareto-optimal. Aucun des joueurs ne peut améliorer sa position sans détériorer celle de l’autre. o Ex 1: J1 peut passer de 2 à 3 met J2 y perd. Donc J2 passe de la case II à la case I et voit ses gains passer de 2 à 1 tandis que ceux de J1, après avoir fugacement été de 3 retombent à 1. o Nous sommes à présent dans la case I. L’équilibre (1,1) est un équilibre de Nash, c’est-à-dire que les deux joueurs n’ont pas intérêt à dévier de leur stratégie lorsqu’ils connaissent celle de l’autre. Cet équilibre est sous-optimal. - L’équilibre (3,0) est un Pareto-Optimal (case III). Aucun des joueurs ne peut améliorer sa position sans détériorer celle de l’autre. o Ex 2 : J2 peut passer de 0 à 2 met J1 y perd. On se retrouve dans l’équilibre (2,2) et donc on reprend le raisonnement qui lui est associé (cf.ci-dessus). - L’équilibre (0,3) est Pareto-Optimal (case III). Aucun des joueurs ne peut améliorer sa position sans détériorer celle de l’autre. o Ex 3 : J1 peut passer de 0 à 2 met J2 y perd. On se retrouve dans l’équilibre (2,2) et donc on reprend le raisonnement qui lui est associé. Dans ce jeu, le résultat (P, P) Pareto-domine l’équilibre de Nash (G, G). Un équilibre de Nash n’est pas nécessairement un optimum de Pareto. En outre, certaines situations peuvent conduire à des équilibres de Nash également vraisemblables ne pouvant être comparés selon le critère d’efficacité parétienne. b) Matching Pennies Il n’y a aucun équilibre mais toutes les issues sont des optima de Pareto. Ce jeu est à somme nulle. Ex : En case I, le couple de gain est -1 pour le joueur J1 et 1 pour le joueur 2. J1 décide de passer de la case I à la case II afin d’augmenter ses gains de -1 à 1. Mais J2 y perd donc il passe de la case III à la case IV. Dans ce cas, J1 passe de 1 à -1 et souhaite à nouveau changer de case pour obtenir un gain positif etc. Nous n’atteignons pas d’équilibre de Nash mais chaque couple de stratégie est un optimum de Pareto. Bien que nous ne trouvions pas d’équilibre de Nash dans le jeu des Matching Pennies, il existe d’autres équilibres en stratégies mixtes. Tout jeu fini admet au moins un équilibre en stratégie mixte. c) Bataille des sexes Il y a deux équilibres de Nash (A, A) et (S, S) qui sont aussi des optima de Pareto car on ne peut dévier de stratégie sans diminuer le gain de l’autre joueur dans ces deux cas. II- Définitions 1) Stratégie Dominante Une stratégie dominante pour un joueur est une stratégie qui lui donne toujours un gain supérieur ou égal au gain qu’il peut attendre de toutes ses autres stratégies (quelles que soient les stratégies des autres joueurs). - Une stratégie dominante domine toutes les autres stratégies. - Si chacun des joueurs possède une stratégie dominante, alors il existe au moins un équilibre de Nash consistant pour les joueurs à choisir leur stratégie dominante • Un équilibre en stratégies dominantes est un équilibre de Nash (réciproque non vérifiée) 2) Stratégies dominées Une stratégie dominée pour un joueur est une stratégie qui lui donne toujours un gain inférieur à celui d’au moins une des autres stratégies à sa disposition (quelles que soient les stratégies des autres joueurs). - Une stratégie peut n'être dominée que par une seule stratégie. Une stratégie dominée n’est jamais jouée - On recherche des équilibres de Nash par élimination des stratégies dominées. 3) Equilibre en stratégie mixte Une stratégie mixte pour un joueur est une distribution de probabilité sur l’ensemble de ses stratégies pures : – Si m stratégies pures possibles, (p1,p2, …,ps,…, pm-1, pm ) stratégies mixtes telles ∑ni=1 ps = 1où ps est la probabilité de jouer la sième stratégie. Dans un équilibre en stratégies mixtes, chacun des joueurs est indifférent entre jouer sa stratégie mixte ou jouer l’une de ses stratégies pures support de sa stratégie mixte. Les gains attendus sont les même. Exemple 1 : H\V A R A -3, -3 -1, 2 R 2, -1 0,0 En gras sont représentés les deux équilibres en stratégies pures. On construit l’équilibre en stratégies mixtes en notant p et q les probabilités de jouer A pour le joueur horizontal et vertical, respectivement. On doit avoir UH(A/q) = UH(R/q) -> −3q +2(1 − q) = −q UV(A/p) = UV (R/p) -> −3p+2(1 − p) = −p d’où p = q = 1/2 Ce jeu présente une forme ”d’envie” : prendre l’action A n’a de valeur que si l’autre ne la prend pas ; celui qui n’a pas pris l’action est moins bien que si aucun des deux ne l’avait prise, il ”envie” son rival. On remarque que l’équilibre en stratégies mixtes offre des paiements égaux à -1/2 aux deux joueurs. Exemple 2 : Equilibre Mixte dans un jeu de standardisation A\B Standard 1 Standard 2 - Standard 1 (2,1) (0,0) Standard 2 (0,0) (1,2) Deux équilibres en stratégies pures : (S1, S1) et (S2, S2) On note p et q les probabilités de jouer S1 pour le joueur A et B, respectivement. o UA (S1/q)= U A (S2/q) -> 2*q + 0*(1-q)= 1*(1-q) o UB (S1/p)= U B (S2/p) -> 1*p + 0*(1-p)= 2*(1-p) D’où p=q =1/3 - Un équilibre en stratégie mixte : (2/3, 1/3) pour A et (1/3, 2/3) pour B Gain espéré en stratégie mixte = 2/3 o Soit (1-p)= 2/3 o Soit 2*(1-p)= 2/3