theorie des jeux
Transcription
theorie des jeux
Théorie des jeux (Arbres de Décision) Meltem OZTURK: [email protected] www.lamsade.dauphine.fr/∼ozturk, enseignement AMCD – p. 1 Théorie des jeux Un jeux est une situation où les joueurs sont conduits à faire des choix stratégiques parmi un certain nombre d’actions possibles, , et dans un cadre défini à l’avance qui sera les règles du jeu. Le résultat de ces choix constituant une issue du jeu, à laquelle est associé un gain (ou une perte) pour chacun des participants. ref: www.sciences.ch/htmlfr/mathsociales AMCD – p. 2 Théorie des jeux La théorie des jeux s’intéresse aux situations où des individus doivent prendre des décisions "en interaction" , dans le sens où le gain de chacun dépend de ce qu’il fait mais aussi de ce que font les autres. Pour un joueur, toute la difficulté provient alors de ce qu’il doit anticiper le choix des autres, avant de faire le sien. d’où l’hypothèse de rationalité : les joueurs cherchent à maximiser leur gain, compte tenu de l’information dont ils disposent et ce fait est connaissanec commune (chacun sait que les autres sont rationnels, qu’ils savent qu’il sait, etc...) ref: B. Guerrin, La théorie des jeux, Economica, 2002 AMCD – p. 3 Théorie des jeux : histoire L’analyse du duopole d’Antoine Augustin Cournot publiée en 1838 dans ses Recherches sur les principes mathématiques de la théorie des richesses peut être considérée comme la première formulation, dans un cadre particulier, de la notion d’équilibre de Nash. Dans son ouvrage de 1938, Applications aux Jeux de Hasard, Émile Borel développe un théorème du minimax pour les jeux à somme nulle à deux joueurs, c’est-à-dire les jeux dans lesquels ce que gagne l’un est perdu par l’autre. AMCD – p. 4 Théorie des jeux : histoire La théorie des jeux moderne commence avec la publication en 1944 du livre d’Oskar Morgenstern et John von Neumann, Theory of Games and Economic Behavior. Cet ouvrage fondateur détaille la méthode de résolution des jeux à somme nulle Elle a été principalement développée dans les années 1950, notamment avec les travaux de John Nash. Deux prix de Nobel : En 1994, John Nash, Reinhard Selten et John Harsanyi et en 2005, Thomas Schelling et Robert Aumann ref : http://fr.wikipedia.org/wiki/Théorie_des_jeux AMCD – p. 5 Théorie des jeux: premier exemple Dilemme des prisonniers deux prisonniers (complices d’un délit) retenus dans des cellules séparées et qui ne peuvent communiquer. On leur dit que • si un des deux prisonniers dénonce l’autre, il est remis en liberté alors que le second obtient la peine maximale (10 ans) ; • si les deux se dénoncent entre eux, ils seront condamnés à une peine plus légère (5 ans) ; • si les deux refusent de dénoncer, la peine sera minimale (6 mois), faute d’éléments au dossier. AMCD – p. 6 Théorie des jeux: premier exemple Dilemme des prisonniers B se tait B denonce A se tait (0.5,0.5) (10,0) A denonce (0,10) (5,5) où les M (i, j) sont à minimiser. AMCD – p. 7 Théorie des jeux : types de jeux • Jeux coopératifs et jeux non coopératifs jeux coopératifs: formation de coalitions entre les joueurs afin d’obtenir un meilleur résultat pour ses membres; • Jeux simultanés et jeux séquentiels jeu simultané: les joueurs décident en même temps de leur stratégie ; jeu séquentiel: on peut spécifier l’ordre des décisions de sorte qu’un joueur peut décider de sa stratégie conditionnellement à ce qu’ont joué les autres joueurs précédemment. AMCD – p. 8 Théorie des jeux : types de jeux • Jeux finis (l’ensemble des stratégies de chacun des joueurs est fini) . • Jeux à somme nulle et jeux à somme positive (et aussi jeux à intérêts communs, ex: lieu de rdv) • Jeux répétés (connaissance des résultats intermédiaires, change souvent fondamentalement son déroulement (les meilleurs coups et la conclusion). Ex : il peut être utile de prendre ponctuellement le risque de perdre « pour voir », tester les autres joueurs, et mettre en place des stratégies de communication par les coups joués. Notre cours se base sur les jeux non coopératifs, simultanés, finis et à un seul coup. AMCD – p. 9 Cadre du cours: jeux à un seul coup Jeux à un seul coup : Un jeux où les joueurs choisissent simultanément une, et une seule de leur action possible. exemple b1 b2 b3 a1 (7, 5) (3, 7) (1, 8) a2 (8, 4) (5, 3) (2, 6) où M (ai , bj ) = (xi , yj ) : le joueur A choisit de jouer ai et B choisit bj . A l’issue de ces décisions A gagne xi et B gagne yj . AMCD – p. 10 Cadre du cours: jeux à un seul coup Remarque : La représentation matricielle des gains s’appelle forme normale. Il existe aussi une représentation dite forme extensive où on utilise un arbre. • La représentation sous forme matricielle ou normale: Adapté pour des jeux (statiques) avec décisions simultanées • La représentation sous forme d’arbre ou extensive : Adapté pour des jeux avec décisions séquentielles AMCD – p. 11 Théorie des jeux: exemple de stratégie Dilemme des prisonniers B se tait B denonce A se tait (0.5,0.5) (10,0) A denonce (0,10) (5,5) où les M (i, j) sont à minimiser. AMCD – p. 12 Théorie des jeux: exemple de stratégie le joueur A pense: • si B dénonce, alors : • si je me tais j’ai 10 ans de prisons • si je dénonce j’ai 5 ans de prisons c’est donc mieux de dénoncer • si B se tait, alors : • si je me tais j’ai 6 mois de prisons • si je denonce j’ai 0 an de prisons c’est donc mieux de dénoncer Conclusion je dénonce. Dénoncer est une stratégie dominante pour A. AMCD – p. 13 Théorie des jeux: exemple de stratégie Dilemme des prisonniers se taire denoncer se taire (0.5, 0.5) (10,0) denoncer (0,10) (5,5) Résultat: tous les deux prisonniers dénoncent pourtant le cas (se taire, se taire) est mieux pour les deux mais cette issue n’est pas stable! (voir plus loin l’idéee de l’equilibre de Nash) AMCD – p. 14 Théorie des jeux: dilemme des prisonniers Dilemme des prisonniers Modélisation pour • problèmes politiques tarifaires: baisser ou pas le prix d’un produit • politique internationale : avoir ou pas avoir d’armée • psychologie : couple où chacun trompe l’autre • sociologie, ecologie, ... AMCD – p. 15 Petite parenthèse Exemple de stratégie pour jeux séquentiels • voir l’exemple de Jérôme Renault (polycopié 1, page 9) : lien sur le site de Mme Öztürk • et le dilemme des prisonniers AMCD – p. 16 Théorie des jeux : dominance Dominance Une stratégie si est dominante (resp. faiblement dominante) pour un joueur A si et seulement si quelles que soient les actions de l’autre joueur la stratégie si apporte strictement plus (resp. plus ou égal) de gain que les autres stratégies du joueur A. AMCD – p. 17 Théorie des jeux : dominance Dominance b1 b2 b3 a1 (7,5) (3,7) (1,8) a2 (8,4) (5,3) (2,6) AMCD – p. 18 Théorie des jeux : dominance Dominance b1 b2 b3 a1 (7,5) (3,7) (1,8) a2 (8,4) (5,3) (2,6) • pour A : la stratégie dominante est a2 • pour B : la stratégie dominante est b3 solution "évidente :" (a2 , b3 ) AMCD – p. 18 Théorie des jeux : dominance Dominance b1 b2 b3 a1 (7,5) (3,7) (1,8) a2 (8,4) (5,3) (2,6) • pour A : la stratégie dominante est a2 • pour B : la stratégie dominante est b3 solution "évidente :" (a2 , b3 ) • Même remarque que les prisonniers : et si c’était (3,7)? AMCD – p. 18 Théorie des jeux : dominance Dominance b1 b2 b3 a1 (7,5) (3,7) (1,8) a2 (8,4) (5,3) (2,6) • pour A : la stratégie dominante est a2 • pour B : la stratégie dominante est b3 solution "évidente :" (a2 , b3 ) • Même remarque que les prisonniers : et si c’était (3,7)? • Et s’il n’y a pas de stratégie dominante? AMCD – p. 18 Théorie des jeux : dominance Stratégie dominée Une stratégie si est strictement dominée (resp. faiblement dominée) pour un joueur A si et seulement s’il existe une autre stratégie s∗ telle que, quelles que soient les stratégies adoptées par les autres joueurs, cette autre stratégie s∗ est toujours strictement meilleure que si (resp. au moins aussi bonne que si et strictement meilleure dans au moins l’une des situations) . AMCD – p. 19 Théorie des jeux Elimination par iteration des stratégies dominées b1 b2 b3 a1 (2,4) (3,7) (2,5) a2 (4,6) (6,5) (3,7) a3 (5,4) (2,3) (4,2) AMCD – p. 20 Théorie des jeux Elimination par iteration des stratégies dominées b1 b2 b3 a1 (2,4) (3,7) (2,5) a2 (4,6) (6,5) (3,7) a3 (5,4) (2,3) (4,2) on elimine d’abord a1 (dominé par a2 ) AMCD – p. 20 Théorie des jeux Elimination par iteration des stratégies dominées b1 b2 b3 a1 (2,4) (3,7) (2,5) a2 (4,6) (6,5) (3,7) a3 (5,4) (2,3) (4,2) on elimine d’abord a1 (dominé par a2 ) après b2 (dominé par b1 ). AMCD – p. 20 Théorie des jeux Elimination par iteration des stratégies dominées b1 b2 b3 a1 (2,4) (3,7) (2,5) a2 (4,6) (6,5) (3,7) a3 (5,4) (2,3) (4,2) on elimine d’abord a1 (dominé par a2 ) après b2 (dominé par b1 ). L’action a3 devient dominante sur le reste des actions de A. AMCD – p. 20 Théorie des jeux Elimination par iteration des stratégies dominées b1 b2 b3 a1 (2,4) (3,7) (2,5) a2 (4,6) (6,5) (3,7) a3 (5,4) (2,3) (4,2) on elimine d’abord a1 (dominé par a2 ) après b2 (dominé par b1 ). L’action a3 devient dominante sur le reste des actions de A. Donc A choisit a3 , alors B choisira b1 (et si (a2 , b2 )?). AMCD – p. 20 Théorie des jeux Elimination par iteration des stratégies dominées b1 b2 b3 a1 (2,4) (3,7) (2,5) a2 (4,6) (6,5) (3,7) a3 (5,4) (2,3) (4,2) on elimine d’abord a1 (dominé par a2 ) après b2 (dominé par b1 ). L’action a3 devient dominante sur le reste des actions de A. Donc A choisit a3 , alors B choisira b1 (et si (a2 , b2 )?). AMCD – p. 20 Théorie des jeux : exemples • D’autres exemples • exemple jeux pécheurs • exemple avec 4 actions • exemple avec dominance faible • Et si ces exemples étaient des jeux séquentiels • exemple avec dominance • exemple avec élimination par itération des stratégies dominées AMCD – p. 21 Théorie des jeux Elimination par iteration des stratégies dominées • Un jeu est dit résoluble par élimination itérative des stratégies dominées, si on obtient un unique profil en éliminant successivement des stratégies (strictement) dominées • Les profils obtenus après élimination itérative des stratégies strictement dominées ne dépendent pas de l’ordre choisi pour l’élimination des stratégies. • Les profils obtenus après élimination itérative des stratégies faiblement dominées dépendent de l’ordre choisi pour l’élimination des stratégies. AMCD – p. 22 Théorie des jeux Elimination par iteration des stratégies dominées • Si on modélise le même jeux simultané comme un jeux séquentiel, l’ordre de passage des joueurs est important si l’élimination en jeux simultanée se fait avec dominance faible. • et si pas d’actions dominées? AMCD – p. 23 Théorie des jeux: Croyance exemple b1 b2 b3 a1 (2,2) (1,6) (4,4) a2 (3,3) (2,2) (2,0) a3 (2,1) (7,5) (2,7) AMCD – p. 24 Théorie des jeux: Croyance exemple b1 b2 b3 a1 (2,2) (1,6) (4,4) a2 (3,3) (2,2) (2,0) a3 (2,1) (7,5) (2,7) • pas de dominance • idée pour continuer : croyance de chaque joueur concernant le choix des autres fondées sur l’idée que les autres sont rationnels et cela est connaissance commune. AMCD – p. 24 Théorie des jeux: Croyance exemple b1 b2 b3 a1 (2,2) (1,6) (4,4) a2 (3,3) (2,2) (2,0) a3 (2,1) (7,5) (2,7) croyance erronées : Si c’est (a1 , b1 ) qui réalise: AMCD – p. 25 Théorie des jeux: Croyance exemple b1 b2 b3 a1 (2,2) (1,6) (4,4) a2 (3,3) (2,2) (2,0) a3 (2,1) (7,5) (2,7) croyance erronées : Si c’est (a1 , b1 ) qui réalise: • A dit : ayy ayy j’avais cru que B allait jouer b3 . • B dit : ayy ayy j’avais cru que A choisira a2 . • tous les deux joueurs se sont trompés dans leur croyance qui porte sur l’action de l’autre. AMCD – p. 25 Théorie des jeux: Croyance, Eq. de Nash exemple b1 b2 b3 a1 (2,2) (1,6) (4,4) a2 (3,3) (2,2) (2,0) a3 (2,1) (7,5) (2,7) Bonne croyance (?) : si c’est (a2 , b1 ) AMCD – p. 26 Théorie des jeux: Croyance, Eq. de Nash exemple b1 b2 b3 a1 (2,2) (1,6) (4,4) a2 (3,3) (2,2) (2,0) a3 (2,1) (7,5) (2,7) Bonne croyance (?) : si c’est (a2 , b1 ) • A a joué a2 car il pensait que B choisira b1 • B a joué b1 car il pensait que A choisira a2 . • Les deux joueurs ont eu raisons. • Personne n’a intérêt de bouger. AMCD – p. 26 Théorie des jeux: Equilibre de Nash Equilibre de Nash: une issue d’un jeu dans lequel aucun joueur n’a intérêt à modifier sa stratégie unilatéralement, compte tenu des stratégies des autres joueurs. Les joueurs sont contents de leur prévision. Interpretation : issue a∗ , b∗ est un equilibre de Nash : • a∗ est la meilleure stratégie pour A si B joue b∗ • b∗ est la meilleure stratégie pour B si A joue a∗ AMCD – p. 27 Théorie des jeux: Equilibre de Nash Equilibre de Nash: une issue d’un jeu dans lequel aucun joueur n’a intérêt à modifier sa stratégie unilatéralement, compte tenu des stratégies des autres joueurs. Les joueurs sont contents de leur prévision. Remarque : • (a2 , b1 ) est une équilibre de Nash dans le jeu précédent. • issue (dénoncer, dénoncer) est l’équilibre de Nash dans le jeu des prisonniers AMCD – p. 28 Théorie des jeux: Equilibre de Nash exemple de jeu de coordination Femme et mari veulent aller voir un film ensemble. La femme préfère les films romantiques tandis que son mari veut voir un film d’action. Néanmoins ils n’ont pas envie de voir des films séparément. Voici le tableau des utilités (femme sur les lignes et homme sur les colonnes) romantique action romantique (3,2) (1,1) action (1,1) (2,3) AMCD – p. 29 Théorie des jeux: Equilibre de Nash exemple de jeu de coordination Femme et mari veulent aller voir un film ensemble. La femme préfère les films romantiques tandis que son mari veut voir un film d’action. Néanmoins ils n’ont pas envie de voir des films séparément. Voici le tableau des utilités (femme sur les lignes et homme sur les colonnes) romantique action romantique (3,2) (1,1) action (1,1) (2,3) Deux equilibres : (romantique, romantique) et (action, action) AMCD – p. 29 Théorie des jeux: Equilibre de Nash exemple de jeu de coordination Femme et mari veulent aller voir un film ensemble. La femme préfère les films romantiques tandis que son mari veut voir un film d’action. Néanmoins ils n’ont pas envie de voir des films séparément. Voici le tableau des utilités (femme sur les lignes et homme sur les colonnes) romantique action romantique (3,2) (1,1) action (1,1) (2,3) Deux equilibres : (romantique, romantique) et (action, action) Quelle conclusion? (peut-on attendre tout et n’importe quoi?) AMCD – p. 29 Théorie des jeux: Equilibre de Nash exemple de jeu : poule mouillée deux voitures se dirigent l’une vers l’autre au milieu de la chaussée.: celui qui s’écarte au dernier moment est "poule mouillé", donc son gain est nul, celui de l’autre étant strictement positif. Si tous les deux s’écartent le déshonneur est total mais le pire arrive bien sûr quand il n’y a aucun qui s’écarte. passer s’écarter passer (-2, -2) (1,0) s’écarter (0,1) (-1, -1) Equilibre(s) : ? AMCD – p. 30 Théorie des jeux: Equilibre de Nash exemple de jeu : un gagne l’autre perd b1 b2 a1 (0, 1) (1,0) a2 (1, 0) (0,1) Equilibre(s) : ? AMCD – p. 31 Théorie des jeux: Equilibre de Nash exemple de jeu : Pierre/ciseau/papier pierre ciseau papier pierre (0, 0) (1,-1) (-1,1) ciseau (-1, 1) (0, 0) (1, -1) papier (1, -1) (-1, 1) (0, 0) Equilibre(s) : ? AMCD – p. 32 Théorie des jeux: Equilibre de Nash exemple de jeu : Pierre/ciseau/papier pierre ciseau papier pierre (0, 0) (1,-1) (-1,1) ciseau (-1, 1) (0, 0) (1, -1) papier (1, -1) (-1, 1) (0, 0) Equilibre(s) : ? Deux autres exemples de jeux? AMCD – p. 32 Théorie des jeux Equilibre de Nash • Un profil (unique) obtenu par élimination itérative de stratégies (strictement) dominées est un équilibre de Nash (et c’est le seul équilibre du jeu). • On peut avoir plusieurs équilibres de Nash. • On peut ne pas avoir d’équilibre de Nash. • A quoi sert l’équilibre de Nash? • Expérience (ex: jeux des milles pattes, seuls 1,5% des sujets se comportent comme le prédit l’eq. de Nash, pas le cas avec les joueurs professionnels d’échecs)... AMCD – p. 33 Théorie des jeux: Equilibre de Nash exemple de jeu : échange de monnaie b1 b2 a1 (1, -1) (-1,1) a2 (-1, 1) (1, -1) • Pas d’équilibre mais Nash est connu avec sa théorème sur l’existence d’équilibre (1950)? • Jeux à somme nulle, mais même en 1928 Von Neuman garantissait l’existence d’équilibre (thm Minimax)? • Alors où ont-ils trouvé l’équilibre? AMCD – p. 34 Stratégie pure/ stratégie mixte • Une stratégie pure du joueur i est un plan d’action qui prescrit une action de ce joueur pour chaque fois qu’il est susceptible de jouer. • Les cas que nous avons vus jusqu’à présent sont à stratégies pures. • Une stratégie mixte du joueur i est une distribution de probabilités pi définie sur l’ensemble des stratégies pures du joueur i. AMCD – p. 35 Stratégie pure/ stratégie mixte exemple de stratégie mixte : b1 b2 probabilité de A a1 (2, 0) (0,1) pA a2 (0, 3) (1, 0) 1 − pA probabilité de B pB 1 − pB AMCD – p. 36 Stratégie pure/ stratégie mixte exemple de stratégie mixte : b1 b2 probabilité de A a1 (-3, -2) (10, 0) pA a2 (0, 0) (1, 0) 1 − pA probabilité de B pB 1 − pB AMCD – p. 37 Stratégie pure/ stratégie mixte • Il existe toujours un équilibre de Nash dans des stratégies mixtes. • Donc prendre en compte les stratégies mixtes permet de trouver des équilibres là où il n’y en a pas. • Mais cela peut faire apparaître de nouveaux équilibres là où il y en a déjà trop. • Quelle interprétation à donner à des stratégies mixtes? AMCD – p. 38 Stratégie pure/ stratégie mixte Trouver les equilibres de Nash en stratégies mixtes: • • b1 b2 a1 (2,1) (0,0) a2 (0,0) (1, 2) b1 b2 a1 (1, -1) (-1,1) a2 (-1, 1) (1, -1) AMCD – p. 39 si on a du temps Résoudre l’exemple de jeux séquentiel avec plusieurs niveaux : stratégie “backward induction” (induction en arrière) AMCD – p. 40