Partie I : Jeux et équilibre de Nash
Transcription
Partie I : Jeux et équilibre de Nash
Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Partie I : Jeux et équilibre de Nash Nicolas Carayol M1 MIMSE Information incomplète Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Introduction • La théorie des jeux peut se concevoir comme une theorie des comportement d’agents rationnels en situation d’interaction. • Les joueurs sont rationnels : ils poursuivent des objectifs exogènes et indépendants (ici jeux non-coopératifs vs jeux coopératifs) ; Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Jeu en forme normale Définition Un jeu en forme normale I , (Si )i∈I , (ui (·))i∈I est donné par : • Un ensemble I de n ≥ 1 joueurs, indexés par i = 1, 2, . . . n ; • Un ensemble de stratégies Si pour chaque joueur i qui peut choisit une stratégie (pure) si . Le vecteur s ≡ (s1 , s2 , . . . , sn ) est le résultat (ou profil de stratégies) avec s ∈ S, l’ensembe des profils de stratégies. • Une fonction de gain pour chaque joueur i, ui : S → R Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Le dilemme du prisonnier • Un jeu non–coopératif avec n = 2 joueurs, I = {1, 2} • L’ensemble de stratégies de chaque joueur : S1 = S2 = {C , D} Définition • 4 résultats possibles du jeu : S = {(C , C ) , (C , D) , (D, D) , (D, C )} . • Gains symétriques : • • • • u1 (C , C ) = u2 (C , C ) = −1, u1 (C , D) = −10, u2 (C , D) = 0, u1 (D, C ) = 0, u2 (D, C ) = −10, u1 (D, D) = u2 (D, D) = −8. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum DP - Matrice du jeu II 2 1 C D C (−1, −1) (0, −10) D (−10, 0) (−8, −8) Table: Dilemme du prisonnier Information incomplète Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Notation Le profil de stratégies s = (si , s−i ) (∀i ∈ I ) avec s−i = (s1 , s2 , . . . , si−1 , si+1 , . . . , sn ) , s−i ∈ X Sj . j6=i Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Définition La stratégie si du joueur i est strictement dominée par la stratégie si0 si et seulement si, quel que soit le comportement des autres joueurs, le joueur i obtient avec si une utilité strictement inférieure à celle obtenue avec si0 ∀s−i ∈ S−i , ui (si , s−i ) < ui si0 , s−i Définition La stratégie si est faiblement dominée par si0 si l’inégalité est faible pour toutes les stratégies des autres joueurs et qu’il existe au moins un profil de stratégies des autres joueurs pour lequel l’utilité avec pi est strictement inférieure à celle avec si0 : ∀s−i ∈ S−i , ui (si , s−i ) ≤ ui si0 , s−i et ∃s−i ∈ S−i | ui (si , s−i ) < ui si0 , s−i Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Dilemme du prisonier 2 1 N D N (−1, −1) (0, −10) D (−10, 0) (−8, −8) Information incomplète Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Stratégies dominantes Définition Une stratégies si0 est une stratégies strictement dominante si ∀si ∈ Si , ∀s−i ∈ S−i , ui (si , s−i ) < ui si0 , s−i Définition Une stratégies si0 est une stratégies faiblement dominante si : ∀si ∈ Si : ∀s−i ∈ S−i , ui (si , s−i ) ≤ ui si0 , s−i et ∃s−i ∈ S−i | ui (si , s−i ) < ui si0 , s−i Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Equilibre en stratégies dominantes Définition Un profil de stratégies s 0 est un équilibre en stratégies dominantes strict si ∀i ∈ I , ∀si ∈ Si , ∀s−i ∈ S−i , ui (si , s−i ) < ui si0 , s−i Définition Un profil de stratégies s 0 est un équilibre en stratégies (faiblement) dominantes si : ∀i ∈ I : ∀si ∈ Si , ∀s−i ∈ S−i , ui (si , s−i ) ≤ ui si0 , s−i et ∃s−i ∈ S−i | ui (si , s−i ) < ui si0 , s−i Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Equilibre de Nash Définition Un profil s ∗ = (s1∗ , . . . , sn∗ ) (si∗ ∈ Si , i = 1...n) est un équilibre de Nash si aucun joueur n’a intérêt à dévier unilatéralement de sa stratégie pi∗ (quand les autres joueurs continuent à jouer le profil ∗ ) : p−i ∗ ∗ ui si∗ , s−i ≥ ui si , s−i , ∀si ∈ Si , ∀i = 1 . . . n. Définition p ∗ est un équilibre de Nash strict si ∗ ∗ , ∀s ∈ S \ {s ∗ } , ∀i = 1 . . . n. ui si∗ , s−i > ui si , s−i i i i • Si l’équilibre de Nash est strict, en dévier doit avoir un coût pour les joueurs. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum 2 1 C D C (−1, −1) (0, −10) D (−10, 0) (−8, −8) Table: Dilemme du prisonnier Information incomplète Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum La Bataille des sexes 2 1 B b B (2, 1) (0, 0) b (0, 0) (1, 2) Information incomplète Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Définition Une stratégie mixte du joueur i est une mesure de probabilités pi définie sur l’ensemble des stratégies pures du joueur i P ( si pi,si = 1). On note Pi l’ensemble des stratégies mixtes du joueur i. pi,si est la probabilité que i joue le stratégie pure si . pi ∈ Pi correspond donc à une stratégie mixte du joueur i. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Stratégies mixtes Stratégies mixtes : p1 = (q, 1 − q) et p2 = (t, 1 − t) avec q, t ∈ [0, 1]. → q est la fréquence du choix de la stratégie N par 1 → t est la fréquence du choix de N par 2. Information incomplète Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Equilibre de Nash Définition Un profil p ∗ = (p1∗ , . . . , pn∗ ) (pi∗ ∈ Pi , i = 1...n) est un équilibre de Nash en stratégies mixtes si ∗ ∗ , ∀pi ∈ Pi , ∀i = 1 . . . n. (1) ui pi∗ , p−i ≥ ui pi , p−i Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Fonctions de meilleures réponses Déterminer les stratégies du joueur i qui correspondent à la plus grande satisfaction pour lui face à tout profil s−i . Definition Dans un jeu à n joueurs, la fonction de meilleure réponse du joueur i, Ri (p−i ) associe, à chaque combinaison de stratégies des autres joueurs p−i , la (les) stratégie(s) du joueur i qui maximise(nt) son gain : ui (Ri (p−i ) , p−i ) ≥ ui (pi , p−i ) , ∀pi ∈ Pi , p−i ∈ P−i . Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Illustration en strategies pures avec la Dilemme du prisonnier 2 1 C D C (−1, −1) (0, −10) D (−10, 0) (−8, −8) Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Illustration en strategies pures avec la Bataille des sexes 2 1 B b B (2, 1) (0, 0) b (0, 0) (1, 2) Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète De manière plus générale : Proposition p ∗ est un équilibre de Nash si et seulmement si ∗ pi∗ ∈ Ri p−i , ∀i = 1...n. ∗ ∗ Preuve : Par définition, Ri p−i maximise ui pi , p−i , pour tout joueur i → Aucun joueur n’a intérêt à dévier unilatéralement de sa stratégie pi∗ . • Recherche des équilibres de Nash est opérée en pratique par la recherche des points d’intersection entre les fonctions de meilleures réponses de tous les joueurs (comme dans l’oligopole de Cournot). Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Meilleures réponses en stratégies mixtes Stratégies mixtes des deux joueurs : p1 = (q, 1 − q) et p2 = (t, 1 − t) avec q, t ∈ [0, 1] . 2 1 q 1−q B b t B (2, 1) (0, 0) 1−t b (0, 0) (1, 2) Table: Bataille des sexes et stratégies mixtes Comparons alors l’espérance d’utilité de 1 pour ses deux stratégies : si B : U1B (p1 , p2 ) = U1 ((1, 0) , (t, 1 − t)) = 2t + 0 (1 − t) = 2t si b : U1b (p1 , p2 ) = U1 ((0, 1) , (t, 1 − t)) = 0t + 1 (1 − t) = 1 − t Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Meilleures réponses en stratégies mixtes Face à la stratégie mixte p2 de 2, 1 choisira B si : 1 2t > 1 − t ⇒ t > . 3 → La fonction de meilleure réponse de 1 Si 1 [0, 1] Si R1 (t) = q ∗ (t) = 0 Si : t > 1/3 t = 1/3 t < 1/3. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Et pour 2 : B : U2B (p1 , p2 ) = U2 ((q, 1 − q) , (1, 0)) = 1q + 0(1 − q) = q b : U2b (p1 , p2 ) = U2 ((q, 1 − q) , (0, 1)) = 0q + 2 (1 − q) = 2 − 2q Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Meilleures réponses en stratégies mixtes Face à la stratégie mixte p1 de 1, 2 choisira B (t = 1) si : U2B (p1 , p2 ) > U2b (p1 , p2 ) C’est à dire si : 2 q > 2 − 2q ↔ q > . 3 La fonction de meilleure réponse de 2 1 [0, 1] R2 (q) = t ∗ (q) = 0 est : Si q > 2/3 Si q = 2/3 Si q < 2/3. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Représentation graphique Tp : représentation graphique des fonctions de meilleures réponse. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Meilleures réponses en stratégies mixtes : autre exemple Autre exemple 2 1 a b a (2, 2) (3, 1) b (1, 3) (0, 0) Table: Stratégies mixtes Ensemble des EN en stratégies mixtes ? Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Meilleures réponses en stratégies mixtes : autre exemple Autre exemple 2 1 a b a (3, 3) (0, 1) b (0, 2) (1, 1) Table: Exercice : Calculer le(s) équilibre(s) de Nash en stratégies mixtes de ce jeu (s’il en existe). Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Jeu en forme extensive Définition Un jeu en forme extensive I , A, ψ (·) , Λ, (λi )i∈I , (Si )i∈I , ρ, (ui (·))i∈I est donné par • Un ensemble I de n ≥ 1 joueurs, indexés par i = 1, 2, . . . n. • Un ensemble de noeuds A, comprenant la racine a0 . Le sous ensemble Aw ⊂ A rassemble les noeuds terminaux. Les autres noeuds Ad sont les noeuds de décision. • Une fonction donnant le prédécesseur (unique) pour tout noeud différent de la racine ψ : A\ {a0 } → Ad . • Une partition de l’ensemble des noeuds de décision Ad sur l’ensemble des joueurs indiquant, pour chaque noeud de décision, le joueur qui joue : Λ = (Λ1 , ..., Λn ). Λ1 = ensemble des noeuds de décision du joueur 1. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Jeu en forme extensive Définition • Pour chaque joueur i, une partition λi (λi1 , ..., λini ) de son Λi en ni ensembles d’information hj (hj ∈ Hi l’ensemble des ensembles d’information du joueur i) avec la condition que tous les noeuds d’un même ensemble d’information aient le même nombre de branches. • Des probabilités sur d’éventuels mouvements aléatoires (joués par la Nature) : ρ. • La spécification des gains de chaque joueur à chaque noeud terminal : Une fonction de gain pour chaque joueur i, ui : Aw → R Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Information imparfaite • Si un joueur ne connaı̂t pas les choix effectués par les joueurs qui ont joué avant lui, il ne connaı̂t pas parfaitement le noeud sur lequel il se situe. • Si, à un moment donné, il ne peut distinguer deux noeuds, ces deux noeuds appartiennent au même ensemble d’information. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Définition Un jeu en forme extensive est 1. un jeu avec information imparfaite si au moins un ensemble d’information contient plus d’un noeud ; 2. un jeu avec information parfaite si chaque ensemble d’information est réduit à un seul noeud. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Stratégies pures • Une stratégie pure : spécification d’une action pour un joueur chaque fois qu’il est susceptible de j ouer. • Dans un jeu en forme normale : une stratégie d’un joueur i consiste en la détermination d’un si . • Dans un jeu en forme extensive : une stratégie d’un joueur i est une application si qui attribue à chaque ensemble d’information hj (∈ Hi ) du joueur i une action qu’il est susceptible de choisir dans cet ensemble d’information. • Un profil de stratégies (résultat) → spécification d’un déroulement complet du jeu en précisant une stratégie par joueur. omplètement le jeu quand on les combine (on considère donc un profil de stratégies). Par conséque Forme normale et équilibre de Nash forme extensive de l’EN et optimum Information incomplète concept de stratégie de la théorieLades jeux est plus Existence complet que celui du langage courant. Consid ons une version plus détaillée du jeu de l’entrée afin de développer la définition des différents typ e stratégies. emple 3 : Le Jeu de l’entrée II Prenons le jeu représenté dans la Figure 2.3. Strategies pures dans un jeu sequentiel : Exemple (uE , uI ) Produire (−50, 40) Augmenter capacité Installer capacité Non (−10, 120) E1 Produire (50, 60) I E0 Non Non Non (−10, 100) (0, 100) Figure: Le jeu de l’entrée II Fig. 2.3: Le jeu de l’entrée II Il s’agit d’une analyse plus fine des interactions concernant le problème d’entrée sur un marché. Tiré par de la Yildizoglu u commence décision de(2011) l’entrant potentiel (E) : il doit choisir s’il met en place les capaci e production nécessaires à son entrée sur ce nouveau marché. Ayant observé cette décision, la firm nstallée (I) doit choisir si elle augmentesours ses propres production Donnez la représentation formecapacités normaledede ce jeu ?ou non. L’entrant d ors prendre sa décision de procéder effectivement à la production du bien ou non et cela, sa Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Stratégies dans un jeu en forme extensive - II Définition Une stratégie locale du joueur i est similaire à une stratégie mixte, sauf qu’elle est définie au niveau d’un ensemble d’information (au lieu du jeu global). Pour un joueur i, elleéfinit d par conséquent, pour un ensemble d’information hj , une mesure de probabilités sur l’ensemble des actions disponibles en cet ensemble d’information. On la note par πihj (la stratégie locale du joueur i à son ensemble d’information hj ) et Πihj est l’ensemble des stratégies locales de i pour l’ensemble d’information hj . Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Stratégies dans un jeu en forme extensive - III Définition Une stratégie comportementale du joueur i est un vecteur de stratégies locales de ce joueur, contenant une stratégie locale pour chaque ensemble d’information de ce joueur. On la note par πi et Πi est l’ensemble des stratégies comportementales du joueur i. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Concepts de stratégies : • stratégies pures (pour jeux en forme stratégique et extensive) ; • stratégies mixtes (pour jeux en forme stratégique et extensive) ; • stratégies locales (pour jeux en forme extensive) ; • stratégies comportementales (pour jeux en forme extensive). Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Non-existence de l’équilibre de Nash en stratégies pures • Il n’existe pas nécessairement un équilibre de Nash en stratégies pures. • Exemple 2 1 B b B (2, 0) (0, 1) b (0, 2) (1, 0) Table: Bataille des sexes II Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Conditions d’existence Théorème Tout jeu sous forme normale I , (Si )i∈I , (ui )i∈I a au moins un équilibre de Nash en stratégies pures s’il vérifie les conditions suivantes • L’ensemble des stratégies est un sous espace Euclidien (Si ⊆ RK , K ∈ N) non vide, compact et convexe • Les fonctions d’utilité ui (·) : S → R sont continues • Les fonctions d’utilité ui (·, s−i ) : Si → R sont quasi-concaves ∀s−i ∈ S−i . Démonstration. Le théorème du point fixe (Kakutani, 1941) s’applique à la correspondance des meilleures réponses R : S → S • Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Théorème (Nash) Tout jeu sous forme normale fini possède au moins un équilibre de Nash si les stratégies mixtes sont autorisées. Démonstration. Stratégies mixtes dans un jeu fini → elles sont définies dans l’intervalle fermée [0, 1], et sur un support fini (Si ) → compacité et convexité → Théorème de Nash. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Bien-être social • Un concept d’équilibre implique un mécanisme particulier de coordination des stratégies individuelles. Dans l’équilibre de Nash, chaque joueur cherche à améliorer sa situation individuelle unilatéralement. • L’équilibre de Nash est-il un mécanisme de coordination efficace au sens de Pareto ? Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Optimum de Pareto Définition Efficacité au sens de Pareto. 1. Le résultat ŝ Pareto-domine le résultat s si : ui (ŝ) ≥ ui (s) , ∀i et ∃ j, uj (ŝ) > uj (s) . 2. Un résultat s ∗ est un optimum de Pareto s’il n’existe pas un autre résultat qui le Pareto-domine. 3. Les résultats ŝ et s ne sont pas Pareto-comparable si ∃i, ui (ŝ) > ui (s) et ∃ j 6= i, uj (ŝ) < uj (s) . Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Exemple 2 1 C D Optimum de Pareto ? C (−1, −1) (0, −10) D (−10, 0) (−8, −8) Information incomplète Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Exemple 2 1 C D C (−1, −1) (0, −10) D (−10, 0) (−8, −8) Dilemme du prisonnier : (D, D) est un équilibre de Nash mais (N, N) Pareto-domine cet équilibre. Proposition Un équilibre de Nash n’est pas nécessairement un optimum de Pareto. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Application : Jeu de pollution • Jeu de pollution simultané avec stratégies (si )i∈N continues ∈ R+ et la fonction de paiement : ui (s1 , ..., sn )) = v (si ) − avec v 0 > 0, v 00 < 0 et v 0 (0) > 1. X j sj , Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Application : Jeu de pollution • Solution : chaque agent max son paiement individuellement : max v (si ) − si X j sj → v 0 (si ) = 1. • Chaque agent a une (unique) action dominante. • Le profil de stratégies caractérisé par v 0 (si ) = 1, ∀i ∈ N est donc son unique EN. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Application : Jeu de pollution • Si l’objectif est de maximiser le bien être social : max si,∀i∈N X i v (si ) − X j sj → v 0 (si ) = n • Les EN ne maximisent pas le bien-être social • Les EN ne sont pas des optimas de pareto. • Quel mécanisme pour implémenter la solution optimale à l’EN ? Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Application : Jeu de pollution • Si l’on introduit un taux θ de taxe (dite pigouvienne) linéaire en si → ûi (s1 , ..., sn )) = v (si ) − X j sj − θsi + θX sj n j • A l’équilibre de Nash : 0 v (si ) = 1 + θ n−1 n • Or maximiser le bien être social implique : v 0 (si ) = n • Le mécanisme : fixer la taxe telle que n =1+θ n−1 n . Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Application : compétition spatiale Application : compétition spatiale • N=2 • S1 = S2 = [0; 1] (x1 + x2 )/2 si x1 < x2 [1 − (x1 + x2 )] /2 si x1 > x2 1/2 si x1 = x2 • u2 (x1 , x2 ) symétrique • u1 (x1 , x2 ) = • EN ? Information incomplète Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Information incomplète et jeux Bayesiens • L’hypothèse de base des jeux à information complète est que tous les joueurs sont parfaitement informés des règles du jeu. • Or, les joueurs ont souvent une connaissance imparfaite des caracteristiques des autres joueurs ou même de certaines conditions du jeu. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète L’idée de base Exemple : mais qui est votre partenaire ? 1 B b 2.a B b (2, 3) (0, 0) (1, 2) (3, 1) 1 B b 2.b B b (2, 1) (0, 2) (1, 2) (3, 3) Table: Bataille des sexes en info incomplete • Le joueur 1 ignore l’identité du joueur 2. • Le joueur 2 connaı̂t ses préférences et a une stratégie dominante. • Le joueur 1 attribue la probabilité p à l’éventualité que le joueur 2 soit de type 2.a et 1 − p qu’il soit de type 2.b. • si : 2p + 0(1 − p) > 1p + 3(1 − p) → 1 joue B. • C’est le principe du Bayesian Nash Equilibrium. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète L’idée de base • Tout jeu en information incomplète peut être représenté comme un jeu à infomation imparfaite dans lequel la nature joue en premier un coup qu’un agent au moins ne peut pas observer. • Exemple : information asymetrique privé d’un joueur = situation dans laquelle la nature à attribué un type à un joueur que l’autre ne peut observer. • Exemple : transformer le jeu de la bataille des sexes à information incomplète ! Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Remarque • Harsanyi (1973) montre que tout équilibre de Nash (notamment en stratégies mixtes) d’un jeu sous forme normale peut “presque toujours” être obtenu comme la limite d’un équilibre de Nash en stratégies pures d’un jeu perturbé à information incomplète (où les joueurs sont incertains sur les paiements des autres) quand les perturbations (incertitudes a priori, types) tendent vers 0. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Jeux bayésiens • Lorsque l’incertitude porte sur une caractéristique d’un joueur, les différents états de la nature portent sur les types des joueurs. • Quand l’incertitude porte sur une autre caractéristique du jeu, il est quand même le plus souvent possible d’écrire les gains du jeu comme dépendant de types des joueurs. • Les types de i, ti , et des autres joueurs t−i • La distribution de probabilités sur les types des autres sachant son propre type et ses croyances pi (t−i |ti ) • Si les attributions des types sont indépendants : pi (t−i |ti ) = pi (t−i ) Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Jeux bayésiens Definition Un jeu bayésien statique en forme normale est décrit par : · Un ensemble de n joueurs : I = {1, 2, . . . , n} . · Pour chaque joueur i, i ∈ I , un ensemble d’actions Ai et un ensemble de types possibles Ti . A = X Ai et T = X Ti . · Pour chaque joueur i, une fonction i∈I i∈I de gain, ui → les préférences (VNM) du joueur i : ui : S = A × T → R s ≡ (a1 , a2 , . . . , an , t1 , t2 , . . . , tn ) 7→ ui (a, t) . Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Jeux bayésiens Definition (suite) · Une distribution de probabilité a priori pi pour tout i ∈ I qui donne les croyances des agents quant aux types des autres agents : pi : T → [0, 1] (t1 , t2 , . . . , tn ) 7→ pi (t−i |ti ) . qui résulte de la règle de bayes lorsque celle-ci peut être appliquée Pr(b|a) (memo : Pr(a|b) = Pr(a) ) Pr(b) Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Jeux bayésiens Definition Une stratégie (pure) si du joueur i précise une action pour chaque type : si : Ti → Ai ti 7→ si (ti ) = ai . Le profil de stratégies (pures) est donné par s = (s1 , s2 , . . . , sn ). Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Jeux bayésiens • Une stratégie pour i est • séparatrice si si (ti ) 6= si (ti0 ) , ∀ti 6= ti0 ∈ Ti , • mélangeante (pooling) si si (ti ) = si (ti0 ) , ∀ti 6= ti0 ∈ Ti • Les déductions que l’on peut inférer quant à leurs types au vu de leurs choix sont très différentes. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Equilibre de Nash bayésien Definition L’équilibre de Nash en stratégies pures d’un jeu bayésien est un profil de stratégies s ∗ P = (s1∗ , s2∗ , . . . , sn∗ ) tel que, ∀i ∈ I , ∀ti ∈ Ti : ∗ (t ), s ; t × p (t |t ) , si∗ (ti ) = arg maxsi ∈Si t−i ∈T−i ui s−i −i i i −i i avec : s−i (t−i ) = (s1 (t1 ), s2 (t2 ), . . . si−1 (ti−1 ), si+1 (ti+1 ), ..., sn (tn )) . • Notion que l’on peut étendre aux stratégies mixtes σi∗ (ti ) . Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Bataille des sexes avec information incomplète Equilibre : • s2∗ (t2.a ) = B; s2∗ (t2.b ) = b (stratégie séparatrice) • s1∗ (t1 ) = B si p > 3/4 (x, 1 − x), ∀x ∈ [0, 1] si p = 3/4 b si p < 3/4 Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Duopole de Cournot en information incomplète • Q = A − p, • πi (q1 , q2 ) = (p − ci ) qi = (A − q1 − q2 − ci ) qi . • I = {1, 2} . • T1 = {t1 } , T2 = {t2.a , t2.b } • Pr(t2.a ) = P (c2 = c) = α = 1 − Pr(t2.b ) = 1 − P (c2 = c) avec c < c1 < c. Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Duopole de Cournot en information incomplète • La fonction de réaction de la firme 2 : • maxq2 (A − q1 − q2 − c) q2 , si t2 = t2.a ou • maxq2 (A − q1 − q2 − c) q2 , t2 = t2.b • → q2∗ (q1 , c) = A−q21 −c • → q2∗ (q1 , c) = A−q21 −c • Stratégie séparatrice Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Duopole de Cournot en information incomplète • La fonction de réaction de la firme 1 incorpore une incertitude sur la fonction de réaction de 1 : maxq1 α (A − q1 − q2∗ (q1 , c) − c1 ) q1 + (1 − α) (A − q1 − q2∗ (q1 , c) − c1 ) q1 ou maxq1 (A − q1 − E1 (q2∗ ) − c1 ) q1 avec E1 (q2∗ ) = α A−q21 −c + (1 − α) A−q21 −c = A−q1 −E1 (c2 ) 2 Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Duopole de Cournot en information incomplète L’équilibre 2 )−c1 • q1∗ (q2 ) = A−E1 (q 2 1 (c2 ) • E1 (q2∗ ) = A−q1 −E 2 • Donne q1 = A+q1 +E41 (c2 )−2c1 → q1∗ = A+E1 (c32 )−2c1 • La quantité proposée par 1 tient compte de ses croyances sur 2 Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Duopole de Cournot en information incomplète L’équilibre • q2∗ (c) = A− • q2∗ (c) = A− A+E1 (c2 )−2c1 −c 3 2 A+E1 (c2 )−2c1 • q2∗ (c) < q2∗ (c) 3 2 −c = 2A−E1 (c2 )+2c1 −3c 6 = 2A−E1 (c2 )+2c1 −3c 6 Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Duopole de Cournot en information incomplète L’équilibre • q2∗ (c) > q2∗∗ (c) en information complète • q2∗ (c) < q2∗∗ (c) en information complète Forme normale et équilibre de Nash La forme extensive Existence de l’EN et optimum Information incomplète Duopole de Cournot en information incomplète • Dans l’EN avec information incomplète, la firme 2 : • si elle a des coûts élevés, elle produit plus que ses quantités de cournot en information complète, • si elle a des coûts faibles, elle produit moins que ses quantités de cournot en information complète