Jeux sous forme normale: stratégies mixtes - Educnet
Transcription
Jeux sous forme normale: stratégies mixtes - Educnet
Jeux sous forme normale: stratégies mixtes Bruno Ziliotto Cours de Théorie des Jeux de l’ENPC 4 octobre 2016 Bruno Ziliotto 1 Motivation 2 Extension mixte d’un jeu et équilibres de Nash 3 Stratégies dominantes et stratégies dominées 4 Calcul des équilibres de Nash en stratégies mixtes Bruno Ziliotto 1 Motivation 2 Extension mixte d’un jeu et équilibres de Nash 3 Stratégies dominantes et stratégies dominées 4 Calcul des équilibres de Nash en stratégies mixtes Bruno Ziliotto Concepts vus dans le chapitre précédent : équilibres en stratégies dominantes, résolution par élimination des stratégies strictement dominées, équilibres de Nash en stratégies pures... Problème : ces solutions n’existent pas toujours, même sur des jeux très simples, comme le Penalty : G D G 1, −1 −1, 1 Bruno Ziliotto D −1, 1 1, −1 Pourquoi les Nash n’existent pas toujours ? Dans certains jeux, un joueur n’a pas intérêt à ce que sa stratégie soit connue à l’avance. Idée des stratégies mixtes On autorise les joueurs à introduire de l’aléatoire dans leurs choix. Jeu du Penalty Exemple de stratégie mixte : chaque joueur joue G avec probabilité 1/2, et D avec probabilité 1/2. Bruno Ziliotto 1 Motivation 2 Extension mixte d’un jeu et équilibres de Nash 3 Stratégies dominantes et stratégies dominées 4 Calcul des équilibres de Nash en stratégies mixtes Bruno Ziliotto Soit (N, S, g) un jeu sous forme normale. On supposera dans tout ce chapitre que pour tout i, Si est fini. Définition Une stratégie mixte du Joueur i est une distribution de probabilités sur Si . Bruno Ziliotto Quel sens donner aux stratégies mixtes ? Une stratégie mixte peut être interprétée comme : Une croyance sur la façon dont joue un joueur, Une façon dont les stratégies pures sont distribuées au sein d’une population. Certains joueurs utilisent vraiment un générateur (pseudo)-aléatoire pour jouer : poker, jeu du Pierre-Feuille-Ciseau... Bruno Ziliotto Vocabulaire et formalisme On note ∆(Si ) l’ensemble des stratégies mixtes. ∆(Si ) est convexe, et s’identifie à ( p∈R |Si | | ∀k , pk ≥ 0, ) X pk = 1 . k Les éléments de Si seront désormais appelés stratégies pures du Joueur i. Une stratégie pure si ∈ Si s’identifie à la Dirac δsi ∈ ∆(Si ) : Si ⊂ ∆(Si ), donc une stratégie pure est un cas particulier de stratégie mixte. Bruno Ziliotto Paiement espéré On étend chaque fonction de paiement gi en une fonction n Y ∆(Sj ) → R : gi : j=1 N X Y σj (sj ) gi (s). gi (σ1 , ..., σN ) := s∈S j=1 Proposition ∀σi ∈ ∆(Si ), ∀σ−i ∈ Y ∆(Sj ) gi (σi , σ−i ) = j6=i X σi (si )gi (si , σ−i ) si ∈Si Exemple : jeu du Penalty Exprimer le paiement en stratégies mixtes du jeu du Penalty. Bruno Ziliotto Extension mixte d’un jeu Notations : pour i ∈ [|1, N|], Σi = ∆(Si ) et Σ−i = Y Σj j6=i Σ= N Y Σj . j=1 Définition L’extension mixte du jeu (N, S, g) est le jeu sous forme normale (N, Σ, g). Bruno Ziliotto Equilibre de Nash en stratégies mixtes Définition Un équilibre de Nash en stratégies mixtes de (N, S, g) est un équilibre de Nash de son extension mixte (N, Σ, g), c’est-à-dire un profil σ ∈ Σ tel que pour tout i ∈ [|1, N|], pour tout τi ∈ Σi , gi (σi , σ−i ) ≥ gi (τi , σ−i ). Exemple : 1 1 1 1 · G + · D, · G + · D 2 2 2 2 est un Nash du jeu du Penalty. On appellera désormais un équilibre de Nash de (N, S, g) équilibre de Nash en stratégies pures. Bruno Ziliotto Proposition σ ∈ Σ est un équilibre de Nash en stratégies mixtes équivaut à ∀i ∈ [|1, N|], ∀si ∈ Si , gi (σi , σ−i ) ≥ gi (si , σ−i ). Corollaire Tout équilibre de Nash en stratégies pures est un équilibre de Nash en stratégies mixtes. Bruno Ziliotto Le théorème de Nash Théorème (Nash) Tout jeu fini admet un équilibre de Nash en stratégies mixtes. Bruno Ziliotto 1 Motivation 2 Extension mixte d’un jeu et équilibres de Nash 3 Stratégies dominantes et stratégies dominées 4 Calcul des équilibres de Nash en stratégies mixtes Bruno Ziliotto Stratégies dominantes, stratégies dominées L’extension mixte d’un jeu est aussi un jeu ! On peut donc réutiliser les concepts du cours précédent. Par exemple : Définition Une stratégie σi ∈ Σi est strictement dominée s’il existe τi ∈ Σi tel que ∀σ−i ∈ Σ−i , gi (σi , σ−i ) < gi (τi , σ−i ). On dit alors que σi est strictement dominée par τi , et que τi domine strictement σi . Proposition σi ∈ Σi est strictement dominée par τi ∈ Σi si et seulement si ∀s−i ∈ S−i , gi (σi , s−i ) < gi (τi , s−i ). Bruno Ziliotto Une stratégie non strictement dominée par une stratégie pure peut être strictement dominée par une stratégie mixte. H M B G 1, 1 0, 2 0, 2 Bruno Ziliotto C 0, 2 5, 0 1, 1 D 0, 4 1, 6 2, 1 Elimination des stratégies (pures) strictement dominées On pose Γ1 = Γ. A chaque étape k ≥ 1 : Si Γk n’a pas de stratégies pures strictement dominées par une stratégie mixte, la procédure s’arrête. Sinon, soit i ∈ [|1, N|] et si ∈ Sik une stratégie pure strictement dominée. On pose Γk +1 := (N, S k +1 , g) avec k +1 k et S k +1 = S k +1 \ {s }. S−i = S−i i i i Bruno Ziliotto Proposition Soit (Γk ) la suite de jeux obtenue par une procédure d’élimination des stratégies (pures) strictement dominées. Alors pour tout k ≥ 1, NEmix (Γk ) = NEmix (Γ). Bien sûr on a aussi pour tout k ≥ 1, NEpur (Γk ) = NEpur (Γ). Bruno Ziliotto 1 Motivation 2 Extension mixte d’un jeu et équilibres de Nash 3 Stratégies dominantes et stratégies dominées 4 Calcul des équilibres de Nash en stratégies mixtes Bruno Ziliotto Principe d’indifférence faible Soit i ∈ [|1, N|], σ−i ∈ Σ−i et σi ∈ BRi (σ−i ). Alors ∀si , ti ∈ supp (σi ), gi (si , σ−i ) = gi (ti , σ−i ). Principe d’indifférence fort Soit i ∈ [|1, N|] et σ−i ∈ Σ−i . Alors σi ∈ BRi (σ−i ) équivaut à 1 ∀si , ti ∈ supp (σi ), gi (si , σ−i ) = gi (ti , σ−i ), 2 ∀si ∈ / supp (σi ), Bruno Ziliotto gi (si , σ−i ) ≤ gi (σi , σ−i ). Méthode générale pour calculer les Nash mixtes Rechercher les stratégies strictement dominantes, Éliminer les stratégies strictement dominées, Identifier les équilibres de Nash purs, Utiliser les principes d’indifférence pour trouver les Nash non purs. Bruno Ziliotto