La théorie des jeux s`applique-t-elle aux jeux vidéo

Commentaires

Transcription

La théorie des jeux s`applique-t-elle aux jeux vidéo
La théorie des jeux s'applique-t-elle aux
jeux vidéo ? Peut-elle aider à en dénir les
règles ? ∗
Jean-Edouard Colliard
†
13 novembre 2009
Résumé
Nous étudions les rapports entre jeux vidéo et théorie des jeux sous
deux aspects diérents. Nous montrons d'abord que dans certains jeux
vidéo au moins les stratégies des joueurs semblent converger vers un équilibre, ce qui fait des jeux vidéo un laboratoire idéal pour étudier les problématiques d'apprentissage dans les jeux. Inversement, la théorie des jeux
permet de mieux comprendre les interactions stratégiques à l'oeuvre dans
les jeux vidéo, l'exemple développé étant celui des jeux de stratégie en
temps réel, dont nous proposons une modélisation simpliée. Sur la base
du comportement adopté par certains éditeurs, nous faisons l'hypothèse
que les jeux "réussis" sont tels qu'ils n'ont pas d'équilibre en stratégies
pures, ou que la convergence vers ces équilibres est très lente. Nous montrons comment notre modèle de jeu de stratégie en temps réel permet
de comprendre comment certaines caractéristiques récurrentes de ces jeux
peuvent être comprises comme servant à en éliminer les équilibres en stratégies pures.
∗ Tous mes remerciements vont à Mathieu Perona (PSE), qui est à l'origine de plusieurs
des idées de ce travail, ainsi qu'au laboratoire junior jeux video de l'ENS-LSH et à ses organisateurs.
† PSE. Address : Paris School of Economics, 48 Boulevard Jourdan, 75014, Paris, France.
E-mail : [email protected] .
1
1
Introduction : Que prédit vraiment la théorie
des jeux ?
Le principal concept en théorie des jeux non coopérative est celui d'équilibre
de Nash, une situation telle qu'aucun des joueurs ne peut faire mieux que la
stratégie qu'il a choisie étant donnée la stratégie de l'autre joueur. Considérons
par exemple la situation suivante, où le joueur 1 doit choisir entre p et f , le
joueur 2 entre P et F :
1|2
p
f
P
1; 1
2; 1
F
1; 3
0; 0
Il y a deux équilibres en stratégies "pures" : f, P et p, F . Qu'en déduit-on
sur le comportement des joueurs ? Deux types de réponse sont possibles :
Les joueurs procèdent par induction : les joueurs sont supposés suivre un
des deux comportements d'équilibre à la suite d'un raisonnement rationnel, en
anticipant que l'autre joueur est rationnel également et suit un raisonnement
similaire. L'équilibre d'un jeu dépend de ses règles précises donc dans le cas
précis d'un jeu vidéo on n'a guère de prédictions, les jeux vidéo sont bien trop
compliqués pour qu'on puisse calculer l'équilibre éventuel du jeu. La théorie des
jeux a d'ailleurs longtemps été ignorée par les économistes, qui considéraient
que s'il était impossible de résoudre le jeu d'échecs, elle ne pourrait jamais rien
dire d'un système économique, beaucoup plus complexe.
Les joueurs apprennent : si les joueurs répètent souvent le même jeu ils vont
petit à petit corriger leurs erreurs, imiter les joueurs dont les stratégies semblent
gagnantes etc. Si ce processus aboutit ce ne peut être qu'à un des deux équilibres, c'est-à-dire une situation où aucun joueur ne voudra changer de stratégie.
L'équilibre choisi dépendra notamment de l'histoire de l'apprentissage. Ainsi un
théoricien des jeux prédira les phénomènes suivants, avec une assurance décroissante :
s'il y a une stratégie dominante les joueurs vont la trouver après un processus d'apprentissage
plus généralement à force de jouer les agents vont parvenir à un équilibre
la solution devrait résister à de la récurrence à rebours
les croyances des joueurs devraient à peu près se vérier, on ne peut pas
les tromper tout le temps
Dans cette interprétation plus contemporaine de la théorie des jeux une question fondamentale est celle de la vitesse de l'apprentissage et de sa convergence.
Cette question est en général étudiée par la "théorie des jeux expérimentale",
dont le développement ces dernières années a été extrêmement rapide. Il s'agit
en général de faire venir des volontaires en "laboratoire" pour jouer un ou plusieurs jeux relativement simples, leur jeu est ensuite analysé et utilisé pour tester certaines hypothèses ou certains modèles importants en théorie des jeux. Un
problème inévitable de cette approche est que la situation n'est pas "naturelle",
2
les joueurs savent qu'ils participent à une expérience, qu'ils sont "observés", ce
qui peut conduire à certains biais. Il est possible par exemple qu'un joueur qui
sait participer à une expérience pense qu'il y a une "bonne façon" de jouer à
trouver, que ses motivations incluent un désir de "donner la bonne réponse" etc.
Les jeux vidéo, notamment en multijoueur, sont un terrain d'étude prometteur
puisqu'ils ont l'avantage d'être un terrain de jeu "naturel". Voici leurs principaux avantages pour une approche expérimentale :
les règles du jeu sont bien dénies et bien comprises par tous
le même jeu est répété un grand nombre de fois
les joueurs jouent souvent avec des joueurs diérents et qu'ils ne connaissent
pas
les joueurs ont envie de gagner
les joueurs ne savent pas qu'ils sont observés par des économistes (puisqu'ils ne le sont pas)
il est possible d'identier la manière dont les joueurs apprennent (forums
de discussion, fréquence de répétition des parties)
Cela ne veut pas dire que tous les jeux vidéo puissent servir de terrain d'expérimentation. Ainsi il faut d'abord que le jeu soit avant tout un jeu de stratégie,
non un jeu d'adresse ("skill"). La plupart des jeux en temps réel mélangent évidemment les deux, tandis que les jeux au tour par tour sont des jeux de stratégie
seulement. Une autre diérence intéressante entre les deux est que dans le premier cas l'action des joueurs est simultanée, tandis que dans le second cas le jeu
est séquentiel. Nous éliminons par exemple les simulations sportives et les jeux
de combat comme trop proches de purs jeux d'adresse. Dans le second cas des
jeux de combat il est en général possible de contrer le coup d'un adversaire via
une combinaison adéquate, ce qui ajoute un élément stratégique, mais le plus
important semble être de connaître, retenir, et exécuter sans faute la combinaison optimale, ce qui demande beaucoup d'adresse. Ensuite il faut que le but de
la partie soit clairement identié et que les joueurs aient une vraie incitation à
essayer de gagner, on devrait par exemple se méer de jeux comme Civilization
IV, où les deux joueurs pourraient avoir envie de gagner mais où chacun accorderait de la valeur au fait de bâtir une civilisation importante ou d'obtenir
un bon score indépendamment de l'issue de la partie par exemple. En outre il
est préférable que les parties opposent un petit nombre de joueurs, idéalement
deux. Dans le cas contraire ce sont souvent deux équipes qui s'opposent, en quel
cas il se peut qu'une des deux équipes au moins soit composée de joueurs qui
ne se connaissent pas et ont du mal à coordonner leurs actions de manière optimale. Le cas des arontements entre "guildes" ou "clans" en revanche serait très
intéressant à étudier, par exemple dans un jeu comme Counter-Strike. Enn il
faut que les parties soient répétées un grand nombre de fois, ce qui exclut des
jeux se déroulant dans des univers persistants comme Eve Online.
Au nal, nous privilégierons surtout deux exemples : les jeux de stratégie,
en temps réel ou au tour par tour. L'avantage est qu'il s'agit de jeux à somme
nulle, avec clairement un gagnant et un perdant, où le seul but est de gagner.
Le plus indiqué est Starcraft, qui est extrêmement populaire, avec un grand
nombre de joueurs qui jouent depuis de nombreuses années. De nombreux forums sont dédiés au jeu et permettent d'apprendre des autres joueurs, enn
3
l'existence d'un classement en ligne renforce les incitations à tenter à tout prix
de vaincre. Nous ferons également appel à d'autres jeux de stratégie en temps
réel (STR) similaires, ainsi qu'à des jeux de stratégie au tour par tour (qui ont
l'inconvénient de dater en général d'une époque où le multijoueur sur Internet
était moins développé). Un deuxième jeu qui nous intéressera est World of Warcraft (WoW), dont le principal intérêt est là encore son extrême popularité. Il
s'agit d'un univers persistant, mais de nombreuses interactions sont répétées,
notamment les combats "joueur contre joueur". Là aussi des classements et des
tournois rendent ces combats extrêmement compétitifs.
Il s'agit d'un travail préliminaire visant à présenter quelques hypothèses,
il ne repose pas sur une enquête statistique sérieuse mais sur l'expérience de
joueur de l'auteur et des témoignages. Nous chercherons simplement à illustrer
quelques idées qui pourraient faire l'objet de recherches plus approfondies :
1. le comportement des joueurs dans certains jeux en ligne semble valider la
deuxième approche de la théorie des jeux
2. la convergence vers des comportements "rationnels" aboutit plus ou moins
selon les cas, nous présenterons quelques hypothèses expliquant ces diérences
3. étant donné le point 1, si la théorie des jeux trouve quelque validité dans
les jeux vidéo elle fournit aussi quelques concepts utiles pour dénir ce
qu'est un "bon" jeu, et expliquer le pourquoi de certaines caractéristiques
récurrentes des STR
4. la façon dont les éditeurs réagissent à l'apprentissage des joueurs soulève
d'intéressants parallèles avec des applications plus économiques de la théorie des jeux
5. certains auteurs avancent que la pratique des échecs rend les joueurs plus
"stratèges", plus rationnels en un sens très précis. Si eectivement les
joueurs apprennent à se comporter "rationnellement", peut-on identier
des compétences apprises en jouant qui seraient "exportables" dans le
monde réel ?
2
2.1
Apprentissage et convergence vers l'équilibre
Apprendre à contrer l'ordinateur
L'ordinateur joue toujours la même stratégie, dictée par son programme,
éventuellement mixte. Il réagit ainsi toujours de la même façon à l'action du
joueur 1 . Le joueur doit donc simplement trouver la "meilleure réponse" à cette
stratégie. Dans les exemples que nous avons choisis on trouve le mode "escarmouche" des jeux de stratégie, ainsi que le mode "player versus enemy" de
World of Warcraft. Dans le premier cas le joueur humain joue une partie contre
un ordinateur qui mime le comportement d'un joueur humain, dans le second
1. On néglige ici le cas, encore marginal, de programmes qui apprennent également en
fonction des parties passées et mettent à jour leur stratégie en fonction du comportement
passé du joueur.
4
cas les joueurs (souvent par équipe) arontent des monstres de plus en plus
puissants. Dans les deux cas il est intéressant de constater que le joueur humain
prend assez facilement le dessus sur l'ordinateur après un certain temps, ce qui
fait que beaucoup de joueurs considèrent le multijoueur comme nécessaire à la
longévité d'un jeu.
Pourquoi cette faiblesse de l'ordinateur ? L'avantage de la machine est de
pouvoir calculer plusieurs "coups" à l'avance bien plus facilement qu'un humain,
typiquement aux échecs où ce comportement, celui modélisé par la théorie des
jeux basée sur la rationalité des joueurs, se révèle très ecace. Il est intéressant
de noter cependant que même les programmes d'échecs sont programmés pour
connaître les ouvertures ou tirer parti de certaines situations sur la base de ce
que des joueurs humains ont appris [Simon et Schaeer, 1992]. Dans les jeux
vidéo plus anciens, notamment au tour par tour, l'ordinateur peut encore se
montrer redoutable en raison de ses capacités d'optimisation, c'est le cas par
exemple dans des jeux comme Heroes of Might and Magic II (1996) ou Civilization II (1996).
Dans les jeux plus récents l'apparition du temps réel rend les règles beaucoup
plus compliquées, et l'espace des stratégies bien plus vaste. Le choix opéré par
les développeurs semble être de programmer diérentes manières de jouer assez
routinières pour l'ordinateur (développer une base selon telle méthode, attaquer
au bout d'un temps prédéni avec telles unités, si l'attaque échoue recommencer etc.). C'est assez agrant dans le cas des premiers STR comme Warcraft II
(1996), Command and Conquer (1995) et sa première suite Alerte Rouge (toujours 1996, excellente année), ou même encore la première version de Starcraft
(1998). Alors même qu'il y a eu beaucoup de progrès dans la programmation de
l'intelligence articielle (IA), les jeux de stratégie ont tendance à être de plus
en plus complexes et les joueurs humains de plus en plus sophistiqués, si bien
que l'ordinateur paraît dénitivement vaincu (à l'opposée de ce qui semble se
passer pour les échecs, bien que la question soit discutée). Une autre comparaison intéressante peut être faite avec la série des jeux "Total War", dont la
phase stratégique se déroule en tour par tour. L'expérience semble montrer que
dans les jeux les plus anciens (Shogun Total War, 2000, et Medieval Total War,
2002) l'ordinateur est encore très ecace, notamment parce que le nombre de
choix possibles est assez réduit, les armées ne pouvant se déplacer que sur des
cases. A partir de Rome Total War (2004) la possibilité de déplacer ses armées
de manière continue complexie beaucoup le jeu, et le mode solo en devient nettement plus facile. Enn, dans le dernier de la série, Empire Total War (2009),
l'ordinateur paraît parfois totalement hors de la partie tellement ses routines
sont insusantes devant la complexité du jeu 2 .
On saisit alors bien toute l'importance du multijoueur, de plus en plus favorisé par les éditeurs : les jeux étant de plus en plus complexes, il devient de
plus en plus compliqué et coûteux de programmer de "bons" joueurs articiels,
il est donc nécessaire d'inclure un mode multijoueur pour que le joueur humain
soit face à un vrai dé. D'un autre côté, comme il y a une demande pour le
2. On peut se demander néanmoins si dans ce dernier cas il ne s'agit pas aussi d'un problème
de nition du jeu, et d'un arbitrage fait par l'éditeur en faveur de graphismes impressionnants
et du mode multijoueur au détriment du mode solo.
5
multijoueur en tant que tel, programmer une bonne IA est moins important. De
plus, comme on le verra, élaborer des règles très complexes peut être essentiel
pour assurer un mode multijoueur divertissant, ce qui rend la programmation
d'une bonne IA dicile.
Dernier élément tendant à prouver que l'humain est supérieur à l'ordinateur
dans les jeux récents, les programmeurs semblent essayer de relever la diculté
du jeu contre l'ordinateur en utilisant d'autres éléments que sa capacité de
calcul : ainsi l'ordinateur peut "tricher", au sens où il n'obéit pas aux mêmes
règles que le joueur humain (Civilization II ), les diérents joueurs incarnés
par l'ordinateur peuvent être plus ou moins secrètement alliés (Total War ), le
mode solo peut être extrêmement scripté (World in Conict, Warcraft III, les
rst person shooters récents comme Deep Space Extraction, qui voient revenir le
genre du "rail shooter" entièrement scripté), ou imposer des actions répétitives
et un long temps de jeu pour progresser (World of Warcraft ).
2.2
Apprendre à jouer entre humains
Nous prenons ici un exemple que nous examinons en détail : le multijoueur
de Stracraft, qui comme nous l'avons dit représente typiquement le type de jeu
où l'on s'attendrait à ce que les prédictions de la théorie des jeux se réalisent.
Or, il semble que dans les premiers temps du jeu les joueurs aient assez vite
mis au point une stratégie consistant à attaquer très vite ("rush"), qui semblait
l'emporter sur toute stratégie alternative, si bien que toutes les parties se ressemblaient. C'est exactement la prédiction de la théorie des jeux : les joueurs
convergent vers un équilibre. Pour cette raison d'ailleurs, l'éditeur a procédé au
rééquilibrage de certains coûts pour que cette stratégie puisse être contrée par
d'autres (dont certaines se sont avérées dominantes, ce qui a amené de nouvelles
modications etc.).
Il est très surprenant du point de vue de l'interprétation "rationnelle" de
la théorie des jeux que des joueurs avec des capacités de calcul faibles arrivent
apparemment à trouver un équilibre qu'on aurait été bien en peine de calculer,
tant le nombre de stratégies possibles est immense. Les recherches sur le jeu
d'échec ont montré que les joueurs humains raisonnent en général en reconnaissant des schémas et des situations qu'ils ont déjà vus ("pattern recognition"),
ce que n'arrivent pas à faire les ordinateurs. Les joueurs identient ce que des
parties apparemment diérentes ont en commun et simplient le problème posé.
C'est justement ce sur quoi rééchissent les programmateurs d'IA aux échecs,
qui essaient de faire tenir ce genre de raisonnement typiquement humain aux
programmes.
Dans Starcraft comme dans de nombreux autres jeux de stratégie le choix
principal semble être entre investir les ressources disponibles pour avoir davantage de ressources plus tard, ou s'en servir immédiatement pour nancer le
développement militaire. C'est en tout cas de cette façon que semblent raisonner
de nombreux joueurs. Si c'est le cas, il est intéressant de constater qu'un joueur
fait exactement ce que fait un économiste : il simplie le problème pour n'en
retenir que ses élements les plus importants, ce qui s'appelle modéliser.
6
On pourrait poser le problème ainsi : faut-il investir peu pour attaquer l'adversaire très tôt, ou au contraire commencer par bâtir sa puissance économique
an de disposer d'une armée très importante plus tard ? Si mon adversaire m'attaque très tôt, ma meilleure réponse à cette stratégie est de développer moi
aussi ma puissance militaire très rapidement. S'il préfère se développer plus lentement, en l'attaquant très tôt je suis sûr de l'emporter puisque son armée sera
très faible. Autrement dit dans ce "modèle" extrêmement simplié attaquer tôt
est une stratégie dominante, on n'est donc pas surpris que les joueurs aient assez
vite appris la stratégie du "rush".
1|2
Rush
Long
Rush
1/2 ; 1/2
0; 1
Long
1; 0
1/2 ; 1/2
Le choix des stratégies est évidemment bien plus compliqué que le choix
entre une stratégie courte et une stratégie longue, ce pourquoi l'éditeur de Starcraft a réussi à déstabiliser cet équilibre peu ludique. Comprendre comment il
a pu procéder fait l'objet de la prochaine section et demande un modèle plus
complet, ce premier modèle est néanmoins intéressant en ce qu'il illustre cette
incitation de base à attaquer tôt.
Il nous permet également d'illustrer simplement comment les joueurs peuvent
apprendre à jouer leur stratégie dominante, même s'ils ne se rendent pas compte
dès le début qu'ils ont dans tous les cas intérêt à la jouer. Les théoriciens ont développé plusieurs modèles d'apprentissage plus ou moins sophistiqués, dont deux
nous intéresseront particulièrement en ce que leurs hypothèses correspondent
bien à ce qui semble se passer. Voir Fudenberg et Levine [1998] pour un aperçu
général de la théorie de l'apprentissage dans les jeux.
Fictitious play (Brown, 1951) : Cette règle d'apprentissage suppose qu'il
existe un grand nombre de joueurs, qui pensent tous que chaque joueur joue toujours la même stratégie (potentiellement mixte) et essaient donc d'évaluer quelle
est cette stratégie. A chaque période une paire est tirée au hasard et les joueurs
jouent chacun leur meilleure réponse contre ce qu'ils croient être la stratégie
de leur adversaire, cette croyance étant simplement la moyenne des stratégies
qu'ils ont observées par le passé. Dans notre exemple cette règle d'apprentissage
correspondrait à un joueur qui se souvient des diérentes parties qu'il a jouées
et à chaque partie joue la stratégie qui lui aurait le mieux réussi en moyenne
dans les parties passées. Le résultat général est que si ce processus converge,
alors ce ne peut être que vers un équilibre de Nash (sans quoi les stratégies
continueraient d'évoluer), en revanche il n'est pas assuré que la convergence se
fasse. Avec notre matrice l'apprentissage est immédiat : quel que soit le résultat
du jeu, chaque joueur comprend après coup qu'il avait intérêt à jouer la stratégie "rush", à la suite de quoi tout le monde joue la stratégie "rush" et pense
qu'il faut continuer à jouer cette stratégie. Que la convergence soit immédiate est
une conséquence de la simplicité de nos hypothèses sur les stratégies disponibles.
Replicator dynamics (voir par exemple Cressman (2003)) : Cette règle
inspirée de la biologie suppose qu'il y a au départ deux sous-populations de
joueurs dont certains jouent toujours "rush" et d'autres toujours "long". Les
7
joueurs sont appariés au hasard et jouent suivant leur stratégie préférée. On peut
alors calculer les paiements moyens de tous les joueurs. On suppose alors que les
deux populations vont évoluer en fonction des paiements, plus le paiement d'une
population est élevé, plus elle va croître. L'idée sous-jacente est que les joueurs
vont parler entre eux et essayer d'imiter les stratégies qui ont le mieux réussi, or
c'est typiquement le rôle des forums de discussion consacrés à un jeu multijoueur.
Un problème avec cette interprétation néanmoins est que l'évolution devrait
favoriser les stratégies qui ont un paiement médian élevé, non un paiement
moyen. Dans notre jeu les joueurs vont bien nir par converger vers l'équilibre,
mais pas immédiatement. Appelons φt (R) et φt (L) le nombre de joueurs jouant
les stratégies R et L à la période t. Notre hypothèse est que le taux de croissance
de chaque population entre deux périodes est proportionnel au paiement obtenu
par la stratégie, noté ut (R) :
φt+1 (R) = φt (R)(1 + ut (R))
Le paiement de la stratégie R dépend de l'opposant rencontré par le joueur.
Notons θt (R) et θt (L) les proportions de chaque type de joueur à la période t.
On a donc
ut (R) = 0.5θt (R) + θt (L), ut (L) = 0.5θt (L)
En notant ū(t) = θt (R)ut (R) + θt (L)ut (L) le paiement moyen, on obtient au
nal
(ut (R) − ūt )
θt+1 (R) = θt (R)
1 + ū(t)
La gure suivante montre comment évolue le système en fonction de la répartition initiale. On constate sans surprise une convergence assez rapide vers
l'équilibre de Nash, d'autant plus rapide que les joueurs utilisant la stratégie de
"rush" initialement sont nombreux. Ce genre d'exercice illustre bien qu'il n'est
pas du tout nécessaire que les joueurs soient extrêmement rationnels ni même ne
comprennent bien le jeu pour converger vers un équilibre de Nash, des processus
d'imitation extrêmement simples susant à assurer la convergence.
2.3
Ce que les joueurs n'apprennent pas
Si la convergence des joueurs vers un comportement d'équilibre est tout à
fait remarquable, il faut admettre en revanche que dans certains cas ils font au
contraire preuve d'un manque de rationalité à première vue étonnant. Comparer les cas de convergence et d'écart persistant à un comportement optimal est
intéressant à la fois du point de vue de l'étude des jeux vidéo pour savoir où
la théorie des jeux est la plus applicable, et inversement du point de vue de la
théorie des jeux si cela permet de mieux comprendre comment les joueurs en
général apprennent.
L'exemple le plus frappant que j'aie pu constater est celui de l'hôtel des
ventes de World of Warcraft et plus généralement du comportement économique des joueurs dans ce jeu. L'hôtel des ventes est un système permettant
aux joueurs d'échanger entre eux des marchandises qu'ils ont produites ou trouver contre des pièces d'or, la monnaie du jeu, par le biais d'enchères fonctionnant
plus ou moins sur le modèle d'Ebay. On peut constater de multiples anomalies,
8
Figure
1 Convergence vers la stratégie dominante
mais aussi leur trouver de bonnes explications qui ne contredisent pas l'hypothèse d'une convergence des joueurs vers un comportement optimal. Une famille
d'exemples cependant me semble résister à toute explication de ce type. Les
joueurs ont en eet une ou deux "professions", qui leur permettent de transformer des matières premières en objets utiles dans le jeu, dont certains sont très
demandés. Par exemple un alchimiste peut, avec une "ombre éternelle" et une
"opale du crépuscule", "transmuter" une "pierre d'eroi", qui permet d'améliorer la puissance d'un personnage. On s'attendrait donc à ce qu'il y ait une
certaine correspondance entre le prix des matières premières et le prix de la
pierre d'eroi : si la diérence est élevée les alchimistes vont opérer de nouvelles
transmutations, faisant ainsi augmenter la demande pour les matières premières
et l'ore pour le produit ni. En septembre 2009, la diérence entre les deux
était pourtant de l'ordre de 1 à 5 3 , ce qui représente une somme substantielle
(de l'ordre de 80 pièces d'or, ce que gagne un joueur de haut niveau en une
bonne demi-heure, tandis que "transmuter" prend quelques secondes). L'explication pourrait venir du fait qu'il existe peu d'alchimistes de haut niveau, en
quel cas les opportunités de prot à réaliser devraient attirer de nouveaux alchimistes. Le cas du "Pouvoir primordial", là aussi bien plus cher que la somme de
ses composants depuis plusieurs années, tend à démentir cette explication. Plus
intéressant même, il n'est possible de ne transmuter qu'une seule pierre d'eroi
par jour, on pourrait donc penser qu'il s'agit d'un frein important à l'arbitrage
susant pour expliquer la diérence. Or à l'origine c'était aussi le cas pour le
pouvoir primordial, mais la levée de la limitation à une transmutation par jour
n'a eu pour eet qu'une légère baisse des prix, qui plus est relativement éphémère.
3. Du moins sur le serveur français Conseil des Ombres. Les quelques données interserveur
disponibles ainsi qu'une plus longue expérience du jeu montrent qu'il ne s'agit pas d'un phénomène rare, voir par exemple http ://mafeco.fr/ ?q=node/145, http ://mafeco.fr/ ?q=node/28
et http ://mafeco.fr/ ?q=node/26
9
Il semble bien qu'on soit donc en présence d'un cas de comportement sousoptimal durable. Comment expliquer la coexistence de ce cas avec le comportement des joueurs dans Starcraft, et alors même que certains joueurs au
moins sont capables d'exploiter ce type de problèmes (voir par exemple le blog
http ://hotel-des-ventes.blogspot.com/), et que par ailleurs les mêmes joueurs
de WoW peuvent se montrer extrêmement rationnels ? Une piste d'explication
est qu'un STR ou le mode "joueur contre joueur" de WoW sont des jeux à
somme nulle, il faut être meilleur que l'autre, donc toute petite amélioration est
importante. Si l'enrichissement dans WoW aide beaucoup à améliorer et équiper
un personnage, l'enjeu est nettement moins importent et l'incitation à adopter
un comportement rationnel beaucoup plus faible. Peuvent s'ajouter à cela des
considérations morales sur la "spéculation", souvent condamnée par les joueurs
qui la rendent responsable de prix trop élevés (ou trop bas, selon qu'ils sont
demandeurs ou oreurs). De même dans un STR contre un ordinateur le joueur
adopte lui aussi des routines "satisfaisantes" qui contre un joueur humain ne
tiendraient pas la route, c'est peut-être pour cette raison que le mode solo des
STR fonctionne de plus en plus sur la base de scripts.
Une exception toutefois semble être le jeu contre l'ordinateur à haut niveau
dans WoW où les joueurs (ou au moins certains) calculent (au sens propre) les
meilleures stratégies, le meilleur équipement, les meilleures congurations, et se
basent sur des guides stratégiques parfois fort détaillés. C'est surtout le cas lorsqu'il s'agit d'abattre les ennemis les plus forts du moment, où deux phénomènes
au moins rendent très important d'optimiser autant que possible : d'une part
c'est souvent nécessaire pour abattre un monstre justement conçu pour donner
le plus de l à retordre possible aux joueurs, ensuite s'il s'agit d'un monstre
introduit récemment il y a une concurrence entre les diérentes "guildes" pour
être la première à remporter la victoire.
Ceci suggère donc que l'apprentissage a lieu lorsqu'un comportement légèrement sous-optimal aboutit à une défaite totale. Or c'est typiquement le cas
des jeux à somme nulle entre deux humains, où il y a par dénition un gagnant
et un perdant, et où un comportement un tout petit peu moins optimal que
celui de l'adversaire sut pour laisser échapper la victoire. La littérature théorique sur l'apprentissage dans les jeux a d'ailleurs établi les premiers résultats
de convergence dans le cas des jeux à somme nulle, où elle semble demander
moins d'hypothèses, on peut se demander si de plus les joueurs ne convergent
pas plus vite dans les jeux à somme nulle que dans des jeux à somme non nulle.
Enn ce résultat est intéressant pour les utilisations économiques des jeux,
dont on trouvera plusieurs exemples dans Edery et Mollick [2008]. Ces auteurs
citent le cas de plusieurs entreprises qui ont présenté des problèmes qu'elles
essayaient de résoudre sous forme de jeux proposés à leurs employés ou à leurs
clients. Ces jeux sont souvent présentés sous la forme de concours, ce qui rejoint
l'idée que la convergence va être plus rapide dans les jeux à somme nulle.
10
3
3.1
Changer les règles du jeu
Un équilibre est-il ludique ?
Emile Borel, un des précurseurs de la théorie des jeux, s'est détourné assez rapidement de ce champ en considérant qu'un jeu qu'on était capable de
résoudre devenait aussitôt un jeu inintéressant, puisque le résultat était connu
avant même que les joueurs aient commencé à jouer. L'exemple classique de ce
phénomène est le jeu de Nim, dans lequel le premier joueur a une stratégie dominante qui lui permet de gagner à tous les coups, et qui pour cette même raison
a beaucoup perdu de sa popularité. Pour les échecs, de grands maîtres comme
Anatoli Karpov sont convaincus que les meilleurs joueurs niront par être sufsamment forts pour toujours réussir à obtenir un match nul. Ainsi dans son
duel de 1984-1985 contre Gary Kasparov, on dénombre 40 matchs nuls sur 48
parties ! Pour la même raison, de grands maîtres comme José Raul Capablanca
et Bobby Fischer ont inventé de nouvelles formes d'échecs, le premier dans l'idée
de rendre le début de partie plus compliqué, le deuxième pour rendre le début
de partie aléatoire et empêcher les joueurs de se servir de leur expérience passée ! Au poker enn, des algorithmes de plus en plus sophistiqués, dont certains
sont justement basés sur des formes de ctitious play (voir par exemple Dudziak (2006)), semblent approcher de plus en plus près la stratégie optimale. Il
se pourrait que dans quelques années ces algorithmes soient si performants et
si faciles d'accès que les joueurs de poker sur Internet pourraient s'en servir
dans leurs parties, en quel cas le poker sur Internet disparaîtrait probablement
assez rapidement : l'aspect ludique aurait disparu, il ne serait pas possible de
s'attendre à gagner de l'argent en moyenne, et un joueur qui souhaiterait jouer
sans ordinateur pour s'amuser devrait s'attendre à perdre de l'argent.
Il semble que ce problème soit bien pris en compte par certains éditeurs, qui
changent les règles en permanence dès que l'équilibre est trouvé. C'est typiquement ce que fait Blizzard, qui modie périodiquement les règles de Starcraft,
ou l'équilibre entre les diérentes classes de personnages dans WoW. Voir aussi
les versions successives de Civilization, Civilization IV rendant par exemple impossible la stratégie "smallpox" chère aux joueurs de Civilization II, qui avait
tendance à donner des parties extrêmement fermées.
Au nal, un "bon jeu" serait donc un jeu trop compliqué pour qu'on puisse
même approcher l'équilibre (les échecs pour les non grands maîtres), ou bien
n'admettant au moins que des équilibres en stratégies mixtes (papier-caillouciseaux en étant l'exemple archétypique). Avec des stratégies mixtes les parties
ne se ressembleront pas, l'issue ne sera pas connue d'avance. Or justement il
semble que beaucoup de STR cherchent via la multiplicité des unités disponibles à généraliser le papier-caillou-ciseau : on le voit le mieux dans Shogun
Total War par exemple, où un samourai avec épée bat un lancier, un lancier bat
un cavalier, et un cavalier bat un samourai. Dans Starcraft et dans la plupart
des jeux récents le principe est beaucoup plus général : chaque unité est en général excellente contre une ou plusieurs unités, et très médiocre contre d'autres.
En conséquence les joueurs produisent soit des unités de tous les types dans des
proportions savamment dosées, soit misent davantage sur tel ou tel type d'unité
selon les parties, mais jamais toujours sur le même type.
11
1|2
Papier
Caillou
Ciseau
Papier
0; 0
-1 ; 1
1 ; -1
Caillou
1 ; -1
0; 0
-1 ; 1
Ciseau
-1 ; 1
1 ; -1
0; 0
Enn il semble que d'autres règles récurrentes des STR puissent trouver
leur origine dans la volonté d'"équilibrer le jeu", c'est-à-dire (paradoxalement)
d'empêcher que les joueurs parviennent trop facilement à un équilibre, ou au
moins à faire en sorte que cet équilibre soit mixte. Reprenons notre exemple sur
Starcraft, qui se généralise à tous les STR. Supposons que le choix n'est plus entre
attaquer "vite" ou "moins vite" mais que les joueurs peuvent décider de lancer
l'attaque à un temps t ≥ 0 de leur choix. Appelons S(t) la puissance militaire
d'un joueur au temps t, V (t) sa puissance économique (nombre d'unités pouvant
ramasser des ressources). Dénissions de plus pour tout t > 0 la fonction St par
St (t) = max S(t) sous contrainte de faisabilité
Autrement dit si le joueur décide d'attaquer à la date t il est capable d'optimiser dans le temps production militaire et investissement de sorte à avoir la plus
grande force militaire possible en t. St (u) est le nombre de soldats disponibles
au temps u < t lorsque le joueur suit le sentier de production menant à St (t). De
manière similaire Vt (u) est sa puissance économique au temps u lorsqu'il suit le
même chemin. Enn on suppose que si personne n'attaque jamais le paiement
est de 1/2 pour chaque joueur (de fait dans Starcraft le nombre d'unités est
limité, et la limite est relativement basse. Quand elle est atteinte pour les deux
joueurs ceux-ci s'attaquent avec des forces à peu près égales), sinon le vainqueur
a 1 et le perdant 0.
Que se passe-t-il lorsqu'une attaque est lancée ? Nous allons supposer qu'il
faut un temps T pour parvenir à la base ennemie, et que le lancement de l'attaque est connu par le défenseur avec un délai de . Lorsque deux armées de taille
S1 et S2 s'arontent et que 1 attaque, la probabilité que 1 gagne est supposée
être
S1
P (1 gagne) = f
S1 + S2
autrement dit cette probabilité dépend des forces relatives des deux armées.
Lorsque celles-ci sont égales on a P (1 gagne) = f (1/2), si f (1/2) > 1/2 on en
déduit que le jeu favorise l'attaquant, dans le cas contraire il favorise le défenseur. Enn si les deux armées s'attaquent en même temps la probabilité que
1
. On suppose que celui qui lance l'attaque le
1 gagne est simplement de S1S+S
2
premier est considéré comme attaquant, même s'il rencontre l'armée adverse à
mi-chemin.
Supposons que le jeu admette un équilibre en stratégies pures (ce que l'éditeur du jeu cherche justement à éviter). La première possibilité est que dans
cet équilibre un joueur attaque en t = t∗ et l'autre défende. Dans ce cas la
probabilité que l'attaquant gagne est de
St∗ (t∗ )
f
St∗ +T (t∗ + T )
12
Par dénition l'attaquant a moins de troupes que le défenseur, qui a en plus
pour se préparer le temps que met son adversaire à parcourir la distance qui
les sépare. Fort logiquement, pour que l'attaquant ait intérêt à attaquer il faut
que sa probabilité de vaincre soit supérieure à 1/2, ce qui suppose notamment
f (1/2) > 1/2, et donc qu'il y ait un avantage à l'attaque. Mais on voit facilement
que dans ce cas le joueur 2 a intérêt à attaquer un peu avant que 1 n'arrive, il
aura plus de soldats que lui et ne sourira pas du désavantage d'être en défense.
Un tel équilibre pur n'existe donc pas.
Supposons inversement un équilibre où les deux joueurs s'attaquent immédiatement et ont donc chacun une chance sur deux de l'emporter. Pour qu'il
s'agisse d'un équilibre il faut qu'aucun joueur n'ait intérêt à attendre que l'ennemi arrive dans son camp, ce qui demande T secondes. La condition est donc
S0 (0)
> 1/2
f
ST (T ) + S0 (0)
Il s'agit typiquement de l'équilibre que le concepteur du jeu souhaite éviter pardessus tout. Il peut donc essayer de jouer sur les règles du jeu pour que cette
condition ne soit pas satisfaite : en changeant f de sorte à ce que l'attaquant
soit moins favorisé, en augmentant T ie. la taille de la carte, de manière à ce
que le défenseur ait le temps de construire des défenses pendant que l'attaquant
se déplace, en jouant sur la fonction S , de sorte à ce que par exemple il soit
possible de produire beaucoup de soldats pendant un temps très court.
Proposition 1 Si l'attaque est susamment favorisée et T trop faible, il existe
un équilibre où les deux joueurs s'attaquent immédiatement.
Imaginons maintenant que les deux joueurs ne s'attaquent pas avant d'avoir
atteint le nombre maximum d'unités, ce qui est fait au temps t = tmax . Il faut
d'abord qu'aucun des deux joueurs n'ait intérêt à lancer l'attaque plus tôt, s'il
le fait son adversaire l'apprend avec un délai epsilon et se met alors à construire
uniquement des soldats. Chaque unité de production est censée rapporter 1 par
seconde, et chaque soldat coûter pS . Si un joueur choisit d'attaquer en t0 < tmax
il arontera donc un joueur avec pour capacités militaires
Stmax (t0 + ) + (T /pS ) × Vtmax (t0 + )
la condition pour que personne n'ait intérêt à attaquer plus tôt est donc
St0 (t0 )
∀t < tmax , f
< 1/2
St0 (t0 ) + Stmax (t0 + ) + (T /pS ) × Vtmax (t0 + )
Il est d'autant plus facile de remplir cette condition que est petit et T grand
notamment, c'est-à-dire lorsque l'attaque est vite détectée et que le défenseur a
du temps pour s'y préparer. Si on suppose que cette condition est remplie, il faut
de plus que chacun ait intérêt à attaquer, ce qui s'exprime par f (1/2) > 1/2,
autrement dit l'attaque est privilégiée : sans cela il vaut mieux attendre dans sa
base que l'adversaire arrive, on n'aura pas plus d'unités (la limite étant atteinte),
mais l'avantage de la défense.
Proposition 2
Pour susamment petit et T susamment grands, si
l'avantage est à la défense et que les joueurs sont inniment patients il
13
existe un équilibre où aucun joueur n'attaque jamais. S'ils sont impatients
il existe un équilibre où les deux accumulent des unités au maximum, puis
entrent dans une "guerre d'usure".
Si le nombre d'unités n'est pas limité et sous les mêmes hypothèses, il
existe un équilibre où les joueurs, même impatients, n'attaquent jamais.
Une guerre d'usure est dans ce contexte une situation dans laquelle chaque
joueur peut décider d'attaquer, celui qui attaque est défavorisé par rapport à
l'autre, mais il est pire encore que personne n'attaque jamais. Autrement dit
les deux joueurs préfèrent que quelqu'un attaque plutôt que personne, mais
chaque joueur préfère attendre que ce soit l'autre qui attaque an d'avoir une
plus grande chance de gagner. L'équilibre d'un tel jeu (voir par exemple Fudenberg et Tirole, 1986) consiste pour chaque joueur à jouer à chaque période la
même stratégie mixte consistant à attaquer avec une certaine probabilité, et à
ne pas attaquer avec la probabilité complémentaire. Au bout d'un certain temps
l'un des deux joueurs attaquera, mais il est possible que la partie soit très longue.
On comprend ainsi l'intérêt de limiter le nombre d'unités disponibles comme
on le fait dans Starcraft, an d'éviter des parties qui s'éternisent. En revanche
il pourrait être souhaitable du point de vue du développeur de favoriser l'émergence d'une guerre d'usure : les deux camps se développeraient au maximum
puis lanceraient l'attaque à chaque période avec une certaine probabilité, ce qui
rend le jeu moins déterministe.
On peut enn étudier un équilibre où les deux joueurs attaquent en même
temps en t = t∗ ∈]0, tmax [. En suivant le même raisonnement que précédemment
un tel équilibre n'est possible que si et seulement si
St0 (t0 )
1. ∀t0 < t∗ , f S 0 (t0 )+St∗ (t∗ +)+(T
/pS )×Vt∗ (t∗ +) < 1/2
t
2.
∗
∗ (t )
f ( St∗ +T (tS∗t+T
)+St∗ (t∗ ) ) > 1/2
On note notamment que la deuxième inégalité ne peut être vériée que si l'attaque est favorisée. Elle n'est pas vériée pour T trop élevé. Inversement la
première n'est pas vériée si est trop élevé, T trop faible, et l'attaque trop
favorisée.
Proposition 3 Si la défense est favorisée il n'existe aucun équilibre en stratégies pures.
Cette proposition est très intuitive : si la défense est favorisée et qu'il y a
un équilibre en stratégies pures, chaque joueur se dit qu'il sut d'attendre en
défense que l'autre attaque, ce n'est donc pas un équilibre. Dans ce cas on a
donc soit un équilibre en stratégies mixtes, soit un équilibre avec guerre d'usure.
Dans le cas où le concepteur du jeu ne souhaite pas introduire de guerre
d'usure, par exemple pour que les parties ne soient pas toujours très longues, on
voit qu'il lui faut trouver un compromis délicat entre les incitations à attaquer
et celles à défendre pour "tuer" les équilibres en stratégies pures. L'incitation
à attaquer est la même que celle mise en évidence dans la version simpliée du
jeu : en attaquant plus tôt que l'adversaire ne s'y attend on peut le surprendre
14
à un moment où il a beaucoup de puissance économique, mais peu de puissance
militaire. Cette incitation est d'autant plus forte que l'attaque est rapide (T
faible) et dicile à détecter rapidement ( élevé). L'incitation à défendre en revanche est nouvelle : en attaquant plus tard que ce à quoi l'adversaire s'attend
on prote éventuellement de l'avantage de la défense, et on dispose de plus de
temps que lui pour préparer des troupes, et ce d'autant plus que T est élevé.
Il est évidemment dicile de trouver le bon compromis ex ante, ce pourquoi
le concepteur du jeu lui-même apprend, comme semble l'avoir fait Blizzard avec
Starcraft. Dans le cadre d'un modèle très simple qui néglige beaucoup d'éléments
des jeux de stratégie (notamment choix à nombre de soldats égaux entre une
composition plus défensive et une composition plus oensive) nous avons mis en
évidence quelques éléments importants pour obtenir ce compromis : l'avantage
à l'attaque ou à la défense, la vitesse de production des unités, la limitation
du nombre d'unités, le temps de déplacement entre les deux camps T , lié à la
taille de la carte, le retard avec lequel on apprend l'attaque de l'adversaire ,
qui nécessite notamment l'introduction d'un "brouillard de guerre" comme le
font les STR récents.
3.2
Changer les règles plus vite que les joueurs n'apprennent
Pour qu'un jeu ait une longue durée de vie il faut donc changer les règles
plus vite que les joueurs n'apprennent un éventuel équilibre en stratégies pures,
avec comme issues soit d'arriver à un jeu qui n'admet que des équilibres mixtes,
soit d'obtenir des règles si complexes que les joueurs n'arrivent jamais à trouver
l'équilibre (ou en tout cas pas avant que le jeu n'arrive dans le domaine public).
On a ici un parallèle intéressant avec l'analyse économique des réglementations
et régulations, dont les acteurs arrivent au bout d'un moment à trouver les
failles, ou bien réussissent à se coordonner sur un équilibre "collusif", ce qui
nécessite de changer les règles en permanence pour couvrir les nouvelles failles.
Dans ce cadre, on comprend qu'on bien la comparaison entre la vitesse d'apprentissage des joueurs soumis à la régulation et la vitesse à laquelle cette dernière
peut évoluer.
Un autre parallèle intéressant est que les jeux vidéo selon notre raisonnement suivent exactement le chemin inverse des jeux "réels". Dans le second
cas on considère souvent que lorsqu'une interaction aboutit à des situations
sous-optimales des institutions vont petit à petit émerger pour coordonner l'action des joueurs, ou que lorsque ceux-ci jouent des stratégies mixtes ils peuvent
trouver des moyens pour corréler leurs stratégies et s'assurer des paiements plus
importants (dans les jeux de coordination notamment). Lorsque le jeu est "créé"
par quelqu'un (comme dans une enchère par exemple) l'idée est plutôt que les
règles vont changer jusqu'à trouver une issue ecace en un certain sens. Dans le
cas des jeux vidéo le processus semble au contraire aller vers des jeux de moins
en moins stables et de moins en moins prévisibles.
Ce raisonnement illustre enn bien que le jeu vidéo n'est plus un produit
gé, grâce à Internet qui permet de télécharger les mises à jour le contenu évolue et de plus en plus la version vendue est loin d'être le produit ni. Même l'IA
est améliorée et programmée pour répliquer des stratégies inventives élaborées
15
au départ par des joueurs humains. Le véritable produit ni nécessite donc de
nombreuses heures de jeu, ce qui montre bien que l'expérience des joueurs et leur
compétition pour trouver les meilleures stratégies permet d'aller plus loin que ce
que les concepteurs pourraient faire en calculant. Enn, il peut être intéressant
pour les développeurs d'étudier exactement comment les joueurs apprennent,
et notamment de prévoir au bout de combien de temps ils convergeront vers
un équilibre qui nécessitera de changer les règles du jeu. Plusieurs travaux sur
l'apprentissage dans les jeux tentent d'utiliser les modèles théoriques d'apprentissage pour étudier des évolutions empiriques de court terme, voir par exemple
Roth et Er'ev (1995).
4
Le savoir stratégique du joueur est-il exportable ?
Minassian et Rufat [2008] ont bien montré comment les jeux vidéo véhiculaient voire enseignaient des représentations (nécessairement biaisées) de l'espace, notamment dans SimCity ; Edery et Mollick [2008] s'enthousiasment sans
retenue sur l'outil formidable que représentent les jeux vidéo pour accroître la
productivité des travailleurs ; ailleurs 4 je me suis demandé si les jeux vidéo enseignaient quelque chose sur la vie économique.
Etant donné que les joueurs semblent acquérir des comportements rationnels proches de ceux modélisés par la théorie des jeux, on peut se demander
s'ils acquièrent ainsi une "compétence" qui en feraient de meilleurs "stratèges"
d'une façon plus générale. La théorie (version "apprentissage") est d'ailleurs assez agnostique à ce sujet : les joueurs peuvent converger vers l'équilibre parce
qu'ils apprennent de leurs erreurs et comprennent de mieux en mieux l'interaction dans laquelle ils sont engagés (position peut-être la plus répandue), ou
simplement parce qu'ils imitent bêtement les stratégies qui marchent (position
de la théorie des jeux "évolutionniste").
On a d'ailleurs des exemples (discutables) de telles acquisitions, les joueurs
d'échec par exemple semblent davantage comprendre le principe de la récurrence à rebours que les autres gens, et sont capables de l'appliquer à d'autres
jeux [Palacios-Huerta et Volij, 2006]. Les joueurs de football lors des tirs au
but semblent également adopter une stratégie mixte (les droitiers ne tirent pas
toujours à droite) [Chiappori, Levitt et Groseclose, 2002], mais on ne sait pas
s'ils se révèlent bons stratèges hors de leur vie professionnelle. Quelques travaux théoriques étudient d'ailleurs si le fait de jouer certains jeux peut aider
les joueurs à améliorer leurs stratégies dans des jeux "proches", voir Li Calzi
(1995) et Romaldo (1995).
Certains exemples tirés des jeux vidéo mériteraient mériteraient particulièrement d'être étudiés : les maîtres de guilde des plus importantes guildes de
World of Warcraft sont sponsorisés et considérés comme de véritables chefs d'entreprise, certains inclueraient même ce type d'expérience sur leur CV en mettant
en avant qu'ils savent gérer une équipe et l'organuiser autour d'un objectif précis
4. http ://www.mafeco.fr/ ?q=node/59
16
et exigeant. Les jeux coopératifs posent toujours des problèmes de "free ride"
qui doivent être résolus en incitant chacun à coopérer (c'est la raison même de
l'existence des guildes dans WoW, à comparer avec le jeu coopératif désorganisé
des "champs de bataille"), ce qui là encore peut être riche d'enseignements pour
les joueurs. Edery et Mollick [2008] donnent le cas de jeux utilisés par l'armée
américaine qui semblent améliorer la coopération entre membres d'une même
escouade. Les jeux en général illustrent toujours l'importance de la réaction
de l'adversaire, du fait qu'il n'existe en général pas de stratégie dominante et
qu'anticiper la réaction de l'autre est toujours capital, tester si cette compétence
s'exporte semble en revanche plus délicat, en ce qu'il est dicile d'en reconnaître
les eets.
5
Références
Brown, G.W., 1951 : "Iterative Solutions of Games by Fictitious Play",
in Activity Analysis of Production and Allocation, Koopmans, T. (éd.), Wiley,
New-York.
Chiappori, P.-A., Levitt, S.
et Groseclose, T., 2002 : "Testing MixedStrategy Equilibria When Players Are Heterogeneous : The Case of Penalty
Kicks in Soccer", American Economic Review, Vol. 92, n. 4.
2003 : Evolutionary Dynamics and Extensive Form Games, The
MIT Press, Cambridge (Mass.).
Cressma, R.,
2006 : Using Fictitious Play to Find Pseudo-Optimal Solutions
for Full-Scale Poker.
Dudziak, W.,
et Mollick, E., 2008 : Changing the Game : How Video Games
Are Transforming the Future of Business, FT Press.
Edery, D.
et Tirole,
nometrica, Vol. 54, n. 4.
Fudenberg, D.
J.,
1986 : "A theory of Exit in Duopoly", Eco-
et Levine, D., 1998 : The Theory of Learning in Games,
The MIT Press, Cambridge (Mass.).
Fudenberg, D.
Li Calzi, M., 1995 : "Fictitious Play by Cases", Games and Economic Behavior, Vol. 11.
et Volij,
nomic Review, Vol. 99, n. 4.
Palacios-Huerta, I.
Romaldo, D.,
O.,
2009 : "Field Centipedes", American Eco-
1995 : Similarities and Evolution, mimeo.
et Er'ev, I., 1995 : "Learning in Extensive Form Games : Experimental Data and Simple Dynamic Models in the Intermediate Run", Games
and Economic Behavior, Vol. 6.
Roth, A.
17
et Schaeffer, J., 1992 : "The Game of Chess", in Aumann, R.
et Hart, S. (éd.), Handbook of Game Theory with Economic Applications, Elsevier, Amsterdam.
Simon, H.
18