Peut-on suivre de mauvaises conventions ? Une autre

Commentaires

Transcription

Peut-on suivre de mauvaises conventions ? Une autre
Peut-on suivre de mauvaises conventions ?
Une autre lecture des défauts de coordination.
Version provisoire
Guillemette de LARQUIER
FORUM (UMR 7028 CNRS) Université Paris X-Nanterre
[email protected]
Philippe BATIFOULIER
FORUM (UMR 7028 CNRS) Université Paris X-Nanterre
[email protected]
Résumé : En théorie des jeux, la convention est définie comme une forme particulière de solution aux problèmes de
coordination des actions individuelles, lorsque les joueurs ont des intérêts communs. En s’appuyant sur une revue
critique de cette littérature abondante, que nous qualifions d’approches utilitaristes des conventions, stratégique ou
évolutionniste, l’article s’interroge sur une caractéristique des conventions : leur possible sous optimalité, ce qui
implique un défaut de coordination. Isolant clairement l’équilibre Pareto optimal de l’équilibre risque-dominant, les jeux
du type « chasse au cerf » apparaissent comme les mieux adaptés pour poser le problème de ces « mauvaises
conventions ». De fait, le suivi d’une convention sous-optimale peut être individuellement rationnel en statique et
évolutionnairement plus stable en dynamique. Seule la mobilité des agents, et donc leur choix a posteriori d’adhésion à
une convention, permet d’éviter de tels défauts de coordination.
Mots clés : convention, théorie des jeux, théorie des jeux évolutionniste, risque-dominance, défaut de
coordination
Thèmes : 5 – 11
Les conventions sont des règles de coordination, respectées avec une forte régularité, ou
encore suivies et perpétuées parce qu’elles vont simplement de soi. Elles viennent régler les petits et
grands problèmes de coordination de la vie économique et sociale. Ainsi, on observe souvent dans un
collectif de travail, la mobilisation de conventions pour résoudre de petites décisions quotidiennes
comme la durée ou le moment de la pause mais aussi de plus grandes décisions comme le niveau
d’effort ou le mode de fixation des rémunérations. Or, la caractéristique fondamentalement arbitraire
de la convention (au sens où il y a toujours plusieurs solutions envisageables) rend toujours possible
le fait que les individus adoptent une « mauvaise » solution. Si l’on peut Pareto-ordonner les
conventions, il semble alors que l’on puisse parler indifféremment du choix d’une mauvaise
convention ou d’un défaut de coordination. Au niveau micro-économique, pour reprendre l’exemple
du monde du travail, on peut concevoir qu’un collectif soit bloqué dans une organisation inefficace,
alors que chacun sait que d’autres organisations du travail existent et seraient tout aussi stables. C’est
d’ailleurs pour formaliser une composante de l’X-efficiency, que Harvey Leibenstein (1982, 1987) a
mobilisé le concept de convention dans un cadre de théorie des jeux.
En fait, l’intégration de la notion de convention en économie par le biais de la théorie des jeux
a été opérée non pas par un économiste mais par un philosophe du langage, David Lewis (1969), qui
1
s’appuie sur la théorie des jeux de coordination de Schelling (1960), jeux caractérisés par la
multiplicité des équilibres. Lewis va faire de la convention la solution arbitraire d’un problème de
coordination, se présentant comme une régularité de comportement où chacun, de manière
rationnelle, se conforme au comportement qu’il croit que l’autre adoptera. Mais, aujourd’hui, l’auteur
le plus souvent mentionné dans les travaux qui veulent faire référence à l’approche économique des
phénomènes conventionnels est certainement Peyton Young (1993, 1996, 1998)1. Il s’agit alors de
mobiliser la théorie des jeux évolutionniste en insistant sur l’émergence des conventions ou leur
origine (question délaissée par Lewis).
Fondamentalement, la convention est de même nature chez Lewis et chez Young : un
équilibre de Nash dans un jeu de coordination, ou encore un équilibre de coordination. Néanmoins, si
la convention en appelle à la rationalité des agents chez le premier auteur, elle relève beaucoup plus
de la stabilité d’un système d’automates calculateurs chez le second. Cependant, ces deux approches
différentes, stratégique et évolutionniste, peuvent se compléter l’une l’autre pour proposer une
explication utilitariste des conventions2 : on suit des conventions par intérêt, comme des joueurs plus
ou moins rationnels implémentent un équilibre de Nash dans une matrice de gains. Or, la possible
sous-optimalité paretienne de la convention pose question. Pourquoi donc des joueurs maximisateurs
de gains se mettraient-ils à suivre des conventions dont ils savent qu’elles ne sont pas optimales pour
eux-mêmes comme pour les autres ? Autrement dit, c’est une explication des défauts de coordination
par la régularité des comportements conventionnels que l’on cher che ici.
La première partie du texte rend compte de l’étendue du champ couvert par l’approche
stratégique des conventions et étudie les liens entre le type de convention formalisée dans une
interaction donnée et l’optimalité de la solution. On appellera co nvention les stratégies jouées à
l’équilibre de Nash sélectionné. Pour expliquer le choix d’une mauvaise convention, il faudra ajouter
au critère paretien celui de risque-dominance (Harsanyi et Selten, 1988), deux critères que les jeux du
type « chasse au cerf » permettent d’isoler clairement. Mais la rationalisation du processus de
sélection qui s’ensuit, dénature beaucoup l’aspect conventionnel de la solution. C’est pourquoi, dans
le cadre de la théorie des jeux évolutionnistes où l’hypothèse de rationali té des joueurs est affaiblie, la
seconde partie s’attachera à montrer comment sont départagées les conventions Pareto -optimales et
risque-dominantes lors de leur émergence. Le résultat a priori paradoxal que nous obtenons est
qu’une approche fondée sur l’ intérêt et le calcul a plus de facilité à justifier le suivi de mauvaises
conventions que l’inverse, au détriment donc de conventions alternatives, pourtant équilibres de Nash
Pareto-optimaux ! Il y aurait donc une persistance des défauts de coordination, à moins d’introduire
une hypothèse de mobilité des agents, impliquant en quelque sorte une mise en concurrence des
conventions.
1. LES CONVENTIONS ET LES PROBLÈMES DE COORDINATION
Depuis les travaux de Lewis, l’analyse stratégique des conventions s’est co nsidérablement
étoffée et, aujourd’hui, elle n’est plus confinée aux seuls jeux de coordination. Avec les travaux de
Leibenstein, elle s’est étendue aux problèmes de coopération comme dans le dilemme du prisonnier.
1
Même si, comme c’est le cas ici, sa formalisation n’est pas reprise.
Il en ressort que l’approche des conventions, à laquelle ce texte est consacré, se distingue de celle connue sous le terme
générique de « Économie des conventions ». Cf. Batifoulier (2001) pour une mise en perspective des différentes théories
des conventions.
2
2
Cependant, même dans ce dernier cas, la solution « convention » n’a de sens que si les joueurs ont à
résoudre un problème de coordination, ou encore s’ils ont un intérêt commun à atteindre un résultat
donné du jeu, équilibre ou non. Cette définition assez large de la convention explique qu’elle p uisse
être considérée comme solution de plusieurs configurations dérivées du même jeu générique.
1.1. A chaque configuration, sa convention
Nous proposons ici de différencier les grandes classes de jeux non coopératifs où existe, sous
une forme ou une autre, un problème de coordination. Ce travail de classification sera mené à partir
d’un jeu (tableau 1) où deux individus, César et Rosalie, ont les deux mêmes stratégies possibles X et
Y. Il s’agit d’un jeu – classique dans la littérature – statique, symétrique, en information complète et
imparfaite dans lequel a, b, c et d sont des paramètres quelconques.
Tableau 1 : Matrice de gains d’un jeu générique 2×
×2
Rosalie
X
Y
(a,a)
(b,c)
A
B
Y
(c,b)
(d,d)
C
D
Ordre de lecture : (gain de César, gain de Rosalie).
César
X
A partir de cette matrice de gains, nous distinguons dans le tableau 2, différentes classes de
jeux répertoriés selon le nombre d’équilibres, leur Pareto -optimalité et leur risque-dominance3 (dans
le cas où a > d)4.
3
La risque-dominance est un critère de classement – défini et axiomatisé par Harsanyi et Selten (1988) – non pas de
toutes les issues du jeu mais uniquement des équilibres de Nash. On peut donc considérer que dans un jeu où l’équilibre
de Nash est unique, il est par défaut risque-dominant.
Dans le cas où existent deux équilibres, on calcule de la manière suivante ce critère de dominance. Soient ui et vi positifs,
avec i=1,2, les pertes subies par le joueur i s’il dévie respectivement des équilibres de Nash U et V :
•
soit u1u2 > v1v2 et U risque-domine V
•
soit u1u2 < v1v2 et V risque-domine U
•
soit u1u2 = v1v2 et U et V sont risque-équivalents
(Harsanyi et Selten, 1988, p. 87)
4
Le même travail avec a < d donnerait un tableau en partie symétrique. Le cas a = d ferait apparaître des configurations
de jeu « limites » où les équilibres de Nash des jeux RO, DP, RV et CC seraient tous Pareto-optimaux au sens large (ce
qui enlève notamment tout intérêt au DP) et ne modifierait pas les équilibres des jeux JC et CT.
3
Tableau 2 : Type de jeux et qualification des équilibres5
d-b<0
d-b>0
a-c>0
a-c<0
Equilibre : A
A Pareto-optimal et risque-dominant
RO
Equilibres : B et C
B et C Pareto-optimaux
et risque-équivalents6
si b = c
si b ≠ c
CT
JC
Equilibres : A et D
A Pareto-optimal
Equilibre : D
D Pareto-dominé et risque-dominant
DP
si (a–c) > (d–b)7
A risque-dominant
RV
si (a–c) < (d–b)
D risque-dominant
CC
RO : règle d’or ; DP : dilemme du prisonnier ; JC : jeu du croisement ; RV : jeu du rendez-vous ;
CC : jeu de chasse au cerf ; CT : jeu de la coupure téléphonique
Chaque classe de jeux8 présente une configuration spécifique où la notion de convention,
fournissant une solution à l’interaction, prend une forme particulière. Ecartons tout d’abord le cas de
la « règle d’or »9, où le résultat mutuellement avantageux est l’équilibre du jeu unique, Pareto dominant toutes les autres issues. Sans concertation, se forme un accord évident et unanime entre
César et Rosalie pour le même résultat. Cet accord peut être qualifié de conventionnel car il va de soi.
La solution étant triviale, l’intérêt théorique de la convention est ici assez faible, voire nul.
Le dilemme du prisonnier, bien que présentant également un équilibre de Nash unique,
constitue une configuration opposée. En effet, la notion de convention est ici loin d’être triviale. Elle
peut même paraître surprenante car l’équilibre de Nash, néfaste à tous puisque Pareto -dominé par au
moins une autre issue, n’a rien pour aller de soi. En fait, l’application de la n otion de convention
comme solution à ce type de jeux ne cherche pas à qualifier l’équilibre mais au contraire à s’en
éloigner ! La notion de « convention d’effort » de Leibenstein (1982, 1987) permet, en effet,
d’échapper à l’équilibre sous optimal, et la coopération, pourtant bien improbable dans un DP,
émerge si l’on se force individuellement à se coordonner avec autrui sur un résultat donné,
mutuellement avantageux mais hors équilibre. Coopérer, ce serait taire les antagonismes évidents du
5
On se restreint aux équilibres de Nash purs. En effet, intuitivement il est beaucoup plus difficile d’accepter qu’un
équilibre en stratégies mixtes puisse correspondre à un comportement conventionnel. « Ce type de ‘coordination’ n’est
pas satisfaisant […]. Ce que chacun veut est que la coordination soit garantie, non qu’il existe une (petite) probabilité
qu’elle puisse être atteinte. Aussi, il n’est pas clair que les joueurs apprennent quan d ils jouent constamment la stratégie
mixte » (Goyal et Janssen, 1996).
6
En effet, on a ici u1u2 = v1v2 soit (c-a)(b-d) = (c-a)(b-d).
7
Ici la condition de risque-dominance est (a-c)² > (d-b)² qui devient (a-c) > (d-b), étant donné la positivité des deux
termes.
8
Nous avons utilisé ici des appellations « conventionnelles » pour qualifier ces types de jeux, notamment celles mises en
avant par Walliser (1986).
9
En fait, ce type de jeux n’a pas d’appellation communément admise ; celle de « règle d’or » nous paraît la plus
satisfaisante.
4
jeu pour revaloriser l’enjeu de la coordination qui était caché derrière les conflits. Néanmoins, les
deux joueurs peuvent-ils réussir à « tenir » une coordination instable par définition (puisque non
équilibre de Nash) sans dispositif extérieur ? Dans le cas des comportements a priori conflictuels
entre salariés et employeurs (niveau d’effort, niveau de rémunération), Leibenstein soutient que les
partenaires coopèrent au lieu de tomber dans la solution rationnelle mais non raisonnable. Mais, pour
ce faire, il faut que chaque partie fixe en son sein une règle qui éloigne du comportement opportuniste
et autorise ainsi la coopération entre les parties. Dans le cas des salariés, que privilégie Leibenstein,
c’est un « étalon d’effort entre collègues »10 qui joue ce rôle de vecteur de coopération.
Cet étalon se présente comme une convention car chaque salarié qui entre dans l’entreprise,
l’observe, l’adopte et la perpétue. Mais cette convention d’effort n’émerge pas de la relation bilatérale
entre l’employeur et le salarié. Ell e résout leur problème de coopération verticale en assurant d’abord
une coordination horizontale entre salariés (concernant leur effort), d’une part, et entre employeurs
(concernant leur réputation), d’autre part. La convention d’effort, solution instable dans un DP,
provient finalement et plus classiquement d’un des équilibres de Nash d’un jeu de coordination 11.
Au sein du DP, la convention suivie n’est donc pas forcément l’équilibre du jeu. Elle n’y est
pas auto-renforçante, mais elle perdure car elle est soutenue par la menace implicite d’une sanction
qui viendra punir celui qui déroge à la convention et fait défection. En fait, cette sanction n’est autre
que la perte associée à l’échec de la coordination horizontale dans le jeu de coordination associé.
Chez Leibenstein, la sanction s’applique à celui qui ne suit pas la convention d’effort, c’est -à-dire qui
ne s’est pas coordonné avec ses collègues, en dérogeant par exemple à la déontologie professionnelle.
Elle vient du groupe d’ouvriers et non du patron. Au total, la convention comme solution au DP, ne
peut être qu’une « convention externe » 12, c'est
-à-dire une convention qui s’applique bien à un jeu
donné, mais dont la stabilité trouve sa source de manière externe, dans un autre jeu.
On peut alors difficilement savoir, à partir du seul DP, si la convention suivie est bonne ou
mauvaise. Pour le dire, il faudrait connaître la teneur de la coordination qui s’est jouée en amont entre
les salariés. C’est en effet le niveau du standard d’effort collectif qui i nduit la coopération entre les
acteurs du DP. Rien n’interdit que ce standard soit faible, auquel cas la solution individualiste du DP
perdurera. Pour lever cette incertitude, il faudrait savoir comment les salariés en viennent à se
coordonner, entre eux, sur une convention d’effort. Le problème se rabat alors clairement sur les jeux
de coordination.
Les jeux du rendez-vous13, de la chasse au cerf14, du croisement et de la coupure
10
Peer group standard effort.
11
Dans la même perspective, Schotter (1981, p. 159) présente les « conventions de guerre » comme un moyen d’éviter
l’équilibre de Nash (utilisation par deux pays de l’arme nucléaire) pour condui re à une solution instable, mais raisonnable
et optimale (uniquement les « armes conventionnelles »), grâce à une concertation au sein de chaque pays tenant compte
de la peur des dommages.
12
Dans le même ordre d’idées, pour désigner ces conventions d’un ty pe particulier qui viennent résoudre un DP, Orléan
(1997) emploie le terme de « conventions légitimées » et Van der Lecq (1996) préfère celui « d’institutions ».
13
Nom que l’on peut donner à tous les jeux qui s’inspirent de l’exemple resté célèbre de point focal, à savoir la Gare
centrale à New-York, proposé par Schelling (1960, p. 55).
5
téléphonique15, sont quatre types différents de jeux de coordination. Leur caractéristique commune
est de posséder deux équilibres de Nash. Dans les deux premiers jeux, il s’agit pour les deux joueurs
de choisir la même stratégie (dans l’un, se rendre au même endroit pour se retrouver, dans l’autre,
chasser le même animal) ; dans les deux autres, il faut au contraire que les deux joueurs choisissent
des stratégies différentes car complémentaires (dans l’un, freiner et passer, dans l’autre, rappeler et
attendre d’être rappelé). Dans un jeu de coordination, il n’existe pas de meilleure stratégie
systématique au sens où X (resp. Y) est la meilleure stratégie que si l’autre joue X (resp. Y), dans RV
et CC, ou Y (resp. X), dans JC et CT. Néanmoins, comme dans la règle d’or, il n’y a pas
d’antagonisme entre les joueurs : il est individuellement avantageux de se coordonner sur un des
équilibres, il existe bien des intérêts communs.
La convention sert à sélectionner l’un des équilibres de Nash car si la rationalité des agents
suffit à calculer ces équilibres, elle échoue pour ce qui est d’en singulariser un parmi les autres
(Rabin, 1994). Le problème de coordination est résolu quand non seulement chacun choisit la
stratégie liée à la convention mais aussi s’attend à ce que l’autre en fasse autant. Ainsi, pour César,
choisir X ou Y devient une affaire conventionnelle pensant, à distance, que Rosalie en fera autant.
L’équilibre de Nash du jeu sélectionné apparaît comme un repère conventionnel car il a retenu
l’attention des deux joueurs : il appartient à leur histoire commune, il a la force du précédent. En
reprenant les termes de Lewis, les joueurs se sont coordonnés sur la base d’une régularité de
comportement ayant le statut de convention stable car auto-renforçante, du fait de son statut
d’équilibre de Nash. Chacun, non seulement, maintient so n action si l’autre en fait autant, mais
préfère qu'il en soit ainsi.
Ici, la convention n’a donc pas besoin d’être renforcée par un dispositif extérieur au jeu. On
peut alors parler de « convention interne » par opposition à la convention externe dans les jeux de
coopération. Elle est équilibre de Nash du jeu de coordination et peut justement fournir un appui à la
convention externe d’un DP.
Le tableau suivant caractérise plus en détails les différentes configurations.
14
Le jeu de la chasse au cerf est adapté de la parabole de J-J. Rousseau que l’on trouve dans son « Discours sur l’origine
de l’inégalité parmi les Hommes ». Rousseau étudie le cas d’hommes sauvages qui n’ont pas de contrainte morale ou
sociale. « Voilà comment les hommes purent insensiblement acquérir quelques idées grossières des engagements mutuels,
et de l’avantage de les remplir mais seulement autant que pouvait l’exige r l’intérêt présent et sensible ; car la prévoyance
n’était rien pour eux, et, loin de s’occuper d’un avenir éloigné, ils ne songeaient même pas au lendemain. S’agissait -il de
prendre un cerf, chacun sentait bien qu’il devait pour cela garder fidèlement so n poste ; mais si un lièvre venait à passer
à la portée de l’un d’eux, il ne faut pas douter qu’il le poursuivît sans scrupule, et qu’ayant atteint sa proie il ne se soucia
fort peu de faire manquer la leur à ses compagnons » (Rousseau 1754, p. 59). Comme l’on peut l’apprécier, l’histoire
tient en une phrase. Il n’est pas question d’analyse stratégique ni de convention. Pourtant, ce court passage a donné lieu a
une abondante littérature concernant l’interprétation stratégique des conventions.
15
Ce jeu, récurrent sous la plume de Lewis, décrit le problème de coordination de deux individus qui cherchent à
reprendre leur communication téléphonique quand celle-ci a été coupée. Qui doit rappeler l’autre ?
6
Tableau 3 : Types des jeux et des conventions associées
Forme particulière
Caractéristiques
Type de solution apportée
Types de jeu
prise par la
essentielles du jeu
au jeu par la convention
convention
Équilibre de Nash
Accord unanime et
Règle d’or
Entérine la solution
unique Pareto optimal
trivial
Étalon d’effort
Permet de sortir de
Dilemme du
Equilibre de Nash
externe car provenant
l’équilibre de Nash par une
prisonnier
unique, sous optimal
d’un jeu de
solution Pareto améliorante
coordination
Pure coordination :
Sélectionne un des deux
Jeu de la coupure
Régularité de
Deux équilibres de Nash
équilibres impossibles à
téléphonique
comportement
Pareto-optimaux
départager sinon
Deux équilibres de
Sélectionne un des deux
Jeu du
Règle de répartition,
Nash, Stackelberg,
équilibres favorable à l’un,
croisement
ordre de priorité
Pareto-optimaux
défavorable à l’autre
Deux équilibres de
Sélectionne un équilibre de
Point focal
Jeu du rendez–
Nash, le même Pareto
Nash, non pas forcément
ou repère
vous
optimal et risquecelui qui est Pareto-optimal
conventionnel
dominant
Deux équilibres de
Sélectionne un équilibre de
Régularité
Jeu de la chasse Nash, un Pareto optimal
Nash, risque-dominant ou
« prudente » de
au cerf
et l’autre risque Pareto-optimal
comportement
dominant
Ce tableau nous permet de poser la question du suivi d’une mauvaise convention ou du défaut
de coordination. Dit autrement, est-ce que se coordonner par convention garantit un choix collectif
optimal (au sens parétien du terme) ? Dans CT, les deux équilibres sont identiques et Pareto
optimaux ; on ne peut les départager. Dans JC, chacun des équilibres avantage un joueur plutôt que
l’autre. En ce sens, les deux équilibres sont opposés ; plus précisément, il s’agit de deux équilibres de
Nash, Pareto-optimaux, correspondant chacun à un équilibre de Stackelberg pour celui qui passe et
oblige l’autre à freiner. La convention doit fixer l’ordre de priorité, et si chacun arrivé au croisement
préfère un ordre plutôt que l’autre, collectivement il n’existe pas de bonne ou mauvaise convention.
Enfin, dans les jeux RV et CC, les équilibres sont Pareto-ordonnés. Or, en premier lieu, les joueurs
adoptent une convention pour réussir leur coordination (se retrouver, choisir le même gibier à chasser
pour revenir non bredouille), ou encore pour éviter les issues où les stratégies sont incompatibles pour
la réussite de l’action collective en jeu. Peu importe que la solution soit la meilleure ou non,
l’important est qu’elle existe. Serait -il donc possible que suivre une convention présente un manque à
gagner ? Pour y répondre, il faudra s’intéresser à l’autre critère de classement des équilibres de Nash,
la risque-dominance, sachant que dans RV, le même équilibre est Pareto optimal et risque-dominant,
tandis que dans CC, l’équilibre Pareto -optimal est distinct de l’équilibre risque -dominant. C’est donc
ce dernier jeu qui pose avec le plus d’acuité la question de l’arbitrage entre considérations
d’optimalité et considérations de risque pour le choix d’une convention.
1.2. Une bonne convention est-elle optimale ou peu risquée ?
L’analyse stratégique des conventions arrive bien à positionner la convention par rapport à
l’équilibre de Nash, elle achoppe cependant sur la liaison convention -optimalité. En effet, comme
7
nous l’avons laissé entendre plus haut, il es t toujours possible que la convention, dans une interaction
RV ou CC, corresponde à la solution sous optimale. On comprend mal – a priori • pourquoi des
joueurs qui suivent des conventions par intérêt personnel finissent par adopter des conventions dont
ils savent qu’elles ne maximisent pas leur intérêt personnel. Les joueurs sont -ils irrationnels lorsqu’ils
s’accordent sur le résultat sous -optimal donnant sens à la maxime : « le mieux est l’ennemi du
bien » ? Dans CC, spécifié dans le tableau 4, ne vaut-il pas mieux se contenter d’un lièvre plutôt que
mourir de faim ?
Tableau 4. La chasse au cerf
Chasseur n°2
Cerf
Lièvre
(Laisser filer le
(Attraper le
lièvre et rabattre le
lièvre)
cerf)
Chasseur n°1
Cerf
(Laisser filer le lièvre
et rabattre le cerf)
Lièvre
(Attraper le lièvre)
(3, 3)
(−10, 1)
(1, –10)
(1, 1)
Pour se nourrir, deux individus totalement libres peuvent chasser le lièvre ou le cerf.
L’avantage du lièvre est qu’il peut être chassé seul alors que pour le cerf, il faut être deux, l’un devant
faire le rabatteur. Toutefois, le cerf a un résultat nutritif plus important (utilité de 3 contre 1 pour le
lièvre). Si un chasseur chasse le cerf seul, il n’a aucune chance de se nourrir et il meurt (d’où une
utilité de - 10).
C’est pour ce type de configurat ion CC que Lewis recourt implicitement à la distinction entre
une « bonne » convention et un « bon équilibre ». La convention est soutenue par la force du
précédent qui constitue le gage d’une coordination réussie. Elle indique quelle attitude adopter en
fonction de celle adoptée hier, par exemple chasser le lièvre ou le cerf. Peu importe la teneur de la
convention, celle-ci sera considérée comme « bonne » car elle évite l’absence de coordination. Mais,
ceci implique que le précédent peut aussi bien soutenir la convention Pareto-optimale que risquedominante. Dans ces conditions, le précédent, pourtant vecteur d’efficacité, peut accoucher d’une
mauvaise solution, ce que reconnaît Lewis. En effet, chasser le lièvre est une convention aussi
longtemps que tous les chasseurs ont attrapé séparément des lièvres dans le passé plutôt que de
rabattre ensemble un cerf mais cet équilibre n’est pas « un bon équilibre de coordination », (Lewis,
1969, p.47).
La théorie de Lewis n’est pas outillée pour traiter de ce cas de défaut de coordination où une
convention peut correspondre à un « mauvais » équilibre. Pour traiter ce type de problème, nous
devons mieux spécifier le type de rationalité des joueurs comme nous y invitent les travaux de
Harsanyi et Selten (1988).
Chaque joueur sait que l’autre est rationnel, donc chacun sait que l’autre est capable de
calculer les deux équilibres de Nash. Mais l’hypothèse de rationalité parfaite, sans autre précision, ne
nous dit rien sur la sélection des équilibres. En particulier, elle n’implique pas une prédilection a
priori pour les situations collectivement optimales. Donc, il n’est pas irrationnel que, dans son
processus de prise de décision, chaque joueur intègre une probabilité non nulle que l’autre ne
8
choisisse pas la convention Pareto-optimale. Dans ce cas où les joueurs se donnent des probabilités
subjectives sur les possibles actions d’autrui, la rationalité est non seulement parfaite mais également
bayésienne et c’est l’espérance de leur bien -être que les agents maximisent. Or, il se peut que
l’espérance de bien -être ne soit pas individuellement maximisée en choisissant l’équilibre Pareto optimal ; c’est effectivement le cas dans le jeu de la chasse au cerf.
Pour le premier chasseur, Cerf est la meilleure stratégie s’il pense qu e l’autre chasseur choisira
également Cerf avec une probabilité p telle que son espérance de gains soit strictement supérieure à
celle associée à la stratégie Lièvre. Soit :
ap + b(1-p) > cp + d(1-p), ce qui implique p >
(d −b)
(1−(−10))
= 11 .
=
(a −c)+(d −b) (3−1)+(1−(−10)) 13
Par conséquent, Lièvre est la meilleure stratégie si le premier chasseur pense que l’autre
choisira également Lièvre avec une probabilité :
(1-p) >
(3−1)
(a−c)
=2 .
=
(a−c)+(d −b) (3−1)+(1−(−10)) 13
Le jeu étant symétrique, il en est de même pour le second chasseur. Dans ces conditions,
chasser le lièvre demande un niveau de croyance ou de prévisions sur le comportement d’autrui
beaucoup moins exigeant : il suffit de croire un peu (probabilité subjective de 15.4%) que l’autre
risque de chasser le lièvre pour faire comme lui, alors qu’il faut être presque convaincu (probabilité
subjective d’au moins 84.6%) qu’il va chasser le cerf pour faire de même. En d’autres termes, si la
valeur minimale requise de p est supérieure à la valeur minimale requise de (1-p), alors l’équilibre
(Cerf,Cerf) apparaît plus risqué que (Lièvre,Lièvre). On a donc bien : pmin > (1-pmin) ⇔ (a – c) < (d –
b), condition que nous avons précisée dès le tableau 2. L’équilibre (Lièvre,Lièvre) est dit risque dominant, conformément à la définition qu’en donnent Harsanyi et Selten (1988).
L’objectif de ces auteurs est de montrer qu’en cas de multiplicité des équilibres, la sélection
de l’un d’eux peut s’effectuer de manière endogène en usant de la seule rationalité. Or, ils insisten t
bien sur le fait que la risque-dominance et la Pareto-dominance correspondent à deux critères
distincts et possibles de rationalité. « La risque-dominance est fondée sur une rationalité
individuelle : c’est une extension de la rationalité bayésienne […] si un équilibre E1 risque-domine
l’équilibre E2, cela signifie que, dans une situation où les joueurs sont indécis quant à savoir lequel
de E1 ou de E2 sera le résultat effectif, tout joueur, qui essaie de maximiser son espérance de gains
conditionnellement à des probabilités subjectives rationnellement choisies sur les stratégies de
l’autre joueur, optera pour E1. Au contraire, la domination en gains [ la Pareto-dominance] est
fondée sur une rationalité collective : elle s’appuie sur l’hypothèse selon laque lle en l’absence de
raisons contraires, les joueurs rationnels vont choisir un équilibre procurant à tous des gains plus
élevés, plutôt qu’un autre leur procurant des gains plus faibles. En d’autres termes, elle s’appuie sur
l’hypothèse selon laquelle des individus rationnels vont coopérer pour poursuivre leur intérêt
commun si les conditions le leur permettent16» (souligné par nous) (1988, p. 356). Dans une société
de chasseurs où la rationalité est de connaissance commune « individuelle », le résultat du jeu sera
(Lièvre, Lièvre) ; dans une autre société avec cette fois-ci une rationalité « collective » de
connaissance commune, c’est l’issue Pareto -optimale (Cerf, Cerf) qui sera choisie.
Si l’on adhère à cette hypothèse ajoutée à la rationalité initiale d es joueurs lewisiens, la
convention perd alors de son arbitraire, caractéristique pourtant première d’une convention. En effet,
16
Par exemple, les conditions du dilemme du prisonnier ne le permettent pas.
9
l’information complète sur le jeu et la connaissance du type de rationalité des joueurs suffisent à
désigner sans erreur les stratégies d’équilibre retenues. Décréter que les joueurs sont rationnellement
collectifs ou bayésiens, cela revient à les doter dès le départ d’un critère de sélection supplémentaire
pour implémenter un équilibre de Nash parmi plusieurs, résolvant de la sorte tout problème de
coordination avant même de s’y confronter. A ce stade, on peut alors se demander ce qu’il reste de
conventionnel à la solution adoptée pour résoudre la coordination ? Plus grand chose sans doute. Des
individus intellectuellement si bien dotés par la nature n’ont plus besoin de conventions pour gérer
leurs interactions17…
Donc pour interroger l’approche utilitariste des conventions sur l’optimalité ou non des
conventions sans initialement « piper les dés », il faut changer d’hypothèse sur l a rationalité des
joueurs. De la sorte, on explique mieux pourquoi la théorie des conventions s’est essentiellement
développée dans le champ de la théorie des jeux évolutionnistes. Il s’agit dans ce cadre, où il n’est
plus question de rationalité parfaite mais de joueurs myopes et de naïfs, de prédire lequel des
équilibres de coordination rivaux prendra le statut de convention et ceci de manière durable :
l’optimal ou le moins risqué ?
2. QUAND LES « MAUVAISES » CONVENTIONS SE RÉVÈLENT
ÉVOLUTIONNAIREMENT ET STOCHASTIQUEMENT PLUS STABLES
« Il est sans doute plus utile de moins se focaliser sur la rationalité et de penser les
conventions comme le fruit d'un processus évolutionniste» (Sugden, 1989, p.90-91). La théorie des
jeux évolutionniste apparaît comme une sérieuse candidate pour l’explication des conventions dès
lors que l’on insiste plus particulièrement sur l’un des traits propres à tout comportement
conventionnel – et que nous avons négligé – à savoir son enracinement dans le passé.
Si des agents choisissent une solution dite conventionnelle, cela signifie qu’ils ne l’ont pas
inventée à l’instant ; en quelque sorte elle était à leur disposition pour leur éviter des calculs et
raisonnements infinis. Elle vient du passé. Cela a une première implication directe : le problème de
coordination en question a déjà eu lieu. Une théorie des conventions devrait donc concevoir des
interactions qui se répètent. Par ailleurs, venir du passé ne suffit pas pour prétendre être une solution,
il est nécessaire que les succès passés d’un comportement confèrent à ce dernier une prégnance
reconnue pertinente par les individus. Autrement dit, on suppose que les agents sont sensibles à la
force du précédent ; ils préfèrent se conformer à un précédent réussi plutôt que d’imaginer un
nouveau comportement. C’est une condition nécessaire, sans elle point de régularité dans le temps. Il
semble alors logique de plaider pour une théorie des conventions mettant en scène des agents dont les
décisions sont prises en regardant le passé plutôt que l’avenir.
Or, la théorie des jeux évolutionniste associe ces deux caractéristiques que nous venons de
qualifier de nécessaires : approche dynamique, les interactions y sont récurrentes18 ; supposant la
rationalité limitée, les agents qu’elle met en scène calculent leur espérance de gains en fonction
uniquement de l’information issue des périodes précédentes.
Au sein de la micro-société de joueurs, qui constitue le système en évolution, chacun est
17
D’ailleurs, Harsanyi et Selten, qui nous intéressent ici à cause du concept de risque -dominance, n’utilisent jamais celui
de convention !
18
Les jeux sont dits récurrents lorsque les interactions sont répétées entre des joueurs différents à chaque fois.
10
myope : personne n’anticipe l’aveni r. De plus, aucun joueur ne reconnaît ses partenaires. Ainsi,
Rosalie et César, si le hasard fait qu’ils se rencontrent lors d’une interaction, que ce soit à la première
ou à la nième période du jeu, ne s’identifient pas l’un l’autre. Avec Mailath (1998), on peut ajouter au
qualificatif de myope celui de naïf. En effet, période après période, chacun joue sa stratégie en
réagissant par rapport aux états passés du système dans sa globalité et ainsi, de manière non
intentionnelle, contribue au changement du système, ou encore à son évolution. « Les joueurs ne
croient pas – ne comprennent pas – que leur propre comportement affecte potentiellement le jeu de
leur adversaire et les joueurs en particulier ne tiennent pas compte de la possibilité que leur
adversaire s’ajuste également à leurs comportements. » (p.1348).
L’ambition de la théorie des jeux évolutionnistes est alors de montrer (i) que des agents à la
rationalité ainsi limitée vont jouer in fine un équilibre de Nash, et (ii) comment un équilibre est
sélectionné parmi plusieurs (Mailath, 1998). Or, la redéfinition du concept d’équilibre en évolution,
que ce soit en termes de stabilité évolutionnaire ou de stabilité stochastique, correspond à des
régularités de comportements dans une population. C’est pourquo i il n’y a plus qu’un pas à faire pour
reconnaître ici une théorie de l’émergence et de la stabilité des conventions 19, où la question du
caractère Pareto-optimal ou risque-dominant de la convention sélectionnée est centrale.
2.1. Le jeu « or » versus « sel »
Nous allons prendre ici un exemple, adapté de la chasse au cerf. Par ailleurs, notre démarche
évolutionniste est plus fidèle à celle de Kandori, Mailath et Rob (1993) qu’à celle de Young (1998).
Enfin, nous considérons une dynamique uniquement en temps discret. A une date mythique t, dans
une population de marchands existent deux moyens d’échange, le sel et l’or. Tous les marchands se
rencontrent deux à deux selon un tirage aléatoire pour échanger des biens de natures différentes. Étant
dans une économie monétaire, ils ne peuvent pas effectuer de trocs et doivent donc, avant de quitter
leur boutique, remplir leur bourse soit de sel soit d’or pour régler leurs achats. Dans l’absolu, pour
faciliter les échanges, le sel est plus performant. Mais si deux agents ayant choisi des moyens
d’échange différents se rencontrent, au moment de rendre la monnaie, celui qui a de l’or a un
avantage sur celui qui propose du sel. Ce jeu admet deux équilibres de Nash : l’équilibre « sel » qui
Pareto-domine l’équilibre « or », ce dernier risque-dominant « sel ». La question est alors de savoir
lequel va s’imposer, avec le temps, à l’ensemble des marchands comme étant l’équilibre de
coordination allant de soi.
Tableau 5 : Le jeu « sel » versus « or »
Marchand 1
Marchand 2
sel
or
10,10
4,7
7,4
8,8
sel
or
A la date t, l’état du système est résumé par la distribution des stratégies parmi les joueurs. Si
tous choisissent le sel (respectivement l’or), cet état du système perdurera à l’infini en l’absence de
perturbation. Si au contraire, à la date t, la population est mélangée, une proportion pt choisissant le
19
Sugden (1989) suggère la méthode mais c’est à Young (1993) que l’on doit le premier modèle traitant explicitement de
l’origine des conventions à l’aide d’une formalisation complète.
11
sel et une proportion 1-pt l’or, le système va évoluer grâce à l’apprentissage des marchands. Comme
il suffit de connaître la variable pt pour connaître l’état du s ystème en t ; la série des p0, p1, p2, …, pT
retranscrit l’évolution du système de l’origine à la période T, et la fonction b(.) avec b(pt) = pt+1 est la
dynamique du système. Le principe d’une dynamique évolutionniste est de vérifier une propriété (D)
dite darwinienne (Kandori et alii, 1993) :
pt+1 = b(pt)
avec
(D) : sign(b(p)-p) = sign(πS(p)-πO(p))
avec πS(p) (resp. πO(p)) l’espérance des gains à jouer la stratégie sel (resp. or) quand le système est tel
que pt=p. Une stratégie « gagnante » à la période t sera adoptée par une fraction plus importante de
joueurs en t+1. Cela repose sur un processus de sélection « naturelle », qui élimine peu à peu les
stratégies en moyenne moins efficaces.
Dans ces conditions, que la dynamique évolutionniste soit celle de réplication (la plus
connue)20 ou de meilleure réponse21, on peut associer à la fonction b(.) une chaîne de Markov dont la
matrice de transition est régulière, faite de 0 et de 1 et avec une somme par ligne toujours égale à un,
ce qui implique au moins un état stationnaire p* déterminé par la situation initiale du système.
On qualifie de stationnaire un état p* tel que b(p*)=p*. Soit ~p = 4/7 (valeur où πS(p) = πO(p)
= 10p + 4(1-p) = 8(1-p) +7p) et soit p0 l’état initial du système, la dynamique darwinienne a trois
états stationnaires : p*=0 si p0< ~p , p*=1 si p0> ~p et p*= ~p 22 si p0= ~p . On peut appeler ~p la masse
critique qui, selon qu’elle est atteinte ou non en période initiale nous indique, sans autre incident lors
du processus, si le sel sera ou non le moyen d’échange conventionnel de cette société. Soit p0 est
supérieur à 4/7 et l’état stationnaire du système consacrera l’hégémon ie du moyen d’échange sel ; soit
p0 est inférieur à 4/7 et l’état correspondra à la « mauvaise » convention or. En d’autres termes, c’est
la fréquence initiale des stratégies sel et or qui détermine la convention finalement en vigueur dans le
système. Il s’agit de la propriété bien connue de path dependency.
A ce stade, on va chercher à tester la résistance de la convention ayant émergé : si des
comportements déviants surgissent, comment le système et les joueurs vont-ils être influencés ? La
force du précédent (ici, l’hégémonie d’un comportement en t-1) est-elle puissante ou fragile ? Il faut
donc caractériser ces conventions, ou plus exactement ces états du système, en terme de stabilité ou
de résistance.
Pour tester la stabilité d’un état, il faut le pert urber, nous allons donc introduire des chocs
exogènes dans la dynamique déterministe. On suppose qu’à l’état stationnaire, où une convention est
respectée par tous, une petite proportion d’individus changent de stratégie. On qualifie ces individus
de mutants. Si malgré ces mutations en nombre restreint, le système revient à l’état stationnaire de
20
Cette dynamique est directement issue de l’évolution nisme biologique (Fisher, 1930) et introduite en théorie des jeux
par Taylor et Jonker (1978). Néanmoins, elle est très critiquable, car elle ignore totalement le niveau micro-économique
des joueurs qui n’effectuent aucun calcul. Leur rationalité n’est pas affaiblie mais nulle. En quelque sorte, la dynamique
de réplication est une loi macroéconomique sans fondements microéconomiques.
21
Cette dynamique est plus satisfaisante dans le cas de systèmes avec interactions localisées. Sur la base des observations
en t-1, les joueurs procèdent à des calculs d’espérance conditionnellement à leur voisinage et jouent leur meilleure
réponse. Une fois ces choix décentralisés agrégés, la dynamique macro-économique b(.) doit continuer de vérifier la
propriété (D).
22
p*= ~
p correspond bien sûr à l’équilibre en stratégies mixtes du jeu statique. Même s’il peut s’agir d’un état stationnaire
du système, de manière générale on refuse le label de convention à cet état, d’autant plus qu’il se révèlera instable.
12
départ alors, selon la définition de Maynard Smith et Price (1973), la stratégie qui lui est associée est
dite évolutionnairement stable.
A ce test, p*=0 et p*=1 résistent. On qualifie également ces deux états de points fixes
asymptotiquement stables (PFAS) : toute trajectoire engendrée par la dynamique, qui prend son
départ suffisamment près d’un de ces points fixes (nombre de mutants suffisamment petit), converge
vers lui sans jamais trop s’en écarter. Ainsi, les deux équilibres de Nash stricts, correspondent à des
stratégies évolutionnairement stables (SES) et l’on peut calculer leur résistance aux mutations. De
fait, ce calcul nous ramène à celui de la masse critique ~p =4/7 ou celui de la risque-dominance.
Considérons un état où tous les marchands utilisent du sel, la proportion de mutants 1-p devient trop
importante, au point de rendre l’abandon du sel inéluctable, dès lors que 1-p est plus grand que 3/7.
La résistance de la stratégie sel est donc 3/7 et celle de l’or 4/7. Cette dernière SES, ayant une plus
grande résistance, est donc moins facilement déstabilisée par d’éventuelles mutations.
Néanmoins, malgré cet avantage pour la stratégie or, les deux équilibres, en tant que PFAS
concurrents, peuvent soutenir chacun une convention, fonction de l’héritage historique (les conditions
initiales) et des incidents historiques non prévisibles (les mutants). Pour prédire la convention adoptée
par une zone monétaire, nul besoin de jugement sur l’optimalité ou sous -optimalité, seule l’histoire
importe ! C’est du moins l’impression donnée lorsque l’on se cantonne aux dynamiques darwiniennes
déterministes.
C’est pourquoi on introduit un processus de mutation continu et aléatoire. Le jeu devient
stochastique puisque tout joueur est susceptible de modifier son comportement sans raison apparente,
avec une probabilité ε infime mais non nulle. Une fois ce processus de mutation ou d’erreur introduit,
la stabilité du système est beaucoup plus complexe. Si on se limitait à un critère de stabilité locale
pour les PFAS (avec un phénomène de mutation ponctuel), à présent « les caractéristiques de la
dynamique globale deviennent essentielles » et le critère de stabilité stochastique qui s’impose est
plus exigeant ; il sélectionne plus fortement les équilibres (Orléan, 1996, p.591)23. En fait, pour toute
dynamique respectant la propriété darwinienne, quand le taux de mutation ε tend vers 0, et quelle que
soit la situation initiale du système, celui-ci stationnera à long terme « une ‘infinité’ de fois plus
longtemps » (Orléan, 1996, p. 597) dans l’état p* que dans tout autre. Cet état est p* dit
stochastiquement stable (Foster et Young (1990), Kandori, Mailath et Rob (1993), Young (1993)).
En fait, l’état stochastiquement stable (ESS) est celui qui possède le plus grand bassin
d’attraction : son potentiel stochastique (le nombre minimal de mutations nécessaires pour atteindre
son bassin d’attraction) est faible ou enco re sa résistance (le nombre minimal de mutations pour
quitter son bassin d’attraction) élevée. Comme les calculs de résistance et de risque -dominance sont
équivalents lorsqu’il n’existe que deux équilibres, il en découle un résultat assez général : dans un jeu
avec deux équilibres de Nash, l’un Pareto -optimal et l’autre risque -dominant, c’est le second
23
La dynamique systémique devient une équation différentielle stochastique non linéaire :
pt+1 = b(pt) + xt – yt
où x et y sont des variables aléatoires de paramètre ε représentant la part d’agents qui expérimentent respectivement sel et
or. Ce système dynamique stochastique définit une chaîne de Markov dont la matrice de transition a cette fois-ci tous ses
éléments strictement positifs (à cause des mutations, toutes les transitions d’un état à un autre sont rendues possibles). Or,
si la matrice est strictement positive, le processus est dit ergodique : à terme, il y a indépendance par rapport aux
conditions initiales.
13
équilibre, parce que son bassin d’attraction est plus grand, qui sera progressivement adopté par
l’ensemble de la population.
PFAS et ESS sont ainsi propices à représenter l’état d’une société guidée par une convention
puisqu’ils impliquent bien une régularité de comportement. Néanmoins, concernant l’émergence de la
convention, le pouvoir explicatif des deux concepts est très différent. Pour le premier, tout dépend des
conditions initiales (en t=0, quelle est la distribution des stratégies dans la population ?). Pour le
second, ce sont les caractéristiques de la matrice des gains qui déterminent seules la convention finale
(laquelle est risque-dominante ?). Par conséquent, les prédictions sur l’optimalité des conventions
sont également différentes. Si l’on considère que seuls les ESS sont à même de représenter des
sociétés où règne une convention, alors on prédit que toutes les conventions sont Pareto-dominées. Si
on accepte aussi les PFAS comme systèmes de joueurs avec convention, alors tout se joue à la date
0 : le choix de la convention est en quelque sorte déjà fait à l’origine des temps et la dynamique ne
nous apprend rien ! Soit le « choix » est déjà là et il peut être sous-optimal, soit il n’est pas déjà fait et
il a toutes les chances de l’être. Ces résultats présentent le défaut de coordination comme une issue
plus « probable » que l’inverse. Cette conclusion pessimiste est -elle inévitable ?
2.2. Peut-on échapper au défaut de coordination ?
Considérer qu’une convention correspond à un ESS plutôt qu’à un PFAS peut être
intellectuellement plus satisfaisant. La convention est ainsi associée à l’état le plus résistant possible
aux stratégies « incorrectes » pouvant survenir dans la population, de manière certes très rare
(n’oublions pas que ε→0) mais également erratique (aléatoire). Cette résistance continue aux
comportements aberrants est une caractéristique importante des conventions. Or, si on place les
scénarii d’évolution des conventions dans un environnement stochastique, en abandonnant une
dynamique déterministe, la théorie des jeux évolutionnistes va-t-elle fatalement et systématiquement
justifier la pérennité de défauts de coordination ?
Ce résultat serait pour le moins pessimiste, sachant que l’économiste est traditionnellement
très attaché à la Pareto-optimalité. De fait, la majorité des travaux actuels de l’approche
évolutionniste des conventions s’attache à définir les conditions permettant a contrario l’émergence
d’une convention Pareto -optimale. Sachant que la stratégie risque-dominante s’adapte mieux à un
univers stochastique et donc hétérogène « alors que l’efficacité de la stratégie Pareto -optimale ne se
révèle pleinement que dans des contextes de forte homogénéité des choix » (Orléan, 1996, p. 593)24,
on peut s’interroger, sur la possibilité d’échapper à un défaut de coordination programmé, en assurant
aux joueurs un environnement homogène par le biais de plus petits voisinages.
Si les interactions ont lieu dans un réseau, on s’attend à ce que les joueurs prennent l’habitude
de ne rencontrer que les membres de leur voisinage ce qui devrait diminuer les risques de noncoordination et revaloriser le critère paretien dans leur prise de décision. Toute une littérature25, qui se
24
Ou encore, en reprenant les termes de Sugden, les agents sont sensibles à deux qualités des conventions : leur efficacité
(Pareto-dominance) et leur polyvalence face à toute autre stratégie (la capacité de diminuer le risque en cas de non
coordination). Or, « l’évolution aura tendance à valoriser les conventions ‘polyvalentes’ mais inefficientes par rapport à
celles qui sont moins ‘polyvalentes’ et plus efficientes » (Sugden, 1989, p. 94).
25
De manière absolument non exhaustive : Ellison (1993), Blume (1993), Anderlini et Ianni (1996), Berninghaus et
Schwalbe (1996). On peut également citer Boyer et Orléan (1992), ces derniers s’intéressant p lutôt à un jeu du rendezvous où l’équilibre Pareto -dominant est aussi risque-dominant.
14
définie comme « théorie économique des conventions », a ainsi intégré dans les modèles
évolutionnistes l’hypothèse d’interactions localisées afin de relier propriétés de la convention
émergeante et forme du réseau. Mais cette hypothèse supplémentaire ne suffit pas en elle-même. Car,
dans un réseau même sans mutation, l’effet contagion par chevauchement des voisinages privilégie
lui aussi la diffusion des stratégies risques dominantes (Lee et Valentinyi, 2000). C’est pourquoi,
parmi ces modèles, ceux qui cherchent à expliquer l’émergence d’une stratégie conventionnelle
Pareto-optimale ont toujours besoin d’une hypothèse supplémentaire pour atteindre leur objectif.
Par exemple, la convention peut être optimale s’il existe, contre un coût raisonnable, le moyen
d’être flexible (de s’ajuster parfaitement au comportement d’autrui, quelle que soit sa stratégie), et
cela dans un réseau unidimensionnel, avec une dynamique de meilleure réponse déterministe (Goyal
et Janssen, 1997). Or, sachant que le résultat est le même sans réseau et avec une dynamique
stochastique (Galesloot et Goyal, 1997), ce n’est donc pas la modélisation en réseau qui est
déterminante, mais bien l’hypothèse de flexibilité. On peut également jouer sur la structure du taux de
mutation. Supposer par exemple que le taux dépend de l’état du système (la mutation est moins
probable dans l’état Pareto -optimal que dans l’état risque -dominant) permet à l’équilibre optimal
d’être stochastiquement stable (Bergin et Lipman, 1996), mais à condition ici que les interactions ne
soient pas localisées dans un réseau (Lee, Szeidl, Valentinyi, 2003) ou que le réseau ait une forme
très particulière (Jackson et Watts, 2002) !
En fait, pour obtenir l’émergence et l’unicité de la convention P areto-optimale dans
l’ensemble de la population, une dernière hypothèse doit être ajoutée : la mobilité des agents dans le
réseau. On aborde là une famille de modèles en pleine expansion (Oechssler, 1997 ; Dieckmann,
1999 ; Mailath, Samuelson et Shaked, 2001; Ely, 2002)26, qui suppose que la structure d’interaction
n’est plus figée, avec chaque joueur attaché à un nœud du réseau et connecté aux joueurs de son
voisinage. A présent, les nœuds du réseau sont des lieux où peuvent se rencontrer tous les joueurs
choisissant de s’y rendre. En quelque sorte, ce sont les jeux de coordination de classe CC qui forment
les nœuds du réseau. Or, si les joueurs se déplacent dans le réseau, chacun rejoint sciemment un site
où la convention jouée en t-1 maximise son espérance d’utilité : parmi un certain nombre de
conventions déjà établies en des endroits distincts, les joueurs font le choix a posteriori de leur propre
comportement conventionnel ! De la sorte, en chaque nœud du réseau, l’hétérogénéité des stratégies
diminue, le risque de non coordination s’affaiblit, la stratégie Pareto -optimale y gagne en attraction et
l’on échappe enfin à l’émergence programmée de la convention risque -dominante mais Paretodominée. Ainsi, dans un univers stochastique, des joueurs myopes, naïfs mais mobiles finiront-ils par
adopter de bonnes conventions. Nous retrouvons là l’effet régulateur bien connu d’un mécanisme de
marché, fondé sur la stratégie « exit » : si la convention en vigueur chez moi est Pareto-dominée par
celle suivie par mes voisins, je m’en vais chez eux…
Finalement, on ne voit pas ce qui reste de conventionnel dans des choix ainsi définis. Si l’on
est capable d’arbitrer entre différentes conventions, en fonction de leurs avantages et coûts comparés,
le suivi de la règle ne repose pas sur la préférence pour la conformité mais sur un choix conscient et
lucide d’une des branches de l’alternative. Le seul moyen d’éviter un défaut de coordination serait
donc d’abandonner le respect des stratégies conventionnelles pour la mise en co ncurrence des
différents équilibres de coordination !
26
Cette modélisation est plus particulièrement appliquée dans le champ de l’économie spatiale (Bhaskar et Vega Redondo, 1996 ; Blume et Temzelides, 2003) et des réseaux sociaux (Goyal et Vega-Redondo, 1999 ; Droste, Gilles et
Johnson, 2000).
15
CONCLUSION
Les outils de la théorie des jeux permettent donc d’expliquer pourquoi des individus soumis à
un problème de coordination ne se comportent pas comme l’âne de Buridan : ils décident malgré
l’i ndécidable de la situation. Plus encore, il nous semble que ces mêmes outils peuvent être exploités
pour approcher les défauts de coordination de nature macro-économique comme agrégation d’une
multitude d’interactions interindividuelles (avec ou sans résea u).
En effet, récapitulons les défauts de coordination présentés dans ce texte : un collectif de
travail ayant un étalon d’effort faible (induisant le renforcement d’une mauvaise politique salariale),
des hommes et leur famille dénutris ne sachant pas attraper un cerf et une économie où la mauvaise
monnaie a chassé la bonne. Toute interaction où Pareto-optimalité et risque-dominance entrent en
conflit, risque de mener ainsi à une règle de coordination conventionnelle, stable mais « mauvaise ».
Ce résultat est imputable soit à la force du précédent qui supporte une convention qui n’est pas un
« bon équilibre » (Lewis), soit à une parfaite rationalité individuelle bayésienne (Harsanyi et Selten),
soit encore à une dynamique stochastique darwinienne (sensible aux mêmes probabilités du calcul
bayésien, mais correspondant alors plutôt à des fréquences). Les moyens d’échapper au défaut de
coordination sont également circonscrits : une parfaite rationalité collective, une dynamique
déterministe certaine avec une origine des temps où la « bonne » stratégie est majoritaire, et enfin la
parfaite mobilités des agents. Il reste à savoir comment réinterpréter ces résultats en terme de
politiques économiques, préconisations dont sont friands les macro-économistes.
BIBLIOGRAPHIE
ANDERLINI L. et IANNI A. (1996), « Path dependance and learning from neighbors », Games and
Economic Behavior, n°13, pp. 141-177
BATIFOULIER Ph. (éd.) (2001), Théorie des conventions, Economica.
BERGIN J. et B.L. LIPMAN (1996), « Evolution with state-dependent mutations », Econometrica,
vol. 64, pp. 943-956.
BERNINGHAUS S.K. et U. SCHWALBE (1996), « Conventions, Local Interaction, and Automata
Networks », Journal of Evolutionary Economics, vol. 6, pp. 297-312
BHASKAR V. et F. VEGA-REDONDO (1996), « Migration and the Evolution of Conventions »,
Institut Valencia d’Investigacions Economiques , Université d’Alicante, working paper.
BLUME A. et T. TEMZELIDES (2003), « On the Geography of Conventions », Economic Theory,
vol. 22, pp. 863-873.
BLUME L. (1993), « The Statistical Mechanics of Strategic Interaction », Games and Economic
Behavior, vol. 5, pp. 387-424.
BOYER R. et A. ORLÉAN (1992), « How do Convention Evolve ? » Journal of Evolutionary
Economics, vol. 2, pp. 165-177.
COOPER R. et A. JOHN (1988), « Coordinating Coordination Failures in Keynesian Models », The
Quarterly Journal of Economics, vol. 103, pp. 441-463.
DIECKMANN T. (1999), « The Evolution of Conventions with Mobile Players », Journal of
Economic Behavior & Organization, vol. 38, pp. 93-111.
16
DROSTE E., R.P. GILLES et C. JOHNSON (2000), Evolution of Conventions in Endogenous Social
Networks, mimeo, Tilburg University.
ELLISON G. (1993), « Learning, Local Interaction, and Coordination », Econometrica, vol. 61,
pp. 1047-1071.
ELY J. (2002), « Local conventions », Advances in Theoretical Economics, vol. 2.
FISHER R.A. (1930), The Genetical Theory of Natural Selection, Oxford : Clarendon Press.
FOSTER et H.P. YOUNG (1990), « Stochastic evolutionary game dynamics », Theoretical
Population Biology, vol. 38, pp. 219-232
GALESLOOT B.M. et S. GOYAL (1997), « Costs of flexibility and equilibrium selection », Journal
of Mathematical Economics, vol. 28, pp. 249-264.
GOYAL S. et M. JANSSEN (1996), « Can We Rationally Learn to Coordinate ? », Theory and
Decision, vol. 40, pp. 29-49.
GOYAL S. et M. JANSSEN (1997), « Non-exclusive conventions and social coordination », Journal
of Economic Theory, vol. 77, pp. 34-57.
GOYAL S. et F. VEGA-REDONDO (1999), Learning, Network Formation and Coordination,
Econometric Institute Report 9954/A, Rotterdam.
HARSANYI J.C. et R. SELTEN (1988), A General Theory of Equilibrium Selection in Games,
Cambridge, MIT Press.
JACKSON M.O. et A. WATTS (2002), « On the Formation of Interaction Networks in Social
Coordination Games », Games and Economic Behavior, vol. 41, pp. 265-91.
KANDORI M., G.J. MAILATH et R. ROB (1993), « Learning, Mutation, and Long Run Equilibria in
Games », Econometrica, vol. 61, pp. 1019-1045.
LEE I.H., A. SZEIDL et A. VALENTINYI (2003), « Contagion and State Dependent Mutations »,
Advances in Theoretical Economics, vol. 3.
LEE I.H. et A. VALENTINYI (2000), « Noisy contagion without mutation », Review of Economic
Studies, vol. 67, pp. 47-56.
LEIBENSTEIN H. (1982), « The Prisonner’s Dilemma in the Invisible Hand: an Analysis of intra
Firm Productivity », The American Economic Review, n°2, pp. 92-97.
LEIBENSTEIN H. (1987), Inside the firm, Harvard University Press.
LEWIS D. (1969) Convention. A Philosophical Study, Cambridge, Harvard University Press.
MAILATH G. (1998), « Do People Play Nash Equilibrium ? Lessons from Evolutionary Game
Theory », Journal of Economic Literature, vol. 36, pp. 1347-74.
MAILATH G., L. SAMUELSON et A. SHAKED (2001) « Endogenous Interactions » in The
Evolution of Economic Diversity, Pagano et Nicita eds, London : Routledge.
MAYNARD SMITH J. et PRICE G.R. (1973), « The logic of Animal Conflict », Nature, n°246,
pp. 15-18.
OECHSSLER J. (1997), « Decentralization and the Coordination Problem », Journal of Economic
17
Behavior & Organization, vol. 32, pp. 119-135.
ORLÉAN A. (1996), « De la stabilité évolutionniste à la stabilité stochastique. Réflexions sur les jeux
évolutionnistes stochastiques », Revue économique, vol. 47, pp. 589-600.
ORLÉAN A. (1997), « Jeux évolutionnistes et normes sociales », Economie Appliquée, n°3, pp. 177198.
RABIN M. (1994), « Incorporating Behavioral Assumptions into Game Theory » in Problems of
Coordination in Economic Activity, Friedman éd., Boston, Kluwer Academic Publishers.
ROUSSEAU J-J. (1754), Discours sur l’origine de l’inégalité parmi les hommes, édition de 1985,
Bordas.
SCHELLING T. (1960), The strategic of conflict, Harvard University Press.
SCHOTTER A. (1981), The economic theory of social institutions, Cambridge University Press.
SUGDEN R. (1989), « Spontaneous Order », Journal of Economic perspectives, n°3, pp. 85-98.
TAYLOR P.D. et L.B. Jonker (1978), «Evolutionarily Stable Strategies and Game Dynamics.»,
Mathematical Biosciences, vol. 40, pp. 145-156.
VAN DER LECQ F. (1996), « Conventions and Institutions in Coordination Problems », De
Economist, vol. 144, pp. 397-428.
WALLISER B. (1986), « Une typologie des jeux à deux joueurs », Economie et société, novembre,
n°11, pp. 123-147.
YOUNG H.P. (1993), « Evolution of conventions », Econometrica, vol. 61, pp. 57-84.
YOUNG H.P. (1996), « The economics of convention », Journal of Economic Perspectives, vol. 10,
2, pp. 105-122.
YOUNG H.P. (1998), Individual Strategy and Social Structure : An Evolutionary Theory of
Institutions, Princeton University Press.
18