Peut-on suivre de mauvaises conventions ? Une autre
Transcription
Peut-on suivre de mauvaises conventions ? Une autre
Peut-on suivre de mauvaises conventions ? Une autre lecture des défauts de coordination. Version provisoire Guillemette de LARQUIER FORUM (UMR 7028 CNRS) Université Paris X-Nanterre [email protected] Philippe BATIFOULIER FORUM (UMR 7028 CNRS) Université Paris X-Nanterre [email protected] Résumé : En théorie des jeux, la convention est définie comme une forme particulière de solution aux problèmes de coordination des actions individuelles, lorsque les joueurs ont des intérêts communs. En s’appuyant sur une revue critique de cette littérature abondante, que nous qualifions d’approches utilitaristes des conventions, stratégique ou évolutionniste, l’article s’interroge sur une caractéristique des conventions : leur possible sous optimalité, ce qui implique un défaut de coordination. Isolant clairement l’équilibre Pareto optimal de l’équilibre risque-dominant, les jeux du type « chasse au cerf » apparaissent comme les mieux adaptés pour poser le problème de ces « mauvaises conventions ». De fait, le suivi d’une convention sous-optimale peut être individuellement rationnel en statique et évolutionnairement plus stable en dynamique. Seule la mobilité des agents, et donc leur choix a posteriori d’adhésion à une convention, permet d’éviter de tels défauts de coordination. Mots clés : convention, théorie des jeux, théorie des jeux évolutionniste, risque-dominance, défaut de coordination Thèmes : 5 – 11 Les conventions sont des règles de coordination, respectées avec une forte régularité, ou encore suivies et perpétuées parce qu’elles vont simplement de soi. Elles viennent régler les petits et grands problèmes de coordination de la vie économique et sociale. Ainsi, on observe souvent dans un collectif de travail, la mobilisation de conventions pour résoudre de petites décisions quotidiennes comme la durée ou le moment de la pause mais aussi de plus grandes décisions comme le niveau d’effort ou le mode de fixation des rémunérations. Or, la caractéristique fondamentalement arbitraire de la convention (au sens où il y a toujours plusieurs solutions envisageables) rend toujours possible le fait que les individus adoptent une « mauvaise » solution. Si l’on peut Pareto-ordonner les conventions, il semble alors que l’on puisse parler indifféremment du choix d’une mauvaise convention ou d’un défaut de coordination. Au niveau micro-économique, pour reprendre l’exemple du monde du travail, on peut concevoir qu’un collectif soit bloqué dans une organisation inefficace, alors que chacun sait que d’autres organisations du travail existent et seraient tout aussi stables. C’est d’ailleurs pour formaliser une composante de l’X-efficiency, que Harvey Leibenstein (1982, 1987) a mobilisé le concept de convention dans un cadre de théorie des jeux. En fait, l’intégration de la notion de convention en économie par le biais de la théorie des jeux a été opérée non pas par un économiste mais par un philosophe du langage, David Lewis (1969), qui 1 s’appuie sur la théorie des jeux de coordination de Schelling (1960), jeux caractérisés par la multiplicité des équilibres. Lewis va faire de la convention la solution arbitraire d’un problème de coordination, se présentant comme une régularité de comportement où chacun, de manière rationnelle, se conforme au comportement qu’il croit que l’autre adoptera. Mais, aujourd’hui, l’auteur le plus souvent mentionné dans les travaux qui veulent faire référence à l’approche économique des phénomènes conventionnels est certainement Peyton Young (1993, 1996, 1998)1. Il s’agit alors de mobiliser la théorie des jeux évolutionniste en insistant sur l’émergence des conventions ou leur origine (question délaissée par Lewis). Fondamentalement, la convention est de même nature chez Lewis et chez Young : un équilibre de Nash dans un jeu de coordination, ou encore un équilibre de coordination. Néanmoins, si la convention en appelle à la rationalité des agents chez le premier auteur, elle relève beaucoup plus de la stabilité d’un système d’automates calculateurs chez le second. Cependant, ces deux approches différentes, stratégique et évolutionniste, peuvent se compléter l’une l’autre pour proposer une explication utilitariste des conventions2 : on suit des conventions par intérêt, comme des joueurs plus ou moins rationnels implémentent un équilibre de Nash dans une matrice de gains. Or, la possible sous-optimalité paretienne de la convention pose question. Pourquoi donc des joueurs maximisateurs de gains se mettraient-ils à suivre des conventions dont ils savent qu’elles ne sont pas optimales pour eux-mêmes comme pour les autres ? Autrement dit, c’est une explication des défauts de coordination par la régularité des comportements conventionnels que l’on cher che ici. La première partie du texte rend compte de l’étendue du champ couvert par l’approche stratégique des conventions et étudie les liens entre le type de convention formalisée dans une interaction donnée et l’optimalité de la solution. On appellera co nvention les stratégies jouées à l’équilibre de Nash sélectionné. Pour expliquer le choix d’une mauvaise convention, il faudra ajouter au critère paretien celui de risque-dominance (Harsanyi et Selten, 1988), deux critères que les jeux du type « chasse au cerf » permettent d’isoler clairement. Mais la rationalisation du processus de sélection qui s’ensuit, dénature beaucoup l’aspect conventionnel de la solution. C’est pourquoi, dans le cadre de la théorie des jeux évolutionnistes où l’hypothèse de rationali té des joueurs est affaiblie, la seconde partie s’attachera à montrer comment sont départagées les conventions Pareto -optimales et risque-dominantes lors de leur émergence. Le résultat a priori paradoxal que nous obtenons est qu’une approche fondée sur l’ intérêt et le calcul a plus de facilité à justifier le suivi de mauvaises conventions que l’inverse, au détriment donc de conventions alternatives, pourtant équilibres de Nash Pareto-optimaux ! Il y aurait donc une persistance des défauts de coordination, à moins d’introduire une hypothèse de mobilité des agents, impliquant en quelque sorte une mise en concurrence des conventions. 1. LES CONVENTIONS ET LES PROBLÈMES DE COORDINATION Depuis les travaux de Lewis, l’analyse stratégique des conventions s’est co nsidérablement étoffée et, aujourd’hui, elle n’est plus confinée aux seuls jeux de coordination. Avec les travaux de Leibenstein, elle s’est étendue aux problèmes de coopération comme dans le dilemme du prisonnier. 1 Même si, comme c’est le cas ici, sa formalisation n’est pas reprise. Il en ressort que l’approche des conventions, à laquelle ce texte est consacré, se distingue de celle connue sous le terme générique de « Économie des conventions ». Cf. Batifoulier (2001) pour une mise en perspective des différentes théories des conventions. 2 2 Cependant, même dans ce dernier cas, la solution « convention » n’a de sens que si les joueurs ont à résoudre un problème de coordination, ou encore s’ils ont un intérêt commun à atteindre un résultat donné du jeu, équilibre ou non. Cette définition assez large de la convention explique qu’elle p uisse être considérée comme solution de plusieurs configurations dérivées du même jeu générique. 1.1. A chaque configuration, sa convention Nous proposons ici de différencier les grandes classes de jeux non coopératifs où existe, sous une forme ou une autre, un problème de coordination. Ce travail de classification sera mené à partir d’un jeu (tableau 1) où deux individus, César et Rosalie, ont les deux mêmes stratégies possibles X et Y. Il s’agit d’un jeu – classique dans la littérature – statique, symétrique, en information complète et imparfaite dans lequel a, b, c et d sont des paramètres quelconques. Tableau 1 : Matrice de gains d’un jeu générique 2× ×2 Rosalie X Y (a,a) (b,c) A B Y (c,b) (d,d) C D Ordre de lecture : (gain de César, gain de Rosalie). César X A partir de cette matrice de gains, nous distinguons dans le tableau 2, différentes classes de jeux répertoriés selon le nombre d’équilibres, leur Pareto -optimalité et leur risque-dominance3 (dans le cas où a > d)4. 3 La risque-dominance est un critère de classement – défini et axiomatisé par Harsanyi et Selten (1988) – non pas de toutes les issues du jeu mais uniquement des équilibres de Nash. On peut donc considérer que dans un jeu où l’équilibre de Nash est unique, il est par défaut risque-dominant. Dans le cas où existent deux équilibres, on calcule de la manière suivante ce critère de dominance. Soient ui et vi positifs, avec i=1,2, les pertes subies par le joueur i s’il dévie respectivement des équilibres de Nash U et V : • soit u1u2 > v1v2 et U risque-domine V • soit u1u2 < v1v2 et V risque-domine U • soit u1u2 = v1v2 et U et V sont risque-équivalents (Harsanyi et Selten, 1988, p. 87) 4 Le même travail avec a < d donnerait un tableau en partie symétrique. Le cas a = d ferait apparaître des configurations de jeu « limites » où les équilibres de Nash des jeux RO, DP, RV et CC seraient tous Pareto-optimaux au sens large (ce qui enlève notamment tout intérêt au DP) et ne modifierait pas les équilibres des jeux JC et CT. 3 Tableau 2 : Type de jeux et qualification des équilibres5 d-b<0 d-b>0 a-c>0 a-c<0 Equilibre : A A Pareto-optimal et risque-dominant RO Equilibres : B et C B et C Pareto-optimaux et risque-équivalents6 si b = c si b ≠ c CT JC Equilibres : A et D A Pareto-optimal Equilibre : D D Pareto-dominé et risque-dominant DP si (a–c) > (d–b)7 A risque-dominant RV si (a–c) < (d–b) D risque-dominant CC RO : règle d’or ; DP : dilemme du prisonnier ; JC : jeu du croisement ; RV : jeu du rendez-vous ; CC : jeu de chasse au cerf ; CT : jeu de la coupure téléphonique Chaque classe de jeux8 présente une configuration spécifique où la notion de convention, fournissant une solution à l’interaction, prend une forme particulière. Ecartons tout d’abord le cas de la « règle d’or »9, où le résultat mutuellement avantageux est l’équilibre du jeu unique, Pareto dominant toutes les autres issues. Sans concertation, se forme un accord évident et unanime entre César et Rosalie pour le même résultat. Cet accord peut être qualifié de conventionnel car il va de soi. La solution étant triviale, l’intérêt théorique de la convention est ici assez faible, voire nul. Le dilemme du prisonnier, bien que présentant également un équilibre de Nash unique, constitue une configuration opposée. En effet, la notion de convention est ici loin d’être triviale. Elle peut même paraître surprenante car l’équilibre de Nash, néfaste à tous puisque Pareto -dominé par au moins une autre issue, n’a rien pour aller de soi. En fait, l’application de la n otion de convention comme solution à ce type de jeux ne cherche pas à qualifier l’équilibre mais au contraire à s’en éloigner ! La notion de « convention d’effort » de Leibenstein (1982, 1987) permet, en effet, d’échapper à l’équilibre sous optimal, et la coopération, pourtant bien improbable dans un DP, émerge si l’on se force individuellement à se coordonner avec autrui sur un résultat donné, mutuellement avantageux mais hors équilibre. Coopérer, ce serait taire les antagonismes évidents du 5 On se restreint aux équilibres de Nash purs. En effet, intuitivement il est beaucoup plus difficile d’accepter qu’un équilibre en stratégies mixtes puisse correspondre à un comportement conventionnel. « Ce type de ‘coordination’ n’est pas satisfaisant […]. Ce que chacun veut est que la coordination soit garantie, non qu’il existe une (petite) probabilité qu’elle puisse être atteinte. Aussi, il n’est pas clair que les joueurs apprennent quan d ils jouent constamment la stratégie mixte » (Goyal et Janssen, 1996). 6 En effet, on a ici u1u2 = v1v2 soit (c-a)(b-d) = (c-a)(b-d). 7 Ici la condition de risque-dominance est (a-c)² > (d-b)² qui devient (a-c) > (d-b), étant donné la positivité des deux termes. 8 Nous avons utilisé ici des appellations « conventionnelles » pour qualifier ces types de jeux, notamment celles mises en avant par Walliser (1986). 9 En fait, ce type de jeux n’a pas d’appellation communément admise ; celle de « règle d’or » nous paraît la plus satisfaisante. 4 jeu pour revaloriser l’enjeu de la coordination qui était caché derrière les conflits. Néanmoins, les deux joueurs peuvent-ils réussir à « tenir » une coordination instable par définition (puisque non équilibre de Nash) sans dispositif extérieur ? Dans le cas des comportements a priori conflictuels entre salariés et employeurs (niveau d’effort, niveau de rémunération), Leibenstein soutient que les partenaires coopèrent au lieu de tomber dans la solution rationnelle mais non raisonnable. Mais, pour ce faire, il faut que chaque partie fixe en son sein une règle qui éloigne du comportement opportuniste et autorise ainsi la coopération entre les parties. Dans le cas des salariés, que privilégie Leibenstein, c’est un « étalon d’effort entre collègues »10 qui joue ce rôle de vecteur de coopération. Cet étalon se présente comme une convention car chaque salarié qui entre dans l’entreprise, l’observe, l’adopte et la perpétue. Mais cette convention d’effort n’émerge pas de la relation bilatérale entre l’employeur et le salarié. Ell e résout leur problème de coopération verticale en assurant d’abord une coordination horizontale entre salariés (concernant leur effort), d’une part, et entre employeurs (concernant leur réputation), d’autre part. La convention d’effort, solution instable dans un DP, provient finalement et plus classiquement d’un des équilibres de Nash d’un jeu de coordination 11. Au sein du DP, la convention suivie n’est donc pas forcément l’équilibre du jeu. Elle n’y est pas auto-renforçante, mais elle perdure car elle est soutenue par la menace implicite d’une sanction qui viendra punir celui qui déroge à la convention et fait défection. En fait, cette sanction n’est autre que la perte associée à l’échec de la coordination horizontale dans le jeu de coordination associé. Chez Leibenstein, la sanction s’applique à celui qui ne suit pas la convention d’effort, c’est -à-dire qui ne s’est pas coordonné avec ses collègues, en dérogeant par exemple à la déontologie professionnelle. Elle vient du groupe d’ouvriers et non du patron. Au total, la convention comme solution au DP, ne peut être qu’une « convention externe » 12, c'est -à-dire une convention qui s’applique bien à un jeu donné, mais dont la stabilité trouve sa source de manière externe, dans un autre jeu. On peut alors difficilement savoir, à partir du seul DP, si la convention suivie est bonne ou mauvaise. Pour le dire, il faudrait connaître la teneur de la coordination qui s’est jouée en amont entre les salariés. C’est en effet le niveau du standard d’effort collectif qui i nduit la coopération entre les acteurs du DP. Rien n’interdit que ce standard soit faible, auquel cas la solution individualiste du DP perdurera. Pour lever cette incertitude, il faudrait savoir comment les salariés en viennent à se coordonner, entre eux, sur une convention d’effort. Le problème se rabat alors clairement sur les jeux de coordination. Les jeux du rendez-vous13, de la chasse au cerf14, du croisement et de la coupure 10 Peer group standard effort. 11 Dans la même perspective, Schotter (1981, p. 159) présente les « conventions de guerre » comme un moyen d’éviter l’équilibre de Nash (utilisation par deux pays de l’arme nucléaire) pour condui re à une solution instable, mais raisonnable et optimale (uniquement les « armes conventionnelles »), grâce à une concertation au sein de chaque pays tenant compte de la peur des dommages. 12 Dans le même ordre d’idées, pour désigner ces conventions d’un ty pe particulier qui viennent résoudre un DP, Orléan (1997) emploie le terme de « conventions légitimées » et Van der Lecq (1996) préfère celui « d’institutions ». 13 Nom que l’on peut donner à tous les jeux qui s’inspirent de l’exemple resté célèbre de point focal, à savoir la Gare centrale à New-York, proposé par Schelling (1960, p. 55). 5 téléphonique15, sont quatre types différents de jeux de coordination. Leur caractéristique commune est de posséder deux équilibres de Nash. Dans les deux premiers jeux, il s’agit pour les deux joueurs de choisir la même stratégie (dans l’un, se rendre au même endroit pour se retrouver, dans l’autre, chasser le même animal) ; dans les deux autres, il faut au contraire que les deux joueurs choisissent des stratégies différentes car complémentaires (dans l’un, freiner et passer, dans l’autre, rappeler et attendre d’être rappelé). Dans un jeu de coordination, il n’existe pas de meilleure stratégie systématique au sens où X (resp. Y) est la meilleure stratégie que si l’autre joue X (resp. Y), dans RV et CC, ou Y (resp. X), dans JC et CT. Néanmoins, comme dans la règle d’or, il n’y a pas d’antagonisme entre les joueurs : il est individuellement avantageux de se coordonner sur un des équilibres, il existe bien des intérêts communs. La convention sert à sélectionner l’un des équilibres de Nash car si la rationalité des agents suffit à calculer ces équilibres, elle échoue pour ce qui est d’en singulariser un parmi les autres (Rabin, 1994). Le problème de coordination est résolu quand non seulement chacun choisit la stratégie liée à la convention mais aussi s’attend à ce que l’autre en fasse autant. Ainsi, pour César, choisir X ou Y devient une affaire conventionnelle pensant, à distance, que Rosalie en fera autant. L’équilibre de Nash du jeu sélectionné apparaît comme un repère conventionnel car il a retenu l’attention des deux joueurs : il appartient à leur histoire commune, il a la force du précédent. En reprenant les termes de Lewis, les joueurs se sont coordonnés sur la base d’une régularité de comportement ayant le statut de convention stable car auto-renforçante, du fait de son statut d’équilibre de Nash. Chacun, non seulement, maintient so n action si l’autre en fait autant, mais préfère qu'il en soit ainsi. Ici, la convention n’a donc pas besoin d’être renforcée par un dispositif extérieur au jeu. On peut alors parler de « convention interne » par opposition à la convention externe dans les jeux de coopération. Elle est équilibre de Nash du jeu de coordination et peut justement fournir un appui à la convention externe d’un DP. Le tableau suivant caractérise plus en détails les différentes configurations. 14 Le jeu de la chasse au cerf est adapté de la parabole de J-J. Rousseau que l’on trouve dans son « Discours sur l’origine de l’inégalité parmi les Hommes ». Rousseau étudie le cas d’hommes sauvages qui n’ont pas de contrainte morale ou sociale. « Voilà comment les hommes purent insensiblement acquérir quelques idées grossières des engagements mutuels, et de l’avantage de les remplir mais seulement autant que pouvait l’exige r l’intérêt présent et sensible ; car la prévoyance n’était rien pour eux, et, loin de s’occuper d’un avenir éloigné, ils ne songeaient même pas au lendemain. S’agissait -il de prendre un cerf, chacun sentait bien qu’il devait pour cela garder fidèlement so n poste ; mais si un lièvre venait à passer à la portée de l’un d’eux, il ne faut pas douter qu’il le poursuivît sans scrupule, et qu’ayant atteint sa proie il ne se soucia fort peu de faire manquer la leur à ses compagnons » (Rousseau 1754, p. 59). Comme l’on peut l’apprécier, l’histoire tient en une phrase. Il n’est pas question d’analyse stratégique ni de convention. Pourtant, ce court passage a donné lieu a une abondante littérature concernant l’interprétation stratégique des conventions. 15 Ce jeu, récurrent sous la plume de Lewis, décrit le problème de coordination de deux individus qui cherchent à reprendre leur communication téléphonique quand celle-ci a été coupée. Qui doit rappeler l’autre ? 6 Tableau 3 : Types des jeux et des conventions associées Forme particulière Caractéristiques Type de solution apportée Types de jeu prise par la essentielles du jeu au jeu par la convention convention Équilibre de Nash Accord unanime et Règle d’or Entérine la solution unique Pareto optimal trivial Étalon d’effort Permet de sortir de Dilemme du Equilibre de Nash externe car provenant l’équilibre de Nash par une prisonnier unique, sous optimal d’un jeu de solution Pareto améliorante coordination Pure coordination : Sélectionne un des deux Jeu de la coupure Régularité de Deux équilibres de Nash équilibres impossibles à téléphonique comportement Pareto-optimaux départager sinon Deux équilibres de Sélectionne un des deux Jeu du Règle de répartition, Nash, Stackelberg, équilibres favorable à l’un, croisement ordre de priorité Pareto-optimaux défavorable à l’autre Deux équilibres de Sélectionne un équilibre de Point focal Jeu du rendez– Nash, le même Pareto Nash, non pas forcément ou repère vous optimal et risquecelui qui est Pareto-optimal conventionnel dominant Deux équilibres de Sélectionne un équilibre de Régularité Jeu de la chasse Nash, un Pareto optimal Nash, risque-dominant ou « prudente » de au cerf et l’autre risque Pareto-optimal comportement dominant Ce tableau nous permet de poser la question du suivi d’une mauvaise convention ou du défaut de coordination. Dit autrement, est-ce que se coordonner par convention garantit un choix collectif optimal (au sens parétien du terme) ? Dans CT, les deux équilibres sont identiques et Pareto optimaux ; on ne peut les départager. Dans JC, chacun des équilibres avantage un joueur plutôt que l’autre. En ce sens, les deux équilibres sont opposés ; plus précisément, il s’agit de deux équilibres de Nash, Pareto-optimaux, correspondant chacun à un équilibre de Stackelberg pour celui qui passe et oblige l’autre à freiner. La convention doit fixer l’ordre de priorité, et si chacun arrivé au croisement préfère un ordre plutôt que l’autre, collectivement il n’existe pas de bonne ou mauvaise convention. Enfin, dans les jeux RV et CC, les équilibres sont Pareto-ordonnés. Or, en premier lieu, les joueurs adoptent une convention pour réussir leur coordination (se retrouver, choisir le même gibier à chasser pour revenir non bredouille), ou encore pour éviter les issues où les stratégies sont incompatibles pour la réussite de l’action collective en jeu. Peu importe que la solution soit la meilleure ou non, l’important est qu’elle existe. Serait -il donc possible que suivre une convention présente un manque à gagner ? Pour y répondre, il faudra s’intéresser à l’autre critère de classement des équilibres de Nash, la risque-dominance, sachant que dans RV, le même équilibre est Pareto optimal et risque-dominant, tandis que dans CC, l’équilibre Pareto -optimal est distinct de l’équilibre risque -dominant. C’est donc ce dernier jeu qui pose avec le plus d’acuité la question de l’arbitrage entre considérations d’optimalité et considérations de risque pour le choix d’une convention. 1.2. Une bonne convention est-elle optimale ou peu risquée ? L’analyse stratégique des conventions arrive bien à positionner la convention par rapport à l’équilibre de Nash, elle achoppe cependant sur la liaison convention -optimalité. En effet, comme 7 nous l’avons laissé entendre plus haut, il es t toujours possible que la convention, dans une interaction RV ou CC, corresponde à la solution sous optimale. On comprend mal – a priori • pourquoi des joueurs qui suivent des conventions par intérêt personnel finissent par adopter des conventions dont ils savent qu’elles ne maximisent pas leur intérêt personnel. Les joueurs sont -ils irrationnels lorsqu’ils s’accordent sur le résultat sous -optimal donnant sens à la maxime : « le mieux est l’ennemi du bien » ? Dans CC, spécifié dans le tableau 4, ne vaut-il pas mieux se contenter d’un lièvre plutôt que mourir de faim ? Tableau 4. La chasse au cerf Chasseur n°2 Cerf Lièvre (Laisser filer le (Attraper le lièvre et rabattre le lièvre) cerf) Chasseur n°1 Cerf (Laisser filer le lièvre et rabattre le cerf) Lièvre (Attraper le lièvre) (3, 3) (−10, 1) (1, –10) (1, 1) Pour se nourrir, deux individus totalement libres peuvent chasser le lièvre ou le cerf. L’avantage du lièvre est qu’il peut être chassé seul alors que pour le cerf, il faut être deux, l’un devant faire le rabatteur. Toutefois, le cerf a un résultat nutritif plus important (utilité de 3 contre 1 pour le lièvre). Si un chasseur chasse le cerf seul, il n’a aucune chance de se nourrir et il meurt (d’où une utilité de - 10). C’est pour ce type de configurat ion CC que Lewis recourt implicitement à la distinction entre une « bonne » convention et un « bon équilibre ». La convention est soutenue par la force du précédent qui constitue le gage d’une coordination réussie. Elle indique quelle attitude adopter en fonction de celle adoptée hier, par exemple chasser le lièvre ou le cerf. Peu importe la teneur de la convention, celle-ci sera considérée comme « bonne » car elle évite l’absence de coordination. Mais, ceci implique que le précédent peut aussi bien soutenir la convention Pareto-optimale que risquedominante. Dans ces conditions, le précédent, pourtant vecteur d’efficacité, peut accoucher d’une mauvaise solution, ce que reconnaît Lewis. En effet, chasser le lièvre est une convention aussi longtemps que tous les chasseurs ont attrapé séparément des lièvres dans le passé plutôt que de rabattre ensemble un cerf mais cet équilibre n’est pas « un bon équilibre de coordination », (Lewis, 1969, p.47). La théorie de Lewis n’est pas outillée pour traiter de ce cas de défaut de coordination où une convention peut correspondre à un « mauvais » équilibre. Pour traiter ce type de problème, nous devons mieux spécifier le type de rationalité des joueurs comme nous y invitent les travaux de Harsanyi et Selten (1988). Chaque joueur sait que l’autre est rationnel, donc chacun sait que l’autre est capable de calculer les deux équilibres de Nash. Mais l’hypothèse de rationalité parfaite, sans autre précision, ne nous dit rien sur la sélection des équilibres. En particulier, elle n’implique pas une prédilection a priori pour les situations collectivement optimales. Donc, il n’est pas irrationnel que, dans son processus de prise de décision, chaque joueur intègre une probabilité non nulle que l’autre ne 8 choisisse pas la convention Pareto-optimale. Dans ce cas où les joueurs se donnent des probabilités subjectives sur les possibles actions d’autrui, la rationalité est non seulement parfaite mais également bayésienne et c’est l’espérance de leur bien -être que les agents maximisent. Or, il se peut que l’espérance de bien -être ne soit pas individuellement maximisée en choisissant l’équilibre Pareto optimal ; c’est effectivement le cas dans le jeu de la chasse au cerf. Pour le premier chasseur, Cerf est la meilleure stratégie s’il pense qu e l’autre chasseur choisira également Cerf avec une probabilité p telle que son espérance de gains soit strictement supérieure à celle associée à la stratégie Lièvre. Soit : ap + b(1-p) > cp + d(1-p), ce qui implique p > (d −b) (1−(−10)) = 11 . = (a −c)+(d −b) (3−1)+(1−(−10)) 13 Par conséquent, Lièvre est la meilleure stratégie si le premier chasseur pense que l’autre choisira également Lièvre avec une probabilité : (1-p) > (3−1) (a−c) =2 . = (a−c)+(d −b) (3−1)+(1−(−10)) 13 Le jeu étant symétrique, il en est de même pour le second chasseur. Dans ces conditions, chasser le lièvre demande un niveau de croyance ou de prévisions sur le comportement d’autrui beaucoup moins exigeant : il suffit de croire un peu (probabilité subjective de 15.4%) que l’autre risque de chasser le lièvre pour faire comme lui, alors qu’il faut être presque convaincu (probabilité subjective d’au moins 84.6%) qu’il va chasser le cerf pour faire de même. En d’autres termes, si la valeur minimale requise de p est supérieure à la valeur minimale requise de (1-p), alors l’équilibre (Cerf,Cerf) apparaît plus risqué que (Lièvre,Lièvre). On a donc bien : pmin > (1-pmin) ⇔ (a – c) < (d – b), condition que nous avons précisée dès le tableau 2. L’équilibre (Lièvre,Lièvre) est dit risque dominant, conformément à la définition qu’en donnent Harsanyi et Selten (1988). L’objectif de ces auteurs est de montrer qu’en cas de multiplicité des équilibres, la sélection de l’un d’eux peut s’effectuer de manière endogène en usant de la seule rationalité. Or, ils insisten t bien sur le fait que la risque-dominance et la Pareto-dominance correspondent à deux critères distincts et possibles de rationalité. « La risque-dominance est fondée sur une rationalité individuelle : c’est une extension de la rationalité bayésienne […] si un équilibre E1 risque-domine l’équilibre E2, cela signifie que, dans une situation où les joueurs sont indécis quant à savoir lequel de E1 ou de E2 sera le résultat effectif, tout joueur, qui essaie de maximiser son espérance de gains conditionnellement à des probabilités subjectives rationnellement choisies sur les stratégies de l’autre joueur, optera pour E1. Au contraire, la domination en gains [ la Pareto-dominance] est fondée sur une rationalité collective : elle s’appuie sur l’hypothèse selon laque lle en l’absence de raisons contraires, les joueurs rationnels vont choisir un équilibre procurant à tous des gains plus élevés, plutôt qu’un autre leur procurant des gains plus faibles. En d’autres termes, elle s’appuie sur l’hypothèse selon laquelle des individus rationnels vont coopérer pour poursuivre leur intérêt commun si les conditions le leur permettent16» (souligné par nous) (1988, p. 356). Dans une société de chasseurs où la rationalité est de connaissance commune « individuelle », le résultat du jeu sera (Lièvre, Lièvre) ; dans une autre société avec cette fois-ci une rationalité « collective » de connaissance commune, c’est l’issue Pareto -optimale (Cerf, Cerf) qui sera choisie. Si l’on adhère à cette hypothèse ajoutée à la rationalité initiale d es joueurs lewisiens, la convention perd alors de son arbitraire, caractéristique pourtant première d’une convention. En effet, 16 Par exemple, les conditions du dilemme du prisonnier ne le permettent pas. 9 l’information complète sur le jeu et la connaissance du type de rationalité des joueurs suffisent à désigner sans erreur les stratégies d’équilibre retenues. Décréter que les joueurs sont rationnellement collectifs ou bayésiens, cela revient à les doter dès le départ d’un critère de sélection supplémentaire pour implémenter un équilibre de Nash parmi plusieurs, résolvant de la sorte tout problème de coordination avant même de s’y confronter. A ce stade, on peut alors se demander ce qu’il reste de conventionnel à la solution adoptée pour résoudre la coordination ? Plus grand chose sans doute. Des individus intellectuellement si bien dotés par la nature n’ont plus besoin de conventions pour gérer leurs interactions17… Donc pour interroger l’approche utilitariste des conventions sur l’optimalité ou non des conventions sans initialement « piper les dés », il faut changer d’hypothèse sur l a rationalité des joueurs. De la sorte, on explique mieux pourquoi la théorie des conventions s’est essentiellement développée dans le champ de la théorie des jeux évolutionnistes. Il s’agit dans ce cadre, où il n’est plus question de rationalité parfaite mais de joueurs myopes et de naïfs, de prédire lequel des équilibres de coordination rivaux prendra le statut de convention et ceci de manière durable : l’optimal ou le moins risqué ? 2. QUAND LES « MAUVAISES » CONVENTIONS SE RÉVÈLENT ÉVOLUTIONNAIREMENT ET STOCHASTIQUEMENT PLUS STABLES « Il est sans doute plus utile de moins se focaliser sur la rationalité et de penser les conventions comme le fruit d'un processus évolutionniste» (Sugden, 1989, p.90-91). La théorie des jeux évolutionniste apparaît comme une sérieuse candidate pour l’explication des conventions dès lors que l’on insiste plus particulièrement sur l’un des traits propres à tout comportement conventionnel – et que nous avons négligé – à savoir son enracinement dans le passé. Si des agents choisissent une solution dite conventionnelle, cela signifie qu’ils ne l’ont pas inventée à l’instant ; en quelque sorte elle était à leur disposition pour leur éviter des calculs et raisonnements infinis. Elle vient du passé. Cela a une première implication directe : le problème de coordination en question a déjà eu lieu. Une théorie des conventions devrait donc concevoir des interactions qui se répètent. Par ailleurs, venir du passé ne suffit pas pour prétendre être une solution, il est nécessaire que les succès passés d’un comportement confèrent à ce dernier une prégnance reconnue pertinente par les individus. Autrement dit, on suppose que les agents sont sensibles à la force du précédent ; ils préfèrent se conformer à un précédent réussi plutôt que d’imaginer un nouveau comportement. C’est une condition nécessaire, sans elle point de régularité dans le temps. Il semble alors logique de plaider pour une théorie des conventions mettant en scène des agents dont les décisions sont prises en regardant le passé plutôt que l’avenir. Or, la théorie des jeux évolutionniste associe ces deux caractéristiques que nous venons de qualifier de nécessaires : approche dynamique, les interactions y sont récurrentes18 ; supposant la rationalité limitée, les agents qu’elle met en scène calculent leur espérance de gains en fonction uniquement de l’information issue des périodes précédentes. Au sein de la micro-société de joueurs, qui constitue le système en évolution, chacun est 17 D’ailleurs, Harsanyi et Selten, qui nous intéressent ici à cause du concept de risque -dominance, n’utilisent jamais celui de convention ! 18 Les jeux sont dits récurrents lorsque les interactions sont répétées entre des joueurs différents à chaque fois. 10 myope : personne n’anticipe l’aveni r. De plus, aucun joueur ne reconnaît ses partenaires. Ainsi, Rosalie et César, si le hasard fait qu’ils se rencontrent lors d’une interaction, que ce soit à la première ou à la nième période du jeu, ne s’identifient pas l’un l’autre. Avec Mailath (1998), on peut ajouter au qualificatif de myope celui de naïf. En effet, période après période, chacun joue sa stratégie en réagissant par rapport aux états passés du système dans sa globalité et ainsi, de manière non intentionnelle, contribue au changement du système, ou encore à son évolution. « Les joueurs ne croient pas – ne comprennent pas – que leur propre comportement affecte potentiellement le jeu de leur adversaire et les joueurs en particulier ne tiennent pas compte de la possibilité que leur adversaire s’ajuste également à leurs comportements. » (p.1348). L’ambition de la théorie des jeux évolutionnistes est alors de montrer (i) que des agents à la rationalité ainsi limitée vont jouer in fine un équilibre de Nash, et (ii) comment un équilibre est sélectionné parmi plusieurs (Mailath, 1998). Or, la redéfinition du concept d’équilibre en évolution, que ce soit en termes de stabilité évolutionnaire ou de stabilité stochastique, correspond à des régularités de comportements dans une population. C’est pourquo i il n’y a plus qu’un pas à faire pour reconnaître ici une théorie de l’émergence et de la stabilité des conventions 19, où la question du caractère Pareto-optimal ou risque-dominant de la convention sélectionnée est centrale. 2.1. Le jeu « or » versus « sel » Nous allons prendre ici un exemple, adapté de la chasse au cerf. Par ailleurs, notre démarche évolutionniste est plus fidèle à celle de Kandori, Mailath et Rob (1993) qu’à celle de Young (1998). Enfin, nous considérons une dynamique uniquement en temps discret. A une date mythique t, dans une population de marchands existent deux moyens d’échange, le sel et l’or. Tous les marchands se rencontrent deux à deux selon un tirage aléatoire pour échanger des biens de natures différentes. Étant dans une économie monétaire, ils ne peuvent pas effectuer de trocs et doivent donc, avant de quitter leur boutique, remplir leur bourse soit de sel soit d’or pour régler leurs achats. Dans l’absolu, pour faciliter les échanges, le sel est plus performant. Mais si deux agents ayant choisi des moyens d’échange différents se rencontrent, au moment de rendre la monnaie, celui qui a de l’or a un avantage sur celui qui propose du sel. Ce jeu admet deux équilibres de Nash : l’équilibre « sel » qui Pareto-domine l’équilibre « or », ce dernier risque-dominant « sel ». La question est alors de savoir lequel va s’imposer, avec le temps, à l’ensemble des marchands comme étant l’équilibre de coordination allant de soi. Tableau 5 : Le jeu « sel » versus « or » Marchand 1 Marchand 2 sel or 10,10 4,7 7,4 8,8 sel or A la date t, l’état du système est résumé par la distribution des stratégies parmi les joueurs. Si tous choisissent le sel (respectivement l’or), cet état du système perdurera à l’infini en l’absence de perturbation. Si au contraire, à la date t, la population est mélangée, une proportion pt choisissant le 19 Sugden (1989) suggère la méthode mais c’est à Young (1993) que l’on doit le premier modèle traitant explicitement de l’origine des conventions à l’aide d’une formalisation complète. 11 sel et une proportion 1-pt l’or, le système va évoluer grâce à l’apprentissage des marchands. Comme il suffit de connaître la variable pt pour connaître l’état du s ystème en t ; la série des p0, p1, p2, …, pT retranscrit l’évolution du système de l’origine à la période T, et la fonction b(.) avec b(pt) = pt+1 est la dynamique du système. Le principe d’une dynamique évolutionniste est de vérifier une propriété (D) dite darwinienne (Kandori et alii, 1993) : pt+1 = b(pt) avec (D) : sign(b(p)-p) = sign(πS(p)-πO(p)) avec πS(p) (resp. πO(p)) l’espérance des gains à jouer la stratégie sel (resp. or) quand le système est tel que pt=p. Une stratégie « gagnante » à la période t sera adoptée par une fraction plus importante de joueurs en t+1. Cela repose sur un processus de sélection « naturelle », qui élimine peu à peu les stratégies en moyenne moins efficaces. Dans ces conditions, que la dynamique évolutionniste soit celle de réplication (la plus connue)20 ou de meilleure réponse21, on peut associer à la fonction b(.) une chaîne de Markov dont la matrice de transition est régulière, faite de 0 et de 1 et avec une somme par ligne toujours égale à un, ce qui implique au moins un état stationnaire p* déterminé par la situation initiale du système. On qualifie de stationnaire un état p* tel que b(p*)=p*. Soit ~p = 4/7 (valeur où πS(p) = πO(p) = 10p + 4(1-p) = 8(1-p) +7p) et soit p0 l’état initial du système, la dynamique darwinienne a trois états stationnaires : p*=0 si p0< ~p , p*=1 si p0> ~p et p*= ~p 22 si p0= ~p . On peut appeler ~p la masse critique qui, selon qu’elle est atteinte ou non en période initiale nous indique, sans autre incident lors du processus, si le sel sera ou non le moyen d’échange conventionnel de cette société. Soit p0 est supérieur à 4/7 et l’état stationnaire du système consacrera l’hégémon ie du moyen d’échange sel ; soit p0 est inférieur à 4/7 et l’état correspondra à la « mauvaise » convention or. En d’autres termes, c’est la fréquence initiale des stratégies sel et or qui détermine la convention finalement en vigueur dans le système. Il s’agit de la propriété bien connue de path dependency. A ce stade, on va chercher à tester la résistance de la convention ayant émergé : si des comportements déviants surgissent, comment le système et les joueurs vont-ils être influencés ? La force du précédent (ici, l’hégémonie d’un comportement en t-1) est-elle puissante ou fragile ? Il faut donc caractériser ces conventions, ou plus exactement ces états du système, en terme de stabilité ou de résistance. Pour tester la stabilité d’un état, il faut le pert urber, nous allons donc introduire des chocs exogènes dans la dynamique déterministe. On suppose qu’à l’état stationnaire, où une convention est respectée par tous, une petite proportion d’individus changent de stratégie. On qualifie ces individus de mutants. Si malgré ces mutations en nombre restreint, le système revient à l’état stationnaire de 20 Cette dynamique est directement issue de l’évolution nisme biologique (Fisher, 1930) et introduite en théorie des jeux par Taylor et Jonker (1978). Néanmoins, elle est très critiquable, car elle ignore totalement le niveau micro-économique des joueurs qui n’effectuent aucun calcul. Leur rationalité n’est pas affaiblie mais nulle. En quelque sorte, la dynamique de réplication est une loi macroéconomique sans fondements microéconomiques. 21 Cette dynamique est plus satisfaisante dans le cas de systèmes avec interactions localisées. Sur la base des observations en t-1, les joueurs procèdent à des calculs d’espérance conditionnellement à leur voisinage et jouent leur meilleure réponse. Une fois ces choix décentralisés agrégés, la dynamique macro-économique b(.) doit continuer de vérifier la propriété (D). 22 p*= ~ p correspond bien sûr à l’équilibre en stratégies mixtes du jeu statique. Même s’il peut s’agir d’un état stationnaire du système, de manière générale on refuse le label de convention à cet état, d’autant plus qu’il se révèlera instable. 12 départ alors, selon la définition de Maynard Smith et Price (1973), la stratégie qui lui est associée est dite évolutionnairement stable. A ce test, p*=0 et p*=1 résistent. On qualifie également ces deux états de points fixes asymptotiquement stables (PFAS) : toute trajectoire engendrée par la dynamique, qui prend son départ suffisamment près d’un de ces points fixes (nombre de mutants suffisamment petit), converge vers lui sans jamais trop s’en écarter. Ainsi, les deux équilibres de Nash stricts, correspondent à des stratégies évolutionnairement stables (SES) et l’on peut calculer leur résistance aux mutations. De fait, ce calcul nous ramène à celui de la masse critique ~p =4/7 ou celui de la risque-dominance. Considérons un état où tous les marchands utilisent du sel, la proportion de mutants 1-p devient trop importante, au point de rendre l’abandon du sel inéluctable, dès lors que 1-p est plus grand que 3/7. La résistance de la stratégie sel est donc 3/7 et celle de l’or 4/7. Cette dernière SES, ayant une plus grande résistance, est donc moins facilement déstabilisée par d’éventuelles mutations. Néanmoins, malgré cet avantage pour la stratégie or, les deux équilibres, en tant que PFAS concurrents, peuvent soutenir chacun une convention, fonction de l’héritage historique (les conditions initiales) et des incidents historiques non prévisibles (les mutants). Pour prédire la convention adoptée par une zone monétaire, nul besoin de jugement sur l’optimalité ou sous -optimalité, seule l’histoire importe ! C’est du moins l’impression donnée lorsque l’on se cantonne aux dynamiques darwiniennes déterministes. C’est pourquoi on introduit un processus de mutation continu et aléatoire. Le jeu devient stochastique puisque tout joueur est susceptible de modifier son comportement sans raison apparente, avec une probabilité ε infime mais non nulle. Une fois ce processus de mutation ou d’erreur introduit, la stabilité du système est beaucoup plus complexe. Si on se limitait à un critère de stabilité locale pour les PFAS (avec un phénomène de mutation ponctuel), à présent « les caractéristiques de la dynamique globale deviennent essentielles » et le critère de stabilité stochastique qui s’impose est plus exigeant ; il sélectionne plus fortement les équilibres (Orléan, 1996, p.591)23. En fait, pour toute dynamique respectant la propriété darwinienne, quand le taux de mutation ε tend vers 0, et quelle que soit la situation initiale du système, celui-ci stationnera à long terme « une ‘infinité’ de fois plus longtemps » (Orléan, 1996, p. 597) dans l’état p* que dans tout autre. Cet état est p* dit stochastiquement stable (Foster et Young (1990), Kandori, Mailath et Rob (1993), Young (1993)). En fait, l’état stochastiquement stable (ESS) est celui qui possède le plus grand bassin d’attraction : son potentiel stochastique (le nombre minimal de mutations nécessaires pour atteindre son bassin d’attraction) est faible ou enco re sa résistance (le nombre minimal de mutations pour quitter son bassin d’attraction) élevée. Comme les calculs de résistance et de risque -dominance sont équivalents lorsqu’il n’existe que deux équilibres, il en découle un résultat assez général : dans un jeu avec deux équilibres de Nash, l’un Pareto -optimal et l’autre risque -dominant, c’est le second 23 La dynamique systémique devient une équation différentielle stochastique non linéaire : pt+1 = b(pt) + xt – yt où x et y sont des variables aléatoires de paramètre ε représentant la part d’agents qui expérimentent respectivement sel et or. Ce système dynamique stochastique définit une chaîne de Markov dont la matrice de transition a cette fois-ci tous ses éléments strictement positifs (à cause des mutations, toutes les transitions d’un état à un autre sont rendues possibles). Or, si la matrice est strictement positive, le processus est dit ergodique : à terme, il y a indépendance par rapport aux conditions initiales. 13 équilibre, parce que son bassin d’attraction est plus grand, qui sera progressivement adopté par l’ensemble de la population. PFAS et ESS sont ainsi propices à représenter l’état d’une société guidée par une convention puisqu’ils impliquent bien une régularité de comportement. Néanmoins, concernant l’émergence de la convention, le pouvoir explicatif des deux concepts est très différent. Pour le premier, tout dépend des conditions initiales (en t=0, quelle est la distribution des stratégies dans la population ?). Pour le second, ce sont les caractéristiques de la matrice des gains qui déterminent seules la convention finale (laquelle est risque-dominante ?). Par conséquent, les prédictions sur l’optimalité des conventions sont également différentes. Si l’on considère que seuls les ESS sont à même de représenter des sociétés où règne une convention, alors on prédit que toutes les conventions sont Pareto-dominées. Si on accepte aussi les PFAS comme systèmes de joueurs avec convention, alors tout se joue à la date 0 : le choix de la convention est en quelque sorte déjà fait à l’origine des temps et la dynamique ne nous apprend rien ! Soit le « choix » est déjà là et il peut être sous-optimal, soit il n’est pas déjà fait et il a toutes les chances de l’être. Ces résultats présentent le défaut de coordination comme une issue plus « probable » que l’inverse. Cette conclusion pessimiste est -elle inévitable ? 2.2. Peut-on échapper au défaut de coordination ? Considérer qu’une convention correspond à un ESS plutôt qu’à un PFAS peut être intellectuellement plus satisfaisant. La convention est ainsi associée à l’état le plus résistant possible aux stratégies « incorrectes » pouvant survenir dans la population, de manière certes très rare (n’oublions pas que ε→0) mais également erratique (aléatoire). Cette résistance continue aux comportements aberrants est une caractéristique importante des conventions. Or, si on place les scénarii d’évolution des conventions dans un environnement stochastique, en abandonnant une dynamique déterministe, la théorie des jeux évolutionnistes va-t-elle fatalement et systématiquement justifier la pérennité de défauts de coordination ? Ce résultat serait pour le moins pessimiste, sachant que l’économiste est traditionnellement très attaché à la Pareto-optimalité. De fait, la majorité des travaux actuels de l’approche évolutionniste des conventions s’attache à définir les conditions permettant a contrario l’émergence d’une convention Pareto -optimale. Sachant que la stratégie risque-dominante s’adapte mieux à un univers stochastique et donc hétérogène « alors que l’efficacité de la stratégie Pareto -optimale ne se révèle pleinement que dans des contextes de forte homogénéité des choix » (Orléan, 1996, p. 593)24, on peut s’interroger, sur la possibilité d’échapper à un défaut de coordination programmé, en assurant aux joueurs un environnement homogène par le biais de plus petits voisinages. Si les interactions ont lieu dans un réseau, on s’attend à ce que les joueurs prennent l’habitude de ne rencontrer que les membres de leur voisinage ce qui devrait diminuer les risques de noncoordination et revaloriser le critère paretien dans leur prise de décision. Toute une littérature25, qui se 24 Ou encore, en reprenant les termes de Sugden, les agents sont sensibles à deux qualités des conventions : leur efficacité (Pareto-dominance) et leur polyvalence face à toute autre stratégie (la capacité de diminuer le risque en cas de non coordination). Or, « l’évolution aura tendance à valoriser les conventions ‘polyvalentes’ mais inefficientes par rapport à celles qui sont moins ‘polyvalentes’ et plus efficientes » (Sugden, 1989, p. 94). 25 De manière absolument non exhaustive : Ellison (1993), Blume (1993), Anderlini et Ianni (1996), Berninghaus et Schwalbe (1996). On peut également citer Boyer et Orléan (1992), ces derniers s’intéressant p lutôt à un jeu du rendezvous où l’équilibre Pareto -dominant est aussi risque-dominant. 14 définie comme « théorie économique des conventions », a ainsi intégré dans les modèles évolutionnistes l’hypothèse d’interactions localisées afin de relier propriétés de la convention émergeante et forme du réseau. Mais cette hypothèse supplémentaire ne suffit pas en elle-même. Car, dans un réseau même sans mutation, l’effet contagion par chevauchement des voisinages privilégie lui aussi la diffusion des stratégies risques dominantes (Lee et Valentinyi, 2000). C’est pourquoi, parmi ces modèles, ceux qui cherchent à expliquer l’émergence d’une stratégie conventionnelle Pareto-optimale ont toujours besoin d’une hypothèse supplémentaire pour atteindre leur objectif. Par exemple, la convention peut être optimale s’il existe, contre un coût raisonnable, le moyen d’être flexible (de s’ajuster parfaitement au comportement d’autrui, quelle que soit sa stratégie), et cela dans un réseau unidimensionnel, avec une dynamique de meilleure réponse déterministe (Goyal et Janssen, 1997). Or, sachant que le résultat est le même sans réseau et avec une dynamique stochastique (Galesloot et Goyal, 1997), ce n’est donc pas la modélisation en réseau qui est déterminante, mais bien l’hypothèse de flexibilité. On peut également jouer sur la structure du taux de mutation. Supposer par exemple que le taux dépend de l’état du système (la mutation est moins probable dans l’état Pareto -optimal que dans l’état risque -dominant) permet à l’équilibre optimal d’être stochastiquement stable (Bergin et Lipman, 1996), mais à condition ici que les interactions ne soient pas localisées dans un réseau (Lee, Szeidl, Valentinyi, 2003) ou que le réseau ait une forme très particulière (Jackson et Watts, 2002) ! En fait, pour obtenir l’émergence et l’unicité de la convention P areto-optimale dans l’ensemble de la population, une dernière hypothèse doit être ajoutée : la mobilité des agents dans le réseau. On aborde là une famille de modèles en pleine expansion (Oechssler, 1997 ; Dieckmann, 1999 ; Mailath, Samuelson et Shaked, 2001; Ely, 2002)26, qui suppose que la structure d’interaction n’est plus figée, avec chaque joueur attaché à un nœud du réseau et connecté aux joueurs de son voisinage. A présent, les nœuds du réseau sont des lieux où peuvent se rencontrer tous les joueurs choisissant de s’y rendre. En quelque sorte, ce sont les jeux de coordination de classe CC qui forment les nœuds du réseau. Or, si les joueurs se déplacent dans le réseau, chacun rejoint sciemment un site où la convention jouée en t-1 maximise son espérance d’utilité : parmi un certain nombre de conventions déjà établies en des endroits distincts, les joueurs font le choix a posteriori de leur propre comportement conventionnel ! De la sorte, en chaque nœud du réseau, l’hétérogénéité des stratégies diminue, le risque de non coordination s’affaiblit, la stratégie Pareto -optimale y gagne en attraction et l’on échappe enfin à l’émergence programmée de la convention risque -dominante mais Paretodominée. Ainsi, dans un univers stochastique, des joueurs myopes, naïfs mais mobiles finiront-ils par adopter de bonnes conventions. Nous retrouvons là l’effet régulateur bien connu d’un mécanisme de marché, fondé sur la stratégie « exit » : si la convention en vigueur chez moi est Pareto-dominée par celle suivie par mes voisins, je m’en vais chez eux… Finalement, on ne voit pas ce qui reste de conventionnel dans des choix ainsi définis. Si l’on est capable d’arbitrer entre différentes conventions, en fonction de leurs avantages et coûts comparés, le suivi de la règle ne repose pas sur la préférence pour la conformité mais sur un choix conscient et lucide d’une des branches de l’alternative. Le seul moyen d’éviter un défaut de coordination serait donc d’abandonner le respect des stratégies conventionnelles pour la mise en co ncurrence des différents équilibres de coordination ! 26 Cette modélisation est plus particulièrement appliquée dans le champ de l’économie spatiale (Bhaskar et Vega Redondo, 1996 ; Blume et Temzelides, 2003) et des réseaux sociaux (Goyal et Vega-Redondo, 1999 ; Droste, Gilles et Johnson, 2000). 15 CONCLUSION Les outils de la théorie des jeux permettent donc d’expliquer pourquoi des individus soumis à un problème de coordination ne se comportent pas comme l’âne de Buridan : ils décident malgré l’i ndécidable de la situation. Plus encore, il nous semble que ces mêmes outils peuvent être exploités pour approcher les défauts de coordination de nature macro-économique comme agrégation d’une multitude d’interactions interindividuelles (avec ou sans résea u). En effet, récapitulons les défauts de coordination présentés dans ce texte : un collectif de travail ayant un étalon d’effort faible (induisant le renforcement d’une mauvaise politique salariale), des hommes et leur famille dénutris ne sachant pas attraper un cerf et une économie où la mauvaise monnaie a chassé la bonne. Toute interaction où Pareto-optimalité et risque-dominance entrent en conflit, risque de mener ainsi à une règle de coordination conventionnelle, stable mais « mauvaise ». Ce résultat est imputable soit à la force du précédent qui supporte une convention qui n’est pas un « bon équilibre » (Lewis), soit à une parfaite rationalité individuelle bayésienne (Harsanyi et Selten), soit encore à une dynamique stochastique darwinienne (sensible aux mêmes probabilités du calcul bayésien, mais correspondant alors plutôt à des fréquences). Les moyens d’échapper au défaut de coordination sont également circonscrits : une parfaite rationalité collective, une dynamique déterministe certaine avec une origine des temps où la « bonne » stratégie est majoritaire, et enfin la parfaite mobilités des agents. Il reste à savoir comment réinterpréter ces résultats en terme de politiques économiques, préconisations dont sont friands les macro-économistes. BIBLIOGRAPHIE ANDERLINI L. et IANNI A. (1996), « Path dependance and learning from neighbors », Games and Economic Behavior, n°13, pp. 141-177 BATIFOULIER Ph. (éd.) (2001), Théorie des conventions, Economica. BERGIN J. et B.L. LIPMAN (1996), « Evolution with state-dependent mutations », Econometrica, vol. 64, pp. 943-956. BERNINGHAUS S.K. et U. SCHWALBE (1996), « Conventions, Local Interaction, and Automata Networks », Journal of Evolutionary Economics, vol. 6, pp. 297-312 BHASKAR V. et F. VEGA-REDONDO (1996), « Migration and the Evolution of Conventions », Institut Valencia d’Investigacions Economiques , Université d’Alicante, working paper. BLUME A. et T. TEMZELIDES (2003), « On the Geography of Conventions », Economic Theory, vol. 22, pp. 863-873. BLUME L. (1993), « The Statistical Mechanics of Strategic Interaction », Games and Economic Behavior, vol. 5, pp. 387-424. BOYER R. et A. ORLÉAN (1992), « How do Convention Evolve ? » Journal of Evolutionary Economics, vol. 2, pp. 165-177. COOPER R. et A. JOHN (1988), « Coordinating Coordination Failures in Keynesian Models », The Quarterly Journal of Economics, vol. 103, pp. 441-463. DIECKMANN T. (1999), « The Evolution of Conventions with Mobile Players », Journal of Economic Behavior & Organization, vol. 38, pp. 93-111. 16 DROSTE E., R.P. GILLES et C. JOHNSON (2000), Evolution of Conventions in Endogenous Social Networks, mimeo, Tilburg University. ELLISON G. (1993), « Learning, Local Interaction, and Coordination », Econometrica, vol. 61, pp. 1047-1071. ELY J. (2002), « Local conventions », Advances in Theoretical Economics, vol. 2. FISHER R.A. (1930), The Genetical Theory of Natural Selection, Oxford : Clarendon Press. FOSTER et H.P. YOUNG (1990), « Stochastic evolutionary game dynamics », Theoretical Population Biology, vol. 38, pp. 219-232 GALESLOOT B.M. et S. GOYAL (1997), « Costs of flexibility and equilibrium selection », Journal of Mathematical Economics, vol. 28, pp. 249-264. GOYAL S. et M. JANSSEN (1996), « Can We Rationally Learn to Coordinate ? », Theory and Decision, vol. 40, pp. 29-49. GOYAL S. et M. JANSSEN (1997), « Non-exclusive conventions and social coordination », Journal of Economic Theory, vol. 77, pp. 34-57. GOYAL S. et F. VEGA-REDONDO (1999), Learning, Network Formation and Coordination, Econometric Institute Report 9954/A, Rotterdam. HARSANYI J.C. et R. SELTEN (1988), A General Theory of Equilibrium Selection in Games, Cambridge, MIT Press. JACKSON M.O. et A. WATTS (2002), « On the Formation of Interaction Networks in Social Coordination Games », Games and Economic Behavior, vol. 41, pp. 265-91. KANDORI M., G.J. MAILATH et R. ROB (1993), « Learning, Mutation, and Long Run Equilibria in Games », Econometrica, vol. 61, pp. 1019-1045. LEE I.H., A. SZEIDL et A. VALENTINYI (2003), « Contagion and State Dependent Mutations », Advances in Theoretical Economics, vol. 3. LEE I.H. et A. VALENTINYI (2000), « Noisy contagion without mutation », Review of Economic Studies, vol. 67, pp. 47-56. LEIBENSTEIN H. (1982), « The Prisonner’s Dilemma in the Invisible Hand: an Analysis of intra Firm Productivity », The American Economic Review, n°2, pp. 92-97. LEIBENSTEIN H. (1987), Inside the firm, Harvard University Press. LEWIS D. (1969) Convention. A Philosophical Study, Cambridge, Harvard University Press. MAILATH G. (1998), « Do People Play Nash Equilibrium ? Lessons from Evolutionary Game Theory », Journal of Economic Literature, vol. 36, pp. 1347-74. MAILATH G., L. SAMUELSON et A. SHAKED (2001) « Endogenous Interactions » in The Evolution of Economic Diversity, Pagano et Nicita eds, London : Routledge. MAYNARD SMITH J. et PRICE G.R. (1973), « The logic of Animal Conflict », Nature, n°246, pp. 15-18. OECHSSLER J. (1997), « Decentralization and the Coordination Problem », Journal of Economic 17 Behavior & Organization, vol. 32, pp. 119-135. ORLÉAN A. (1996), « De la stabilité évolutionniste à la stabilité stochastique. Réflexions sur les jeux évolutionnistes stochastiques », Revue économique, vol. 47, pp. 589-600. ORLÉAN A. (1997), « Jeux évolutionnistes et normes sociales », Economie Appliquée, n°3, pp. 177198. RABIN M. (1994), « Incorporating Behavioral Assumptions into Game Theory » in Problems of Coordination in Economic Activity, Friedman éd., Boston, Kluwer Academic Publishers. ROUSSEAU J-J. (1754), Discours sur l’origine de l’inégalité parmi les hommes, édition de 1985, Bordas. SCHELLING T. (1960), The strategic of conflict, Harvard University Press. SCHOTTER A. (1981), The economic theory of social institutions, Cambridge University Press. SUGDEN R. (1989), « Spontaneous Order », Journal of Economic perspectives, n°3, pp. 85-98. TAYLOR P.D. et L.B. Jonker (1978), «Evolutionarily Stable Strategies and Game Dynamics.», Mathematical Biosciences, vol. 40, pp. 145-156. VAN DER LECQ F. (1996), « Conventions and Institutions in Coordination Problems », De Economist, vol. 144, pp. 397-428. WALLISER B. (1986), « Une typologie des jeux à deux joueurs », Economie et société, novembre, n°11, pp. 123-147. YOUNG H.P. (1993), « Evolution of conventions », Econometrica, vol. 61, pp. 57-84. YOUNG H.P. (1996), « The economics of convention », Journal of Economic Perspectives, vol. 10, 2, pp. 105-122. YOUNG H.P. (1998), Individual Strategy and Social Structure : An Evolutionary Theory of Institutions, Princeton University Press. 18