les enseignements de l`économie comportementale
Transcription
les enseignements de l`économie comportementale
Principes de microéconomie Méthodes empiriques et théories modernes Seconde édition Étienne Wasmer, Sciences Po Étienne Wasmer, Sciences Po Chapitre complémentaire : Les enseignements de l’économie comportementale Les enseignements de l’économie comportementale 1 Introduction Ce chapitre est consacré aux développements de l’économie comportementale. Ceux-ci sont suffisamment riches et importants pour qu’un chapitre entier leur soit consacré. L’économie comportementale cherche des fondements psychologiques aux comportements observés. Comme l’indiquent Colin Camerer, George Loewenstein et Mattew Rabin, trois auteurs qui ont profondément influencé le champ, il s’agit d’un domaine qui tente d’améliorer la science économique en générant de nouvelles prédictions théoriques, en affinant les prédictions des comportements dans des contextes de vie réelle et en bonifiant les politiques, publiques mais aussi privées1 . Les recherches nous indiquent que, d’une part, les individus ont des biais cognitifs : même lorsqu’ils disposent potentiellement de toute l’information, il leur arrive de déformer cette information avant d’optimiser leurs choix, par exemple en percevant mal les probabilités d’événements ou les bénéfices de telle action ; d’autre part, même avec une information correctement traitée, ils raisonnent parfois de façon en apparence irrationnelle, au moyen de règles de comportements arbitraires limitant de fait leur choix, c’est-à-dire en prenant directement de mauvaises décisions qu’ils regrettent par la suite ; enfin, ils peuvent vouloir décider de quelque chose pour le futur et ignorer que, dans le futur, ils seront incapables d’appliquer ce choix : à chaque période ils se comportent de façon optimale, en ignorant cependant sur leurs propres comportements. De son côté, la finance comportementale, récompensée à travers le prix Nobel de 2013 de Robert Shiller, tente de comprendre comment les investisseurs se comportent différemment de la théorie de l’individu rationnel. Les exemples de comportements ne cadrant pas avec la vision rationnelle de la microéconomie Prenons quelques exemples de traits comportementaux étudiés dans cette litérature. Le premier est le biais de suroptimisme quant à ses propres capacités. Nous avons tous pensé à un moment que deux jours d’effort suffiraient pour accomplir une tâche 1. Colin Camerer, George Loewenstein et Mattew Rabin, Advances in behavioral economics, Russel Stage Foundation, NY, Princeton University Press, Princeton et Oxford, 2004. Les enseignements de l’économie comportementale difficile (réviser un examen, préparer un cours, remplir une déclaration d’impôt) ; plus dramatiquement, car cela peut avoir des conséquences mortelles, une très large majorité des individus interrogés pense avoir des capacités de conducteurs au-dessus de la moyenne ; alors que la durée optimale de conduite sans interruption est de 2 heures, la plupart des conducteurs font une pause après 3 heures ; la ruée vers l’or dans l’Ouest américain était une croyance irrationnelle dans la capacité des chercheurs d’or à devenir immensément riches ; les réfugiés qui tentent de traverser la Méditerranée en barque ou qui s’agrippent clandestinement au train d’atterrissage d’un avion ont des chances de survie extrêmement faibles ; on pourrait multiplier les exemples de trop grande confiance ayant des conséquences néfastes pour l’individu. Le deuxième est l’aversion à la perte. Les individus ayant acheté des actions dont la valeur a augmenté acceptent volontiers de les vendre ; pour celles dont la valeur a baissé, l’idée d’encaisser la perte est suffisamment désagréable pour qu’ils souhaitent les conserver en dépit de toute rationalité. Lors de la crise de 2007, les vendeurs de biens immobiliers refusaient d’accepter la baisse de la valeur de leurs biens et le volume des transactions immobilières a baissé de façon très importante, alors que les prix des transactions réalisées n’ont baissé que de quelques pourcents : les individus préféraient voir la valeur de leur bien se dégrader plutôt que d’accepter une baisse du prix par rapport au plus haut du marché avant la crise. On pourrait aussi se demander si le trait psychologique consistant à ne pas se débarrasser d’objets devenus parfaitement inutiles et à les laisser s’accumuler n’est pas un symptôme de cette aversion : le coût d’opportunité de l’espace perdu est jugé inférieur à la perte d’utilité de perdre un objet sans aucun usage. Le troisième est l’importance de la présentation des choix, ce qu’on appelle les framing effects. Un exemple classique est donné par Tversky et Kahneman (1981) à propos d’un programme de lutte contre un virus asiatique mortel. Dans une première expérience, 78 % des individus préfèrent, sur un groupe de 600 personnes, « sauver 200 vies – choix A » alors que 22 % des participants choisissent de « sauver les 600 personnes avec une probabilité d’un tiers et ne sauver personne avec une probabilité de deux tiers – choix B ». Mais si on présente ces alternatives de façon logiquement identique mais opposée, le choix A devenant « 400 personnes meurent – choix C » et le choix B devenant « Avec une probabilité de un tiers personne ne meurt et avec une probabilité de deux tiers, 600 personnes mourront – choix D », dans ce cas le choix s’inverse et plus des trois quarts des participants préfèrent désormais le second choix. Plus généralement, des facteurs qu’on jugerait objectivement sans influence sur ces choix semblent pourtant les influencer. Par exemple, au supermarché, les biens les plus coûteux sont en général placés dans les rayons à hauteur des yeux, alors que des biens parfaitement substituables mais de prix plus faibles sont situés en bas. Il suffirait alors de se baisser pour faire une économie substantielle ; mais nous ne le faisons pas systématiquement. Pire, les caddies sont parfois conçus pour ne pas rouler tout à fait droit et donc nous ramener à notre insu vers les rayons. Étant plus près de biens que nous n’avions pas prévu de consommer, nous en achèterions pourtant certains, contrairement à ce que nous avions planifié ou à ce que nous aurions fait si le caddie avait roulé droit. Pire encore, lorsque la climatisation est importante, les consommateurs achètent plus par un réflexe difficile à justifier rationnellement. Lorsque nous voyons du rouge, notre capacité 3 4 Les enseignements de l’économie comportementale à prendre des risques semble augmenter ; pour les hommes, les publicitaires semblent penser que c’est aussi le cas lorsqu’ils voient une jeune femme attirante ; cela explique pourquoi, à l’occasion des salons de l’automobile, les modèles de voitures de sport exposés sont souvent rouges et présentés par des mannequins. Nos actions sont parfois affectées par le contexte : le biais de statu quo vient de ce que nous préférons conserver un choix adopté dans le passé plutôt que de réoptimiser. L’exemple classique est le contrat choisi pour une police d’assurance ou les sommes épargnées pour la retraite lorsque celle-ci est par capitalisation. Dans leur ouvrage classique, deux grands contributeurs de cette littérature, Richard Thaler et Cass Sunstein1 , expliquent que les professeurs d’université oubliaient parfois de répondre au questionnaire leur demandant combien ils voulaient souscrire, ce qui rendait le montant de leur contribution nul. Ils ont suggéré à l’administration d’indiquer par défaut la dernière somme déclarée, à la satisfaction de tous les enseignants étourdis. Nous semblons irrationnellement dépendants des coûts passés (sunk costs). Par exemple, si nous avons acheté un bien dont nous sommes insatisfaits, nous avons tendance à le consommer quand même, puisque nous l’avons payé. Si je loue deux semaines à la montagne, partir au bout de 12 jours peut être rationnel si l’utilité marginale des vacances diminue progressivement. Pourtant beaucoup de gens restent jusqu’au bout. Cette dépendance aux sunk costs est sans doute une façon de refuser d’admettre que nous avons fait une erreur : errare humanum est, perseverare diabolicum est. Pour reprendre d’autres exemples distillés tout au long du manuel, nous avons aussi des problèmes de self-control et d’incohérence temporelle : nous planifions une action pénible pour demain mais, le moment venu, nous décidons de changer de plan et de la reporter à après-demain ; nous avons une difficulté à appréhender les petites probabilités et jouons à la loterie alors que le gain espéré est nettement plus faible que la dépense. Les implications pour l’analyse économique D’innombrables travaux ont démontré l’ampleur de ces comportements déviants par rapport à la rationalité stricte de la théorie microéconomique. Il faut donc relire l’ensemble des résultats obtenus jusqu’ici à l’aune de ces développements, pour les nuancer voire si besoin les contredire. Le lecteur méfiant envers l’économie traditionnelle pourrait voir dans cette accumulation d’exemples la confirmation de ses a priori. L’économie comportementale démontrerait l’inutilité de toute la microéconomie. Pourtant, les scientifiques dont les travaux ont illustré ces biais de rationalité ne vont pas jusqu’à suggérer de supprimer la microéconomie des cursus universitaires. Comme le disait Richard Thaler au Financial Times, jeter la théorie classique revient à se débarrasser de nombreux éléments très utiles2 . 1. Richard H. Thaler et Cass R. Sunstein, Nudge, Improving Decisions About Health, Wealth, and Happinness, Penguin Books, 2008, 2009. 2. « To discard the basic neoclassical framework of economics means throwing away a lot of stuff that’s useful » ; http://www.ft.com/cms/s/2/9d7d31a4-aea8-11e3-aaa6-00144feab7de.html#axzz3AXjdJqkl Les enseignements de l’économie comportementale En réalité, ces comportements, déjà amplement discutés au cours des différents chapitres de ce manuel, sont surtout illustratifs des limites de l’analyse classique. Ils ne remettent cependant pas en question l’essentiel, ce qui est à l’intérieur de ces limites. La capacité descriptive de la microéconomie « standard » est loin d’être parfaite, mais elle permet néanmoins de représenter un cadre d’analyse cohérent des choix et de s’appliquer à plusieurs domaines, ce que les modèles d’économie comportementale ne permettent pas encore : ils sont souvent conçus pour expliquer un phénomène, pas plusieurs. De plus, les expériences où l’on soumet des individus à différentes contraintes de budget et différents prix relatifs montrent que leurs préférences ainsi révélées sont cohérentes à 90 % d’un choix à l’autre (voir chapitre 9) ce qui est l’essence de la fonction d’utilité : une stabilité des préférences. Il faut juste comprendre que, par rationalité, on entend cohérence des choix et pas égoïsme ; l’altruisme peut être individuellement rationnel s’il apporte une certaine satisfaction capturée de manière stable par la fonction de l’utilité de l’individu. Il semblerait irrationnel économiquement d’avoir des enfants compte tenu du coût et de la perte de temps à les élever. Cependant les individus ont clairement une utilité pour s’assurer une progéniture, que ce soit par pur plaisir ou, dans les sociétés primitives, pour que quelqu’un s’occupe d’eux lorsqu’ils seront devenus incapables de s’assumer économiquement ou même physiologiquement. Il est enfin admis que l’utilité des agents économiques peut comprendre, outre le don et sa capacité à s’assurer une descendance, d’autres dimensions telles que le loisir, la création artistique, le bonheur de proches, la gratuité apparente des actes. La liste n’est pas limitative et il suffit de s’assurer que, soumis à differents environnements avec des « prix relatifs » différents, les individus font des choix en cohérence avec leurs choix passés. En outre, même dans le cas où le comportement des individus échappe systématiquement à la rationalité construite par la microéconomie, comme dans le cas de nos biais de perception, notre suroptimisme, notre capacité à être manipulés dans les supermarchés ou par la publicité, la microéconomie ne nous dit-elle pas ce que nous devrions faire et donc a contrario ne pas faire, prouvant ainsi son caractère essentiel ? Ainsi, même quand la micréconomie est défaillante à rendre compte des actes, son caractère normatif reste applicable. Bien sûr, nous n’épargnons peut-être pas assez pour nos vieux jours car nous cédons à l’impulsion de la consommation ; bien sûr, nous épuisons les ressources non renouvelables sans nous soucier du futur ; bien sûr, l’humanité a une tendance spontanée à épuiser les ressources renouvelables, polluer, réduire le nombre d’espèces vivantes. La microéconomie nous explique, à travers ses différents concepts, comment tout ceci se produit et quelle est la situation souhaitable à laquelle il faudrait parvenir, notamment au travers du calcul économique : la valeur du futur pour un individu, pour une génération, la valeur de la préservation d’un écosystème et les ressources présentes que nous devrions sacrifier pour préserver cette valeur, le sentier prévisible du prix du pétrole et le moment auquel nous devrons préférer investir dans une ressource alternative. En d’autres termes, tout ce qui a été vu jusqu’ici doit être conservé, et l’économie comportementale ne remet pas en cause l’intérêt de l’analyse normative ; en revanche, elle souligne les contextes dans lesquels on peut manipuler la rationalité. Le marketing expérimental n’est peut-être pas l’invention la plus enrichissante pour l’humanité ; mais 5 6 Les enseignements de l’économie comportementale il faut savoir que cela existe et le prendre en compte dans notre propre analyse ne serait-ce que pour pouvoir donner tort à ceux qui tentent de nous manipuler. Il faut enfin ajouter un dernier avertissement préalable : ce chapitre intervient en fin d’ouvrage, mais il n’est pas un remords tardif. Il est juste un développement logique de ce qui précède, tant l’ensemble du manuel a distillé tout au long de sa rédaction les limites de la description du comportement par des actes purement rationnels. Dès le chapitre 1, nous soulignions dans l’exemple consacré aux gangs de vendeurs de crack que l’espérance de survie des vendeurs était particulièrement faible ; ou que certains biens avaient un caractère addictif, analyse reprise dans le chapitre 5 ; dans le chapitre 6, nous avions introduit les études sur le bonheur (happiness studies) et constaté que si l’argent ne faisait pas le bonheur, d’autres dimensions comptaient énormément : la stabilité économique ou familiale, la qualité des institutions, la santé, être employé plutôt que chômeur contribuent plus sûrement au sentiment de satisfaction que 10 % de revenu en plus. De nouveau, cela ne remet pas en cause la notion d’utilité. Chacune de ces caractéristiques contribuant à la satisfaction d’un individu pouvait se réinterpréter comme un taux marginal de substitution entre cette dimension d’une part, et une dimension monétaire d’autre part. Le chapitre 7 consacré aux choix intertemporels avait illustré, à travers le paradoxe d’Ulysse et les sirènes, que lorsqu’il s’agit de planifier nos actions futures à la date d’aujourd’hui, nos plans pouvaient en effet apparaître très rationnels. . . mais que, lorsqu’il s’agissait de les mettre en application, nous pouvions alors les remettre en cause et « remettre à après-demain ce que nous avions initialement prévu pour demain ». De même, dans le chapitre 8 consacré à l’incertain, nous avions discuté des travaux de Kahneman et Tversky, qui établissent les différents écarts à la rationalité : les individus peuvent sous-estimer les fortes probabilités et surestimer les faibles probabilités. D’autres formes de comportements en apparence non strictement rationnels ont aussi été identifiés dans les chapitres consacrés à la théorie des jeux, comme la capacité à coopérer dans le dilemme du prisonnier en jeu répété. Ce chapitre va donc simplement développer et ordonner ces comportements et en tirer les leçons pour l’analyse des politiques économiques. 2 Les biais de rationalité dans les expériences contrôlées À partir des années 1970 et à la suite des travaux d’Allais, Kahneman et Tversky ont tenté de remettre en question les théories standards de l’utilité. Ces deux derniers auteurs sont considérés comme les fondateurs de l’économie expérimentale qui a recours à des expériences en laboratoire. Leurs travaux ont ainsi montré qu’une majorité de personnes confrontées à des tests expérimentaux prend des décisions non conformes aux axiomes de rationalité. D’après eux, les individus sont victimes de « biais de jugement ». Ces biais résultent de ce qu’ils appellent des « heuristiques », c’est-à-dire des raisonnements que nous appliquons de manière routinière aux situations quotidiennes, sans vérifier leur pertinence. À titre d’exemple, beaucoup de gens vont juger qu’avec un salaire de départ de 30 000 dollars annuels, une augmentation de 1 500 dollars associée à une inflation de 5 % est préférable à une augmentation de 600 dollars sans inflation. Cela ne semble pas Les enseignements de l’économie comportementale rationnel : l’inflation de 5 % sur le salaire initial réduit le pouvoir d’achat de précisément 1 500 dollars et l’augmentation de salaire ne fait que rendre l’inflation neutre en termes de pouvoir d’achat, alors que la seconde alternative fait en revanche gagner 600 dollars de pouvoir d’achat. Kahneman et Tversky montrent également que les gens ont tendance à faire des choix dans lesquels, en apparence, ils surpondèrent les probabilités très faibles ou sous-pondèrent les probabilités moyennes et fortes, ce qui permet d’expliquer le paradoxe d’Allais. En outre, dans la plupart des situations de la vie réelle, les probabilités des résultats des décisions ne sont pas connues, et les espérances d’utilité ne peuvent être calculées. Il faut également noter que l’utilité des individus ne dépend pas uniquement de leur richesse mais également de facteurs « irrationnels » tels que la douleur psychique que provoquent les pertes nominales de valeur, le besoin d’imiter le comportement d’autres individus ou des considérations éthiques. Kahneman et Tversky : la théorie des perspectives (prospect theory) La théorie des perspectives (prospect theory) est une théorie économique développée par Daniel Kahneman et Amos Tversky dans un article de 19791 . Sur la base de constats empiriques, elle démontre que les individus évaluent de façon asymétrique leurs perspectives de perte et de gain. Les individus se déterminent en fonction d’un niveau de référence – la richesse initiale par exemple – par rapport à laquelle ils évaluent différemment les gains et les pertes d’utilité. La fonction d’utilité décroît plus rapidement pour les pertes qu’elle n’augmente pour les gains. Ainsi, il y a chez l’agent économique une aversion à la perte (loss aversion) qui explique par exemple pourquoi la perspective de perdre 1 000 euros nous paraît beaucoup plus décisive que celle de les gagner, ou encore pourquoi le joueur de casino prend des risques inconsidérés pour récupérer sa mise. Dans le prolongement de cette théorie, on trouve les modèles d’utilité pondérée2 , qui utilisent l’asymétrie ainsi introduite entre gains et pertes pour distinguer les « optimistes », qui surpondèrent les probabilités des événements favorables, des « pessimistes », surtout sensibles aux événements défavorables. Ces expériences se sont multipliées et ont rapidement montré la prévalence des phénonèmes d’écart à la rationalité. Nous ne citerons que les plus célèbres et renverrons le lecteur à l’excellent ouvrage pédagogique d’Eber et Willinger3 . 1. D. Kahneman et A. Tversky, « Prospect theory: An analysis of decision under risk », Econometrica, vol. 47, n˚ 2, mars 1979, p. 263-292. 2. Soo Hong Chew, « A generalization of the quasilinear mean with applications to the measurement of income inequality and decision theory resolving the Allais paradox », Econometrica, vol. 51, n˚ 4, juillet 1983, p. 10651092. 3. Eber Nicolas et Marc Willinger, L’Économie expérimentale, La Découverte, coll. « Repères », n˚ 423, 2e éd., 2002. 7 8 Les enseignements de l’économie comportementale Le contexte peut-être le plus connu dans lequel des comportements apparemment non rationnels existent est le jeu du dictateur introduit par Kahneman, Knetsch et Thaler1 . Il montre que les individus prennent en compte, dans leurs comportements, une notion d’équité ou de justice, que l’anglais résume sous le nom de fairness. Le jeu peut être résumé comme suit. Dans un contexte purement expérimental destiné à isoler des effets perturbateurs, un individu reçoit une dotation initiale disons de 100 jetons, qui seront à la fin du jeu transformés en argent réel (par exemple, 10 jetons correspondraient à 1 euro). Cet individu peut décider de tout garder pour lui ou d’en donner une partie à un autre individu, anonyme, qu’il ne rencontrera en principe jamais (la règle du double anonymat garantit par ailleurs que le receveur potentiel ne pourra pas l’identifier non plus). Si l’individu est dénué de tout altruisme, il ne devrait jamais donner le moindre jeton. Or, on s’aperçoit que les individus donnent fréquemment ; une partie significative des jetons est en effet donnée : en moyenne, c’est ainsi 20 % des dotations initiales qui sont redistribuées sans contrepartie. Ce jeu ne remet pas en cause la notion d’utilité, il suffit que l’altruisme soit un facteur entrant dans l’utilité. Le don est un bien de consommation particulier, dont nous avions vu qu’il était du reste à la fois normal et ordinaire : plus la valeur du don est importante, moins on donne ; plus la dotation initiale est importante, plus on donne. Un autre dispositif expérimental est le jeu de l’ultimatum, développé par Güth et al.2 . L’individu 1 reçoit toujours ses 100 jetons et décide d’en donner une partie au joueur 2. Mais, cette fois-ci, le joueur 2 peut accepter ce don ou le refuser. Dans ce dernier cas, aucun des deux joueurs ne reçoit alors quoi que ce soit. L’idée est ici d’introduire un point de menace. Il est conçu pour dissuader l’égoïsme pur consistant à ne pas donner. Il devrait alors inciter à faire le don minimum. En effet, dans ce cas précis la théorie des jeux peut appliquer son raisonnement à rebours (backward induction) comme suit : si l’unité de base est un jeton, le joueur 1 devrait ne proposer qu’un jeton et conserver les 99 autres, de façon à ce que le joueur 2 accepte cette proposition : un jeton est mieux que pas de jeton du tout. Or, ce n’est pas ce qui est proposé empiriquement dans ces jeux : les joueurs offrent en moyenne jusqu’à 40 % du total des jetons, soit deux fois plus que précédemment ; très peu de joueurs proposent le minimum (un jeton) ; qui plus est, le second joueur rejette en moyenne une offre sur deux pour les offres inférieures à 20 % ; enfin, le mode de la distribution des dons (le choix le plus fréquent) est le partage équitable 50-50. Si cela peut suggérer que la théorie des jeux échoue à prédire ce qui se passe, il est à noter qu’on retrouve des traces de rationalité ici. D’une part, le joueur 1 donne plus que dans le simple jeu du dictateur où il ne faisait face à aucune menace. D’autre part, il peut anticiper rationnellement que le joueur 2 ne soit pas rationnel, et par exemple anticiper une règle ad hoc – non rationnelle – de rejet systématique par le joueur 2 en dessous d’un certain seuil de fairness ; il est donc parfaitement rationnel pour le joueur l de proposer plus. Ce qui est en apparence irrationnel ici est le refus du joueur 2 d’accepter des offres faibles. 1. D. Kahneman, J. Knetsch et R. Thaler « Fairness and the Assumptions of Economics », Journal of Business, vol. 59, 1986, p. S285-S300. 2. W. Güth, R. Schmittberger, and B. Schwarze « An experimental analysis of ultimatum bargaining », Journal of Economic Behavior and Organization, 3, 1982, p. 367-388. Les enseignements de l’économie comportementale Et, même dans ce cas, la rationalité n’est jamais loin : si on imagine une variante du jeu précédent dans laquelle le joueur 2 peut signaler qu’il rejettera aléatoirement les offres sous un certain seuil, il devient dès lors rationnel pour ce joueur 2 d’être irrationnel. Par là, on entend qu’il est intéressant de se contraindre dans ces choix pour obtenir un gain plus important. On retrouve ici la stratégie du joueur de poker : celui-ci laisse deviner que, de temps en temps, il va jouer une mise importante avec une main faible – de façon à ce que l’autre le croit irrationnel et surenchérisse de temps en temps pour mieux perdre. Une autre interprétation, moins cynique, est que les individus ne cherchent pas à maximiser leur utilité telle que définie par la théorie ; ils prennent en compte des considérations d’équité : je n’accepte que ce qui est équitable ; si j’estime la proposition inéquitable, je la rejette contre mon intérêt immédiat. Ainsi, une offre en dessous de 20 jetons est considérée comme inéquitable pour certains, équitable pour d’autres. La portée de ces expériences est cependant nécessairement limitée car les gains sont faibles et le contexte particulier. Si Bill Gates nous offrait 1 % de sa fortune dans le cadre du jeu de l’ultimatum, nous accepterions sans doute ses 801 millions de dollars (Forbes estimant à la date d’aujourd’hui sa fortune à 80,1 milliards de dollars) même si l’on peut penser que 1 %, c’est une fraction inéquitable. On objectera que Bill Gates a gagné cet argent, et donc que c’est différent des 100 jetons donnés initialement. Oui, mais si Mme Bettencourt nous donnait 1 % de sa fortune qu’elle a elle-même héritée, nous accepterions aussi ! Plus troublant, il s’avère que lorsque certaines informations sur les deux joueurs sont communiquées, le genre des joueurs par exemple, les fairness points peuvent se déplacer. Ainsi, par rapport à l’anonymat complet, les offres moyennes faites par le joueur 1 (qu’il soit homme ou femme) au joueur 2 semblent être en moyenne plus élevées lorsque ce dernier est un homme que quand c’est une femme. Les hommes et les femmes, en tant que joueur 1, ont tous les deux le même comportement biaisé envers les hommes. De leur côté, les joueurs 2 choisissent un point de refus plus élevé quand ils font face à un joueur 1 féminin1 . La microéconomie classique a beaucoup de défauts, mais elle a le mérite d’être neutre au genre. Le monde décrit par l’économie expérimentale est-il vraiment préférable d’un point de vue prescriptif ? A contrario, la microéconomie classique peut-elle prétendre comprendre et prévenir les discriminations de genre si elle ne peut pas modéliser ces effets ? Dans le jeu de la confiance2 , on introduit un effet multiplicateur et une nouvelle étape dans le processus. Le joueur 1 choisit un montant disons X sur ses 100 jetons initiaux ; le joueur 2 reçoit de sa part un montant multiplié par rapport à X : par exemple, le montant donné est triplé. Le joueur 2 reçoit donc 3X – le montant est triplé par l’organisateur du jeu, auquel on ajoute forfaitairement 10. La nouvelle étape est que le joueur 2 a la possibilité de rétrocéder une partie Y de cette somme au joueur 1. Ce sera donc un montant compris entre 0 et 10 + 3X. L’idée est ici d’inspirer de la confiance pour que la somme initialement donnée X soit la plus élevée possible, de façon à maximiser les ressources collectives, qui seront ensuite repartagées. Que dit la théorie des jeux ? De nouveau, par backward induction, le joueur 2 ne devrait rien redonner puisque tout est anonyme : Y = 0. Mais le 1. S. Solnick, « Gender differences in the ultimatum game », Economic Inquiry, 39, 2001, p. 189-200. 2. J. Berg, J. Dickhaut et K. McCabe, « Trust, Reciprocity, and Social History », Games and Economic Behavior, 10, juillet 1995, p. 122-42. 9 10 Les enseignements de l’économie comportementale joueur 1 l’anticipant, il devrait lui non plus ne rien donner. On aurait donc là un comportement rationnel du point de vue individuel et irrationnel du point de vue collectif. Or, il s’avère qu’en moyenne, le joueur 1 donne la moitié de sa dotation ; le joueur 2 lui redonne son gain initial ; ce n’est pas rationnel ; notons au passage que ce n’est pas très juste non plus de la part du joueur 2 qui a obtenu une somme dont il ne restitue en moyenne que le tiers. Enfin, la notion de suroptimisme a également été testée par différents auteurs. On citera l’étude de Camerer et Lovallo1 qui teste la décision de participation à un marché dans lequel les gains et pertes dépendent du nombre d’autres entrants. Plus il y a d’entrants, plus les gains sont faibles et les pertes importantes. On ne fait des gains que si le nombre de joueurs est inférieur à un nombre préannoncé aux participants. De façon intéressante, les participants estiment généralement correctement le nombre potentiel des autres participants et ne se trompent pas systématiquement sur ce point. Le marché fonctionne. . . jusqu’à un certain point. En effet, quand le payoff du jeu dépend des capacités individuelles, les participants surestiment leurs propres capacités de façon systématique. Les trois premiers exemples de cette section sont des éléments indiquant que les individus peuvent avoir ce qu’on appelle plus généralement des préférences sociales qui impliquent les comparaisons interpersonnelles, les notions de réciprocité et de fairness ; le dernier de ces exemples montre que les individus peuvent se tromper sur eux-mêmes, et donc qu’il ne se connaissent pas parfaitement. 3 Les motivations des individus dans les comportements in situ Une des critiques régulièrement formulées à l’égard des expériences de laboratoire est leur validité externe. Dans un cadre expérimental, soit il n’y a pas d’enjeu, ou celui-ci est faible, soit le sujet fournit une réponse dont il pense qu’elle correspond partiellement ou totalement à celle attendue par l’expérimentateur. Cette critique s’adresse aussi à toutes les études menées dans le cadre des expérimentations aléatoires, malgré le soin apporté à ces études. Les règles de comportement ad hoc existent-elles ? Voyons maintenant des exemples de la vie réelle étudiés par l’économie comportementale. Une controverse célèbre a opposé quatre chercheurs2, qui prétendaient avoir identifié un comportement irrationnel chez les chauffeurs de taxi newyorkais, et un chercheur plus orthodoxe de UCLA qui a contesté leur interprétation. Le cas étudié est la règle d’arrêt dans la journée des chauffeurs de taxi. Le contexte est le suivant. Chaque jour, les compagnies de taxi collectent des données sur les heures travaillées dans la journée et les recettes journalières dont le chauffeur est entièrement crédité (il est residual claimant pour reprendre le concept 1. C. Camerer, et D. Lovallo. « Overconfidence and excess entry: An experimental approach », American Economic Review, vol. 89, n˚ 1, 1999, p. 306-318 ; http://www.hss.caltech.edu/~camerer/AER_Overconfidence.pdf 2. C. Camerer, L. Babcock, G. Loewenstein et R. Thaler, « Labor supply of New York city cab drivers: One day at a time », Quarterly Journal of Economics, Mai 1997, p. 407-441. Les enseignements de l’économie comportementale développé dans le chapitre sur l’aléa moral). En contrepartie, il paie une redevance qui est entre 76 dollars et 87 dollars par rotation et le coût de l’essence durant cette période de rotation qui est en moyenne de 15 dollars. On peut évaluer le « salaire horaire » de la journée en divisant la recette de la journée par le nombre d’heures effectuées. Colin Camerer et ses coauteurs observent que les chauffeurs de taxi effectuent d’autant plus d’heures par jour que les revenus horaires générés cette journée sont faibles. Ils affirment que la règle de comportement est sous-optimale : comme nous l’avions décrit lors du chapitre introductif, il faut travailler jusqu’à ce que le gain marginal du temps passé coïncide avec le coût marginal de l’effort. Quand les clients sont nombreux, il faut faire plus de courses, car le salaire horaire – les revenus générés chaque heure de conduite – est plus élevé ; quand ils sont rares, il faut s’arrêter, car le salaire horaire est plus faible. C’est pourtant l’inverse que disent avoir observé ces auteurs. Le coefficient de corrélation entre le (log du) salaire horaire de la journée et le (log du) nombre d’heures serait entre −0,3 et −0,5, et non pas positif comme nous pourrions le penser. L’interprétation proposée est qu’en réalité les chauffeurs de taxi n’égalisent pas coût et recette marginale. Ils raisonneraient différemment. Ils cibleraient ainsi un seuil psychologique de recettes journalières – daily targeting – à l’issue duquel ils décident de s’arrêter, par exemple 150 dollars. Cela compenserait le coût de location du taxi à la société et assurerait des revenus correspondant aux attentes du chauffeur en termes de revenu journalier. Cette règle comportementale serait le signe de raisonnements non rationnels. La conclusion des auteurs est sans appel : « Nous avons obtenu une hypothèse simple en économie comportementale – daily targeting – qui prédit que le signe d’un coefficient de régression est l’opposé de celui prédit par la théorie standard, et donc nous avons une différence fondamentale – qualifiée de dramatic – entre les deux théories. » La théorie classique serait non représentative des comportements réels. Les auteurs ne vont cependant pas jusqu’à conclure qu’il faudrait rééduquer ces chauffeurs de taxi pour qu’ils se comportent de façon à maximiser leurs gains. Et c’est pourtant l’implication naturelle de leurs résultats si aucun problème de données ou de variables manquantes n’avait conduit à ce résultat important. Cela nous amène à la critique formulée par Henry Farber sur ce résultat1 . Celui-ci conteste l’analyse et indique au contraire que la décision d’arrêter des chauffeurs est d’abord et avant tout liée au nombre d’heures effectuées depuis le début de la journée : la convexité du coût de la fatigue et les régulations imposant un le nombre d’heures maximal seraient les premiers facteurs conduisant à cette décision. Il conteste aussi l’existence d’un salaire horaire qui serait fixe dans la journée : au contraire, ce salaire évolue dans la journée et, en toute logique, la décision d’arrêter ou de continuer dépend du salaire horaire courant, et pas de la moyenne passée de ce salaire horaire au cours de la journée, comme dans la régression de Camerer et al.. Les chauffeurs interrogés par Henry Farber travaillaient 11 heures par jours six jours sur sept – la limite légale étant 12 heures par jour. Ils répondaient fréquemment à sa question sur le moment où ils s’arrêtent par : « je dois m’arrêter quand je suis trop fatigué » ; et ils niaient à deux exceptions sur 25 avoir un montant journalier cible. 1. Henry Farber, « Is tomorrow another day ? The labor supply of New York city cabdrivers », Journal of Political Economy, vol. 113, n˚ 1, 2005. 11 12 Les enseignements de l’économie comportementale Le débat reste donc ouvert sur la rationalité ou non des chauffeurs de taxi et plus largement des agents économiques. Ce qui est certain, c’est que les déterminants monétaires ne peuvent jamais être la seule explication aux choix observés et que le processus de décision inclut de nombreux éléments psychologiques ou physiologiques, en l’occurrence ici la fatigue. Nous allons proposer deux illustrations de cet énoncé. Motivations extrinsèques, intrinsèques et conflits intra-individuels Une théorie originale élaborée dans une forme élégante et assez aboutie est celle de Roland Benabou et Jean Tirole déjà évoquée dans le chapitre 21. Leur idée est que nos actions sont faites à la fois pour remplir nos objectifs « classiques » comme les arbitrages consommation-loisir, mais aussi pour révéler nos qualités, nos préférences, que ce soit aux autres ou à nous-mêmes si nous ignorions notre propre type. En d’autres termes, nous ne nous connaissons pas entièrement, les autres a fortiori nous connaissent encore moins, et ce sont nos actes qui nous définissent. Il est vrai que lorsque quelqu’un part escalader le Mont-Blanc, on ne peut pas dire que ce soit pour maximiser son bien-être ; se geler les pieds sans oxygène n’est pas particulièrement gratifiant et aurait plutôt des effets négatifs à long terme sans parler du risque d’accident mortel. Pourtant, certains le font, sans même la satisfaction d’être les premiers ou parmi les 1 000 premiers. Benabou et Tirole prennent, eux, l’exemple du don. Nous pourrions être âpres au gain ou au contraire soucieux des autres, ou tout état intermédiaire entre ces deux extrêmes. Nous allons donner aux autres, pour prouver au monde et à nous-mêmes que nous sommes des gens biens, et du reste sans forcément que ce ne soit le cas. Les incitations monétaires sont appelées extrinsèques. Elles sont du ressort de l’analyse classique. Mais elles peuvent interférer de façon contre-productive avec les incitations intrinsèques, celles qui nous révèlent. En effet, lorsque l’action est rémunérée, le fait d’envoyer le signal par son action, et donc de payer un coût associé, mais de regagner une partie voire la totalité de ce coût annule tout ou partie de sa valeur de signal. Ainsi, la politique visant à sanctionner par une amende légère les parents arrivant en retard pour récupérer leurs enfants à l’école en Israël avait-elle conduit à une augmentation des retards, les parents estimant qu’il leur suffisait désormais de payer pour être dédouané de leur retard (voir chapitre 21). Pour autant, ces deux dimensions ne sont pas toujours contradictoires : la défiscalisation aux deux tiers des dons à des associations reconnues d’utilité publique permet à la fois d’activer les motivations extrinsèques et intrinsèques, du moins dans le confort de l’anonymat de sa déclaration d’impôt. Un second exemple a lui aussi été brièvement évoqué dans le chapitre consacré aux choix intertemporels. Dans ce contexte, les individus planifient leurs actions à l’avance pour les dates futures. Ils aimeraient se conformer à ce planning. Ainsi, planifier une épargne pour sa retraite est une décision logique et pleine de sens. En revanche, il peut arriver que l’on soit soumis à des tentations de court terme visant à consommer et que l’on renonce aux choix de long terme. Les enseignements de l’économie comportementale La fourmi et la cigale ont chacune leur stratégie. Chacune de ces stratégies est cohérente ; elles correspondent juste à des préférences différentes. Mais la nouveauté est qu’il semble bien que nous soyons tour à tour fourmi et cigale, fourmi quand nous planifions pour notre futur moi (notre self futur) et cigale quand le futur self est en capacité de décider et donc de contredire le self passé. Dit ainsi, nous exprimons le dilemme entre ces choix comme des conflits intrapersonnels mais à différentes périodes. Ce dilemme avait été rencontré par Ulysse qui l’avait tranché en s’attachant au mât et en bouchant les oreilles de ses rameurs. La branche de l’économie qui analyse ces conflits entre ces différents moi est appelée picoeconomics, car l’unité d’analyse ne se situe plus au niveau de l’individu mais à un niveau inférieur. Levine et Fudenberg, deux éminents théoriciens des jeux, ont poussé cette logique jusqu’au bout. Selon eux, le comportement humain peut se représenter comme une interaction stratégique à deux acteurs1 . L’un est en charge du long terme et de la planification. Le second est aux commandes : c’est lui qui applique les décisions dans le court terme. Mais comme dans le chapitre consacré à l’aléa moral, le self de long terme n’a pas les moyens de contrôler entièrement et parfaitement le self de court terme. Payer un coût pour contrôler le self de court terme rend ce contrôle optimal dans certains contextes : c’est précisément le self-control. Mais ce coût peut devenir prohibitif et, dans ce cas, il est préférable pour le self de long terme de lâcher prise, de laisser le court terme dominer, puis de reprendre le contrôle face à un self de court terme lui-même affaibli. Les auteurs montrent que cette théorie de la décision permet d’expliquer de nombreux faits, notamment l’hyperbolicité des fonctions d’utilité intertemporelle et certains paradoxes liés à l’aversion pour le risque. Par un joli retournement, les auteurs utilisent la théorie microéconomique de base – des agents veulent maximiser selon leurs propres objectifs – pour rendre compte de comportements non rationnels et en partie erratiques – comme les périodes de perte de self-control ! La picoéconomie Cette branche de l’analyse, définie par le psychologue George Ainslie, encore appelée micro-microéconomie tente de rendre compte de l’incohérence temporelle. Les humains (souvent) et les animaux inférieurs (toujours) escomptent les gains futurs au moyen d’une courbe hyperbolique et pas exponentielle, et qui était celle qui conduit aux choix cohérents rationnellement de Paul Samuelson. Que la période de temps soit la seconde ou la décennie, des sujets exposés à des alternatives expérimentales indiquent toujours qu’ils préfèrent un montant plus petit immédiatement à un montant plus important plus tard. Le paradoxe de l’incohérence temporelle est que ces choix peuvent être fréquemment inversés si un délai pour les deux alternatives est proposé : le délai rend le bénéfice immédiat moins valorisant. Ainsi, nous pourrions préférer 100 tout de suite à 200 dans un an, mais préférer 200 dans un an et un mois à 100 dans un mois. La courbe d’escompte exponentielle ne permet pas de rendre compte de cette inversion, car le taux d’escompte entre deux périodes est 1. David K. Levine et Drew Fudenberg, « A dual-self model of impulse control », American Economic Review, vol. 96, n˚ 5, décembre 2006. 13 14 Les enseignements de l’économie comportementale fonction uniquement de l’éloignement entre ces deux périodes, et pas de l’éloignement par rapport au présent immédiat. Les courbes qui correspondent le mieux aux données observées sont en fait hyperboliques (voir notamment David Laibson1 ). Afin d’expliquer cela, on peut introduire l’idée d’une relation stratégique entre des sois successifs. À un moment donné, une personne est alors conduite à verrouiller ses choix futurs en prenant des engagements pour se contraindre. Un tel comportement stratégique suggère que les règles d’interaction interpersonnelle, entre deux personnes distinctes, peuvent aussi sous-tendre la prise de décision intrapersonnelle. Ce que nous croyons être le libre arbitre pourrait alors être le résultat de négociations intertemporelles analogues à un dilemme du prisonnier répété. 4 L’apport de la neuroéconomie et des sciences médicales sur la compréhension des déterminants des décisions individuelles Des êtres manipulables Le comportement individuel est régi par libre arbitre. Du moins aimons-nous à le croire. Ainsi nous serions responsables de nos choix, qui devraient nous conduire à remplir les objectifs que nous nous assignons : travailler, épargner, acheter un appartement, fonder un foyer, obtenir une promotion, conquérir un parti, aider nos concitoyens. Pourtant, les travaux les plus récents montrent qu’une partie de nos perceptions et par conséquence de nos choix sont partiellement le résultat de processus neurocognitifs qui nous échappent. Le plus connu et le plus ancien est l’effet placebo. Lorsque nous prenons une pilule inerte dont nous ne savons pas si elle est différente d’un médicament doté d’un principe actif, notre état s’améliore pourtant significativement, et l’effet « causal » du médicament doit s’apprécier comme l’écart entre l’amélioration d’un groupe recevant le principe actif et l’amélioration due à cet effet placebo, ce qui est une différence-en-différences, définie dans le chapitre 3. Donc, nous sommes manipulables. Si la médecine peut nous manipuler, qu’en est-il des vendeurs ? Comme nous l’avons vu en introduction, pour déclencher un achat, peu importe que celui-ci nous apporte quelque chose de réel ; il suffit que nous ayons l’impression que notre bien-être (notre utilité) sera plus élevé après l’achat qu’avant ; les vendeurs de vêtements utilisent des miroirs déformants pour nous faire croire que nous sommes plus minces ou plus sportifs que nous ne le sommes réellement, et que par hasard cette impression favorable sur nous-même coïncide avec le port de cette veste ou de ce tailleur ; et même si nous ne sommes pas entièrement dupes, nous faisons comme si c’était le cas, ce qui est la forme la plus aboutie de manipulation, l’auto-intoxication. Avons-nous remarqué que, lors des visites, les agents immobiliers commencent presque toujours par le bien le plus invendable, trop cher ou 1. David Laibson, « Golden eggs and hyperbolic discounting. » The Quarterly Journal of Economics, 112(2), 1997, p. 443-477. Les enseignements de l’économie comportementale en trop mauvais état, pour que les deuxième et troisième biens visités puissent déclencher un « coup de cœur » ? La couleur des objets influe sur la perception, jusque dans les déterminants les plus fondamentaux, comme le coefficient d’aversion pour le risque (la couleur rouge de l’introduction de ce chapitre le ferait diminuer temporairement et donc stimulerait une prise de risque). Par quels mécanismes les décisions se déclenchent-elles et comment le cerveau évalue-t-il les gains et pertes des décisions ? C’est ce que les avancées récentes permettent de mieux comprendre. L’imagerie du cerveau et les mécanismes de prise de décision Les études sur le sujet du fonctionnement du cerveau sont souvent frappantes. L’une d’entre elles mérite qu’on s’y arrête. Elle a été menée par une équipe allemande de psychologues1 . Des sujets doivent noter des boissons qu’ils reçoivent passivement à l’aide d’un tuyau. Juste avant l’ingestion, un écran leur passe très rapidement une image de la marque censée commercialiser le breuvage : Coca-Cola, Pepsi-Cola, River Cola (une marque générique allemande) et enfin T-Cola, une marque qui n’existe pas et qui est donc inconnue des sujets. En réalité, la boisson ingérée est un coctktail des trois premières, en proportions égales. Les sujets devraient donc globalement être indifférents entre ces quatre ingestions. Or, les deux premières, marques mondialement connues, avaient systématiquement de meilleures notes que les autres. De façon plus intrigante, l’activité cérébrale des sujets – qui était visualisée par IRM (imagerie par résonnance magnétique) – était différente selon le type d’écran qu’ils venaient de voir. Lorsqu’ils avaient vu sur leur écran l’une des marques connues, une zone spécifique – le striatum ventral – située sous le cortex et semble-t-il consacrée à la récompense et au plaisir, c’est-à-dire le siège de la motivation –, s’activait davantage. En revanche, une autre zone, le cortex orbitofrontal, région du cortex frontal qui entre en jeu dans le processus de décision, était moins actif pour les boissons connues, et plus actif pour les marques inconnues ; comme si la marque visait à amoindrir les capacités de réflexion préalables à la décision2 . Nos décisions sont manipulées de différentes façons et plus certains accumuleront du savoir, plus il sera urgent de populariser ce savoir. Une fois tout cela compris, ne commençons-nous pas à regretter le monde néoclassique pur, où la décision de consommation correspondait à un choix rationnel et pas à l’influence d’une série de signaux suggestifs ou d’auto-illusion ? Quoi qu’il en soit, les économistes ont également investi le champ de la neuroéconomie et tentent de comprendre par quels mécanismes le cerveau évalue les décisions qu’il prend ou tout simplement comment il attribue une valeur aux objets, aux actes, puis comment il prend ses décisions, comment il mémorise et comment il oublie de façon sélective, s’il est véritablement le siège des 1. Simone Kühn et Jürgen Gallinat, « Does taste matter ? How anticipation of cola brands influences gustatory processing in the brain », PLOS One, avril 2013. 2. Pierre Barthélémy, qui relate cette étude sur son blog http://passeurdesciences.blog.lemonde.fr/2013/06/16/commentles-grandes-marques-influent-sur-nos-cerveaux/, en souligne aussi les limites méthodologiques. Il alerte également sur les dangers potentiels de ce type d’influence. 15 16 Les enseignements de l’économie comportementale différents conflits interpersonnels, ce que les recherches actuelles semblent en effet suggérer. De plus, certains traits comportementaux décrits en introduction semblent être visualisés dans le cerveau. Par exemple, un des enseignements de cette discipline a trait au biais d’aversion à la perte. Des chercheurs1 ont évalué les zones actives du cerveau lorsque les individus de l’étude (des sujets recrutés à Caltech) doivent gérer un portefeuille d’actions et réaliser des transactions. Les gains ou les pertes avaient des impacts différents : certaines zones s’activaient spécifiquement en cas de gains, notamment le cortex préfrontal, et pas dans le cas de pertes, indiquant ainsi une asymétrie. D’autre part, les auteurs suggèrent que cette zone s’active en fonction des gains bruts en capital, mais pas en fonction de la valeur espérée des gains nets, qui serait pourtant ce qui se passerait si les agents maximisaient une utilité espérée. La mesure physiologique du stress et les mécanismes de prise de décision Ce lien entre les neurosciences et la rationalité a été approfondi et donne des conclusions particulièrement frappantes. Ainsi, l’étude de la pauvreté s’est enrichie d’une meilleure connaissance des raisons profondes de l’absence apparente de rationalité de la part de populations en situation de grande difficulté. Dans un article paru dans la prestigieuse revue Science2 , Johannes Haushofer et Ernst Fehr étudient les trappes de pauvreté dues à l’enchaînement de causalités réciproques entre pauvreté et mauvaises décisions économiques. Ils montrent notamment que la pauvreté est associée à un stress mesuré par le taux de cortisol dans l’organisme ; certaines études indiquent que ce lien est causal3 ; le taux mesuré est le cortisol dans la salive ; les sujets vivant au Kenya reçoivent aléatoirement un transfert en espèces de 0, 400 ou 1 500 dollars ; seuls ceux qui reçoivent le montant maximal voient leur taux de cortisol baisser significativement, le montant étant associé à une diminution substantielle ; alors que le bonheur mesuré sur une échelle de satisfaction augmente sensiblement et dans les mêmes proportions pour les individus ayant reçu 400 ou 1 500 dollars ; le taux de cortisol serait ainsi une mesure objective du stress plus performante que l’autodéclaration. Qui plus est, dans des études séparées, la présence de cortisol est associée à des comportements d’investissement de court terme et averse au risque4 . 1. Cary Frydman, Nicholas Barberis, Colin Camerer, Peter Bossaerts et Antonio Rangel, « Using neural data to test a theory of investor behavior: An application to realization utility », Journal of Finance, 2013. Voir aussi un intéressant article de synthèse de Thomas Renault (Paris 1 et Ieseg Paris) sur son blog, citant cet article et quelques autres exemples liés à la finance comportementale. 2. Johannes Haushofer et Ernst Fehr, « On the psychology of poverty », Science, 344, 862, 2014. 3. J. Haushofer, J. Shapiro, « Household response to income changes: Evidence from an unconditional cash transfer program in Kenya », Massachusetts Institute of Technology Working Paper, 2013 ; disponible sur http://web.mit.edu/joha/ www/publications/haushofer_shapiro_uct_2013.11.16.pdf 4. A. Cohn, J. Engelmann, E. Fehr, M. A. Maréchal, « Evidence for countercyclical risk aversion: An experiment with financial professionals ». UBS International Center of Economics in Society Working Paper, n˚ 4, 2013 ; disponible sur http://papers.ssrn.com/sol3/papers.cfm?abstract_id=2327557. Dans cette étude, les auteurs induisent un état de stress chez des sujets en les soumettant à une menace de chocs électriques d’intensité variable (rien de moins !). Dans les groupes où le stress induit était plus fort par les conditions expérimentales, l’aversion au risque relative mesurée à travers différents comportements d’investissements observés par la suite était plus élevée que dans les autres groupes. D’autres études se contentent de projeter des images de films d’horreur pour induire de façon exogène ces variations de stress. Les enseignements de l’économie comportementale Pris ensemble, ces enchaînements sont interprétés par les auteurs comme un cercle vicieux par lequel, si le cortisol conduit à un comportement de survie efficace dans le court terme, il entraînerait dans le long terme des décisions d’investissement sous-optimales entretenant le cycle de sous-développement économique. 5 Implications de politique économique On voit à travers les différents exemples donnés depuis le début de ce chapitre que nombreux sont les comportements différents de ceux de l’homo economicus. Nous allons maintenant conclure ce chapitre en évoquant les implications de politique économique que l’on peut tirer du champ. Comment les écarts à la rationalité redéfinissent l’optimum social ? L’une des applications les plus intéressantes de l’économie comportementale est celle de la conception et de l’évaluation des politiques publiques. Les apports sont à un double niveau. D’une part, à partir du moment où l’on sait que les individus ou les ménages réagissent à des incitations dans un sens parfois différent de ce que prédit la théorie microéconomique classique, on peut mieux à la fois prendre la mesure des comportements qu’il faut corriger et tenter de les influencer ; ainsi, l’incohérence temporelle qui conduit certains individus à ne pas épargner suffisamment pour la période de leur vie où ils ne pourront plus travailler est un trait de caractère assez répandu qui conduit à la mise en place de plans de retraite obligatoires ou très incitatifs, avec notamment des pénalités de retrait anticipé. Ainsi, une politique de lutte contre la pauvreté devra-t-elle, si on en croit les enseignements de la section précédente, tenter de lutter contre ses causes réelles, qui seraient en partie liées à l’incapacité à prendre de bonnes décisions économiques quand les conditions de revenu et d’incertitude engendrent un stress important. D’autre part, et à un niveau plus fondamental, se pose la question du bon critère pour évaluer le bien-être des individus. Dans l’environnement rassurant de l’édifice néoclassique, les individus ont des comportements rationnels, issus de préférences dotées de propriétés de stabilité, de cohérence et n’ont pas de biais de perception. Dans l’environnement plus mouvant de la théorie comportementale, toutes ces composantes volent en éclats. Pour ne donner que trois exemples, si vraiment les chauffeurs de taxi arrêtent leur journée alors que le gain marginal de continuer est plus important que le coût marginal de l’effort, faut-il les aider à comprendre qu’il faudrait continuer ? Si les individus ont une préférence pour le présent qui les fait préférer consommer plutôt qu’épargner et renoncer à leur plan d’épargne décidé hier, faut-il maximiser leur bien-être du point de vue de leurs préférences d’aujourd’hui, ou au contraire d’hier ? Enfin, si les individus ont des biais de perception les faisant mal estimer les très faibles probabilités, par exemple de l’impact potentiellement catastrophique des OGM, faut-il les suivre et appliquer un principe de précaution ou se contenter de maximiser le bien-être sur la base de probabilités objectives ? 17 18 Les enseignements de l’économie comportementale À ce jour, ces questions ne sont pas tranchées, et chacun d’entre nous peut avoir sa propre opinion sur le sujet. On peut ainsi penser qu’il faut systématiquement laisser les individus décider de leur comportement mais les laisser assumer leurs erreurs. On peut au contraire décider à leur place de ce qui est mieux pour eux. La décision ici est de nature politique. Un troisième niveau des politiques publiques Il faut en effet mentionner la montée en puissance d’une behavioral public policy analysis, qui tente d’encourager les citoyens à agir dans un sens plus conforme à leur propre bien-être. Jusqu’à présent nous avions vu deux niveaux de politiques publiques : celles visant à interdire ou à obliger, c’est-à-dire des politiques coercitives, comme des politiques de quota ou de prix fixes ; et celles visant à inciter, par une taxation ou des subventions. L’économie du comportement apporte une troisième et nouvelle stratégie d’intervention, avec ce qu’on appelle le nudging ou la nudge theory, que nous pourrions traduire par une politique de coup de pouce ou d’appui en douceur de la bonne décision. Ce corps de doctrine issu autant de l’économie que de la science politique est fondé sur l’idée qu’il est possible d’influencer le comportement des individus ou des acteurs économiques sans contraintes supplémentaires (les politiques de type 1), et sans changer directement les incitations économiques (les politiques de type 2). Le concept a été développé par Richard Thaler et Cass Sunstein, auteurs d’un ouvrage retentissant, Nudge, en 2008 et déjà évoqué au début de ce chapitre. Ces auteurs définissent le concept a contrario : une telle incitation (a nudge) doit être le résultat d’une intervention peu onéreuse et simple, visant à suggérer de meilleurs choix. Trois exemples différents permettront de comprendre les différents niveaux possibles d’intervention et en quoi le nudge est perçu comme la plus moderne et peut-être la plus effective. Une politique proenvironnementale consiste par exemple à diminuer la consommation d’électricité des foyers ; la politique la plus primitive, de type 1, consisterait à attribuer un quota de consommation à chaque ménage en fonction de sa composition, quota qu’il est interdit de dépasser. Si vous vouliez faire une troisième machine à laver cette semaine, ce n’est plus possible car le quota est atteint. Une seconde politique, plus incitative, consiste à surtaxer la consommation d’électricité, soit dès le départ soit, mieux, au-delà d’un certain seuil ; ainsi, si le besoin de la troisième machine à laver est important, vous la feriez, mais si vous pouvez vous en passer, vous attendriez la semaine suivante. La politique du nudge, qui a été tentée à San Marcos en Californie, a consisté à informer les ménages sur leur consommation et notamment leur position par rapport à la moyenne. La politique visant à simplement informer factuellement les ménages avait bien contribué à diminuer la consommation de ceux au-dessus de la moyenne. Mais elle avait aussi fait augmenter la consommation des ménages en dessous de la moyenne, qui se sentaient déculpabilisés ! Pour éviter cette convergence vers la moyenne, on a imaginé une nouvelle façon d’informer les ménages : les factures comprenaient un emoticon (soit un sourire, smiley, soit au contraire un visage triste ou avec un froncement de sourcil, un frown) sur la facture d’électricité lorsque la consommation était en dessous ou au-dessus de la moyenne. Ce type de « suggestion » a permis de réduire la consommation globale de façon importante et à moindre coût. Et ce, même si elle a été assortie d’une explication du Les enseignements de l’économie comportementale besoin environnemental de réduire la consommation d’énergie. Pour autant, personne ne conteste l’idée que la politique incitative (payer plus cher l’énergie) reste la meilleure option ; simplement, aux États-Unis, elle fait perdre les élections. Un second exemple de ce triptyque des politiques est le suivant : pour lutter contre l’obésité et le développement du junk food, on peut interdire certains composants ou les réguler ; par exemple, on pourrait décréter que les frites amidonnées et les gras saturés sont désormais impropres à la consommation ; on peut aussi les surtaxer, de même que les sucres et l’huile de palme, comme cela se fait depuis peu en France ; on peut enfin « suggérer ». Dans ce cas précis, Thaler et Sunstein proposent de mettre, dans les cantines scolaires, ou dans les supermarchés, les aliments à base de fruits et légumes à hauteur des yeux ; et de reléguer les acides gras trans plus loin, par exemple en bas des rayons ou des plateaux de présentation. Enfin, en matière de police de la route, on retrouve ce triptyque : on interdit de rouler au-dessus de 50 à l’entrée des agglomérations ; l’interdiction ne suffisant pas, on peut ensuite placer des radars automatiques aux entrées des agglomérations et il faut bien reconnaître que cette taxation de la vitesse est assez efficace ; mais elle est parfois mal vécue et peut elle aussi inverser le résultat des élections ! Depuis peu, certaines municipalités ont introduit des capteurs de vitesse reliés à un panneau lumineux qui indique la vitesse en vert – et parfois avec un smiley – lorsque celle-ci est inférieure au maximum autorisé et en rouge – avec un frown – lorsqu’elle est au-dessus ; et cela fonctionne plutôt bien. L’homo economicus ne devrait pas changer sa vitesse, l’homo comportementalis la réduit s’il est stigmatisé1 ! D’une certaine manière, cette théorie du nudging rejoint celle des motivations extrinsèques et intrinsèques développée par Benabou et Tirole. Nous agissons pour des motivations extrinsèques (monétaires) ou pour des motivations intrinsèques (souci d’apparaître comme une personne éthique), mais les deux interagissent parfois difficilement. Enfin, l’intérêt du nudging est qu’il est peu coûteux, donc que différents messages peuvent être expérimentés : par exemple, pour inciter au don d’organes, dire que d’autres ont besoin de nos organes ne semble pas très efficace2 . Dire qu’un jour nous pourrions avoir besoin des dons d’organe des autres semble bien mieux fonctionner ! On peut se demander si ce type de politique peut s’appliquer à d’autres secteurs. Par exemple, pour lutter contre la surconsommation médicale, ne pourrait-on faire apparaître au dos des ordonnances le coût réel pour la Sécurité sociale ? Peut-être hésiterions-nous alors à acheter trois boîtes de médicaments qui coûtent chacune 10 centimes d’euros et parfois plusieurs centaines d’euros à la collectivité ? Pour éviter que des enfants de 11 ans ne passent leur journées à jouer à Minecraft, peut-on imaginer un programme qui leur envoie un frown au bout de deux heures ou un smiley quand ils se déconnectent ? 1. L’auteur du manuel a même vu récemment des panneaux sur l’autoroute qui indiquaient : « La voiture immatriculée 8912 CBE » roule trop vite ; il s’est demandé une fraction de seconde s’il s’agissait de la sienne, avant d’être dépassé par une voiture immatriculée 8912 CBE 14. Il a alors été rassuré, tout en constatant que le conducteur ne semblait pas avoir été influencé par le panneau. 2. http://www.ft.com/cms/s/2/9d7d31a4-aea8-11e3-aaa6-00144feab7de.html#axzz3AXjdJqkl 19 20 Les enseignements de l’économie comportementale 6 Conclusion : les insuffisances de la théorie microéconomique Le point de vue de la majorité des économistes y compris comportementaux est que leurs recherches ne remettent pas en cause l’intérêt de la microéconomie et de ses concepts. Ce point de vue n’est en effet pas très fécond ; lorsque nous ouvrions le chapitre 21 consacré aux asymétries d’informations, nous reprenions le point de vue de Jean Tirole. Selon lui, les entreprises ne sont pas en apparence rationnelles, non pas par envie ou par stupidité, mais parce que la rationalité est dissimulée à un autre niveau, celle d’un plus grand nombre d’acteurs en interaction stratégique (les actionnaires, les dirigeants, les salariés). La prise en compte de ces autres niveaux aboutit à un changement de point de vue radical sur l’analyse de la décision au sein des entreprises. A contrario, la critique facile, « les entreprises ne sont pas rationnelles », ne nous aurait pas beaucoup éclairés sur les principes de régulation de ces entreprises. De fait, tout en en conservant les outils de base, l’ensemble des résultats se trouve modifié, à la fois plus précis empiriquement et avec des implications normatives différentes. L’aléa moral et la sélection adverse conduisent à l’irrationalité collective de l’entité « entreprise » et au-delà du marché à partir de la rationalité individuelle de ces acteurs. Elles se corrigent partiellement ou totalement par des contrats, des incitations, des obligations à travers par exemple des assurances obligatoires agrégeant les risques. Nous voulons ici renouveler cette démarche : ce n’est pas parce que les décisions des individus sont parfois non rationnelles qu’il n’existe pas des formes de rationalités cachées dans leurs comportements. Le conflit stratégique entre les differents selfs (celui de court terme qui cède à la tentation, celui de long terme qui tente de le préserver) constitue deux entités rationelles. De même qu’on pouvait améliorer les prises de décision des entreprises par des réponses institutionnelles, il est possible d’encadrer le comportement individuel grâce à des contraintes, des interdictions, des obligations. Ce sont là des choix de société : certaines choisiront le paternalisme (asymmetric paternalism) : la société est partiellement responsable des erreurs de ses citoyens. Le cas extrême est par exemple de rendre pénalement responsable l’ami qui, à l’issue d’un repas arrosé, laisse l’invité ivre reprendre le volant1 . On admet que la personne ivre n’est pas rationnelle, et on oblige alors la personne rationnelle à la protéger contre elle-même. On oblige le chômeur à accepter des offres d’emploi « acceptables » sous peine de sanction, et donc on délègue la rationalité à l’agent de Pôle Emploi qui saurait mieux que l’individu ce qui est dans son intérêt. D’autres sociétés au contraire décident de laisser à chacun l’entière responsabilité de ses actions : la personne sobre ne sera pas jugée pour laisser la personne ivre se comporter de façon dangereuse. Dans le New Hampshire, où l’on peut conduire à moto sans casque, 1. Ce qui est le cas en France en vertu d’une interprétation audacieuse de l’article 121.3 du Code pénal et notamment de son 4e alinéa (voir http://www.lefigaro.fr/actualite-france/2014/03/05/01016-20140305ARTFIG00123-sixmois-ferme-pour-avoir-laisse-son-ami-ivre-conduire.php?pagination=5), mais pas au Canada où la Cour suprême fédérale a jugé « que les hôtes d’une fête privée ne peuvent pas être tenus responsables d’un accident commis par un de leurs invités qui aurait trop bu », contrairement aux tenanciers de bars qui sont eux logiquement responsables. http://ici.radio-canada.ca/nouvelles/societe/2006/05/05/001-CS-alcool-responsabilite.shtml Les enseignements de l’économie comportementale la devise de l’État est « Live Free or Die ». Être libre de ses actes mais évidemment en subir les conséquences. Ce n’est pas à autrui de protéger les autres, c’est-à soi-même. Le corollaire est que cela ne sera pas à la collectivité de prendre en charge les dépenses de santé après un accident à moto. C’est la devise libertarienne par excellence. On a donc ici les deux branches de l’alternative : solidarité allant de pair avec le paternalisme d’une part, et liberté allant de pair avec la responsabilité individuelle d’autre part. Aucun critère économique ne peut trancher entre les deux ; c’est une question de choix démocratique et de détermination philosophique. Le rôle de l’analyse des sciences sociales est d’expliciter les choix et de les rendre conscients pour les citoyens. Dans le cadre de ce chapitre, les branches de l’alternative paternalisme incarné par la politique de type 1 visant à interdire ou responsabilité individuelle en incitant économiquement, en taxant, a été subtilement tranchée par le concept de nudging, qui permet d’influencer tout en laissant un maximum de liberté aux ménages. Du reste, Thaler et Sunstein qualifient leur politique de libertarian paternalism, indiquant qu’ils ne réduisent pas l’espace de choix des individus mais conservent la notion de paternalisme asymétrique, estimant que beaucoup de gens sont en fait heureux qu’on les incite à faire des choix différents de ceux qu’ils feraient autrement dans leur propre intérêt de long terme. Les implications de ce concept sont très riches et beaucoup reste encore à apprendre. On notera en guise de conclusion qu’elles ne sont pas cependant la réponse ultime aux grands problèmes sociaux. Le marketing comportemental s’en empare également, non pas dans notre propre intérêt mais au contraire pour nous pousser à faire autre chose que ce que nous considérons approprié et il convient d’être conscient de ces influences. Cela nous amène naturellement à la seconde observation : s’il est possible de défaire l’influence du nudging en comprenant comment il agit, cela s’applique aussi aux actions publiques. Du reste, tout est une question de degré et de généralisation : si nous évoluions dans une société où le gouvernement nous envoyait toutes les 10 minutes par texto des smiley ou des visages tristes dès que nous adoptons des comportements coopératifs ou contre-productifs, ne développerions-nous pas des anticorps à ces politiques ? De nouveau, les enseignements de la recherche ne permettent pas toujours de répondre à toutes les questions. Mais il est indéniable qu’ils permettent de poser les termes du débat de façon claire. 21