les enseignements de l`économie comportementale

Transcription

les enseignements de l`économie comportementale
Principes
de microéconomie
Méthodes empiriques et théories modernes
Seconde édition
Étienne Wasmer, Sciences Po
Étienne Wasmer, Sciences Po
Chapitre complémentaire :
Les enseignements de l’économie
comportementale
Les enseignements de l’économie
comportementale
1 Introduction
Ce chapitre est consacré aux développements de l’économie comportementale. Ceux-ci
sont suffisamment riches et importants pour qu’un chapitre entier leur soit consacré.
L’économie comportementale cherche des fondements psychologiques aux comportements observés. Comme l’indiquent Colin Camerer, George Loewenstein et Mattew Rabin,
trois auteurs qui ont profondément influencé le champ, il s’agit d’un domaine qui tente
d’améliorer la science économique en générant de nouvelles prédictions théoriques, en
affinant les prédictions des comportements dans des contextes de vie réelle et en bonifiant
les politiques, publiques mais aussi privées1 . Les recherches nous indiquent que, d’une
part, les individus ont des biais cognitifs : même lorsqu’ils disposent potentiellement de
toute l’information, il leur arrive de déformer cette information avant d’optimiser leurs
choix, par exemple en percevant mal les probabilités d’événements ou les bénéfices de
telle action ; d’autre part, même avec une information correctement traitée, ils raisonnent
parfois de façon en apparence irrationnelle, au moyen de règles de comportements
arbitraires limitant de fait leur choix, c’est-à-dire en prenant directement de mauvaises
décisions qu’ils regrettent par la suite ; enfin, ils peuvent vouloir décider de quelque chose
pour le futur et ignorer que, dans le futur, ils seront incapables d’appliquer ce choix :
à chaque période ils se comportent de façon optimale, en ignorant cependant sur leurs
propres comportements. De son côté, la finance comportementale, récompensée à travers
le prix Nobel de 2013 de Robert Shiller, tente de comprendre comment les investisseurs
se comportent différemment de la théorie de l’individu rationnel.
Les exemples de comportements ne cadrant pas avec la vision
rationnelle de la microéconomie
Prenons quelques exemples de traits comportementaux étudiés dans cette litérature.
Le premier est le biais de suroptimisme quant à ses propres capacités. Nous avons
tous pensé à un moment que deux jours d’effort suffiraient pour accomplir une tâche
1. Colin Camerer, George Loewenstein et Mattew Rabin, Advances in behavioral economics, Russel Stage Foundation,
NY, Princeton University Press, Princeton et Oxford, 2004.
Les enseignements de l’économie comportementale
difficile (réviser un examen, préparer un cours, remplir une déclaration d’impôt) ;
plus dramatiquement, car cela peut avoir des conséquences mortelles, une très large
majorité des individus interrogés pense avoir des capacités de conducteurs au-dessus de
la moyenne ; alors que la durée optimale de conduite sans interruption est de 2 heures,
la plupart des conducteurs font une pause après 3 heures ; la ruée vers l’or dans l’Ouest
américain était une croyance irrationnelle dans la capacité des chercheurs d’or à devenir
immensément riches ; les réfugiés qui tentent de traverser la Méditerranée en barque ou
qui s’agrippent clandestinement au train d’atterrissage d’un avion ont des chances de
survie extrêmement faibles ; on pourrait multiplier les exemples de trop grande confiance
ayant des conséquences néfastes pour l’individu.
Le deuxième est l’aversion à la perte. Les individus ayant acheté des actions dont la valeur
a augmenté acceptent volontiers de les vendre ; pour celles dont la valeur a baissé, l’idée
d’encaisser la perte est suffisamment désagréable pour qu’ils souhaitent les conserver en
dépit de toute rationalité. Lors de la crise de 2007, les vendeurs de biens immobiliers
refusaient d’accepter la baisse de la valeur de leurs biens et le volume des transactions
immobilières a baissé de façon très importante, alors que les prix des transactions réalisées
n’ont baissé que de quelques pourcents : les individus préféraient voir la valeur de leur
bien se dégrader plutôt que d’accepter une baisse du prix par rapport au plus haut du
marché avant la crise. On pourrait aussi se demander si le trait psychologique consistant
à ne pas se débarrasser d’objets devenus parfaitement inutiles et à les laisser s’accumuler
n’est pas un symptôme de cette aversion : le coût d’opportunité de l’espace perdu est jugé
inférieur à la perte d’utilité de perdre un objet sans aucun usage.
Le troisième est l’importance de la présentation des choix, ce qu’on appelle les framing
effects. Un exemple classique est donné par Tversky et Kahneman (1981) à propos d’un
programme de lutte contre un virus asiatique mortel. Dans une première expérience,
78 % des individus préfèrent, sur un groupe de 600 personnes, « sauver 200 vies –
choix A » alors que 22 % des participants choisissent de « sauver les 600 personnes avec
une probabilité d’un tiers et ne sauver personne avec une probabilité de deux tiers – choix
B ». Mais si on présente ces alternatives de façon logiquement identique mais opposée,
le choix A devenant « 400 personnes meurent – choix C » et le choix B devenant « Avec
une probabilité de un tiers personne ne meurt et avec une probabilité de deux tiers,
600 personnes mourront – choix D », dans ce cas le choix s’inverse et plus des trois quarts
des participants préfèrent désormais le second choix.
Plus généralement, des facteurs qu’on jugerait objectivement sans influence sur ces choix
semblent pourtant les influencer. Par exemple, au supermarché, les biens les plus coûteux
sont en général placés dans les rayons à hauteur des yeux, alors que des biens parfaitement
substituables mais de prix plus faibles sont situés en bas. Il suffirait alors de se baisser
pour faire une économie substantielle ; mais nous ne le faisons pas systématiquement.
Pire, les caddies sont parfois conçus pour ne pas rouler tout à fait droit et donc nous
ramener à notre insu vers les rayons. Étant plus près de biens que nous n’avions pas
prévu de consommer, nous en achèterions pourtant certains, contrairement à ce que
nous avions planifié ou à ce que nous aurions fait si le caddie avait roulé droit. Pire
encore, lorsque la climatisation est importante, les consommateurs achètent plus par un
réflexe difficile à justifier rationnellement. Lorsque nous voyons du rouge, notre capacité
3
4
Les enseignements de l’économie comportementale
à prendre des risques semble augmenter ; pour les hommes, les publicitaires semblent
penser que c’est aussi le cas lorsqu’ils voient une jeune femme attirante ; cela explique
pourquoi, à l’occasion des salons de l’automobile, les modèles de voitures de sport exposés
sont souvent rouges et présentés par des mannequins.
Nos actions sont parfois affectées par le contexte : le biais de statu quo vient de ce que nous
préférons conserver un choix adopté dans le passé plutôt que de réoptimiser. L’exemple
classique est le contrat choisi pour une police d’assurance ou les sommes épargnées pour
la retraite lorsque celle-ci est par capitalisation. Dans leur ouvrage classique, deux grands
contributeurs de cette littérature, Richard Thaler et Cass Sunstein1 , expliquent que les
professeurs d’université oubliaient parfois de répondre au questionnaire leur demandant
combien ils voulaient souscrire, ce qui rendait le montant de leur contribution nul. Ils
ont suggéré à l’administration d’indiquer par défaut la dernière somme déclarée, à la
satisfaction de tous les enseignants étourdis.
Nous semblons irrationnellement dépendants des coûts passés (sunk costs). Par exemple,
si nous avons acheté un bien dont nous sommes insatisfaits, nous avons tendance à
le consommer quand même, puisque nous l’avons payé. Si je loue deux semaines à
la montagne, partir au bout de 12 jours peut être rationnel si l’utilité marginale des
vacances diminue progressivement. Pourtant beaucoup de gens restent jusqu’au bout.
Cette dépendance aux sunk costs est sans doute une façon de refuser d’admettre que nous
avons fait une erreur : errare humanum est, perseverare diabolicum est.
Pour reprendre d’autres exemples distillés tout au long du manuel, nous avons aussi
des problèmes de self-control et d’incohérence temporelle : nous planifions une action
pénible pour demain mais, le moment venu, nous décidons de changer de plan et de la
reporter à après-demain ; nous avons une difficulté à appréhender les petites probabilités
et jouons à la loterie alors que le gain espéré est nettement plus faible que la dépense.
Les implications pour l’analyse économique
D’innombrables travaux ont démontré l’ampleur de ces comportements déviants par
rapport à la rationalité stricte de la théorie microéconomique. Il faut donc relire l’ensemble
des résultats obtenus jusqu’ici à l’aune de ces développements, pour les nuancer voire
si besoin les contredire. Le lecteur méfiant envers l’économie traditionnelle pourrait
voir dans cette accumulation d’exemples la confirmation de ses a priori. L’économie
comportementale démontrerait l’inutilité de toute la microéconomie. Pourtant, les
scientifiques dont les travaux ont illustré ces biais de rationalité ne vont pas jusqu’à
suggérer de supprimer la microéconomie des cursus universitaires. Comme le disait
Richard Thaler au Financial Times, jeter la théorie classique revient à se débarrasser de
nombreux éléments très utiles2 .
1. Richard H. Thaler et Cass R. Sunstein, Nudge, Improving Decisions About Health, Wealth, and Happinness,
Penguin Books, 2008, 2009.
2. « To discard the basic neoclassical framework of economics means throwing away a lot of stuff that’s useful » ;
http://www.ft.com/cms/s/2/9d7d31a4-aea8-11e3-aaa6-00144feab7de.html#axzz3AXjdJqkl
Les enseignements de l’économie comportementale
En réalité, ces comportements, déjà amplement discutés au cours des différents chapitres
de ce manuel, sont surtout illustratifs des limites de l’analyse classique. Ils ne remettent
cependant pas en question l’essentiel, ce qui est à l’intérieur de ces limites. La capacité
descriptive de la microéconomie « standard » est loin d’être parfaite, mais elle permet
néanmoins de représenter un cadre d’analyse cohérent des choix et de s’appliquer à
plusieurs domaines, ce que les modèles d’économie comportementale ne permettent pas
encore : ils sont souvent conçus pour expliquer un phénomène, pas plusieurs. De plus, les
expériences où l’on soumet des individus à différentes contraintes de budget et différents
prix relatifs montrent que leurs préférences ainsi révélées sont cohérentes à 90 % d’un
choix à l’autre (voir chapitre 9) ce qui est l’essence de la fonction d’utilité : une stabilité
des préférences.
Il faut juste comprendre que, par rationalité, on entend cohérence des choix et pas
égoïsme ; l’altruisme peut être individuellement rationnel s’il apporte une certaine
satisfaction capturée de manière stable par la fonction de l’utilité de l’individu. Il
semblerait irrationnel économiquement d’avoir des enfants compte tenu du coût et de
la perte de temps à les élever. Cependant les individus ont clairement une utilité pour
s’assurer une progéniture, que ce soit par pur plaisir ou, dans les sociétés primitives,
pour que quelqu’un s’occupe d’eux lorsqu’ils seront devenus incapables de s’assumer
économiquement ou même physiologiquement. Il est enfin admis que l’utilité des agents
économiques peut comprendre, outre le don et sa capacité à s’assurer une descendance,
d’autres dimensions telles que le loisir, la création artistique, le bonheur de proches, la
gratuité apparente des actes. La liste n’est pas limitative et il suffit de s’assurer que, soumis
à differents environnements avec des « prix relatifs » différents, les individus font des
choix en cohérence avec leurs choix passés.
En outre, même dans le cas où le comportement des individus échappe systématiquement
à la rationalité construite par la microéconomie, comme dans le cas de nos biais de
perception, notre suroptimisme, notre capacité à être manipulés dans les supermarchés
ou par la publicité, la microéconomie ne nous dit-elle pas ce que nous devrions faire et
donc a contrario ne pas faire, prouvant ainsi son caractère essentiel ? Ainsi, même quand
la micréconomie est défaillante à rendre compte des actes, son caractère normatif reste
applicable. Bien sûr, nous n’épargnons peut-être pas assez pour nos vieux jours car nous
cédons à l’impulsion de la consommation ; bien sûr, nous épuisons les ressources non
renouvelables sans nous soucier du futur ; bien sûr, l’humanité a une tendance spontanée
à épuiser les ressources renouvelables, polluer, réduire le nombre d’espèces vivantes. La
microéconomie nous explique, à travers ses différents concepts, comment tout ceci se
produit et quelle est la situation souhaitable à laquelle il faudrait parvenir, notamment au
travers du calcul économique : la valeur du futur pour un individu, pour une génération,
la valeur de la préservation d’un écosystème et les ressources présentes que nous devrions
sacrifier pour préserver cette valeur, le sentier prévisible du prix du pétrole et le moment
auquel nous devrons préférer investir dans une ressource alternative.
En d’autres termes, tout ce qui a été vu jusqu’ici doit être conservé, et l’économie
comportementale ne remet pas en cause l’intérêt de l’analyse normative ; en revanche,
elle souligne les contextes dans lesquels on peut manipuler la rationalité. Le marketing
expérimental n’est peut-être pas l’invention la plus enrichissante pour l’humanité ; mais
5
6
Les enseignements de l’économie comportementale
il faut savoir que cela existe et le prendre en compte dans notre propre analyse ne serait-ce
que pour pouvoir donner tort à ceux qui tentent de nous manipuler.
Il faut enfin ajouter un dernier avertissement préalable : ce chapitre intervient en fin
d’ouvrage, mais il n’est pas un remords tardif. Il est juste un développement logique de ce
qui précède, tant l’ensemble du manuel a distillé tout au long de sa rédaction les limites
de la description du comportement par des actes purement rationnels. Dès le chapitre 1,
nous soulignions dans l’exemple consacré aux gangs de vendeurs de crack que l’espérance
de survie des vendeurs était particulièrement faible ; ou que certains biens avaient un
caractère addictif, analyse reprise dans le chapitre 5 ; dans le chapitre 6, nous avions
introduit les études sur le bonheur (happiness studies) et constaté que si l’argent ne faisait
pas le bonheur, d’autres dimensions comptaient énormément : la stabilité économique ou
familiale, la qualité des institutions, la santé, être employé plutôt que chômeur contribuent
plus sûrement au sentiment de satisfaction que 10 % de revenu en plus. De nouveau, cela
ne remet pas en cause la notion d’utilité. Chacune de ces caractéristiques contribuant
à la satisfaction d’un individu pouvait se réinterpréter comme un taux marginal de
substitution entre cette dimension d’une part, et une dimension monétaire d’autre part.
Le chapitre 7 consacré aux choix intertemporels avait illustré, à travers le paradoxe d’Ulysse
et les sirènes, que lorsqu’il s’agit de planifier nos actions futures à la date d’aujourd’hui,
nos plans pouvaient en effet apparaître très rationnels. . . mais que, lorsqu’il s’agissait
de les mettre en application, nous pouvions alors les remettre en cause et « remettre à
après-demain ce que nous avions initialement prévu pour demain ». De même, dans le
chapitre 8 consacré à l’incertain, nous avions discuté des travaux de Kahneman et Tversky,
qui établissent les différents écarts à la rationalité : les individus peuvent sous-estimer les
fortes probabilités et surestimer les faibles probabilités. D’autres formes de comportements
en apparence non strictement rationnels ont aussi été identifiés dans les chapitres consacrés
à la théorie des jeux, comme la capacité à coopérer dans le dilemme du prisonnier en jeu
répété. Ce chapitre va donc simplement développer et ordonner ces comportements et en
tirer les leçons pour l’analyse des politiques économiques.
2 Les biais de rationalité dans les expériences
contrôlées
À partir des années 1970 et à la suite des travaux d’Allais, Kahneman et Tversky ont
tenté de remettre en question les théories standards de l’utilité. Ces deux derniers auteurs
sont considérés comme les fondateurs de l’économie expérimentale qui a recours à des
expériences en laboratoire. Leurs travaux ont ainsi montré qu’une majorité de personnes
confrontées à des tests expérimentaux prend des décisions non conformes aux axiomes
de rationalité. D’après eux, les individus sont victimes de « biais de jugement ». Ces biais
résultent de ce qu’ils appellent des « heuristiques », c’est-à-dire des raisonnements que
nous appliquons de manière routinière aux situations quotidiennes, sans vérifier leur
pertinence. À titre d’exemple, beaucoup de gens vont juger qu’avec un salaire de départ
de 30 000 dollars annuels, une augmentation de 1 500 dollars associée à une inflation de
5 % est préférable à une augmentation de 600 dollars sans inflation. Cela ne semble pas
Les enseignements de l’économie comportementale
rationnel : l’inflation de 5 % sur le salaire initial réduit le pouvoir d’achat de précisément
1 500 dollars et l’augmentation de salaire ne fait que rendre l’inflation neutre en termes
de pouvoir d’achat, alors que la seconde alternative fait en revanche gagner 600 dollars de
pouvoir d’achat.
Kahneman et Tversky montrent également que les gens ont tendance à faire des choix dans
lesquels, en apparence, ils surpondèrent les probabilités très faibles ou sous-pondèrent
les probabilités moyennes et fortes, ce qui permet d’expliquer le paradoxe d’Allais. En
outre, dans la plupart des situations de la vie réelle, les probabilités des résultats des
décisions ne sont pas connues, et les espérances d’utilité ne peuvent être calculées. Il faut
également noter que l’utilité des individus ne dépend pas uniquement de leur richesse
mais également de facteurs « irrationnels » tels que la douleur psychique que provoquent
les pertes nominales de valeur, le besoin d’imiter le comportement d’autres individus ou
des considérations éthiques.
Kahneman et Tversky : la théorie des perspectives (prospect theory)
La théorie des perspectives (prospect theory) est une théorie économique développée
par Daniel Kahneman et Amos Tversky dans un article de 19791 . Sur la base de
constats empiriques, elle démontre que les individus évaluent de façon asymétrique
leurs perspectives de perte et de gain. Les individus se déterminent en fonction
d’un niveau de référence – la richesse initiale par exemple – par rapport à laquelle ils
évaluent différemment les gains et les pertes d’utilité. La fonction d’utilité décroît plus
rapidement pour les pertes qu’elle n’augmente pour les gains. Ainsi, il y a chez l’agent
économique une aversion à la perte (loss aversion) qui explique par exemple pourquoi
la perspective de perdre 1 000 euros nous paraît beaucoup plus décisive que celle de
les gagner, ou encore pourquoi le joueur de casino prend des risques inconsidérés
pour récupérer sa mise. Dans le prolongement de cette théorie, on trouve les modèles
d’utilité pondérée2 , qui utilisent l’asymétrie ainsi introduite entre gains et pertes
pour distinguer les « optimistes », qui surpondèrent les probabilités des événements
favorables, des « pessimistes », surtout sensibles aux événements défavorables.
Ces expériences se sont multipliées et ont rapidement montré la prévalence des phénonèmes d’écart à la rationalité. Nous ne citerons que les plus célèbres et renverrons le lecteur
à l’excellent ouvrage pédagogique d’Eber et Willinger3 .
1. D. Kahneman et A. Tversky, « Prospect theory: An analysis of decision under risk », Econometrica, vol. 47, n˚ 2,
mars 1979, p. 263-292.
2. Soo Hong Chew, « A generalization of the quasilinear mean with applications to the measurement of income
inequality and decision theory resolving the Allais paradox », Econometrica, vol. 51, n˚ 4, juillet 1983, p. 10651092.
3. Eber Nicolas et Marc Willinger, L’Économie expérimentale, La Découverte, coll. « Repères », n˚ 423, 2e éd.,
2002.
7
8
Les enseignements de l’économie comportementale
Le contexte peut-être le plus connu dans lequel des comportements apparemment non
rationnels existent est le jeu du dictateur introduit par Kahneman, Knetsch et Thaler1 .
Il montre que les individus prennent en compte, dans leurs comportements, une notion
d’équité ou de justice, que l’anglais résume sous le nom de fairness. Le jeu peut être
résumé comme suit. Dans un contexte purement expérimental destiné à isoler des effets
perturbateurs, un individu reçoit une dotation initiale disons de 100 jetons, qui seront
à la fin du jeu transformés en argent réel (par exemple, 10 jetons correspondraient à 1
euro). Cet individu peut décider de tout garder pour lui ou d’en donner une partie à
un autre individu, anonyme, qu’il ne rencontrera en principe jamais (la règle du double
anonymat garantit par ailleurs que le receveur potentiel ne pourra pas l’identifier non
plus). Si l’individu est dénué de tout altruisme, il ne devrait jamais donner le moindre
jeton. Or, on s’aperçoit que les individus donnent fréquemment ; une partie significative
des jetons est en effet donnée : en moyenne, c’est ainsi 20 % des dotations initiales qui sont
redistribuées sans contrepartie. Ce jeu ne remet pas en cause la notion d’utilité, il suffit
que l’altruisme soit un facteur entrant dans l’utilité. Le don est un bien de consommation
particulier, dont nous avions vu qu’il était du reste à la fois normal et ordinaire : plus la
valeur du don est importante, moins on donne ; plus la dotation initiale est importante,
plus on donne.
Un autre dispositif expérimental est le jeu de l’ultimatum, développé par Güth et al.2 .
L’individu 1 reçoit toujours ses 100 jetons et décide d’en donner une partie au joueur 2.
Mais, cette fois-ci, le joueur 2 peut accepter ce don ou le refuser. Dans ce dernier cas,
aucun des deux joueurs ne reçoit alors quoi que ce soit. L’idée est ici d’introduire un point
de menace. Il est conçu pour dissuader l’égoïsme pur consistant à ne pas donner. Il devrait
alors inciter à faire le don minimum. En effet, dans ce cas précis la théorie des jeux peut
appliquer son raisonnement à rebours (backward induction) comme suit : si l’unité de
base est un jeton, le joueur 1 devrait ne proposer qu’un jeton et conserver les 99 autres, de
façon à ce que le joueur 2 accepte cette proposition : un jeton est mieux que pas de jeton
du tout.
Or, ce n’est pas ce qui est proposé empiriquement dans ces jeux : les joueurs offrent en
moyenne jusqu’à 40 % du total des jetons, soit deux fois plus que précédemment ; très
peu de joueurs proposent le minimum (un jeton) ; qui plus est, le second joueur rejette
en moyenne une offre sur deux pour les offres inférieures à 20 % ; enfin, le mode de la
distribution des dons (le choix le plus fréquent) est le partage équitable 50-50. Si cela
peut suggérer que la théorie des jeux échoue à prédire ce qui se passe, il est à noter qu’on
retrouve des traces de rationalité ici. D’une part, le joueur 1 donne plus que dans le simple
jeu du dictateur où il ne faisait face à aucune menace. D’autre part, il peut anticiper
rationnellement que le joueur 2 ne soit pas rationnel, et par exemple anticiper une règle
ad hoc – non rationnelle – de rejet systématique par le joueur 2 en dessous d’un certain
seuil de fairness ; il est donc parfaitement rationnel pour le joueur l de proposer plus. Ce
qui est en apparence irrationnel ici est le refus du joueur 2 d’accepter des offres faibles.
1. D. Kahneman, J. Knetsch et R. Thaler « Fairness and the Assumptions of Economics », Journal of Business,
vol. 59, 1986, p. S285-S300.
2. W. Güth, R. Schmittberger, and B. Schwarze « An experimental analysis of ultimatum bargaining », Journal of
Economic Behavior and Organization, 3, 1982, p. 367-388.
Les enseignements de l’économie comportementale
Et, même dans ce cas, la rationalité n’est jamais loin : si on imagine une variante du jeu
précédent dans laquelle le joueur 2 peut signaler qu’il rejettera aléatoirement les offres
sous un certain seuil, il devient dès lors rationnel pour ce joueur 2 d’être irrationnel. Par
là, on entend qu’il est intéressant de se contraindre dans ces choix pour obtenir un gain
plus important. On retrouve ici la stratégie du joueur de poker : celui-ci laisse deviner
que, de temps en temps, il va jouer une mise importante avec une main faible – de façon à
ce que l’autre le croit irrationnel et surenchérisse de temps en temps pour mieux perdre.
Une autre interprétation, moins cynique, est que les individus ne cherchent pas à
maximiser leur utilité telle que définie par la théorie ; ils prennent en compte des
considérations d’équité : je n’accepte que ce qui est équitable ; si j’estime la proposition
inéquitable, je la rejette contre mon intérêt immédiat. Ainsi, une offre en dessous de
20 jetons est considérée comme inéquitable pour certains, équitable pour d’autres.
La portée de ces expériences est cependant nécessairement limitée car les gains sont faibles
et le contexte particulier. Si Bill Gates nous offrait 1 % de sa fortune dans le cadre du jeu
de l’ultimatum, nous accepterions sans doute ses 801 millions de dollars (Forbes estimant
à la date d’aujourd’hui sa fortune à 80,1 milliards de dollars) même si l’on peut penser
que 1 %, c’est une fraction inéquitable. On objectera que Bill Gates a gagné cet argent, et
donc que c’est différent des 100 jetons donnés initialement. Oui, mais si Mme Bettencourt
nous donnait 1 % de sa fortune qu’elle a elle-même héritée, nous accepterions aussi !
Plus troublant, il s’avère que lorsque certaines informations sur les deux joueurs sont
communiquées, le genre des joueurs par exemple, les fairness points peuvent se déplacer.
Ainsi, par rapport à l’anonymat complet, les offres moyennes faites par le joueur 1 (qu’il
soit homme ou femme) au joueur 2 semblent être en moyenne plus élevées lorsque ce
dernier est un homme que quand c’est une femme. Les hommes et les femmes, en tant
que joueur 1, ont tous les deux le même comportement biaisé envers les hommes. De leur
côté, les joueurs 2 choisissent un point de refus plus élevé quand ils font face à un joueur 1
féminin1 . La microéconomie classique a beaucoup de défauts, mais elle a le mérite d’être
neutre au genre. Le monde décrit par l’économie expérimentale est-il vraiment préférable
d’un point de vue prescriptif ? A contrario, la microéconomie classique peut-elle prétendre
comprendre et prévenir les discriminations de genre si elle ne peut pas modéliser ces effets ?
Dans le jeu de la confiance2 , on introduit un effet multiplicateur et une nouvelle étape
dans le processus. Le joueur 1 choisit un montant disons X sur ses 100 jetons initiaux ; le
joueur 2 reçoit de sa part un montant multiplié par rapport à X : par exemple, le montant
donné est triplé. Le joueur 2 reçoit donc 3X – le montant est triplé par l’organisateur du jeu,
auquel on ajoute forfaitairement 10. La nouvelle étape est que le joueur 2 a la possibilité
de rétrocéder une partie Y de cette somme au joueur 1. Ce sera donc un montant compris
entre 0 et 10 + 3X. L’idée est ici d’inspirer de la confiance pour que la somme initialement
donnée X soit la plus élevée possible, de façon à maximiser les ressources collectives,
qui seront ensuite repartagées. Que dit la théorie des jeux ? De nouveau, par backward
induction, le joueur 2 ne devrait rien redonner puisque tout est anonyme : Y = 0. Mais le
1. S. Solnick, « Gender differences in the ultimatum game », Economic Inquiry, 39, 2001, p. 189-200.
2. J. Berg, J. Dickhaut et K. McCabe, « Trust, Reciprocity, and Social History », Games and Economic Behavior, 10,
juillet 1995, p. 122-42.
9
10
Les enseignements de l’économie comportementale
joueur 1 l’anticipant, il devrait lui non plus ne rien donner. On aurait donc là un comportement rationnel du point de vue individuel et irrationnel du point de vue collectif. Or, il
s’avère qu’en moyenne, le joueur 1 donne la moitié de sa dotation ; le joueur 2 lui redonne
son gain initial ; ce n’est pas rationnel ; notons au passage que ce n’est pas très juste non plus
de la part du joueur 2 qui a obtenu une somme dont il ne restitue en moyenne que le tiers.
Enfin, la notion de suroptimisme a également été testée par différents auteurs. On citera
l’étude de Camerer et Lovallo1 qui teste la décision de participation à un marché dans
lequel les gains et pertes dépendent du nombre d’autres entrants. Plus il y a d’entrants,
plus les gains sont faibles et les pertes importantes. On ne fait des gains que si le nombre
de joueurs est inférieur à un nombre préannoncé aux participants. De façon intéressante,
les participants estiment généralement correctement le nombre potentiel des autres
participants et ne se trompent pas systématiquement sur ce point. Le marché fonctionne. . .
jusqu’à un certain point. En effet, quand le payoff du jeu dépend des capacités individuelles,
les participants surestiment leurs propres capacités de façon systématique.
Les trois premiers exemples de cette section sont des éléments indiquant que les individus
peuvent avoir ce qu’on appelle plus généralement des préférences sociales qui impliquent
les comparaisons interpersonnelles, les notions de réciprocité et de fairness ; le dernier de
ces exemples montre que les individus peuvent se tromper sur eux-mêmes, et donc qu’il
ne se connaissent pas parfaitement.
3 Les motivations des individus
dans les comportements in situ
Une des critiques régulièrement formulées à l’égard des expériences de laboratoire est leur
validité externe. Dans un cadre expérimental, soit il n’y a pas d’enjeu, ou celui-ci est faible, soit
le sujet fournit une réponse dont il pense qu’elle correspond partiellement ou totalement à
celle attendue par l’expérimentateur. Cette critique s’adresse aussi à toutes les études menées
dans le cadre des expérimentations aléatoires, malgré le soin apporté à ces études.
Les règles de comportement ad hoc existent-elles ?
Voyons maintenant des exemples de la vie réelle étudiés par l’économie comportementale.
Une controverse célèbre a opposé quatre chercheurs2, qui prétendaient avoir identifié un
comportement irrationnel chez les chauffeurs de taxi newyorkais, et un chercheur plus
orthodoxe de UCLA qui a contesté leur interprétation. Le cas étudié est la règle d’arrêt dans
la journée des chauffeurs de taxi. Le contexte est le suivant. Chaque jour, les compagnies de
taxi collectent des données sur les heures travaillées dans la journée et les recettes journalières
dont le chauffeur est entièrement crédité (il est residual claimant pour reprendre le concept
1. C. Camerer, et D. Lovallo. « Overconfidence and excess entry: An experimental approach », American Economic
Review, vol. 89, n˚ 1, 1999, p. 306-318 ; http://www.hss.caltech.edu/~camerer/AER_Overconfidence.pdf
2. C. Camerer, L. Babcock, G. Loewenstein et R. Thaler, « Labor supply of New York city cab drivers: One day at a
time », Quarterly Journal of Economics, Mai 1997, p. 407-441.
Les enseignements de l’économie comportementale
développé dans le chapitre sur l’aléa moral). En contrepartie, il paie une redevance qui
est entre 76 dollars et 87 dollars par rotation et le coût de l’essence durant cette période
de rotation qui est en moyenne de 15 dollars. On peut évaluer le « salaire horaire » de la
journée en divisant la recette de la journée par le nombre d’heures effectuées.
Colin Camerer et ses coauteurs observent que les chauffeurs de taxi effectuent d’autant
plus d’heures par jour que les revenus horaires générés cette journée sont faibles. Ils
affirment que la règle de comportement est sous-optimale : comme nous l’avions décrit
lors du chapitre introductif, il faut travailler jusqu’à ce que le gain marginal du temps
passé coïncide avec le coût marginal de l’effort. Quand les clients sont nombreux, il faut
faire plus de courses, car le salaire horaire – les revenus générés chaque heure de conduite
– est plus élevé ; quand ils sont rares, il faut s’arrêter, car le salaire horaire est plus faible.
C’est pourtant l’inverse que disent avoir observé ces auteurs. Le coefficient de corrélation
entre le (log du) salaire horaire de la journée et le (log du) nombre d’heures serait entre
−0,3 et −0,5, et non pas positif comme nous pourrions le penser.
L’interprétation proposée est qu’en réalité les chauffeurs de taxi n’égalisent pas coût
et recette marginale. Ils raisonneraient différemment. Ils cibleraient ainsi un seuil
psychologique de recettes journalières – daily targeting – à l’issue duquel ils décident
de s’arrêter, par exemple 150 dollars. Cela compenserait le coût de location du taxi à
la société et assurerait des revenus correspondant aux attentes du chauffeur en termes
de revenu journalier. Cette règle comportementale serait le signe de raisonnements non
rationnels. La conclusion des auteurs est sans appel : « Nous avons obtenu une hypothèse
simple en économie comportementale – daily targeting – qui prédit que le signe d’un
coefficient de régression est l’opposé de celui prédit par la théorie standard, et donc nous
avons une différence fondamentale – qualifiée de dramatic – entre les deux théories. »
La théorie classique serait non représentative des comportements réels. Les auteurs ne
vont cependant pas jusqu’à conclure qu’il faudrait rééduquer ces chauffeurs de taxi pour
qu’ils se comportent de façon à maximiser leurs gains. Et c’est pourtant l’implication
naturelle de leurs résultats si aucun problème de données ou de variables manquantes
n’avait conduit à ce résultat important.
Cela nous amène à la critique formulée par Henry Farber sur ce résultat1 . Celui-ci conteste
l’analyse et indique au contraire que la décision d’arrêter des chauffeurs est d’abord et
avant tout liée au nombre d’heures effectuées depuis le début de la journée : la convexité
du coût de la fatigue et les régulations imposant un le nombre d’heures maximal seraient
les premiers facteurs conduisant à cette décision. Il conteste aussi l’existence d’un salaire
horaire qui serait fixe dans la journée : au contraire, ce salaire évolue dans la journée et,
en toute logique, la décision d’arrêter ou de continuer dépend du salaire horaire courant,
et pas de la moyenne passée de ce salaire horaire au cours de la journée, comme dans la
régression de Camerer et al.. Les chauffeurs interrogés par Henry Farber travaillaient 11
heures par jours six jours sur sept – la limite légale étant 12 heures par jour. Ils répondaient
fréquemment à sa question sur le moment où ils s’arrêtent par : « je dois m’arrêter quand je
suis trop fatigué » ; et ils niaient à deux exceptions sur 25 avoir un montant journalier cible.
1. Henry Farber, « Is tomorrow another day ? The labor supply of New York city cabdrivers », Journal of Political
Economy, vol. 113, n˚ 1, 2005.
11
12
Les enseignements de l’économie comportementale
Le débat reste donc ouvert sur la rationalité ou non des chauffeurs de taxi et plus largement
des agents économiques. Ce qui est certain, c’est que les déterminants monétaires ne
peuvent jamais être la seule explication aux choix observés et que le processus de décision
inclut de nombreux éléments psychologiques ou physiologiques, en l’occurrence ici la
fatigue. Nous allons proposer deux illustrations de cet énoncé.
Motivations extrinsèques, intrinsèques et conflits
intra-individuels
Une théorie originale élaborée dans une forme élégante et assez aboutie est celle de
Roland Benabou et Jean Tirole déjà évoquée dans le chapitre 21. Leur idée est que nos
actions sont faites à la fois pour remplir nos objectifs « classiques » comme les arbitrages
consommation-loisir, mais aussi pour révéler nos qualités, nos préférences, que ce soit aux
autres ou à nous-mêmes si nous ignorions notre propre type. En d’autres termes, nous ne
nous connaissons pas entièrement, les autres a fortiori nous connaissent encore moins, et
ce sont nos actes qui nous définissent. Il est vrai que lorsque quelqu’un part escalader le
Mont-Blanc, on ne peut pas dire que ce soit pour maximiser son bien-être ; se geler les
pieds sans oxygène n’est pas particulièrement gratifiant et aurait plutôt des effets négatifs
à long terme sans parler du risque d’accident mortel. Pourtant, certains le font, sans même
la satisfaction d’être les premiers ou parmi les 1 000 premiers. Benabou et Tirole prennent,
eux, l’exemple du don. Nous pourrions être âpres au gain ou au contraire soucieux des
autres, ou tout état intermédiaire entre ces deux extrêmes. Nous allons donner aux autres,
pour prouver au monde et à nous-mêmes que nous sommes des gens biens, et du reste
sans forcément que ce ne soit le cas.
Les incitations monétaires sont appelées extrinsèques. Elles sont du ressort de l’analyse
classique. Mais elles peuvent interférer de façon contre-productive avec les incitations
intrinsèques, celles qui nous révèlent. En effet, lorsque l’action est rémunérée, le fait
d’envoyer le signal par son action, et donc de payer un coût associé, mais de regagner
une partie voire la totalité de ce coût annule tout ou partie de sa valeur de signal. Ainsi,
la politique visant à sanctionner par une amende légère les parents arrivant en retard
pour récupérer leurs enfants à l’école en Israël avait-elle conduit à une augmentation des
retards, les parents estimant qu’il leur suffisait désormais de payer pour être dédouané
de leur retard (voir chapitre 21). Pour autant, ces deux dimensions ne sont pas toujours
contradictoires : la défiscalisation aux deux tiers des dons à des associations reconnues
d’utilité publique permet à la fois d’activer les motivations extrinsèques et intrinsèques,
du moins dans le confort de l’anonymat de sa déclaration d’impôt.
Un second exemple a lui aussi été brièvement évoqué dans le chapitre consacré aux choix
intertemporels. Dans ce contexte, les individus planifient leurs actions à l’avance pour les
dates futures. Ils aimeraient se conformer à ce planning. Ainsi, planifier une épargne pour
sa retraite est une décision logique et pleine de sens. En revanche, il peut arriver que l’on
soit soumis à des tentations de court terme visant à consommer et que l’on renonce aux
choix de long terme.
Les enseignements de l’économie comportementale
La fourmi et la cigale ont chacune leur stratégie. Chacune de ces stratégies est cohérente ;
elles correspondent juste à des préférences différentes. Mais la nouveauté est qu’il semble
bien que nous soyons tour à tour fourmi et cigale, fourmi quand nous planifions pour
notre futur moi (notre self futur) et cigale quand le futur self est en capacité de décider et
donc de contredire le self passé.
Dit ainsi, nous exprimons le dilemme entre ces choix comme des conflits intrapersonnels
mais à différentes périodes. Ce dilemme avait été rencontré par Ulysse qui l’avait tranché
en s’attachant au mât et en bouchant les oreilles de ses rameurs. La branche de l’économie
qui analyse ces conflits entre ces différents moi est appelée picoeconomics, car l’unité
d’analyse ne se situe plus au niveau de l’individu mais à un niveau inférieur. Levine
et Fudenberg, deux éminents théoriciens des jeux, ont poussé cette logique jusqu’au
bout. Selon eux, le comportement humain peut se représenter comme une interaction
stratégique à deux acteurs1 . L’un est en charge du long terme et de la planification. Le
second est aux commandes : c’est lui qui applique les décisions dans le court terme. Mais
comme dans le chapitre consacré à l’aléa moral, le self de long terme n’a pas les moyens de
contrôler entièrement et parfaitement le self de court terme. Payer un coût pour contrôler
le self de court terme rend ce contrôle optimal dans certains contextes : c’est précisément
le self-control. Mais ce coût peut devenir prohibitif et, dans ce cas, il est préférable pour
le self de long terme de lâcher prise, de laisser le court terme dominer, puis de reprendre
le contrôle face à un self de court terme lui-même affaibli. Les auteurs montrent que cette
théorie de la décision permet d’expliquer de nombreux faits, notamment l’hyperbolicité des
fonctions d’utilité intertemporelle et certains paradoxes liés à l’aversion pour le risque. Par
un joli retournement, les auteurs utilisent la théorie microéconomique de base – des agents
veulent maximiser selon leurs propres objectifs – pour rendre compte de comportements
non rationnels et en partie erratiques – comme les périodes de perte de self-control !
La picoéconomie
Cette branche de l’analyse, définie par le psychologue George Ainslie, encore appelée
micro-microéconomie tente de rendre compte de l’incohérence temporelle. Les
humains (souvent) et les animaux inférieurs (toujours) escomptent les gains futurs au
moyen d’une courbe hyperbolique et pas exponentielle, et qui était celle qui conduit
aux choix cohérents rationnellement de Paul Samuelson. Que la période de temps
soit la seconde ou la décennie, des sujets exposés à des alternatives expérimentales
indiquent toujours qu’ils préfèrent un montant plus petit immédiatement à un
montant plus important plus tard. Le paradoxe de l’incohérence temporelle est que
ces choix peuvent être fréquemment inversés si un délai pour les deux alternatives est
proposé : le délai rend le bénéfice immédiat moins valorisant. Ainsi, nous pourrions
préférer 100 tout de suite à 200 dans un an, mais préférer 200 dans un an et un
mois à 100 dans un mois. La courbe d’escompte exponentielle ne permet pas de
rendre compte de cette inversion, car le taux d’escompte entre deux périodes est
1. David K. Levine et Drew Fudenberg, « A dual-self model of impulse control », American Economic Review,
vol. 96, n˚ 5, décembre 2006.
13
14
Les enseignements de l’économie comportementale
fonction uniquement de l’éloignement entre ces deux périodes, et pas de l’éloignement
par rapport au présent immédiat. Les courbes qui correspondent le mieux aux
données observées sont en fait hyperboliques (voir notamment David Laibson1 ).
Afin d’expliquer cela, on peut introduire l’idée d’une relation stratégique entre des
sois successifs. À un moment donné, une personne est alors conduite à verrouiller ses
choix futurs en prenant des engagements pour se contraindre. Un tel comportement
stratégique suggère que les règles d’interaction interpersonnelle, entre deux personnes
distinctes, peuvent aussi sous-tendre la prise de décision intrapersonnelle. Ce que
nous croyons être le libre arbitre pourrait alors être le résultat de négociations
intertemporelles analogues à un dilemme du prisonnier répété.
4 L’apport de la neuroéconomie et des sciences
médicales sur la compréhension des déterminants
des décisions individuelles
Des êtres manipulables
Le comportement individuel est régi par libre arbitre. Du moins aimons-nous à le croire.
Ainsi nous serions responsables de nos choix, qui devraient nous conduire à remplir les
objectifs que nous nous assignons : travailler, épargner, acheter un appartement, fonder
un foyer, obtenir une promotion, conquérir un parti, aider nos concitoyens. Pourtant, les
travaux les plus récents montrent qu’une partie de nos perceptions et par conséquence de
nos choix sont partiellement le résultat de processus neurocognitifs qui nous échappent.
Le plus connu et le plus ancien est l’effet placebo. Lorsque nous prenons une pilule inerte
dont nous ne savons pas si elle est différente d’un médicament doté d’un principe actif,
notre état s’améliore pourtant significativement, et l’effet « causal » du médicament doit
s’apprécier comme l’écart entre l’amélioration d’un groupe recevant le principe actif et
l’amélioration due à cet effet placebo, ce qui est une différence-en-différences, définie
dans le chapitre 3. Donc, nous sommes manipulables.
Si la médecine peut nous manipuler, qu’en est-il des vendeurs ? Comme nous l’avons vu en
introduction, pour déclencher un achat, peu importe que celui-ci nous apporte quelque
chose de réel ; il suffit que nous ayons l’impression que notre bien-être (notre utilité)
sera plus élevé après l’achat qu’avant ; les vendeurs de vêtements utilisent des miroirs
déformants pour nous faire croire que nous sommes plus minces ou plus sportifs que nous
ne le sommes réellement, et que par hasard cette impression favorable sur nous-même
coïncide avec le port de cette veste ou de ce tailleur ; et même si nous ne sommes pas
entièrement dupes, nous faisons comme si c’était le cas, ce qui est la forme la plus aboutie
de manipulation, l’auto-intoxication. Avons-nous remarqué que, lors des visites, les agents
immobiliers commencent presque toujours par le bien le plus invendable, trop cher ou
1. David Laibson, « Golden eggs and hyperbolic discounting. » The Quarterly Journal of Economics, 112(2), 1997,
p. 443-477.
Les enseignements de l’économie comportementale
en trop mauvais état, pour que les deuxième et troisième biens visités puissent déclencher
un « coup de cœur » ? La couleur des objets influe sur la perception, jusque dans les
déterminants les plus fondamentaux, comme le coefficient d’aversion pour le risque (la
couleur rouge de l’introduction de ce chapitre le ferait diminuer temporairement et donc
stimulerait une prise de risque).
Par quels mécanismes les décisions se déclenchent-elles et comment le cerveau évalue-t-il
les gains et pertes des décisions ? C’est ce que les avancées récentes permettent de mieux
comprendre.
L’imagerie du cerveau et les mécanismes de prise de décision
Les études sur le sujet du fonctionnement du cerveau sont souvent frappantes. L’une
d’entre elles mérite qu’on s’y arrête. Elle a été menée par une équipe allemande de
psychologues1 . Des sujets doivent noter des boissons qu’ils reçoivent passivement à l’aide
d’un tuyau. Juste avant l’ingestion, un écran leur passe très rapidement une image de
la marque censée commercialiser le breuvage : Coca-Cola, Pepsi-Cola, River Cola (une
marque générique allemande) et enfin T-Cola, une marque qui n’existe pas et qui est donc
inconnue des sujets. En réalité, la boisson ingérée est un coctktail des trois premières,
en proportions égales. Les sujets devraient donc globalement être indifférents entre
ces quatre ingestions. Or, les deux premières, marques mondialement connues, avaient
systématiquement de meilleures notes que les autres. De façon plus intrigante, l’activité
cérébrale des sujets – qui était visualisée par IRM (imagerie par résonnance magnétique)
– était différente selon le type d’écran qu’ils venaient de voir. Lorsqu’ils avaient vu sur leur
écran l’une des marques connues, une zone spécifique – le striatum ventral – située sous
le cortex et semble-t-il consacrée à la récompense et au plaisir, c’est-à-dire le siège de la
motivation –, s’activait davantage.
En revanche, une autre zone, le cortex orbitofrontal, région du cortex frontal qui entre
en jeu dans le processus de décision, était moins actif pour les boissons connues, et plus
actif pour les marques inconnues ; comme si la marque visait à amoindrir les capacités de
réflexion préalables à la décision2 . Nos décisions sont manipulées de différentes façons et
plus certains accumuleront du savoir, plus il sera urgent de populariser ce savoir.
Une fois tout cela compris, ne commençons-nous pas à regretter le monde néoclassique
pur, où la décision de consommation correspondait à un choix rationnel et pas à l’influence
d’une série de signaux suggestifs ou d’auto-illusion ? Quoi qu’il en soit, les économistes
ont également investi le champ de la neuroéconomie et tentent de comprendre par quels
mécanismes le cerveau évalue les décisions qu’il prend ou tout simplement comment il
attribue une valeur aux objets, aux actes, puis comment il prend ses décisions, comment
il mémorise et comment il oublie de façon sélective, s’il est véritablement le siège des
1. Simone Kühn et Jürgen Gallinat, « Does taste matter ? How anticipation of cola brands influences gustatory
processing in the brain », PLOS One, avril 2013.
2. Pierre Barthélémy, qui relate cette étude sur son blog http://passeurdesciences.blog.lemonde.fr/2013/06/16/commentles-grandes-marques-influent-sur-nos-cerveaux/, en souligne aussi les limites méthodologiques. Il alerte également
sur les dangers potentiels de ce type d’influence.
15
16
Les enseignements de l’économie comportementale
différents conflits interpersonnels, ce que les recherches actuelles semblent en effet
suggérer. De plus, certains traits comportementaux décrits en introduction semblent
être visualisés dans le cerveau. Par exemple, un des enseignements de cette discipline
a trait au biais d’aversion à la perte. Des chercheurs1 ont évalué les zones actives du
cerveau lorsque les individus de l’étude (des sujets recrutés à Caltech) doivent gérer
un portefeuille d’actions et réaliser des transactions. Les gains ou les pertes avaient des
impacts différents : certaines zones s’activaient spécifiquement en cas de gains, notamment
le cortex préfrontal, et pas dans le cas de pertes, indiquant ainsi une asymétrie. D’autre
part, les auteurs suggèrent que cette zone s’active en fonction des gains bruts en capital,
mais pas en fonction de la valeur espérée des gains nets, qui serait pourtant ce qui se
passerait si les agents maximisaient une utilité espérée.
La mesure physiologique du stress et les mécanismes de prise
de décision
Ce lien entre les neurosciences et la rationalité a été approfondi et donne des conclusions
particulièrement frappantes. Ainsi, l’étude de la pauvreté s’est enrichie d’une meilleure
connaissance des raisons profondes de l’absence apparente de rationalité de la part de
populations en situation de grande difficulté. Dans un article paru dans la prestigieuse
revue Science2 , Johannes Haushofer et Ernst Fehr étudient les trappes de pauvreté
dues à l’enchaînement de causalités réciproques entre pauvreté et mauvaises décisions
économiques. Ils montrent notamment que la pauvreté est associée à un stress mesuré par
le taux de cortisol dans l’organisme ; certaines études indiquent que ce lien est causal3 ; le
taux mesuré est le cortisol dans la salive ; les sujets vivant au Kenya reçoivent aléatoirement
un transfert en espèces de 0, 400 ou 1 500 dollars ; seuls ceux qui reçoivent le montant
maximal voient leur taux de cortisol baisser significativement, le montant étant associé à
une diminution substantielle ; alors que le bonheur mesuré sur une échelle de satisfaction
augmente sensiblement et dans les mêmes proportions pour les individus ayant reçu
400 ou 1 500 dollars ; le taux de cortisol serait ainsi une mesure objective du stress plus
performante que l’autodéclaration. Qui plus est, dans des études séparées, la présence de
cortisol est associée à des comportements d’investissement de court terme et averse au
risque4 .
1. Cary Frydman, Nicholas Barberis, Colin Camerer, Peter Bossaerts et Antonio Rangel, « Using neural data to
test a theory of investor behavior: An application to realization utility », Journal of Finance, 2013. Voir aussi un
intéressant article de synthèse de Thomas Renault (Paris 1 et Ieseg Paris) sur son blog, citant cet article et quelques
autres exemples liés à la finance comportementale.
2. Johannes Haushofer et Ernst Fehr, « On the psychology of poverty », Science, 344, 862, 2014.
3. J. Haushofer, J. Shapiro, « Household response to income changes: Evidence from an unconditional cash
transfer program in Kenya », Massachusetts Institute of Technology Working Paper, 2013 ; disponible sur
http://web.mit.edu/joha/ www/publications/haushofer_shapiro_uct_2013.11.16.pdf
4. A. Cohn, J. Engelmann, E. Fehr, M. A. Maréchal, « Evidence for countercyclical risk aversion: An experiment with
financial professionals ». UBS International Center of Economics in Society Working Paper, n˚ 4, 2013 ; disponible
sur http://papers.ssrn.com/sol3/papers.cfm?abstract_id=2327557. Dans cette étude, les auteurs induisent un état de
stress chez des sujets en les soumettant à une menace de chocs électriques d’intensité variable (rien de moins !).
Dans les groupes où le stress induit était plus fort par les conditions expérimentales, l’aversion au risque relative
mesurée à travers différents comportements d’investissements observés par la suite était plus élevée que dans les
autres groupes. D’autres études se contentent de projeter des images de films d’horreur pour induire de façon
exogène ces variations de stress.
Les enseignements de l’économie comportementale
Pris ensemble, ces enchaînements sont interprétés par les auteurs comme un cercle vicieux
par lequel, si le cortisol conduit à un comportement de survie efficace dans le court terme, il
entraînerait dans le long terme des décisions d’investissement sous-optimales entretenant
le cycle de sous-développement économique.
5 Implications de politique économique
On voit à travers les différents exemples donnés depuis le début de ce chapitre que
nombreux sont les comportements différents de ceux de l’homo economicus. Nous allons
maintenant conclure ce chapitre en évoquant les implications de politique économique
que l’on peut tirer du champ.
Comment les écarts à la rationalité redéfinissent l’optimum
social ?
L’une des applications les plus intéressantes de l’économie comportementale est celle de la
conception et de l’évaluation des politiques publiques. Les apports sont à un double niveau.
D’une part, à partir du moment où l’on sait que les individus ou les ménages réagissent à
des incitations dans un sens parfois différent de ce que prédit la théorie microéconomique
classique, on peut mieux à la fois prendre la mesure des comportements qu’il faut corriger
et tenter de les influencer ; ainsi, l’incohérence temporelle qui conduit certains individus à
ne pas épargner suffisamment pour la période de leur vie où ils ne pourront plus travailler
est un trait de caractère assez répandu qui conduit à la mise en place de plans de retraite
obligatoires ou très incitatifs, avec notamment des pénalités de retrait anticipé. Ainsi, une
politique de lutte contre la pauvreté devra-t-elle, si on en croit les enseignements de la
section précédente, tenter de lutter contre ses causes réelles, qui seraient en partie liées à
l’incapacité à prendre de bonnes décisions économiques quand les conditions de revenu
et d’incertitude engendrent un stress important.
D’autre part, et à un niveau plus fondamental, se pose la question du bon critère
pour évaluer le bien-être des individus. Dans l’environnement rassurant de l’édifice
néoclassique, les individus ont des comportements rationnels, issus de préférences
dotées de propriétés de stabilité, de cohérence et n’ont pas de biais de perception. Dans
l’environnement plus mouvant de la théorie comportementale, toutes ces composantes
volent en éclats. Pour ne donner que trois exemples, si vraiment les chauffeurs de taxi
arrêtent leur journée alors que le gain marginal de continuer est plus important que
le coût marginal de l’effort, faut-il les aider à comprendre qu’il faudrait continuer ? Si
les individus ont une préférence pour le présent qui les fait préférer consommer plutôt
qu’épargner et renoncer à leur plan d’épargne décidé hier, faut-il maximiser leur bien-être
du point de vue de leurs préférences d’aujourd’hui, ou au contraire d’hier ? Enfin, si les
individus ont des biais de perception les faisant mal estimer les très faibles probabilités,
par exemple de l’impact potentiellement catastrophique des OGM, faut-il les suivre et
appliquer un principe de précaution ou se contenter de maximiser le bien-être sur la base
de probabilités objectives ?
17
18
Les enseignements de l’économie comportementale
À ce jour, ces questions ne sont pas tranchées, et chacun d’entre nous peut avoir sa propre
opinion sur le sujet. On peut ainsi penser qu’il faut systématiquement laisser les individus
décider de leur comportement mais les laisser assumer leurs erreurs. On peut au contraire
décider à leur place de ce qui est mieux pour eux. La décision ici est de nature politique.
Un troisième niveau des politiques publiques
Il faut en effet mentionner la montée en puissance d’une behavioral public policy analysis,
qui tente d’encourager les citoyens à agir dans un sens plus conforme à leur propre
bien-être. Jusqu’à présent nous avions vu deux niveaux de politiques publiques : celles
visant à interdire ou à obliger, c’est-à-dire des politiques coercitives, comme des politiques
de quota ou de prix fixes ; et celles visant à inciter, par une taxation ou des subventions.
L’économie du comportement apporte une troisième et nouvelle stratégie d’intervention,
avec ce qu’on appelle le nudging ou la nudge theory, que nous pourrions traduire par une
politique de coup de pouce ou d’appui en douceur de la bonne décision.
Ce corps de doctrine issu autant de l’économie que de la science politique est fondé
sur l’idée qu’il est possible d’influencer le comportement des individus ou des acteurs
économiques sans contraintes supplémentaires (les politiques de type 1), et sans changer
directement les incitations économiques (les politiques de type 2). Le concept a été
développé par Richard Thaler et Cass Sunstein, auteurs d’un ouvrage retentissant, Nudge,
en 2008 et déjà évoqué au début de ce chapitre. Ces auteurs définissent le concept a
contrario : une telle incitation (a nudge) doit être le résultat d’une intervention peu
onéreuse et simple, visant à suggérer de meilleurs choix. Trois exemples différents
permettront de comprendre les différents niveaux possibles d’intervention et en quoi
le nudge est perçu comme la plus moderne et peut-être la plus effective.
Une politique proenvironnementale consiste par exemple à diminuer la consommation
d’électricité des foyers ; la politique la plus primitive, de type 1, consisterait à attribuer
un quota de consommation à chaque ménage en fonction de sa composition, quota qu’il
est interdit de dépasser. Si vous vouliez faire une troisième machine à laver cette semaine,
ce n’est plus possible car le quota est atteint. Une seconde politique, plus incitative,
consiste à surtaxer la consommation d’électricité, soit dès le départ soit, mieux, au-delà
d’un certain seuil ; ainsi, si le besoin de la troisième machine à laver est important, vous
la feriez, mais si vous pouvez vous en passer, vous attendriez la semaine suivante. La
politique du nudge, qui a été tentée à San Marcos en Californie, a consisté à informer les
ménages sur leur consommation et notamment leur position par rapport à la moyenne.
La politique visant à simplement informer factuellement les ménages avait bien contribué
à diminuer la consommation de ceux au-dessus de la moyenne. Mais elle avait aussi fait
augmenter la consommation des ménages en dessous de la moyenne, qui se sentaient
déculpabilisés ! Pour éviter cette convergence vers la moyenne, on a imaginé une nouvelle
façon d’informer les ménages : les factures comprenaient un emoticon (soit un sourire,
smiley, soit au contraire un visage triste ou avec un froncement de sourcil, un frown)
sur la facture d’électricité lorsque la consommation était en dessous ou au-dessus de la
moyenne. Ce type de « suggestion » a permis de réduire la consommation globale de
façon importante et à moindre coût. Et ce, même si elle a été assortie d’une explication du
Les enseignements de l’économie comportementale
besoin environnemental de réduire la consommation d’énergie. Pour autant, personne
ne conteste l’idée que la politique incitative (payer plus cher l’énergie) reste la meilleure
option ; simplement, aux États-Unis, elle fait perdre les élections.
Un second exemple de ce triptyque des politiques est le suivant : pour lutter contre
l’obésité et le développement du junk food, on peut interdire certains composants ou les
réguler ; par exemple, on pourrait décréter que les frites amidonnées et les gras saturés
sont désormais impropres à la consommation ; on peut aussi les surtaxer, de même que
les sucres et l’huile de palme, comme cela se fait depuis peu en France ; on peut enfin
« suggérer ». Dans ce cas précis, Thaler et Sunstein proposent de mettre, dans les cantines
scolaires, ou dans les supermarchés, les aliments à base de fruits et légumes à hauteur des
yeux ; et de reléguer les acides gras trans plus loin, par exemple en bas des rayons ou des
plateaux de présentation.
Enfin, en matière de police de la route, on retrouve ce triptyque : on interdit de rouler
au-dessus de 50 à l’entrée des agglomérations ; l’interdiction ne suffisant pas, on peut
ensuite placer des radars automatiques aux entrées des agglomérations et il faut bien
reconnaître que cette taxation de la vitesse est assez efficace ; mais elle est parfois mal vécue
et peut elle aussi inverser le résultat des élections ! Depuis peu, certaines municipalités ont
introduit des capteurs de vitesse reliés à un panneau lumineux qui indique la vitesse en vert
– et parfois avec un smiley – lorsque celle-ci est inférieure au maximum autorisé et en rouge
– avec un frown – lorsqu’elle est au-dessus ; et cela fonctionne plutôt bien. L’homo economicus ne devrait pas changer sa vitesse, l’homo comportementalis la réduit s’il est stigmatisé1 !
D’une certaine manière, cette théorie du nudging rejoint celle des motivations extrinsèques
et intrinsèques développée par Benabou et Tirole. Nous agissons pour des motivations
extrinsèques (monétaires) ou pour des motivations intrinsèques (souci d’apparaître
comme une personne éthique), mais les deux interagissent parfois difficilement.
Enfin, l’intérêt du nudging est qu’il est peu coûteux, donc que différents messages
peuvent être expérimentés : par exemple, pour inciter au don d’organes, dire que d’autres
ont besoin de nos organes ne semble pas très efficace2 . Dire qu’un jour nous pourrions
avoir besoin des dons d’organe des autres semble bien mieux fonctionner !
On peut se demander si ce type de politique peut s’appliquer à d’autres secteurs. Par
exemple, pour lutter contre la surconsommation médicale, ne pourrait-on faire apparaître
au dos des ordonnances le coût réel pour la Sécurité sociale ? Peut-être hésiterions-nous
alors à acheter trois boîtes de médicaments qui coûtent chacune 10 centimes d’euros et
parfois plusieurs centaines d’euros à la collectivité ? Pour éviter que des enfants de 11 ans
ne passent leur journées à jouer à Minecraft, peut-on imaginer un programme qui leur
envoie un frown au bout de deux heures ou un smiley quand ils se déconnectent ?
1. L’auteur du manuel a même vu récemment des panneaux sur l’autoroute qui indiquaient : « La voiture immatriculée
8912 CBE » roule trop vite ; il s’est demandé une fraction de seconde s’il s’agissait de la sienne, avant d’être
dépassé par une voiture immatriculée 8912 CBE 14. Il a alors été rassuré, tout en constatant que le conducteur ne
semblait pas avoir été influencé par le panneau.
2. http://www.ft.com/cms/s/2/9d7d31a4-aea8-11e3-aaa6-00144feab7de.html#axzz3AXjdJqkl
19
20
Les enseignements de l’économie comportementale
6 Conclusion : les insuffisances de la théorie
microéconomique
Le point de vue de la majorité des économistes y compris comportementaux est que leurs
recherches ne remettent pas en cause l’intérêt de la microéconomie et de ses concepts. Ce
point de vue n’est en effet pas très fécond ; lorsque nous ouvrions le chapitre 21 consacré
aux asymétries d’informations, nous reprenions le point de vue de Jean Tirole. Selon lui,
les entreprises ne sont pas en apparence rationnelles, non pas par envie ou par stupidité,
mais parce que la rationalité est dissimulée à un autre niveau, celle d’un plus grand nombre
d’acteurs en interaction stratégique (les actionnaires, les dirigeants, les salariés). La prise en
compte de ces autres niveaux aboutit à un changement de point de vue radical sur l’analyse
de la décision au sein des entreprises. A contrario, la critique facile, « les entreprises ne sont
pas rationnelles », ne nous aurait pas beaucoup éclairés sur les principes de régulation de
ces entreprises. De fait, tout en en conservant les outils de base, l’ensemble des résultats se
trouve modifié, à la fois plus précis empiriquement et avec des implications normatives
différentes. L’aléa moral et la sélection adverse conduisent à l’irrationalité collective de
l’entité « entreprise » et au-delà du marché à partir de la rationalité individuelle de ces
acteurs. Elles se corrigent partiellement ou totalement par des contrats, des incitations,
des obligations à travers par exemple des assurances obligatoires agrégeant les risques.
Nous voulons ici renouveler cette démarche : ce n’est pas parce que les décisions des
individus sont parfois non rationnelles qu’il n’existe pas des formes de rationalités cachées
dans leurs comportements. Le conflit stratégique entre les differents selfs (celui de court
terme qui cède à la tentation, celui de long terme qui tente de le préserver) constitue deux
entités rationelles. De même qu’on pouvait améliorer les prises de décision des entreprises
par des réponses institutionnelles, il est possible d’encadrer le comportement individuel
grâce à des contraintes, des interdictions, des obligations.
Ce sont là des choix de société : certaines choisiront le paternalisme (asymmetric
paternalism) : la société est partiellement responsable des erreurs de ses citoyens. Le cas
extrême est par exemple de rendre pénalement responsable l’ami qui, à l’issue d’un repas
arrosé, laisse l’invité ivre reprendre le volant1 . On admet que la personne ivre n’est pas
rationnelle, et on oblige alors la personne rationnelle à la protéger contre elle-même. On
oblige le chômeur à accepter des offres d’emploi « acceptables » sous peine de sanction, et
donc on délègue la rationalité à l’agent de Pôle Emploi qui saurait mieux que l’individu
ce qui est dans son intérêt.
D’autres sociétés au contraire décident de laisser à chacun l’entière responsabilité de ses
actions : la personne sobre ne sera pas jugée pour laisser la personne ivre se comporter
de façon dangereuse. Dans le New Hampshire, où l’on peut conduire à moto sans casque,
1. Ce qui est le cas en France en vertu d’une interprétation audacieuse de l’article 121.3 du Code pénal et notamment
de son 4e alinéa (voir http://www.lefigaro.fr/actualite-france/2014/03/05/01016-20140305ARTFIG00123-sixmois-ferme-pour-avoir-laisse-son-ami-ivre-conduire.php?pagination=5), mais pas au Canada où la Cour suprême
fédérale a jugé « que les hôtes d’une fête privée ne peuvent pas être tenus responsables d’un accident commis par
un de leurs invités qui aurait trop bu », contrairement aux tenanciers de bars qui sont eux logiquement responsables.
http://ici.radio-canada.ca/nouvelles/societe/2006/05/05/001-CS-alcool-responsabilite.shtml
Les enseignements de l’économie comportementale
la devise de l’État est « Live Free or Die ». Être libre de ses actes mais évidemment en
subir les conséquences. Ce n’est pas à autrui de protéger les autres, c’est-à soi-même. Le
corollaire est que cela ne sera pas à la collectivité de prendre en charge les dépenses de
santé après un accident à moto. C’est la devise libertarienne par excellence.
On a donc ici les deux branches de l’alternative : solidarité allant de pair avec le
paternalisme d’une part, et liberté allant de pair avec la responsabilité individuelle d’autre
part. Aucun critère économique ne peut trancher entre les deux ; c’est une question de
choix démocratique et de détermination philosophique. Le rôle de l’analyse des sciences
sociales est d’expliciter les choix et de les rendre conscients pour les citoyens. Dans le
cadre de ce chapitre, les branches de l’alternative paternalisme incarné par la politique de
type 1 visant à interdire ou responsabilité individuelle en incitant économiquement, en
taxant, a été subtilement tranchée par le concept de nudging, qui permet d’influencer tout
en laissant un maximum de liberté aux ménages. Du reste, Thaler et Sunstein qualifient
leur politique de libertarian paternalism, indiquant qu’ils ne réduisent pas l’espace de
choix des individus mais conservent la notion de paternalisme asymétrique, estimant que
beaucoup de gens sont en fait heureux qu’on les incite à faire des choix différents de ceux
qu’ils feraient autrement dans leur propre intérêt de long terme.
Les implications de ce concept sont très riches et beaucoup reste encore à apprendre.
On notera en guise de conclusion qu’elles ne sont pas cependant la réponse ultime aux
grands problèmes sociaux. Le marketing comportemental s’en empare également, non
pas dans notre propre intérêt mais au contraire pour nous pousser à faire autre chose
que ce que nous considérons approprié et il convient d’être conscient de ces influences.
Cela nous amène naturellement à la seconde observation : s’il est possible de défaire
l’influence du nudging en comprenant comment il agit, cela s’applique aussi aux actions
publiques. Du reste, tout est une question de degré et de généralisation : si nous évoluions
dans une société où le gouvernement nous envoyait toutes les 10 minutes par texto des
smiley ou des visages tristes dès que nous adoptons des comportements coopératifs ou
contre-productifs, ne développerions-nous pas des anticorps à ces politiques ?
De nouveau, les enseignements de la recherche ne permettent pas toujours de répondre à
toutes les questions. Mais il est indéniable qu’ils permettent de poser les termes du débat
de façon claire.
21