Chapitre 3

Transcription

Chapitre 3
Chapitre 4
Comparaison des perspectives risquées
Si nous ne réussissons pas, nous
courons le risque d’échouer.
George W. Bush
Sommaire
4.1 La notion de dominance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
78
4.2 La dominance stochastique du premier ordre . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
79
4.3 La dominance stochastique du second ordre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
81
4.4 Une justification de la notion de dominance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
83
4.5 L’accroissement du risque à moyenne constante . . . . . . . . . . . . . . . . . . . . . . . . . . .
88
4.5.1 Préférences unanimes et risque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.5.2 La « mean-preserving increase in spread » (MPIS) . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.5.3 L’accroissement du risque comme ajout d’un « bruit » . . . . . . . . . . . . . . . . . . . . . . 92
4.6 La variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
94
4.7 Synthèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
96
L’
étude des perspectives risquées portant sur des grandeurs monétaires caractérisées par leur fonction
de répartition F (x) nous a conduit à montrer l’importance de la composante « personnelle » dans leur
évaluation.
Nous allons maintenant essayer de faire abstraction de cette composante personnelle en nous demandant si
certaines perspectives risquées ne sont pas « dans l’absolu » plus (ou moins) risquées que d’autres. Le terme
« dans l’absolu » est crucial. Il signifie que nous allons essayer de porter un jugement sur les fonctions de
répartition les caractérisant et ce, indépendamment de toute composante « personnelle » ou « psychologique ».
Si nous réussissons ce tour de force, cela voudra dire que quel que soit l’individu, quelle que soit la fonction
d’utilité u, certaines perspectives risquées pourront être dites « préférables » à d’autres.
Prenons deux exemples.
Madame Cunégonde Tapa-Cembal conçoit des produits financiers pour la fameuse banque Finiroise. Elle a
concocté deux produits dont elle n’est pas peu fière. Le premier, qu’elle décide d’appeler Risco+, est caractérisé
par les gains et les probabilités suivantes (0 (, 10 (, 20 ( ; 13 , 31 , 13 ). Le second — qu’elle nomme Avanto — est
décrit par (0 (, 10 (, 20 ( ; 0, 23 , 13 ).
Elle se dit que les clients de la banque achèteront l’un au l’autre de ces produits (ou un mélange des deux) en
fonction de leur attitude par rapport au risque.
Quelques temps plus tard, les conseillers de clientèle lui font part d’un comportement paradoxal des clients :
tous choisissent le produit Avanto pour placer l’intégralité des sommes qu’ils ont épargnées !
Cunégonde s’étonne de ce comportement, mais après quelques calculs elle comprend qu’il devait fatalement
en être ainsi. En effet, prenons un individu quelconque dont la fonction u est inconnue. On sait qu’il choisit le
77
78
CHAPITRE 4. COMPARAISON DES PERSPECTIVES RISQUÉES
produit financier dont l’espérance d’utilité est la plus élevée. Or, ces espérances sont
Risco+
Avanto
1
1
1
u(0) + u(10) + u(20),
3
3
3
2
1
u(10) + u(20).
3
3
Faisons — par exemple — la différence entre l’espérance d’utilité de Avanto et de Risco+. Il vient
¢
1
1
1¡
u(10) − u(0) = u(10) − u(0) > 0,
3
3
3
B
∀u.
En effet, si on admet que la fonction u est strictement croissante, alors u(10) est toujours supérieur à u(0) et
ce, évidemment, quel que soit l’individu. Par conséquent il n’y a rien d’étonnant à ce que tous les clients de la
Finiroise aient choisi le produit Avanto.
Cunégonde Tapa-Cembal se dit en son for intérieur qu’elle vient de découvrir un phénomène étonnant : certaines
variables aléatoires ou distributions de probabilités sur des gains seront toujours préférées à d’autres et cela
quel que soit l’individu.
Maintenant, elle conçoit deux nouveaux projets : le produit Futuro et le produit Extenso. Le premier est décrit
1 4 4 1
par (0 (,10 (,20 (,30 ( ; 14 , 14 , 14 , 14 ) et le second par (0 (,10 (,20 (,30 ( ; 10
, 10 , 10 , 10 ). Or, une fois encore,
les conseillers de clientèle lui annoncent que tous les clients connus pour leur aversion pour le risque ont
systématiquement choisi le produit Extenso. Une fois de plus Cunégonde fait ses calculs et s’aperçoit qu’il devait
en être ainsi. L’espérance d’utilité des deux produits est
1
1
1
1
u(0) + u(10) + u(20) + u(30),
4
4
4
4
1
4
4
1
u(0) + u(10) + u(20) + u(30).
10
10
10
10
Futuro
Extenso
Faisons la différence entre l’espérance d’utilité de Extenso et de Futuro. Il vient
−
On peut encore écrire
6
6
6
6
u(0) + u(10) + u(20) − u(30).
40
40
40
40
¡
¢´
6³
u(10) − u(0) − u(30) − u(20) .
40
Mais la fonction u des clients qui ont une aversion pour le risque est croissante et concave. Par conséquent, la
différence u(10) − u(0) est plus grande que la différence u(30) − u(20). On en déduit que tout individu présentant
une aversion pour le risque préférera le produit Extenso au produit Futuro.
Ces deux exemples avaient pour but de montrer l’existence de situations risquées universellement préférées à
d’autres. Nous allons dans ce qui suit étudier de façon plus rigoureuse ce phénomène.
4.1 La notion de dominance
Considérons deux perspectives risquées décrites par des variables aléatoires définies sur un intervalle fermé
[a b]. La première est caractérisée par la fonction de répartition F et la seconde par la fonction G. On sait que la
première perspective risquée est préférée à la seconde si
Z
b
a
u(x)d F (x) ≥
Z
b
a
u(x)dG(x),
ou u désigne, comme d’habitude, la fonction d’utilité du revenu certain de l’individu considéré.
Puisque les seuls éléments qui diffèrent entre les deux perspectives risquées sont les fonctions de répartition, on
sait qu’on est autorisé à dire que la variable aléatoire F est préférée à la variable aléatoire G dès l’instant où
Z
b
a
u(x)d F (x) ≥
Z
b
a
u(x)dG(x).
Imaginons maintenant que tous les individus préfèrent F à G. On dira dans ce cas que F domine G. Vous
remarquerez le changement subtil de vocabulaire : au lieu de dire « unanimement préféré » — ce qui aurait été
79
4.2. LA DOMINANCE STOCHASTIQUE DU PREMIER ORDRE
parfaitement justifié — on a préféré utiliser le terme de « dominance ». Comme nous le verrons par la suite, ce
glissement dans la terminologie n’est que le reflet de notre nouvelle problématique : il s’agit de comparer des
variables aléatoires en se basant sur leurs seules propriétés intrinsèques.
Définition 1 (dominance stochastique). Soit U l’ensemble des fonctions d’utilité u : X −→ R monotone croissante. Soit F l’ensemble des fonctions de répartition définies sur [a b] ⊂ X . Si est la relation binaire de
dominance stochastique sur F , alors
F G
si
∀u ∈ U ,
Z
b
a
u(x)d F (x) ≥
b
Z
a
u(x)dG(x)
N
Une variable aléatoire F domine une autre variable aléatoire G si il y a unanimité parmi les agents soumis au
risque pour dire que F est préférable à G.
4.2 La dominance stochastique du premier ordre
La notion de dominance stochastique ne résout pas le problème posé dans l’introduction : porter un jugement
sur des fonctions de répartition sans faire appel à une quelconque composante psychologique (la fonction u).
La notion de dominance stochastique du premier ordre est une réponse partielle à ce problème.
Définition 2 (dominance stochastique du premier ordre). Si on note 1 la dominance stochastique du premier ordre, alors
F 1 G ⇐⇒ F (x) ≤ G(x) ∀x ∈ [a b]
N
Dire que F (x) ≤ G(x), ∀x ∈ [a b] revient à dire que la perspective risquée décrite par F accorde des masses de
probabilités plus faibles aux valeurs faibles de x et des masses de probabilités plus fortes aux valeurs fortes de x.
Puisque x est une grandeur monétaire, cela revient à dire qu’avec F , les probabilités sont faiblement concentrées
vers les gains faibles et fortement concentrées vers les gains importants, contrairement à la fonction G qui
présente le biais inverse.
Exemple. Considérons les deux perspectives risquées caractérisées par leurs fonctions de répartition F et G
(voir graphique 4.1).
1
G
0.8
F
0.6
0.4
0.2
0.25
0.5
1
0.75
[a
1.25
1.5
1.75
b]
Figure 4.1 – Les fonctions de répartition F et G
On constate que ∀x ∈ [a b], F (x) ≤ G(x). Par conséquent, on dira que F domine G au sens de la dominance
stochastique du premier ordre. En revanche, le graphique 4.2 montre deux fonctions F et G qui ne possèdent
pas la propriété de dominance stochastique du premier ordre. En effet, ∀x ∈ [0 1], F (x) ≥ G(x) alors que pour
x ∈ [1 1, 75], on a G(x) ≥ F (x).
La relation 1 est une relation binaire sur l’ensemble F des fonctions de répartition (définies sur un même
intervalle de R). Si on vérifie très facilement que 1 est transitive, on voit immédiatement qu’elle n’est pas
complète (voir l’exemple ci-dessus). Par conséquent, 1 ne permet pas d’ordonner toutes les fonctions de
80
CHAPITRE 4. COMPARAISON DES PERSPECTIVES RISQUÉES
1
G
0.8
F
0.6
F
0.4
0.2
G
0.25
0.5
0.75
1
1.5
1.25
1.75
z
a
b
Figure 4.2 – Absence de dominance stochastique
répartitions en partant de la « plus dominante » jusqu’à la « moins dominante ». La relation de dominance
stochastique permet de classer certaines fonctions de répartition (voir le cas de la figure 4.1) mais pas toutes
(voir le cas de la figure 4.2).
Dans ces conditions, quel peut bien être l’intérêt de cette notion ?
La réponse est simple. Si deux perspectives risquées se caractérisent par des fonctions de répartition F et G
et que F domine G au sens de la dominance stochastique du premier ordre, alors tout individu préférera la
première perspective à la seconde.
Proposition 1.
F 1 G ⇐⇒ ∀u ∈ U ,
Z
b
a
u(x) d F (x) ≥
b
Z
a
u(x) dG(x).
ä
Démonstration. Supposons tout d’abord que F 1 G est vrai. Par définition, F (x) ≤ G(x), ∀x ∈ [a b] et par
¡
¢
Rb
conséquent F (x) − G(x) ≤ 0, ∀x ∈ [a b]. Pour tout u ∈ U , considérons l’intégrale a u(x) d F (x) − dG(x) et
intégrons la par partie
Z
b
a
¡
¢ h
¡
¢ ib
u(x) d F (x) − dG(x) = u(x) F (x) −G(x)
−
Z
a
b
a
¡
¢
u 0 (x) F (x) −G(x) d x.
(4.1)
Montrons que cette expression est positive.
On sait
£
¤ que F (x) − G(x) = 0 pour les valeurs x = a et x = b, que
u 0 (x) > 0 puisque u ∈ U et enfin, que F (x) − G(x) ≤ 0. Donc, (4.1) est bien positive pour tout x ∈ [a b]. Par
conséquent,
∀u ∈ U ,
Z
b
a
¡
¢
u(x) d F (x) − dG(x) ≥ 0 =⇒ ∀u ∈ U ,
Z
b
a
u(x) d F (x) ≥
Z
b
a
u(x) dG(x).
(4.2)
Montrons maintenant l’implication inverse 1 .
Supposons qu’il est faux que F (x) ≤ G(x), ∀x ∈ [a b]. Cela signifie qu’il existe un x 0 ∈ [a b] tel que F (x 0 ) > G(x 0 ).
Par continuité, il existe un voisinage de x 0 — noté Vx0 — tel que G(x) < F (x), ∀x ∈ Vx0 . Considérons maintenant
la fonction u ? ∈ U définie de la façon suivante
?
u vérifie
(
(u ? )0 = 0, ∀x ∉ Vx0
(4.3)
(u ? )0 > 0, ∀x ∈ Vx0
Par conséquent,
Z
b
a
? 0
¡
¢
(u ) (x) F (x) −G(x) d x =
Z
? 0
Vx 0
¡
¢
(u ) (x) F (x) −G(x) d x > 0 =⇒ −
Z
Vx 0
¡
¢
(u ? )0 (x) F (x) −G(x) d x < 0
(4.4)
1. Nous venons de montrer A ⇒ B . Nous cherchons à montrer B ⇒ A. Nous démontrerons en réalité la proposition équivalente ¬A ⇒ ¬B
ou ¬ désigne la négation de la proposition.
81
4.3. LA DOMINANCE STOCHASTIQUE DU SECOND ORDRE
Mais en tenant compte de l’intégration par partie (4.1), il vient
b
Z
a
¡
¢
u ? (x) d F (x) − dG(x) = −
Par conséquent
Z
b
a
Z
Vx 0
u ? (x) d F (x) <
¡
¢
(u ? )0 (x) F (x) −G(x) d x < 0.
Z
b
a
(4.5)
u ? (x) dG(x),
et il est faux que F 1 G. On en tire donc la conclusion souhaitée
Z b
Z
F 1 G =⇒ ∀u ∈ U ,
u(x) d F (x) ≥
a
b
a
(4.6)
u(x) dG(x).
■
Exemple. Dans un casino, il y a deux tables de jeu. On y joue deux jeux différents. Après avoir examiné les règles
(que je ne précise pas ici), vous constatez que les deux jeux peuvent se réduire aux variables aléatoires décrites
par le tableau 4.1.
On conçoit intuitivement que toute personne se présentant dans ce casino se dirigera vers la seconde table de
jeu (caractérisée par les probabilités g ) plutôt que vers la première. Le tableau des probabilité fait nettement
ressortir le fait que celles associées aux pertes sont plus faibles à la seconde table de jeu et qu’elles ont été
« déplacées » vers les gains positifs. On voit aussi que G domine F . Or nous avons démontré que dans ce cas,
« tout » individu préférera la perspective risquée décrite par G, ce qui correspond à l’intuition qu’on peut avoir
du choix par tout individu de la seconde table de jeu.
Table 4.1 – Comparaison des deux jeux
(a) probabilités des gains nets
(b) Fonctions de répartition
probabilités
Fonctions de répartition
gains nets
f
g
gains nets
F
G
comparaison
-10
0,2
0,1
-10
0,2
0,1
G(−10) ≤ F (−10)
-5
0,2
0,1
-5
0,4
0,2
G(−5) ≤ F (−5)
0
0,2
0,2
0
0,6
0,4
G(0) ≤ F (0)
+5
0,2
0,3
+5
0,8
0,7
G(5) ≤ F (5)
+10
0,2
0,3
+10
1
1
G(10) ≤ F (10)
4.3 La dominance stochastique du second ordre
Revenons au graphique 4.2 où on ne pouvait dire qui de F ou G dominait stochastiquement l’autre. Définissons
T (x) comme la surface comprise entre F et G pour l’intervalle [a x],
Z x
¡
¢
T (x) =
F (t ) −G(t ) d t .
(4.7)
a
Pour tout x ∈ [a
¢
¢
R x¡
R x¡
z], a F (t ) −G(t ) d t > 0 et pour tout x ∈ [z b], z F (t ) −G(t ) d t < 0, on a
Z x
Z z
Z x
¡
¢
¡
¢
¡
¢
F (t ) −G(t ) d t +
∀x > z,
F (t ) −G(t ) d t =
F (t ) −G(t ) d t .
a
|a
{z
} |z
{z
}
>0
(4.8)
<0
Si ∀x ∈ [a b], T (x) ≥ 0, cela signifie que pour tout x, la masse des probabilités où F est supérieur à G est
supérieure à la masse des probabilités où G est supérieur à F . C’est cette notion qui fonde la définition de la
dominance stochastique du second ordre.
82
CHAPITRE 4. COMPARAISON DES PERSPECTIVES RISQUÉES
Définition 3 (dominance stochastique du second ordre). Si on note 2 la dominance stochastique du second
ordre, alors
Z x
¡
¢
F 2 G si ∀x ∈ [a b], T (x) =
G(t ) − F (t ) d t ≥ 0.
a
B
N
On notera que la dominance stochastique du premier ordre entraîne la dominance stochastique du second
ordre mais que l’inverse n’est pas vrai.
Il nous reste maintenant à montrer que si F 2 G, c.-à-d. si — selon notre interprétation — F est moins risquée
que G, alors tout individu ayant une aversion pour le risque choisira la perspective risquée décrite par la fonction
de répartition F plutôt que celle décrite par G.
Proposition 2. Soit Uc l’ensemble des fonctions d’utilité croissantes et concaves sur l’intervalle [a
F 2 G ⇐⇒ ∀u ∈ Uc ,
Z
b
a
u(x) d F (x) ≥
b
Z
u(x) dG(x).
a
ä
Démonstration. Supposons que F 2 G est vrai. Considérons l’expression
grant par partie, il vient
Z
b
a
£
¤
£
¡
¢¤b
u(x) G(x) − F (x) d x = u(x) G(x) − F (x) a −
b
Z
b]
Rb
a
¡
¢
u(x) G(x) − F (x) d x. En l’inté-
£
¤
u 0 (x) G(x) − F (x) d x.
a
(4.9)
£
¡
¢¤b
Comme u(x) G(x) − F (x) a = 0, l’expression 4.9 s’écrit
b
Z
a
£
¤
u(x) G(x) − F (x) d x = −
b
Z
a
£
¤
u 0 (x) G(x) − F (x) d x.
(4.10)
En intégrant une nouvelle fois par partie le membre de droite de l’égalité 4.10, on obtient
Z
−
b
a
h
£
¤
u 0 (x) G(x) − F (x) d x = − u 0 (x)
Z
b
a
a
£
¤ ib
G(t ) − F (t ) d t +
Z
a
b
u 00 (x)
a
³Z x £
¤ ´
G(t ) − F (t ) d t d x.
a
(4.11)
¢
R x¡
a G(t ) − F (t ) d t . Donc, en remplaçant dans 4.10, il vient
Mais, par définition, T (x) =
−
x
Z
£
¤
£
¤b
u 0 (x) G(x) − F (x) d x = − u 0 (x) T (x) a +
b
Z
a
u 00 (x) T (x) d x.
(4.12)
£
¤b
Puisque u 0 (x) > 0, que T (a) = 0 et que, par hypothèse, T (b) ≥ 0, il vient − u 0 (x) T (x) a ≤ 0.
On sait par ailleurs qu’on se place dans le cas d’individus ayant une aversion pour le risque. Par conséquent,
u 00 (x) ≤ 0. Comme, par hypothèse, T (x) ≥ 0, on peut se prononcer sur le signe de 4.12
Z
−
b
a
£
¤
£
¤b
u 0 (x) G(x) − F (x) d x = − u 0 (x) T (x) a +
Z
b
a
u 00 (x) T (x) d x ≤ 0.
(4.13)
En vertu de la relation 4.1, page 80, on sait que
Z
b
a
¡
¢
u(x) dG(x) − d F (x) = −
b
Z
a
£
¤
u 0 (x) G(x) − F (x) d x.
(4.14)
On peut donc en conclure que
Z
b
a
u(x) d F (x) ≥
b
Z
a
u(x) dG(x).
Montrons l’implication inverse.
Supposons qu’il est faux que F 2 G. On essaie de montrer qu’il existe une fonction u concave telle que
Z
b
a
u(x) G(x) d x >
Z
b
a
u(x) F (x) d x.
(4.15)
83
4.4. UNE JUSTIFICATION DE LA NOTION DE DOMINANCE
Dire qu’il est faux que F 2 G revient à dire qu’il existe un x 0 ∈ [a b] tel que T (x 0 ) < 0. Par continuité, il existe un
voisinage de x 0 — noté Vx0 — où ∀x ∈ Vx0 , T (x) < 0. On considère une fonction u ayant les propriétés suivantes


u est linéaire sur [a x 0 − ²]
u est telle que
(4.16)
u est concave sur Vx0


u et constante [x 0 + ² b]
Vous vérifierez par vous-même que, si elle est convenablement construite, cette fonction est bien concave sur
[a b]. Nous avons vu précédemment (voir équation 4.12) que
Z b
Z b
£
¤
£ 0
¤b
0
−
u (x) G(x) − F (x) d x = − u (x) T (x) a +
u 00 (x) T (x) d x.
(4.17)
a
a
£
¤b
Puisque ∀x ∉ Vx0 , u (x) = 0 et u 0 (x) T (x) a = u 0 (b)T (b)
Z b
Z
£
¤
−
u 0 (x) G(x) − F (x) d x = −u 0 (b)T (b) +
00
a
Vx 0
u 00 (x) T (x) d x.
(4.18)
Mais, pour tout x ∈ Vx0 on a u 00 (x) < 0 et T (x) < 0, comme u est constante sur [x 0 + ² b], on a u 0 (b) = 0, donc, on
peut affirmer que
Z b
Z
£
¤
0
0
−
u (x) G(x) − F (x) d x = −u (b)T (b) +
u 00 (x) T (x) d x > 0.
(4.19)
|
{z
} Vx
a
0
0
En vertu de la relation 4.14, on peut écrire
Z
Z b
¡
¢
u(x) dG(x) − d F (x) = −
a
Z
=⇒
b
a
u(x) dG(x) >
Il s’ensuit que
∀u ∈ Uc ,
Z
b
a
Z
b
a
b
a
£
¤
u 0 (x) G(x) − F (x) d x > 0
(4.20)
u(x) d F (x).
u(x) d F (x) ≥
Z
b
a
(4.21)
u(x) dG(x) =⇒ F 2 G.
(4.22)
■
4.4 Une justification de la notion de dominance
Ma présentation de la notion de dominance a été un peu sèche et vous êtes en droit de vous demander comment
ces concepts ont surgi dans la théorie du risque. Je vous propose une analyse graphique qui, je l’espère, justifiera
cette notion. Nous allons supposer qu’une perspective risquée est décrite par une variable aléatoire X définie
sur un intervalle fermé [x a x b ]. La fonction de répartition de X sera notée F .
Pour fixer les idées, on peut prendre par exemple F (x) = (x − 1)2 définie sur [1 2].
1
F
0
0
1
2
xa
xb
84
CHAPITRE 4. COMPARAISON DES PERSPECTIVES RISQUÉES
Nous allons essayer de représenter graphiquement l’espérance d’utilité de cette perspective risquée.
Si u est la fonction d’utilité d’un revenu certain, on sait que l’espérance d’utilité s’écrit
Z xb
u(x) d F (x).
xa
(4.23)
Sous cette forme, il est difficile d’obtenir une représentation graphique intéressante. En fait, il est judicieux de
changer d’espace de départ : au lieu de raisonner sur x (des sommes de monnaie par exemple), nous allons
travailler avec les indices d’utilité u de ces sommes de monnaie. Dans l’intégrale (4.23), le changement des
bornes d’intégration ne pose pas de problèmes particuliers, pas plus d’ailleurs que l’indice d’utilité. En revanche,
il faut faire attention à la fonction de répartition F qui n’est évidemment plus la même. Notons F̂ la fonction
de répartition lorsqu’elle est définie sur l’intervalle [u a u b ] de l’espace des utilités. Puisque u est strictement
croissante, on a évidemment 2
F̂ (u) = Pr(U ≤ u) = Pr(u(X ) ≤ u(x)) = Pr(X ≤ x) = F (x).
(4.24)
Si u = log(x + 1), il est clair que :
– F̂ est définie sur l’intervalle [log(2) = 0, 693 log(3) = 1, 0982] ;
– si F (1, 5) = Pr(X ≤ 1, 5) = 0,25 alors F̂ (0, 916) = Pr(U ≤ 0, 916) = 0, 25, c.-à-d. si la somme de monnaie 1,5 a un
indice d’utilité de 0,916 et si la probabilité d’obtenir une somme de monnaie inférieure ou égale à 1,5 est 0,25,
alors il semble évident — puisque la fonction est strictement croissante — que la probabilité d’obtenir un
indice d’utilité inférieur ou égal à 0,916 est également 0,25.
Dès lors, notre espérance d’utilité peut s’écrire
Z ub
u d F̂ (u).
(4.25)
ua
En intégrant 3 par partie l’intégrale (4.25), il vient
Z ub
Z
u d F̂ (u) = 1 × u b −
ua
ub
ua
F̂ (u) d u.
(4.26)
Or, sous cette forme, il devient enfantin de représenter graphiquement une espérance d’utilité. Commençons
dans un premier temps par représenter F̂ 4 .
1
espérance d’utilité
F̂ = (e u − 2)2
0
0
1
u a ∼ 0, 69
ub ∼ 1, 098
Dans la relation (4.26),
– 1 × u b est — d’un point de vue graphique — la surface du rectangle de base 0u b et de hauteur 1 ;
2. Vous noterez que U et X sont deux variables aléatoires.
3. Je vous laisse vérifier cette intégration par partie. Souvenez-vous simplement que F̂ (u a ) = 0 et F̂ (u b ) = 1.
¡
¢2
4. Je vous laisse vérifier que F̂ = e u − 2 .
85
4.4. UNE JUSTIFICATION DE LA NOTION DE DOMINANCE
Ru
– le terme u ab F̂ (u)d u est la surface située sous la courbe F̂ (sur l’intervalle [0, 693 1, 0982]).
Par conséquent l’espérance d’utilité de la perspective risquée est donnée par la différence entre ces deux surfaces,
comme on le voit sur le graphique précédent avec la surface colorée en jaune pâle.
Ce procédé est très intéressant quand on travaille sur les problèmes de dominance stochastique. Considérons
deux variables aléatoires dont les fonctions de répartition sont F et G. On suppose que F̂ et Ĝ ont l’allure
suivante :
1
espérance d’utilité
Ĝ
F̂
0
0
1
u a ∼ 0, 69
ub ∼ 1, 098
On « voit » que l’espérance d’utilité de la perspective risquée F̂ est supérieure à celle de la perspective risquée Ĝ.
Ceci dit, cette façon de représenter l’espérance d’utilité n’est pas très utile pour se prononcer sur les problèmes
de dominance stochastique. En effet, celle-ci se rapporte aux distributions F et G et non à leurs images F̂ et Ĝ.
Compte tenu de ce qui vient d’être dit, il est évident que l’espérance d’utilité de F est supérieure à celle de G si
Z ub
Z ub
Z ub
Z ub
Z ub
¡
¢
u d F̂ (u) −
u d Ĝ(u) = 1 × u b −
F̂ (u)d u − 1 × u b +
Ĝ(u)d u = −
F̂ (u) − Ĝ(u) d u > 0. (4.27)
ua
ua
ua
ua
ua
Graphiquement, il faut que la surface située entre les fonctions de répartition de Ĝ (au dessus) et F̂ (au dessous)
soit positive.
Mais puisque de façon générale F̂ (u) = F (x), on a
F̂ (u) d u = F (x)u 0 (x) d x,
(4.28)
et notre relation (4.27) devient
E F [u(X )] − EG [u(X )] > 0 ⇐⇒ −
Z
xb ¡
xa
¢
F (x) −G(x) u 0 (x) d x > 0.
(4.29)
Cette relation est évidemment très intéressante puisqu’elle est exprimée en termes de F et G, c.-à-d. les fonctions de répartition sur les « sommes de monnaie x » (et non sur l’utilité de ces sommes de monnaie comme
précédemment).
Or, comme u 0 (x) > 0, l’espérance d’utilité de F sera supérieure à l’espérance d’utilité de G si la surface située
entre les courbes représentatives de G et F — c.-à-d. les fonctions de répartition sur les sommes de monnaie —
est positive.
Posons-nous maintenant la question suivante : quelles doivent être les propriétés de F , G et u 0 (x) qui assurent
que F sera toujours préférée à G ? Ou, si l’on préfère : dans quelles circonstances l’intégrale (4.29) est-elle
toujours positive ?
Un premier cas favorable se présente immédiatement à l’esprit : si tous les éléments d’une « somme » sont
positifs, alors la somme elle-même est forcément positive. Cela se traduit de la façon suivante : si pour tout
x ∈ [x a x b ] on a
¡
¢
G(x) − F (x) u 0 (x) > 0,
86
CHAPITRE 4. COMPARAISON DES PERSPECTIVES RISQUÉES
alors l’intégrale (4.29) sera assurément positive.
On sait que u 0 (x) > 0 puisque la fonction d’utilité d’un revenu certain est toujours croissante. Par conséquent, si
nous imposons
¡
¢
∀x ∈ [x a x b ], G(x) − F (x) = − F (x) −G(x) > 0 =⇒ G(x) > F (x),
(4.30)
nous aurons atteint le résultat souhaité.
Dans le graphique suivant, nous avons représenté deux fonctions de répartition F et G telles que pour tout x, on
a bien G(x) > F (x).
1
G
F
0
B
0
1
xa
xb
Compte tenu de ce qui a été dit précédemment, nous pouvons affirmer sans autre forme de procès que F est
préférable à G. Vous remarquerez que je ne préoccupe pas de la fonction d’utilité u et de sa dérivée u 0 qui quel
que soit l’individu est positive.
La condition à laquelle nous sommes parvenus n’est rien d’autre que la condition de dominance stochastique
du premier ordre 5 , qui, je vous le rappelle s’exprime sous la forme
F 1 G ⇐⇒ F (x) ≤ G(x) ∀x ∈ [a b]
B
Nous allons maintenant continuer notre enquête en considérant un cas moins simple. Revenons à l’intégrale
(4.29). De façon très approximative 6 , on est en droit de penser qu’elle est positive si le terme G(x) − F (x) est plus
souvent positif que négatif. De façon imagée, cela veut dire que la fonction de répartition G est « plus souvent »
au dessus de F que l’inverse.
Imaginons que les fonctions de répartition de F et G se croisent une fois en un point x a < x ? < x b . Cela veut dire
que :
¡
¢
1. pour tout x < x ? , − F (x) −G(x) > 0 ;
¡
¢
2. pour tout x > x ? , − F (x) −G(x) < 0.
Si on préfère, la relation (4.29) peut s’écrire
Z
−
x? ¡
xa
¢
F (x) −G(x) u 0 (x) d x −
Z
xb ¡
x?
¢
F (x) −G(x) u 0 (x) d x.
(4.31)
On se doute qu’il n’est pas évident de préjuger du signe de cette expression : tout dépend de l’importance
comparée de la partie positive et négative de l’intégrale. Par ailleurs, il est évident que le terme u 0 (x) intervient
comme un coefficient de pondération (variable selon x) et qu’il est — de ce fait — assez génant. C’est pourquoi
nous allons nous en débarrasser.
5. Pour que les graphiques soient clairs, j’ai privilégié des inégalités strictes. Vous n’aurez aucun mal à étendre le raisonnement à des
inégalités larges.
6. Et fausse de surcroît !
87
4.4. UNE JUSTIFICATION DE LA NOTION DE DOMINANCE
Supposons que l’individu ait une aversion pour le risque. Cela veut dire que u 00 (x) < 0, ou, si on préfère, que
la fonction u 0 (x) est décroissante. Servons nous de cette remarque pour procéder à une majoration (et une
minoration) de u 0 (x).
Sur l’intervalle [x a x ? ], on a u 0 (x) ≥ u(x ? ). Par conséquent,
x? ¡
Z
Sur l’intervalle [x ?
Z
x? ¡
¢
F (x) −G(x) u 0 (x ? ) d x.
(4.32)
x b ], on a u 0 (x) ≤ u(x ? ). Par conséquent,
Z xb
Z xb
¡
¢
¡
¢
−
F (x) −G(x) u 0 (x) d x ≥ −
F (x) −G(x) u 0 (x ? ) d x.
(4.33)
−
¢
F (x) −G(x) u 0 (x) d x ≥ −
xa
x?
xa
x?
Additionnons membre à membre ces deux inégalités
Z
−
x? ¡
¢
F (x) −G(x) u 0 (x) d x −
xa
xb ¡
Z
¢
F (x) −G(x) u 0 (x) d x
x?
x? ¡
Z
≥−
0
?
F (x) −G(x) u (x ) d x −
xa
¢
Z
(4.34)
xb ¡
x?
¢
F (x) −G(x) u 0 (x ? ) d x
Si le membre de droite de (4.34) est positif, il en sera de même assurément pour le membre de gauche. On
aboutit donc — en vertu de la relation (4.29), page 85 — à la chaîne causale
Z
−
x? ¡
xa
0
?
F (x) −G(x) u (x ) d x −
¢
Z
xb ¡
x?
¢
F (x) −G(x) u 0 (x ? ) d x > 0 =⇒ E F [u(X )] − EG [u(X )] > 0
(4.35)
Mais si on tient compte du fait que u 0 (x ? ) > 0, il vient
x? ¡
Z
−
xa
¢
F (x) −G(x) d x −
Z
xb ¡
x?
¢
F (x) −G(x) d x > 0 =⇒ E F [u(X )] − EG [u(X )] > 0
(4.36)
c.-à-d., si la surface où G est au dessus de F est plus grande que la surface où F est en dessous de G, alors F sera
préféré à G. Vous noterez que ce résultat n’a pu être obtenu que grâce à notre majoration (resp. minoration) de
u 0 (x) et celle-ci n’a pu elle-même être obtenue que parce que nous avons fait l’hypothèse que u 0 (x) était partout B
décroissante, c.-à-d. que l’individu avait une aversion pour le risque.
1
−
Rx ⋆ ¡
xa
¢
F (x) − G(x) d x > 0
G
Rx b ¡
F
x⋆
¢
F (x) − G(x) d x > 0
0
0
xa
1
x⋆
2
xb
Dans le graphique ci-dessus, on a représenté deux fonctions de répartition F et G qui se coupent en x ? . Il est
« visible » que la surface située entre G et F est plus grande lorsque G est au dessus de F (surface rose « positive »)
que lorsque F est au dessus de G (surface bleue « négative »). On en déduit que F est préférée à G par tout
individu présentant une aversion pour les risque.
88
CHAPITRE 4. COMPARAISON DES PERSPECTIVES RISQUÉES
Vous aurez — une fois encore — remarqué que la condition à laquelle nous avons aboutie n’est rien d’autre
qu’une version à peine remaniée de la condition de dominance stochastique du second ordre.
F 2 G
si
∀x ∈ [x a x b ], T (x) =
Z
x¡
xa
¢
G(t ) − F (t ) d t ≥ 0 ⇐⇒ T (x) = −
Z
x¡
xa
¢
F (t ) −G(t ) d t ≥ 0
Je vous laisse vous convaincre par vous même de la véracité formelle de cette affirmation. Dans le graphique
ci-dessous, vous constatez que lorsque x balaie tout l’intervalle [x a x b ], T (x) est positif tant que x < x ? , c.-à-d.
tant que x parcourt la zone rose « positive ». Passé le cap que représente x ? , vous entrez dans la zone bleue
« négative », mais, aussi loin que vous « poussez » x, aucune partie de celle-ci ne sera suffisante pour rendre
négative la zone « rose » et donc T (x) — qui est la somme de la zone rose et bleue — restera positif pour tout x.
T (x) =
Rx ⋆ ¡
¢
Rx ¡
¢
x a G(x) − F (x) d x + x ⋆ G(x) − F (x) d x > 0
1
−
G
F
+
0
0
x⋆
1
x
xa
2
xb
4.5 L’accroissement du risque à moyenne constante
B
Nous allons continuer à nous intéresser à la caractérisation des perspectives risquées à partir de leurs fonctions
de répartition. Contrairement à ce que nous avons fait précédemment, nous allons introduire une restriction
supplémentaire en supposant que les perspectives risquées que nous examinons ont la même espérance de gain.
Dans ce cadre plus restrictif que le précédent, nous allons essayer de trouver des conditions permettant de dire
qu’une fonction de répartition est universellement plus risquée qu’une autre.
Comme précédemment, nous souhaiterions définir la relation « être plus risqué que » sans faire référence à
la notion d’utilité, c.-à-d., en ne faisant reposer notre définition que sur les caractéristiques intrinsèques des
fonctions de répartition.
Il revient à Rothschild et Stiglitz Rothschild et Stiglitz (1970) et Rothschild et Stiglitz (1971) d’avoir proposé de
telles caractérisations. L’introduction de leur article (Rothschild et Stiglitz (1970), p. 225 et sq.), montre qu’ils
entendent proposer des façons de caractériser le risque qui soient à la fois différentes et meilleures que la
variance.
This paper attempts to answer the question: When is a random variable Y "more variable" than
another random variable X ?
Intuition and tradition suggest at least four plausible — and apparently different — answers to
this question. These are:
1. Y is Equal to X Plus Noise
If we simply add some uncorrelated noise to a random variable, (r.v.), the new r.v. should be
riskier’ than the original. More formally, suppose Y and X are related as follows:
Y = X +Z,
d
4.5. L’ACCROISSEMENT DU RISQUE À MOYENNE CONSTANTE
89
where "=" means "has the same distribution as" and Z is a r.v. with the property that E (Z | X )
d
= 0 for all X
That is, Y is equal to X plus a disturbance term (noise.) If X and V are discrete r.v.’s, condition
(1) has another natural interpretation. Suppose X is a lottery ticket which pays off a i with
P
probability p i ; p i , = 1. Then, Y is a lottery ticket which pays b i with probability p i , where b i
is either a payoff of a i , or a lottery ticket whose expected value is a i . Note that condition (1)
implies that X and Y have the same mean.
2. Every Risk Averter Prefers X to Y
In the theory of expected utility maximization, a risk averter is defined as a person with a
concave utility function. If X and Y have the same mean, but every risk averter prefers X to Y ,
i.e., if
EU (X ) ≥ EU (Y ) for all concave U
then surely it is reasonable to say that X is less risky than Y .
3. Y Has More Weight in the Tails Than X
If X and Y have density functions f and g , and if g was obtained from f by taking some of the
probability weight from the center off and adding it to each tail of f in such a way as to leave
the mean unchanged, then it seems reasonable to say that Y is more uncertain than X .
4. Y Has a Greater Variance Than X
Comparisons of riskiness or uncertainty are commonly restricted to comparisons of variance,
largely because of the long history of the use of the variance as a measure of dispersion in
statistical theory. The major result of this paper is that the first three approaches lead to a
single definition of greater riskiness, different from that of the fourth approach.
[...]
In Section IV we show that [our] concept of increasing risk is not equivalent to that implied by
equating the risk of X with the variance of X . This suggests to us that our concepts lead to a better
definition of increasing risk than the standard one.
4.5.1 Préférences unanimes et risque
Commençons par la proposition la plus évidente d’un point de vue intuitif. Une perspective risquée G est — sans
ambiguïté — plus risquée qu’une autre perspective risquée F , si F et G rapportent en moyenne la même chose
(elles sont indiscernable du point de vue du gain moyen) et si tout individu ayant une aversion pour le risque B
préfère F à G.
Définition 4 (relation « être plus risqué que » 1 ). Soient deux fonctions de répartition F et G, d’espérance
mathématique µF et µG . On dira que G est plus risquée que F si
∀u ∈ Uc ,
Z
b
a
µF = µG
Z b
u(x) d F (x) ≥
u(x) dG(x)
a
N
Nous venons de définir la deuxième proposition de Rothschild et Stiglitz. Il nous reste à définir la première et la
troisième. Nous conclurons en montrant qu’elles sont toutes équivalentes.
4.5.2 La « mean-preserving increase in spread » (MPIS)
Considérons une fonction de répartition F . À partir de F , on construit une nouvelle fonction de répartition G
en déplaçant les masses de probabilité du centre de la distribution vers les extrémités, tout en veillant à ne pas
changer sa moyenne.
Le graphique 4.3 illustre une telle manipulation. On a représenté une fonction de répartition F (graphique 4.3b)
définie sur l’intervalle [−2 2] et la densité de probabilité f associée (graphique 4.3a). On construit g à partir de
f en reportant les masses de probabilité du « centre » vers les « extrémités ». La dispersion des probabilités est
donc plus importante puisqu’on a réduit leur concentration au centre de l’intervalle [−2 2]. On notera que la
90
CHAPITRE 4. COMPARAISON DES PERSPECTIVES RISQUÉES
symétrie des deux densités de probabilité f et g laisse à penser que le processus de dispersion n’a pas changé la
moyenne des deux distributions 7 .
f
1
F
0.4
0.8
g
G
0.3
0.6
0.2
0.4
G
0.1
0.2
F
-2
-1
1
-2
2
-1
(a) densités de probabilités
1
2
(b) fonctions de répartition
Figure 4.3 – Accroissement de la dispersion
Vous analyserez par vous-même l’allure des fonctions F et G du graphique 4.3b connaissant leurs densités de
probabilités.
Exercice 1. Représentez sur le graphique 4.3 la fonction h représentant des probabilités uniformément réparties
sur l’intervalle [−2 2].
Quelle est la forme de la fonction de répartition H ?
Sachant que
Z 2
Z 2
x f (x) d x =
x g (x) d x = 0.
−2
−2
Peut-on parler dans le cas de H d’un accroissement de la dispersion à moyenne constante, c.-à-d. d’un « meanpreserving increase in spread » ?
♣
Selon Rothschild et Stiglitz, cet accroissement de la dispersion à moyenne constante traduit un accroissement
du risque.
Définition 5 (relation « être plus risqué que » 2). Soient F et G deux fonctions de répartition définies sur un
intervalle [a b]. Soit
Z y
¡
¢
T (y) =
G(x) − F (x) d x.
a
On dira que G est plus risquée que F si
T (b) = 0,
T (y) ≥ 0,
y ∈ [a b].
N
Cette définition ne se laisse pas apprivoiser immédiatement. Montrons dans un premier temps que T (b) = 0 est
la traduction de l’idée de moyenne constante.
Rb
Proposition 3. Notons µF = a x d F (x)
T (b) = 0 ⇐⇒ µF = µG
Démonstration. Dire que T (b) = 0 est équivalent à dire que
Z
b¡
a
ä
¢
R b¡
a G(x) − F (x) d x = 0. Intégrons T (b) par partie
¢
£ ¡
¢¤b
G(x) − F (x) d x = x G(x) − F (x) a −
Z
b
a
¡
¢
x G 0 (x) − F 0 (x) d x = 0
7. C’est effectivement le cas. Vous vérifierez par vous-même sur les fonctions
2
1
1
0.5287507222489367 e(−0.5x ) et g (x) = − 16
(−4 + x)(2 + x) − 32
(2 + x)2 sur l’intervalle [−2 2].
(4.37)
f (x) = −0.06626907553103739 +
91
4.5. L’ACCROISSEMENT DU RISQUE À MOYENNE CONSTANTE
£ ¡
¢¤b
puisque x G(x) − F (x) a est nul, il vient
y¡
Z
a
G(x) − F (x) d x = −
¢
Z
b
Z
a
b
=−
a
¡
¢
x G 0 (x) − F 0 (x) d x = 0
(4.38)
¡
¢
x g (x) − f (x) d x = 0
(4.39)
= −(µG − µF ) = 0
(4.40)
On a donc bien µG = µF
■
Par ailleurs, dire que T (y) ≥ 0 revient à dire qu’il y accroissement de la dispersion.
Reprenons l’exemple précédent et observons le comportement de G(x) − F (x) et de
l’intervalle [−2 2].
¢
Ry ¡
−2 G(x) − F (x) d x sur
0.04
0.02
-1
-2
1
2
-0.02
-0.04
(a) G(x) − F (x)
0.05
0.04
0.03
0.02
0.01
-2
-1
1
2
¢
Ry ¡
(b) −2 G(x) − F (x) d x
Figure 4.4 – La fonction T (y)
On vérifie bien que ∀y ∈ [−2 2], T (y) ≥ 0.
L’utilisation de la fonction T , que nous avons déjà rencontrée en étudiant la dominance stochastique d’ordre 2,
suggère qu’il doit exister des liens entre ces deux notions.
Proposition 4. Si une fonction de répartition F est moins risquée qu’une fonction de répartition G au sens de
l’accroissement du risque à moyenne constante alors F domine G au sens de la dominance stochastique du second
ordre.
ä
Démonstration. Évident
■
Proposition 5. Si F domine G au sens de la dominance stochastique du second ordre et si F et G ont la même
moyenne, alors F est moins risquée que G au sens de l’accroissement du risque à moyenne constante.
ä
Démonstration. Évident
■
Cette seconde version de la relation « être plus risqué que » ne repose pas comme la première sur les préférences
des individus. À aucun moment, nous n’avons fait référence à une quelconque fonction d’utilité d’un individu.
On peut toutefois montrer que ces deux définitions sont équivalentes.
92
CHAPITRE 4. COMPARAISON DES PERSPECTIVES RISQUÉES
Proposition 6. Les deux propositions suivantes sont équivalentes :
1. F est moins risquée que G au sens de l’accroissement du risque à moyenne constante ;
2. F est unanimement plus appréciée que G par les individus présentant une aversion pour le risque.
ä
Démonstration. Même démonstration que pour la dominance stochastique du second ordre en ajoutant
toutefois l’égalité des moyennes (espérance mathématique).
■
4.5.3 L’accroissement du risque comme ajout d’un « bruit »
Considérons la perspective risquée décrite par la variable aléatoire discrète X suivante :


−4 −→



−2 −→
X

+2 −→




+4 −→
1
4
1
4
1
4
1
4
Ex ante, cette perspective présente un certain risque. Mais lorsque l’incertitude sera levée — c.-à-d. ex post —
une des quatre valeurs deviendra une réalité certaine.
Supposons que le gain de « +2 » soit maintenant transformé en un gain aléatoire — noté Z — de « +1 » avec une
probabilité 21 et de « +3 » avec également une probabilité 12 , c.-à-d. un gain aléatoire dont l’espérance est « +2 ».

1

−4 −→ 4



1


−2 −→ 4
(
X
1 −→ 12
1

←− Z

4


3 −→ 12



+4 −→ 1
4
Il est fort probable que toute personne confrontée à cette situation aura tendance à considérer que le risque
autour de la valeur « +2 » s’est accru puisque la valeur certaine 8 « +2 » a été remplacée par une variable aléatoire
dont l’espérance seule est égale à « +2 ».
Mais, si le risque s’est localement accru, il y a fort à parier que les personnes concernées considéreront également
que la seconde perspective risquée Y construite à partir de X

1


−4 −→ 4


−2 −→ 1


4
Y +1 −→ 18




+3 −→ 18



+4 −→ 1
4
est globalement plus risquée que X .
Nous allons prendre maintenant un exemple un peu plus compliqué. Considérons la variable aléatoire :


1 −→
X 2 −→


3 −→
1
4
1
2
1
4
Nous allons ajouter à X une variable aléatoire Z telle que : ∀x, E[Z | X = x] = 0. On appelle une telle variable
aléatoire un « bruit ». On définit Z de la façon suivante :


P (Z = 0 | X = 1) = 1
x = 1 P (Z = 1 | X = 1) = 0


P (Z = 2 | X = 1) = 0


P (Z = −1 | X = 2) =
x = 2 P (Z = 0 | X = 2) = 46


P (Z = 1 | X = 2) = 16
1
6


P (Z = −2 | X = 3) = 0
x = 3 P (Z = −1 | X = 3) = 0


P (Z = 0 | X = 3) = 1
On vérifie facilement que pour chaque valeur de X l’expression E[Z | X = x] est bien nulle.
8. En cas de réalisation
93
4.5. L’ACCROISSEMENT DU RISQUE À MOYENNE CONSTANTE
Dans ces conditions, en ajoutant Z à X , on obtient une nouvelle variable aléatoire Y :







1 −→












X 2 −→














3 −→




1
4
1
2
1
4


P (Z
P (Z


P (Z

P

 (Z
P (Z


P (Z


P (Z
P (Z


P (Z
= 0 | X = 1) = 1 −→ P (X + Z = 1 | X = 1) = 1
= 1 | X = 1) = 0 −→ P (X + Z = 2 | X = 1) = 0
= 2 | X = 1) = 0 −→ P (X + Z = 3 | X = 1) = 0
= −1 | X = 2) =
= 0 | X = 2) =
= 1 | X = 2) =
4
6
1
6
1
6
−→ P (X + Z = 1 | X = 2) =
−→ P (X + Z = 2 | X = 2) =
−→ P (X + Z = 3 | X = 2) =
4
6
1
6
1
6


P (X + Z = 1) =
−→ P (X + Z = 2) =


P (X + Z = 3) =
1
3
1
3
1
3
= −2 | X = 3) = 0 −→ P (X + Z = 1 | X = 3) = 0
= −1 | X = 3) = 0 −→ P (X + Z = 2 | X = 3) = 0
= 0 | X = 3) = 1 −→ P (X + Z = 3 | X = 3) = 1
Comme on a ajouté un bruit à chaque valeur de X , on dira que la variable aléatoire Y est plus risquée que X .
On peut généraliser ces exemples à des variables aléatoires continues et retrouver ainsi la première proposition
de Rothschild et Stiglitz :
Définition 6 (relation « être plus risqué que » 3). Soient F et G deux variables aléatoires définies sur [a b] représentant deux perspectives risquées. On dira que G est plus risquée que F si
G ∼F +Z
(∼ signifiant « a la même fonction de densité ». )
et
∀x, E[Z | F = x] = 0
(Z est un « bruit »)
N
Nous allons examiner deux propriétés de cette version de la relation « être plus risqué que ». En effet, nous
devons vérifier — dans un souci de cohérence avec les définitions précédentes — que F et G ont la même
espérance (moyenne). Nous devons également nous assurer que tout individu craignant le risque préféra F à G.
Proposition 7. Si F et G sont deux variables aléatoires ne différant que par un bruit Z , alors E (F ) = E (G)
ä
Démonstration. Étant données les propriétés de Z , on peut écrire
E Z [x + Z | F = x] = x
(4.41)
£
¤
EF E Z [F + Z | F ] = EF [F ]
(4.42)
La relation 4.41 étant vraie pour tout x,
En utilisant le théorème de l’espérance mathématique conditionnelle (voir par exemple Foata et Fuchs (1998), p.
147), il vient
E[F + Z ] = E[F ] =⇒ E[G] = E[F ]
(4.43)
■
Proposition 8. Les deux propositions suivantes sont équivalentes
1. F est moins risquée que G au sens de l’addition d’un bruit Z ;
2. F est universellement plus appréciée que G par les individus présentant une aversion pour le risque.
ä
Démonstration. On vient de voir (relation 4.41) que
E Z [x + Z | F = x] = x
(4.44)
Si les individus craignent le risque, leur fonction d’utilité est concave. En appliquant l’inégalité de Jensen 9 , il
vient :
³ £
h ¡
¢i
¤´
E Z u x + Z | F = x ≤ u E Z x + Z | F = x = u(x)
(4.45)
9. Sous la forme commode : l’espérance d’utilité de la variable aléatoire est plus faible que l’utilité de l’espérance de la variable aléatoire.
On sait en effet que si l’individu craint le risque, l’utilité de la perspective risquée est plus faible que l’utilité de l’espérance de gain de cette
perspective risquée.
94
CHAPITRE 4. COMPARAISON DES PERSPECTIVES RISQUÉES
Puisque cette relation est vraie pour tout x, il vient
h £
¤i
£
¤
EF E Z u(F + Z | F ) ≤ EF u(F )
(4.46)
En utilisant le même théorème que précédemment, on en déduit que
£
¤
£
¤
E u(F + Z ) ≤ E u(F ) =⇒ E[u(G)] ≤ E[u(F )]
(4.47)
■
L’espérance d’utilité de la perspective risquée définie par Y étant inférieure à celle de X — et ce quelle que soit
la fonction d’utilité (concave) considérée — la perspective la moins risquée au sens de la troisième définition de
Rothschild et Stiglitz est donc bien celle qui est unanimement choisie.
4.6 La variance
Considérons les deux perspectives risquées suivantes
richesse
probabilités
richesse
probabilités
0
1
2
0,5
0,85
4
1
2
10,5
0,15
(a) perspective risquée 1
(b) perspective risquée 2
Table 4.2 – Deux perspectives risquées
Calculons l’espérance mathématique des deux perspectives
perspective risquée 1
perspective risquée 2
1
1
×0+ ×4 = 2
2
2
0, 85 × 0, 5 + 0, 15 × 10, 5 = 2
(4.48)
(4.49)
ainsi que les variances
perspective risquée 1
perspective risquée 2
1
1
× (0 − 2)2 + × (4 − 2)2 = 4
2
2
0, 85 × (0, 5 − 2)2 + 0, 15 × (10, 5 − 2)2 = 12, 75
(4.50)
(4.51)
Si on juge de l’importance du risque par le critère de la plus grande variance (plus grande dispersion des gains),
le deuxième projet est plus risqué que le premier.
p
Calculons maintenant l’utilité accordée à chaque projet par un individu dont la fonction d’utilité serait u = w.
perspective risquée 1
perspective risquée 2
1 p
1 p
× 0+ × 4 = 1
2
2
p
p
0, 85 × 0, 5 + 0, 15 × 10, 5 = 1, 0871
(4.52)
(4.53)
Contre toute attente, l’individu — qui se caractérise par une aversion pour le risque — choisira la seconde
perspective risquée bien que la variance des gains y soit plus importante. Comme on a construit l’exemple en
veillant à ce que les espérances de gains soient identiques, ce choix « paradoxal » ne peut donc s’expliquer par
des gains moyens qui auraient été plus importants dans un cas que dans l’autre.
Cet exemple montre à l’évidence que la variance n’est pas un bon indicateur de l’importance du risque. Rappelons en effet que pour un individu craignant le risque, un tel indicateur doit impérativement vérifier la séquence :
plus de risque (à moyenne constante) −→ moins appécié.
Il nous reste maintenant à comprendre pourquoi la variance est un si piètre indicateur du risque. Nous verrons
par la même occasion que pour une certaine classe de fonctions d’utilité u elle peut néanmoins se révéler
satisfaisante.
Considérons les deux perspectives risquées w 0 + X et w 0 + Z obtenues par l’addition d’un risque (défini sous
forme d’une variable aléatoire continue sur l’intervalle [a b]) à une richesse certaine w 0 . Nous allons supposer
95
4.6. LA VARIANCE
que leurs espérances existent et sont égales : E[w 0 + X ] = E[w 0 + Y ] = µ. L’utilité de chaque perspective risquée
s’écrit
Z b
E[u(w 0 + X )] =
u(w 0 + x) f (x)d x
(4.54)
E[u(w 0 + Y )] =
Z
a
b
a
u(w 0 + y)g (y)d y
(4.55)
Considérons maintenant l’expression u(w 0 + x). On peut évidemment la réécrire sous la forme : u(w 0 +µ+ x −µ).
Supposons maintenant que u soit dérivable l’ordre n. Il vient
(x − µ)2 00
u (w 0 + µ)+
2!
(x − µ)n (n)
(x − µ)3 (3)
u (w 0 + µ) + ... +
u (w 0 + µ)
3!
n!
u(w 0 + µ + x − µ) ' u(w 0 + µ) + (x − µ)u 0 (w 0 + µ) +
(4.56)
En intégrant, on obtient
b
Z
u 00 (w 0 + µ) b
E[u(w 0 + X )] ' u(w 0 + µ) + u (w 0 + µ)
(x − µ) f (x) d x +
(x − µ)2 f (x), d x+
2!
a
a
Z
Z
u (3) (w 0 + µ) b
u (n) (w 0 + µ) b
(x − µ)3 f (x) d x + ... +
(x − µ)n f (x) d x
3!
n!
a
a
Z
0
(4.57)
On reconnaît dans l’équation 4.57 les moments centrés d’ordre 1 à n. On sait que le moment centré d’ordre 1 est
identiquement nul, le moment centré d’ordre 2 est la variance. Si on note m nX le moment centré d’ordre n de la
variable aléatoire X , l’équation 4.57 devient
E[u(w 0 + X )] ' u(w 0 + µ) +
u 00 (w 0 + µ) 2 u (3) (w 0 + µ) 3
u (n) (w 0 + µ) n
σX +
m X + ... +
mX
2!
3!
n!
(4.58)
En procédant de la même façon pour Y , il vient
E[u(w 0 + Y )] ' u(w 0 + µ) +
u (n) (w 0 + µ) n
u 00 (w 0 + µ) 2 u (3) (w 0 + µ) 3
σY +
m Y + ... +
mY
2!
3!
n!
(4.59)
En soustrayant les relations 4.58 et 4.59, on obtient
E[u(w 0 + X )] − E[u(w 0 + Y )] '
¢
u (3) (w 0 + µ) ¡ 3
u 00 (w 0 + µ) 2
(σ X − σ2Y ) +
m X − m Y3 + ...
2!
3!
¢
u (n) (w 0 + µ) ¡ n
+
m X − m Yn
n!
(4.60)
On ne peut conclure avec certitude sur le signe de la différence E[u(w 0 + X )] − E[u(w 0 + Y )] qui dépend du signe
de toutes les dérivées successives de la fonction u. Or, en disant qu’un individu présente une aversion pour
le risque, on se prononce sur le signe de la dérivées première (positive) et seconde (négative) de sa fonction
d’utilité, mais pas sur le signe des dérivées d’ordre supérieur.
On pourrait évidemment chercher à préciser le signe de ces dérivées successives afin de lever l’indétermination.
Malheureusement, il n’existe pas d’interprétation économique satisfaisante des dérivées d’ordre 3 ou plus d’une
fonction d’utilité et on se trouve donc dans une impasse.
Il faut donc se rendre à l’évidence : il n’existe pas de relation simple entre accroissement de la variance et
préférence chez les individus ayant une aversion pour le risque.
On terminera cette partie « décevante » sur la variance en faisant toutefois la remarque suivante. Si la fonction
d’utilité u ne possède pas de dérivée d’ordre n > 2, alors la relation 4.59 s’écrit
E[u(w 0 + X )] − E[u(w 0 + Y )] '
u 00 (w 0 + µ) 2
(σ X − σ2Y )
2!
(4.61)
Supposons comme précédemment que σ2Y > σ2X (la dispersion des gains est plus forte avec la perspective
risquée Y ).
Si nous avons a faire à un individu craignant le risque, alors on peut affirmer que u 00 (w 0 + µ) < 0.
96
CHAPITRE 4. COMPARAISON DES PERSPECTIVES RISQUÉES
On en déduit alors que
E[u(w 0 + X )] − E[u(w 0 + Y )] '
u 00 (w 0 + µ) 2
(σ X − σ2Y ) > 0 =⇒ E[u(w 0 + X )] > E[u(w 0 + Y )]
2!
(4.62)
On aboutit alors à la conclusion attendue : l’individu préfère la perspective risquée ayant la plus faible dispersion
des gains. Dans ce cas, l’accroissement de la variance peut sans ambiguïté être assimilé à un risque plus
important.
4.7 Synthèse
Le schéma 4.5 est une synthèse des caractéristiques des variables aléatoires et leur rapport avec l’unanimité des
préférences.
97
4.7. SYNTHÈSE
Propriétés intrinsèques des variables
aléatoires
dominance stochastique du
premier ordre : F domine G
Tout individu préfère F à G
dominance stochastique du
second ordre : F domine G
Si les VA ont la même espérance
les masses de probabilités de
G sont plus dispersées que
celles de F
G est obtenu en ajoutant un
bruit à F
Pour certaines fonctions
d'utilité : la variance de F est
plus petite que la variance de
G
Figure 4.5 – Synthèse sur le risque
Tout individu
ayant une
aversion pour le
risque préfère F à
G
Bibliographie
Dominique Foata et Aimé Fuchs. Calcul des probabilités. Dunod, 2e édition, 1998.
Michael Rothschild et Joseph E. Stiglitz. « Increasing Risk : I. A Definition ». Journal of Economic Theory, 2(3),
September 1970.
Michael Rothschild et Joseph E. Stiglitz. « Increasing Risk II : Its Economic Consequences ». Journal of
Economic Theory, 3(1), March 1971.
98