da7

Transcription

da7
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
1
Introduction
Rappel : on parle de choix incertain lorsqu'un agent ne sait pas exactement quelles
conséquences auront ses actions. Le choix risqué, que nous avons vu lors des deux dernières
séances, correspond au cas particulier où le décideur connaît les probabilités qu'ont les
actions d'engendrer les conséquences. Il nous reste maintenant à envisager le cas plus
général où de telles informations probabilistes ne sont pas disponibles - manifestement le
cas qui correspond à la plupart de nos décisions quotidiennes.
•
Le modèle de référence pour le choix incertain est le modèle d'espérance subjective d'utilité (MESU). S'il est question d'espérance, c'est, vous l'aurez deviné, que des
probabilités sont ré-introduites d'une manière ou d'une autre. On appelle ces probabilités
des probabilités subjectives. Elles sont subjectives en un double sens :
1/ elles représentent des états mentaux, les degrés de croyances d'un agent.
On appelle souvent bayésianisme la thèse selon laquelle les degrés de croyances d'un agent
rationnel sont représentables par des probabilités. Cela signie par exemple que si P et Q
sont des propositions incompatibles, le degré de croyance de Paul dans P ∨ Q est la somme
de son degré de croyance dans P et de son degré de croyance dans Q (additivité)
•
2/ elles peuvent varier d'un individu à l'autre
2
Le modèle d'espérance subjective d'utilité
2.1 Le cadre savagien
•
Le cadre général du modèle d'espérance subjective d'utilité est le suivant :
(i) ontologie :
. un ensemble d'états de la nature S : un état de la nature (ou monde possible
chez les philosophes) est une manière dont les choses pourraient se passer. Par
hypothèse, le monde actuel ou l'état de la nature actuel est la manière dont les
choses se passent en réalité.
Exemple 1
un facteur : l'oeuf est pourri
p.
2 états de la nature possible :
s1 = p, s2 = ¬p
p, il faut chaud q . 4 états de la nature possibles : s1 = pq ,
s2 = p¬q , s3 = ¬pq , s4 = ¬p¬q .
deux facteurs : il fait beau
.
un ensemble de conséquences C : l'interprétation ne change pas par rapport aux
modèles précédents.
1
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
.
2
un ensemble d'actions réalisables F : une action (ou un acte dit-on parfois) est une
fonction des états de la nature vers les conséquences f : S → C . Autrement dit,
chaque action f a une conséquence déterminée c étant donné un état de la nature
s
Exemple 2 (l'omelette de Savage)
5 oeufs déjà dans le plat à omelette ; reste un oeuf dont on ne sait pas s'il est pourri
ou pas.
s1
f1
f2
f3
s2
= bon
= pourri
= dans le plat
une omelette à six oeufs
pas d'omelette, 5 oeufs gâchés
= dans un bol
une omelette à six oeufs, un bol à laver
une omelette à 5 oeufs, un bol à l
= à la poubelle
une omelette à 5 oeufs, un oeuf gâché
une omelette à 5 oeufs
(ii) déterminants subjectifs :
. une fonction de probabilité P sur S (les croyances partielles de l'agent)
Exemple 3
un facteur : Paul estime aussi probable
s1
et
s2 : P (s1 ) = P (s2 ) = 1/2
deux facteurs : Paul pense qu'il est impossible qu'il fasse beau et qu'il est peu
probable qu'il fasse chaud :
P (s1 = pq) = 0, P (s2 = p¬q) = 0, P (s3 = ¬pq) = 1/3,
P (s4 = ¬p¬q) = 2/3.
.
•
une fonction d'utilité u sur C (les désirs de l'agent)
Dans le cadre savagien, l'omelette de Savage constitue un exemple de situation de
ou de problème de décision ; de manière plus générale :
s1 s2 ... sm
f1 c11 c12 ... c1m
f2 c21 c21 ... c2m
... ... ... ... ....
fn cn1 cn2 ... cnm
choix
• La règle de décision du MEUS est analogue à celle du MEU : choisir l'action f dont
l'espérance subjective d'utilité est maximale :
ESU (fi ) = P (s1 ) × u(ci1 ) + ... + P (sm ) × u(cim ) =
Exemple 4 (vin ou poisson ?)
P
j
P (sj ) × u(cij )
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
poisson
viande
1/4
3/4
vin rouge (VR)
0
4
vin blanc (VB)
4
2
ESU (V R) = (1/4 × 0) + (3/4 × 4) = 3
ESU (V B) = (1/4 × 4) + (3/4 × 2) = 5/2
2.2 Probabilités
• Pour présenter les éléments fondamentaux du modèle savagien, nous avons réduit au
minimum l'exposition des probabilités. On a fait comme si les probabilités (les degrés de
croyances ici) ne portaient que sur les états de la nature. Mais l'agent entretient également
des croyances sur d'autres événements = ensemble d'états de la nature E ⊆ S .
Exemple 5
S = {s1 , s2 , s3 , s4 } ; P (s1 = pq) = 0, P (s2 = p¬q) = 0, P (s3 = ¬pq) = 1/3, P (s4 =
¬p¬q) = 2/3.
. Paul pense qu'il est impossible qu'il fasse beau : P ({s1 , s2 }) = 0
. Paul pense qu'il est improbable qu'il fasse chaud : P ({s1 , s3 }) < 1/2
. Paul pense qu'il est impossible qu'il fasse beau et chaud : P ({s1 , s2 } ∩ {s1 , s3 }) =
P (s1 ) = 0
. Paul pense qu'il est improbable qu'il fasse beau ou chaud : P ({s1 , s2 } ∪ {s1 , s3 }) =
P ({s1 , s2 , s3 }) < 1/2
. Paul pense qu'il est probable qu'il ne fasse pas chaud : P ({s1 , s3 }c ) = P ({s2 , s4 }) >
1/2
. Paul pense qu'il est impossible qu'il fasse ni beau ni pas beau : P ({s1 , s2 }c ∩
({s1 , s2 }c )c ) = P (∅) = 0
. Paul qu'il est certain qu'il fait beau ou pas beau : P ({s1 , s2 } ∪ {s1 , s2 }c ) = P (S) = 1
Plusieurs points à noter :
- correspondance entre les connecteurs logiques (et, ou, ne..pas...) qui servent à
exprimer des croyances complexes et les opérateurs ensemblistes (union, intersection, complémentation)
- tous les énoncés probabilistes se laissent déduire des données intitiales et des propriétés
du calcul des probabilités :
ex.1 : Paul pense qu'il est impossible qu'il fasse beau : P ({s1, s2}) = 0
La probabilité de l'événement {s1, s2} est la somme de la probabilité de deux événements mutuellement exclusifs dont {s1, s2} est l'union i.e. {s1} et {s2}. C'est une propriété
parfaitement générale : si les ensembles E, E 0 sont disjoints, P (E ∪ E 0) = P (E) + P (E 0)
(additivité nie)
3
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
4
ex.2 : Paul qu'il est certain qu'il fait beau ou pas beau : P ({s1, s2} ∪ {s1, s2}c) = P (S) = 1
Dénition 1
P
est une
(i)
P
distribution de probabilité niment additive sur S
est une fonction de ℘(S) dans [0, 1],
E, E 0 sont disjoints, P (E
(ii) si les ensembles
si
∪ E 0 ) = P (E) + P (E 0 )
(additivité nie),
et
(iii)
P (S) = 1.
ex.3 : Paul pense qu'il est impossible qu'il fasse ni beau ni pas beau : P ({s1, s2}c ∩
({s1 , s2 }c )c ) = P (∅) = 0. Suit des axiomes qui précèdent : S = S ∪ ∅ et S ∩ ∅ = ∅
donc P (S) + P (∅) = P (S) donc P (∅) = 1.
ex.4 : Paul qu'il est certain qu'il fait beau ou pas beau : P ({s1, s2} ∪ {s1, s2}c) = P (S) = 1.
De manière générale,
P (E) + P (E c ) = 1
P (E c ) = 1 − P (E)
Suit également des axiomes : E ∪ E c = S donc P (E ∪ E c) = 1. Par ailleurs E ∩ E c = ∅
donc P (E) + P (E c) = P (E ∪ E c). Donc P (E) + P (E c) = 1.
2.3 Le principe de la chose sûre
On a vu dans le rôle central de l'axiome d'indépendance dans le MEU. Il y a un
principe analogue qui joue un rôle crucial dans le MESU : le principe de la chose sûre.
•
Exemple 6
Comparer les 4 actes suivants :
f = [1000 euros si Prince de Bretagne gagne la 5è, une bière sinon]
g = [1000 euros si Prince de Bretagne gagne la 5è, un pastis sinon]
f 0 = [100 euros si Prince de Bretagne gagne la 5è, une bière sinon]
g 0 = [100 euros si Prince de Bretagne gagne la 5è, un pastis sinon]
Notons
Ec =
Prince de Bretagne gagne la 5è et
E
= Prince de Bretagne ne gagne pas
la 5è.
.
.
.
.
f et g sont identiques sur E c : on le note f =E c g
f 0 et g 0 sont aussi identiques sur E c : f 0 =E c g 0
f et f 0 sont identiques sur E : f =E f 0
g et g 0 sont identiques sur E : g =E g 0
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
f
et
g
ont une partie commune : ce qui se passe sur
E c.
On peut concevoir
des transformations identiques de cette partie commune :
g 0 ont toujours les mêmes conséquences sur E c .
PCS : Paul préfère
f
à
g
ssi il préfère
f0
à
f
et
g
f0
et
5
g0
comme
0
sont modiés, mais f et
g0.
Notation 1
On note
• f =E x si f (s) = x pour tout s ∈ E (f est constant sur E ),
• f =E g si f (s) = g(s) pour tout s ∈ E (f et g sont identiques
• f = xEy si f =E x et f =E c y .
sur
E ),
et
L'idée qui commande le PCS est que pour déterminer ses préférences entre deux actions
qui ont une partie commune, on se base uniquement sur la partie qui n'est pas commune
aux deux actions (ici E ). En toute généralité, le principe s'énonce comme suit :
(P2) si f =E f 0, g =E g0, f =E
c
g
et f 0 =E g0, alors f g ssi f 0 g0
c
Proposition 1
Si une relation de préférence se laisse représenter par le MESU, alors elle obéit au principe
de la chose sûre.
Exemple 7
Voici une représentation matricielle des deux paires d'actions de l'exemple précédent :
f
g
f0
g0
E
cf
cg
cf
cg
Ec
cc
cc
c0c
c0c
Supposons que les utilités et probabilités soient les suivantes :
f
g
f0
g0
0.8
0.2
10
1000
5
1000
10
100
5
100
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
6
f à g : ESU (f ) = 0.8 × 10 + 0.2 × 1000 = 208 et ESU (g) =
0.8 × 5 + 0.2 × 1000 = 204. Le PCS serait violé si g 0 était préféré à f 0 ; il est clair que ce
0
0
n'est pas le cas : ESU (f ) > ESU (g ).
Dans ce cas Paul préfère
Preuve.
Rappel : nous traitons uniquement le cas où S est ni. Par hypothèse,
fonction d'utilité u(.) et une certaine distribution
ESU (f ) > ESU (g) pour une certaine
de probabilité P (.). Cela implique que
P
x∈E
P
P (x) × u(f (x)) +
y∈E
P (y) × u(f (y)) >
P
x∈E c
P (x) × u(g(x)) +
P
y∈E c
P (y) ×
u(g(y))
Mais puisque pour tout y ∈ E c, f (y) = g(y),
P
x∈E
P (x) × u(f (x)) >
P
x∈E c
P (x) × u(g(x))
(*)
Comparons maintenant ESU (f 0) et ESU (g0).
P
P
ESU (f 0 ) = Px∈E P (x) × u(f 0 (x)) +P y∈E P (y) × u(f 0 (y))
ESU (f 0 ) = x∈E P (x) × u(f (x)) + y∈E P (y) × u(f 0 (y))
Symétriquement,
ESU (g 0 ) =
P
x∈E
P (x) × u(g(x)) +
Par hypothèse, f 0 =E
conséquent
ESU (f 0 ) > ESU (g 0 )
f
0
c
g0
ssi
donc
P
x∈E
P
P
y∈E
y∈E
P (y) × u(g 0 (y))
P (y) × u(f 0 (y)) =
P (x) × u(f (x)) >
P
x∈E
P
y∈E
P (y) × u(g 0 (y))
et par
P (x) × u(g(x)).
Or on a vu (*) que tel était le cas donc puisque est représenté par P et u, il suit que
g 0 . La réciproque qui montre que si f 0 g 0 alors f g procède de la même façon. ♠
2.4 Révélation des croyances
• En démontrant le théorème de représentation pour le MEU, nous avons vu comment on pouvait en principe révéler les utilités (sur les conséquences) d'un décideur qui se
conforme aux axiomes à partir de ses préférences : l'utilité d'une conséquence x est αδ si
le décideur est indiérent entre δx et un αδ -mixage de la meilleure et de la pire loterie. Le
point crucial est que les probabilités, données, sont indispensables dans cette procédure.
Et les probabilités, c'est précisément ce que l'on a pas dans le cas incertain.
x
x
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
Une manière de procéder (celle de Savage) consiste à commencer par révéler les
croyances à partir des préférences - les utilités sur C seront révélées ensuite. Il s'agit donc
de révéler P probabilité sur S à partir des préférences sur les actes F .
•
• La façon usuelle de procéder décompose la démarche en deux étapes. Ce qui est directement révélé n'est pas une distribution de probabilité mais une probabilité qualitative.
Cette probabilité qualitative a ensuite des propriétés qui lui permettent d'être représentée
par une probabilité quantitative. Une probabilité qualitative >⊆ S × S signie intuitivement "...est estimé plus probable que ...". Voici la manière dont elle est révélée à partir
des préférences :
A partir de la relation de préférence sur les actes, on dénit deux relations de préférence
dérivées :
Dénition 2
préférence sur les actes conditionnelle à E , notée E , est dénie ainsi :
La relation de
f E g
si
∀f 0 , g 0 ∈ F ,
Dénition 3
La relation de
xy
ssi
si
f 0 =E f , g 0 =E g
et
f 0 =E c g 0 ,
alors
f 0 g0
préférence sur les conséquences est dénie ainsi :
f f0
où
∀s ∈ S , f (s) = x
et
f 0 (s) = y
(Def >) E1 > E2 ssi ∃x, y ∈ C tels que x y, xE1y xE2y
(Def >) est une manière de révéler une probabilité qualitative entre E1 et E2 : un agent
estime E1 plus probable que E2 exactement quand, s'il préfère une conséquence à une autre,
il préfère le pari où la conséquence préférée est obtenue conditionnellement à E1 que le pari
où elle est obtenue conditionnellement à E2. Bien sûr, pour que cette approche fonctionne,
il faut d'abord qu'il existe deux telles conséquences :
(P5) il existe x, y ∈ C tels que x y
Il faut ensuite que le résultat soit le même quelles que soient les conséquences x, y que
l'on choisissse. C'est ce que garantit l'axiome suivant :
(P4) si x y et x0 y0, alors xEy xE 0y ssi x0Ey0 x0E 0y0
7
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
8
• Les préférences du décideur sont évidemment supposées rationnelles (au sens technique du moins), ce qu'on appelle (P1) dans ce contexte ; de (Def >), (P1)-(P5) on peut
montrer qu'on a bien fait la moitié du chemin i.e. que > est une relation de probabilité
qualitative. Voici la dénition formelle :
Dénition 4
La relation
>
sur
℘(S)
est une
> est un ordre faible,
S > ∅,
(iii) ¬(∅ > E), et
0
00
(iv) si (E ∪ E ) ∩ E = ∅,
probabilité qualitative si pour tout E, E 0 , E 00 ∈ ℘(S),
(i)
(ii)
alors
E > E0
ssi
E ∪ E 00 > E 0 ∪ E 00 .
(P1), (P3), (P4) et (P5) permettent de montrer (i)-(iii). Le coeur de la dénition est
l'analogue qualitatif de l'additivité i.e. (iv). C'est là qu'intervient le principe de la chose
sûre (P2). Supposons que (iv) ne soit pas satisfait i.e. (E ∪ E 0) ∩ E 00 = ∅, E > E 0 et
E ∪ E 00 < E 0 ∪ E 00 . Et supposons que x y . Soient
f = xEy , g = xE 0 y , f 0 = xE ∪ E 00 y et g 0 = xE 0 ∪ E 00 y
Clairement f =E f 0 et g =E g0 et f =E g et f 0 =E g0. On satisfait donc l'antécédent
de (P2). On peut donc en conlure que f g ⇔ f 0 g0. Par hypothèse E > E 0 donc par
(Def >) f g donc f 0 g0 donc E ∪ E 00 > E 0 ∪ E 00. Contradiction.
00c
00c
00
00
Un autre point intéressant concerne la démonstration de (iii) ¬(∅ > E) : l'évenement
impossible n'est pas strictement plus probable qu'un événement quelconque. Pour que
cela soit le cas il faudrait que pour x y, x∅y xEy. Mais x∅y n'est rien d'autre que
l'acte constant y. Donc il faudrait que y xEy avec x y ! Intuitivement, il y a deux
possibilités : ou bien E a une probabilité nulle et dans ce cas ∅ ∼ E ou bien E a une
probabilité non-nulle et dans ce cas E > ∅. La diculté, c'est bien évidemment que l'on ne
dispose pas encore de probabilité quantitative pour distinguer les événements à proba.nulle
des autres. Comment faire ?
Idée de base : trouver un type de préférence qui révèle que l'agent a une probabilité nulle
vis-à-vis d'un événément.
Dénition 5
Pour tout
E ∈ ℘(S), E
est
nul si f ∼ g quand f =Ec g 1
La signication intuitive est simple : un événement est nul pour un agent si ce qui se
passe sur cet événement lui indière complètement. Autrement dit, si deux actes qui sont
identiques sur le complémentaire de l'événement en question sont indiérents.
1 [?],
[?]. Nous avons suivi la formulation de ce dernier, qui contient une légère amélioration par rapport
au résultat original de Savage.
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
9
Reprenons le raisonnement. (a) Supposons que E est nul. Considérons x y ; xEy et x∅y.
On l'a vu x∅y = y = yEy. Puisque E est nul, xEy ∼ yEy = x∅y. Donc E ∼ ∅. (a)
Supposons que E est non-nul. Considérons x y, xEy et x∅y = y. On retombe sur le
point de tout à l'heure. C'est un axiome qui exclut cette situation (P3) :
(P3) si E n'est pas nul, f =E x et g =E y, alors f E g ssi x y
(P3) nous permet de conclure que xEy E x∅y = y. Mais comme ces deux actes sont
identiques sur E c, on peut en conclure que xEy x∅y = y donc que E > ∅.
• Toute probabilité qualitative ne se laisse pas représenter par une distribution de
probabilité. Il faut des propriétés supplémentaires pour le garantir. Voici d'abord comment
P (.) est dénie. Soit E un événement. Supposons qu'il existe une partition de S en 2n
éléments équiprobables2 C1n, ..., C2n . Pour tout n, il existe un plus petit k tel
Sk que nl'union
des k premiers éléments de la partition est strictement plus probable que E : j=1 Cj > E ;
notons k(n) ce nombre.
S
Si une probabilité quantitative représente >, l'événement kj=1 Cjn devra avoir comme
probabilité k(n)/2n.
En augmentant n, on obtient des approximations de plus en plus nes de la probabilité
de E . On peut alorsSdénir
la probabilité quantitative P (E) de E comme étant la limite
k
n
des probabilités de j=1 Cj quand n augmente (donc quand on trouve des événements de
plus en plus proches de E ) :
n
(Def P ) P (E) = limn→∞ k(n)/2n
Le détail est compliqué, mais c'est l'axiome
(P6) si f g, alors, étant donné x, il existe une partition nie de S telle que, pour
tout membre Si de la partition, si f 0 =S x et f 0 =S f alors f 0 g, et si g0 =S x et
g 0 =S g , alors f g 0
i
c
i
i
C
i
qui garantit les partitions uniformes qui sont à la base de la construction. Pris ensemble,
les axiomes garantissent, d'une part, que l'on peut dénir une telle distribution P (.) et,
d'autre part, qu'elle représente bien la probabilité qualitative > :
E1 > E2 ⇔ P (E1 ) > P (E2 )
2 L'équiprobabilité
est, à cet endroit, évidemment dénie en termes de probabilité qualitative.
(1)
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
10
2.5 Axiomatisation du modèle d'espérance subjective d'utilité
Modèle d'espérance d'utilité en situation d'incertitude (MESU)
(MESU ) L'agent peut choisir entre les diérents actes f
F est l'ensemble des fonctions f : S → S .
∈ F,
où
(MESU P1) est un ordre asymétrique et négativement transitif
sur F
(MESU P2) si f =E f 0, g =E g0, f =E g et f 0 =E g0, alors f g
ssi f 0 g0
(MESU P3) si E n'est pas nul, f =E x et g =E y, alors f E g ssi
c
c
xy
(MESU P4) si x y et x0 y0, alors xEy xE 0y ssi x0Ey0 x0E 0y0
(MESU P5) il existe certains z, y ∈ C tels que x y
(MESU P6) si f g, alors, étant donné x, il existe une partition
nie de S telle que, pour tout membre Si de la partition, si f 0 =S x
et f 0 =S f alors f 0 g, et si g0 =S x et g0 =S g, alors f g0.
i
c
i
i
C
i
(MESU P7) si, pour tous s ∈ E , f E g(s), alors f
pour tous s ∈ E , f (s) E g, alors f E g
E g ;
et si,
(MESU C) L'agent, s'il en existe au moins un, choisit un acte maximal
Comme dans le modèle d'espérance en situation de risque, on dispose d'un théorème
de représentation pour le modèle d'espérance en situation d'incertitude s.s. ; c'est un résultat plus fort, puisqu'il garantit l'existence non seulement d'une fonction d'utilité u(.) sur
les conséquences, mais également d'une distribution de probabilité subjective sur l'espace
d'états S .
Théorème 1 (théorème de représentation)
Si la relation
sur
F
satisfait (MESU P1)-(MESU P7), alors
(i) il existe une unique distribution de probabilité niment additive
0
0
que (a) P (E) > P (E ) si xEy xE y quand x y et (b) P (E)
P sur (S, ℘(S)) telle
= 0 quand E est un
événement nul.
(ii) il existe une fonction bornée
près, telle que
u : C → R, unique à une transformation ane croissante
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
∀f, g ∈ F , f g
ssi
E[u(f (s)), P ] > E[u(g(s)), P ]
La partie (i) du théorème de représentation, qui concerne la probabilité subjective,
nous avons montré dans les grandes lignes comment elle procède des axiomes dans la
section précédente. La démonstration de la partie (ii) est essentiellement une adaptation
du théorème de représentation pour le MEU (voir Fishburn 1970 ou Kreps 1988).
2.6 Références
•
D. Kreps (1988), Notes on the Theory of Choice, Westview Press
•
L. Savage (1954/1972), The Foundations of Statistics, Dover
3
Dépendance des probabilités sur les états de la nature
à l'égard des actes
• principe de dominance : soient deux actions f1 et f2 ; si en tout état du monde sj
Pierre préfère au sens large c1j à c2j et si en un état du monde sj au moins Pierre préfère
strictement c1j à c2j , alors Pierre doit préférer f1 plutôt que f2
∗
∗
∗
Exemple 8
poisson
viande
vin rouge (VR)
0
4
vin blanc (VB)
4
4
(VB) domine (VR)
Remarques :
(i) le principe de dominance requiert moins d'information que le critère d'espérance
subjective d'utilité : pas besoin de connaître les probabilités subjectives ni l'utilité
(seulement les préférences)
(ii) tout se paie : le principe de dominance fournit moins de recommandations que le
principe de maximisation de l'ESU
(iii) l'ESU s'aligne sur la dominance : si f1 domine f2 (et si leur ESU est nie), alors
ESU (f1 ) > ESU (f2 )
•
Question : le principe de dominance est-il able ?
11
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
Exemple 9 (de
12
labore )
réussite
échec
réviser
5
- 5
ne pas réviser
10
0
Exemple 10 (plutôt rouge que mort)
invasion
pas invasion
rester armé
mort
pauvre
se désarmer
rouge
riche
Hypothèse : rouge
mort et riche
pauvre
Qu'est-ce qui ne va pas avec le principe de dominance ? La probabilité que Paul
réussisse l'examen dépend de son choix : plus forte s'il révise, plus faible s'il ne révise pas.
Dans les deux exemples, la probabilité pour qu'un état de la nature survienne dépend de
l'acte que Pierre choisit. Le principe de dominance ne semble plus valable quand les états
de la nature dépendent des actions que l'agent doit choisir. Puisque l'ESU s'aligne sur la
dominance, cela implique que quelque chose ne va pas dans l'ESU ! !
•
• Idée : il faut prendre en compte la probabilité des états de la nature conditionnellement
aux actions
Exemple : la probabilité d'une invasion soviétique conditionnellement au choix de Paul
de rester armé ou de se désarmer. On le note de la manière suivante : P (invasion / rester
armé) - et, de manière générale : P (s/a)
Exemple 11
On peut représenter les probabilités conditionnelles de la manière suivante :
invasion
pas invasion
rester armé
.1
.9
se désarmer
.8
.2
Supposons que les utilités soient les suivantes :
invasion
pas invasion
rester armé
- 100
0
se désarmer
- 50
50
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
13
On peut alors déterminer l'espérance subjective condtionnnelle d'utilité (ESCondU) :
(.1 × −100) + (.9 × 0) = −10
= (.8 × −50) + (.2 × 50) = −30
ESCondU(rester armé) =
ESCondU(se désarmer)
• De manière générale, l'ESCondU d'une action ai est la suivante
ESCondU (ai ) = P (s1 /ai ) × u(ci1 ) + ... + P (sm /ai ) × u(cim )
ESCondU (ai ) =
P
j
:
P (sj /ai ) × u(cij )
- la règle de décision associée est bien sûr qu'il faut choisir l'action a dont l'espérance
subjective conditionnelle d'utilité est maximale. Ce modèle a principalement été élaboré
par R. Jerey, The Logic of Decision (1965/1983)
• L'ESCondU peut recommander des actions diérentes de celles que recommande le
principe de dominance ou l'ESU. Les recommandations sont nécessairement identiques
quand les états de la nature sont indépendants des actions i.e. quand pour toute action ai
et tout état de la nature sj , P (sj /ai) = P (sj )
Exemple : prendre un parapluie en fonction de sa croyance qu'il va pleuvoir ou non
• La règle de maximisation de l'ESCondU peut être conçue comme un critère
de bonne
: la meilleure action pour Paul est celle dont il serait le plus heureux d'apprendre
qu'elle a eu lieu. Les partisans de l'ESCondU sont appelés les partisans de la théorie
évidentielle de la décision ou évidentialistes
nouvelle
Le paradoxe de Newcomb (R. Nozick, Newcomb's Problem and Two Principles
of Choice (1969))
2 boîtes :
B1 : 1 000 euros B2 : 1 M euros ou rien
Paul a le choix entre deux actions :
a1 : prendre les deux boîtes
a2 : prendre seulement la boîte B2
c'est un prédicteur omniscient (PO) qui décide du contenu de la boîte B2 :
.s'il prédit que Paul prendra les deux boîtes, il ne met rien dans B2 ;
.s'il prédit que Paul prendra seulement la boîte B2, il met 1M euros dedans
.le prédicteur fait son choix avant celui de Paul
Paul sait tout cela ; a1 ou a2 ?
• Matrice de décision
•
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
a1
a2
14
0 dans B2 1M dans B2
1 000
1 001 000
0
1 000 000
(i) raisonnement par ESCondU :
a1
a2
0 dans B2 1M dans B2
1 000 (1) 1 001 000 (0)
0 (0) 1 000 000 (1)
ESCondU (a1 ) = 1 × 1000 + 0 × 1001000 = 1000
ESCondU (a2 ) = 0 × 0 + 1 × 1000000 = 0
⇒
il faut choisir a2 (one-boxer ) !
(ii) raisonnement par dominance : a1 domine a2 ⇒ il faut choisir a1 (two-boxer ) !
• Où est le problème ? On a vu que le principe de dominance avait une validité limitée et
que l'ESCondU semblait plus able Dans les exemples qui parlaient en faveur de l'ESCondU
contre la dominance, l'action de Paul a un eet sur l'état de la nature ; dans le problème
de Newcomb, le PO a déjà fait son choix quand Paul doit prendre sa décision à son tour.
Exemple 12 (Newcomb médical)
Hypothèse : il n'y a pas de lien causal entre tabagie et cancer mais une cause commune (le
mauvais gène
G)
qui induit une corrélation statistique entre tabagie et cancer
cancer
pas de cancer
fumer
- 990 (.75)
10 (.25)
ne pas fumer
- 1000 (.2)
0 (.8)
(i) raisonnement par ESCondU :
ESCondU (f umer) = (−990 × .75) + (10 × .25) = −245
ESCondU (nepasf umer) = (−1000 × .2) + (0 × .8) = −200
⇒ il vaut mieux ne pas fumer !
(ii) raisonnement par dominance : il vaut mieux fumer !
Dans le cas du Newcomb médical, ce qui motive la dominance, c'est que (par hypothèse)
il n'y a pas de relation causale entre tabagie et cancer. La tabagie est un signe (et pas
une cause) d'une forte prédisposition au cancer. De manière générale, les probabilités ne
discriminent pas entre les relations qui sont causales et celles qui ne le sont pas. P (c/a)
peut être supérieure à P (c)
parce que a tend a causer c
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
parce qu'il existe une cause commune à a et c
le problème de Newcomb provient du fait qu'il y a dépendance probabiliste mais indépendance causale
• Les partisans d'une théorie causale de la décision (ou causalistes) soutiennent qu'il
faut se baser sur la dépendance causale et pas seulement sur la dépendance probabiliste.
Le principe de dominance est correct quand il y a indépendance causale même s'il n'y pas
indépendance probabiliste. Les causalistes sont two-boxers. Ils estiment que les one-boxers
sont irrationnels et adoptent une conception magique de la causalité.
Réponse évidentialiste : lui (l'évidentialiste) repart avec 1M euros du problème de
Newcomb, le causaliste avec 1 000 euros !
•
ìf you're so smart, why ain't you so rich ?
Théorie causale de la décision
notion qui capture la dépendance probabiliste :
•
P (a . s)
l'état s est causalement indépendant de l'action a ssi
P (a . s) = P (s)
règle de décision
ESCausU (ai ) = P (ai . s1 ) × u(ci1 ) + ... + P (ai . sm ) × u(cim )
ESCausU (ai ) =
P
j
P (ai . sj ) × u(cij )
Analyse causaliste de Newcomb :
indépendance causale :
•
P (0 − B2) = P (a1 . 0 − B2) = P (a2 . 0 − B2) = µ
P (1M − B2) = 1 − P (0 − B2) = 1 − µ
0 dans B2 1M dans B2
a1
1 000
1 001 000
a2
0
1 000 000
calcul de l'espérance subjective causale d'utilité :
ESCausU (a1 ) = 1000µ + 1001000(1 − µ)
ESCausU (a2 ) = 0µ + 1000000(1 − µ)
comparaison :
ESCausU (a1 ) − ESCausU (a2 ) = 1000 > 0
il faut choisir a1 !
l'ESCausU s'aligne sur le principe de dominance quand les actions et les états sont
causalement indépendants :
15
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
16
dans de labore, l'ESCausU peut contredire le principe de dominance
dans le problème de Newcomb, l'ESCausU s'aligne sur le principe de dominance
l'ESCondU était une sorte de mesure de bienvenue ; l'ESCausU mesure l'ecacité
espérée d'un acte à produire les conséquences que l'agent désire
4
Dépendance de l'utilité et des préférences à l'égard
des états de la nature
•
Revenons sur l'axiome (P3) :
(P3) si E n'est pas nul, f =E x et g =E y, alors f E g ssi x y
en nous rappelant les dénitions suivantes :
Dénition 6
La relation de
f E g
si
∀f 0 , g 0 ∈ F ,
Dénition 7
La relation de
xy
ssi
préférence sur les actes conditionnelle à E , notée E , est dénie ainsi :
si
f 0 =E f , g 0 =E g
et
f 0 =E c g 0 ,
alors
f 0 g0
préférence sur les conséquences est dénie ainsi :
f f0
où
∀s ∈ S , f (s) = x
et
f 0 (s) = y
signie donc que si l'on rendait f et g identiques sur E c, alors f serait préféré à g.
(P3) signie que pour un E non nul, si f est l'acte constant x sur E et g l'acte constant y
sur E , alors la préférence conditionnelle f E g est déterminée par la relation de préférence
entre l'acte constant x et l'acte constant y. En particulier, cela signie que pour tout état
s ∈ S , f {s} g ssi x y et par conséquent pour toute paire d'états s, s0 , f {s} g ssi
f {s } g . (Cette glose est approximative dans la mesure où les états doivent être non nuls).
Les préférences entre conséquences doivent donc être indépendantes des états de la nature,
et plus généralement, la valeur qu'un agent accorde à une conséquence ne dépend pas de
l'état de la nature.
f E g
0
Exemple 13 (Parapluie et maillot de bain (Gilboa, 2007))
Soit
x
= avoir un parapluie et
qui est prudent,
x y.
y
= avoir un maillot de bain. Supposons que pour Paul
Comparons maintenant l'acte
y
et l'acte
xEy
où
événement non nul pour Paul. Il semble parfaitement sensé que l'on ait
préfère un maillot de bain s'il fait beau. Ceci viole directement (P3).
E = il fait beau,
y E xEy : Paul
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
On a un problème similaire avec (P4) :
(P4) si x y et x0 y0, alors xEy xE 0y ssi x0Ey0 x0E 0y0
(P4) garantit que la révélation des probabilités est indépendante des conséquences dont on
se sert pour le faire. La situation suivante est concevable pour x0 = 100, y0 = 0 et E = il
fait beau : x0Ey0 x0E cy0 : il est donc probable qu'il fait beau mais xEy ≺ xE cy : Paul
préfère avoir un parapluie s'il pleut et un maillot sinon à avoir un parapluie s'il fait beau
et un maillot sinon.
Exemple 14 (l'opération de Mme A. (Aumann, 1971))
Mme A. doit subir une opération ; il y a 1/2 chance qu'elle survive (et guérisse parfaitement)
et 1/2 chance qu'elle décède. on demande à son mari, M.A., s'il préfère parier 100 euros
sur la survie (a1 ) ou 100 euros sur le décès (a2 ) :
a1
a2
Problème :
a1 a2
ssi
survie
décès
100
0
0
100
1/2.u(100) + 1/2.u(0) > 1/2.u(0) + 1/2.u(100).
Réaction naturelle : les conséquences sont mal spéciées, elles ne prennent pas en
compte tout ce qui est pertinent pour le décideur. y1 = bronzer au soleil dans une chaise
longue en maillot de bain vs. y2= marcher sous la pluie en maillot de bain.
•
a1
a2
survie
décès
100 avec Mme A. 0 sans Mme A.
0 avec Mme A. 100 sans Mme A.
Dans ce cas, le problème disparaît :
a1 a2 ssi 1/2.u(100avecM meA.) +
1/2.u(0avecM meA.) > 1/2.u(0sansM meA.) + 1/2.u(100sansM meA.).
Dans le cadre savagien, on fait l'hypothèse que l'ensemble des actions réalisables est
l'ensemble F = X S , c'est-à-dire toutes les manières possibles d'associer des états de la
nature à des conséquences.
•
17
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
a1
a2
a3
a4
.
survie
100 avec Mme A.
0 avec Mme A.
0 avec Mme A.
0 sans Mme A.
18
décès
0 sans Mme A.
100 sans Mme A.
100 avec Mme A.
100 avec Mme A.
Savage, L. (1971), Lettre à R.Aumann, 27 janvier 1971 dans J.H. Drèze (ed.), Essays
, pp. 78-81, Cambridge UP, Cambridge
on Economic Decisions under Uncertainty
It is quite usual in this theory to contemplate acts that are not actually available.
These serve something like construction lines in geometry...
In particular, I can contemplate the possibility that the lady dies medically and yet
is restored in good health to her husband. Put a little dierently, I can ask [M.A] how
he would bet on the operation if the continuance of his family life were not dependent
on its outcome. Make believe is certainly involved, and indeed it is extremely dicult
to make believe to the required extent. Yet, it does seem to be a helpful goal.
•
utilité dépendante des états : u : C × S → R et
EUd (f ) =
P
s∈S
P (s) × u(f (s), s)
Problème : on perd l'unicité de P (.) : pour un
(u0 , P 0 ) représente les mêmes préférences où
u0 (f (s), s) = u(f (s),
P s)/λs
0
P (s) = λs P (s)/ s0 ∈S λs0 P (s0 )
ensemble quelconque de coecients λs > 0,
Pour récupérer l'unicité, une approche inuente étend le domaine des objets entre lesquels
l'agent exprime ses préférences : il ne s'agit plus des actes savagiens, mais d'actes accompagnés de probabilités pour les états de la nature. On parle de préférences hypothétiques.
• Revenons à Mme A. On avait donné en première analyse : a1 a2 ssi 1/2.u(100) +
1/2.u(0) > 1/2.u(0) + 1/2.u(100). Cette analyse suppose que les probabilités subjectives
sont (1/2, 1/2) ; mais d'où viennent ces probabilités ? Si l'on suit la ligne savagienne stricte,
il faut révéler les probabilités par les préférences. Et dans ce cas, il n'y a pas de réfutation
du MESU puisque précisément a1 a2 montre que P (S) > P (D). Evidemment, c'est
extrêmement contre-intuitif.
Supposons que M.A a, comme l'exemple le suggère, une utilité dépendante des états :
u(x) = x si S et u(x) = x/2 si D (Karni 1996, adapté par Gilboa 2007). Dans ce cas, avec
PI (D) = PI (Dc ) = 1/2, M.A sera indiérent entre
f
= 0 si S , 3000 si D et g= 1000 dans tous les cas
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
Du point de vue de Savage, on aura PP (D) = 1/3. Il faut noter que M. A peut parfaitement
satisfaire les axiomes de Savage. Par conséquent, il faut distinguer dépendance des préférences par rapport aux états et dépendance de l'utilité par rapport aux états. Le premier
type de dépendance est exclu par les axiomes du MESU, pas le second.
.
Karni (1996), Probabilities and Beliefs, Journal of Risk and Uncertainty, 13 :249-62
In many situations, especially when eliciting expert's opinions, the verbal communication of beliefs may be more valuable than inferences from the expert's choice
behavior.
...Within the framework of SEU the choice-theoretic denition of subjective probabilities is based on the convention that the utility functions are event-independent.
This convention is not implied by the axioms. Consequently, the denition of probabilities does not necessarily represent the decision maker's beliefs concerning the
likely realization of alternative events.
Nau cours 4
5
Le paradoxe d'Ellsberg
.
What might it mean operationally, in terms of refutable predictions about observable
phenomena, to say that someone behaves as if he assigned quantitative likelihoods
to events : or to say that he does not ?
5.1 Le Paradoxe à 3 couleurs
une urne contient 90 boules, 30 rouges (R) et 60 bleues (B) ou jaunes (J) (la proportion précise de boules bleues et de boules jaunes n'est pas connue). On tire une
boule de l'urne au hasard.
Choix 1 :
f1 : 100 E si (R), rien sinon
g1 : 100 E si (B), rien sinon
Choix 2 :
f10 : 100 E si (R ∪ J), rien sinon
g10 : 100 E si (B ∪ J), rien sinon
Comportement modal : f1 g1 et f10 ≺ g10
Le comportement modal est problématique du point de vue du MESU. La meilleure
façon de le voir, c'est de représenter les quatre actions de la manière suivante :
•
19
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
f1
g1
f10
g10
20
Rouge Bleu Jaune
100
0
0
0
100
0
100
0
100
0
100 100
On voir que f1 et g1 ont une partie commune et que f10 et g10 peuvent se concevoir comme le
résultat d'une transformation identique de cette partie commune. Formellement, on peut
facilement vérier :
- f1 =J g1
- f10 =J g10
- f1 =cJ f10
- g1 =cJ g10
d'après (P2) on est donc en position de conclure que f1 g1 ssi f10 g10 . Le comportement
modal viole donc le MESU.
On a vu dans le cours précédent le rôle crucial que jouait (P2) dans la révélation des
probabilités : (P2) permet d'obtenir l'additivité qualitative pour la relation de probabilité
comparative dénie par (Def >) :
•
(Def >) E1 > E2 ssi ∃x, y ∈ C tels que x y, xE1y xE2y
Comme on peut s'y attendre, la violation de (P2) dans le Paradoxe d'Ellsberg a pour
conséquence que l'on ne peut pas révéler de croyances probabilistes : les degrés de croyances
révélées par f1 − g10 violent les axiomes des probabilités. Supposons en eet que 100 0.
Alors
- si f1 g1 alors par (Def>) R > B ou P (R) > P (B).
- si f10 ≺ g10 alors par (Def>) R ∪ J > B ∪ J ou P (R ∪ J) > P (B ∪ J)
Puisque l'événement J est incompatible avec R et B , ce que l'on obtient est donc incompatible à la fois avec l'additivité qualitative (pour >) et l'additivité (pour P(.)). Si ce sont
bien les degrés de croyances du décideur qui sont révélées par (Def>), alors ces degrés de
croyance n'obéissent pas au calcul des probabilités.
• Comme dans le cas du PA, le comportement modal paraît tout à fait sensé, et comme
dans le cas du PA, on peut en fournir une interprétation raisonnable. Dans le Choix 1, les
sujets ne savent pas du tout quelle est la proportion de boules bleues, elle peut être comprise
entre 0 et 2/3 ; tandis que les sujets connaissent la proportion exacte de boules rouges (1/3).
Le comportement modal semble procéder d'une forme de prudence qui consiste à opter pour
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
l'action qui s'appuie sur une proportion exactement connue. Dans le Choix 2, le rapport
s'inverse entre f10 et g10 : la proportion de R ∪ J n'est pas connue (entre 1/3 et 2/3) tandis
que celle de B ∪ J l'est (2/3). Même principe : l'action qui s'appuie sur une proportion
exactement connue est favorisée. On désigne en général les cas où les proportions ne sont
pas connues (et, de manière générale, les probabilités) comme des cas ambigus et l'on
parle d'aversion pour l'ambiguïté pour désigner le comportement modal.
Pour passer de f1, g1 à f10 , g10 , on a étendu le domaine gagnant du pari par union de
l'événement initial (resp. R et B ) avec J . Cette opération ne préserve pas l'ambiguïté ou
l'absence d'ambiguïté des paris initiaux : f1 n'était pas ambigu mais le devient tandis que
g1 était ambigu mais ne l'est plus. On comprend le conit avec (P2) : l'opération préserve
le fait que les deux actions ont une partie commune donc d'après (P2) devrait préserver
les préférences ; mais elle inverse l'ambiguïté...
5.2 Le Paradoxe à 2 couleurs
Choix 1 : l'urne 1 contient 100 boules rouges (R1) et noires (N1) en proportions inconnues
r1 = 100 E si R1 rien sinon
n1 = 100 E si N1 , rien sinon
Choix 2 : l'urne 2 contient 50 boules rouges et 50 boules noires
r2 = 100 E si R2 rien sinon
n2 = 100 E si N2 , rien sinon
Comportement modal :
(i) r1 ∼ n1
(ii) r2 ∼ n2
(iii) r1 ≺ r2
(iv) n1 ≺ n2
Quels degrés de croyances sont révélés par le comportement modal ?
De (iii), on infère que R1 < R2 ou P (R1) < P (R2)
De (iv), on infère que N1 < N2 ou P (N1) < P (N2)
D'où il suit que P (R1) + P (N1) < P (R2) + P (N2),
soit P (R1) + P (R1c ) < P (R2) + P (R2c ), ce qui est incompatible avec le calcul des probabilités.
•
• Raisonnons de nouveau axiomatiquement, en partant d'une visualisation des diérents
actes :
21
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
R1 R2
r1
n1
r2
n2
100
0
100
0
R1 N2
100
0
0
100
N1 R2
0
100
100
0
22
N1 N2
0
100
0
100
Les actes r1 et r2 sont identiques sur R1R2 et N1N2, même remarque pour n1 et n2 :
r1 =R1 R2 ∪N1 N2 r2
n1 =R1 R2 ∪N1 N2 n2
Peut-on passer de r1 et r2 à n1 et n2 par une transformation identique de leur partie
commune R1R2 ∪N1N2 (et donc appliquer (P2)) ? Oui si l'on a correspondance sur (R1R2 ∪
N1 N2 )c . Attention : cela marche si l'on associe r1 à n2 et r2 à n1 . On a donc :
r1 =(R1 R2 ∪N1 N2 )c n2
n1 =(R1 R2 ∪N1 N2 )c r2
Les choses sont plus visibles si l'on réarrange le tableau ainsi :
R1 R2
r1
r2
n2
n1
100
100
0
0
R1 N2
100
0
100
0
N1 R2
0
100
0
100
N1 N2
0
0
100
100
Par (P2), on conclut de ce qui précède que r1 r2 ssi n2 n1. Ce qui est contredit par le
comportement modal.
Remarque : on voit que l'interprétation par l'aversion pour l'ambiguïté semble également
plausible pour le Paradoxe à 2 couleurs.
5.3 Le modèle multi-prior (Gilboa & Schmeidler)
Pour terminer sur le PE, nous allons donner un exemple de modèle de choix en
incertitude conçu pour en rendre compte : le modèle multi-prior (Gilboa & Schmeidler)
•
Exemple 15 (3 couleurs)
Soit
P
l'ensemble des distributions de probabilités qui assignent 1/3 à
On considère pour simplier que
-
u(.) = id.
∀P ∈ P , E[u, P ](f1 ) = 100.1/3
donc
minP ∈P E[u, P ](f1 ) = 100/3.
R
et 2/3 à
B ∪ J.
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
23
minP ∈P E[u, P ](g1 ) = 100.0 = 0
⇒ f1 g1
-
minP ∈P E[u, P ](f10 ) = 100.1/3 + 100.0 = 100/3
0
- minP ∈P E[u, P ](g1 ) = 100.2/3 = 200/3
0
0
⇒ f1 ≺ g1
-
Exemple 16 (2 couleurs)
Soit
P
l'ensemble des distributions de probabilités qui assignent 1/2 à
On considère pour simplier que
R2
et (donc)
N2 .
u(.) = id.
∀P ∈ P , E[u, P ](r2 ) = 100.1/2 donc minP ∈P E[u, P ](r2 ) = 50.
- ∀P ∈ P , E[u, P ](n2 ) = 100.1/2 donc minP ∈P E[u, P ](n2 ) = 50
⇒ r2 ∼ n2
-
minP ∈P E[u, P ](r1 ) = 100.0 = 0
- minP ∈P E[u, P ](n1 ) = 100.0 = 0
⇒ r2 ∼ n2
⇒ r1 ≺ r2
⇒ n1 ≺ n2
-
Gilboa et Schmeidler (1989) ont axiomatisé le modèle multi-prior dans un cadre
Anscombe-Aumann.
Les actes f ne sont plus des applications des états de la nature vers les conséquences
certaines mais des applications des états de la nature vers l'ensemble des loteries simples
(à support ni) L sur l'ensemble des conséquences certaines C .
On dénit une opération de mixage analogue à celle du MEU : pour toute paire d'actes
f, g ∈ F ,
•
αf ⊕ (1 − α)g(s) = αf (s) ⊕ (1 − α)g(s)
Autrement dit, αf ⊕(1−α)g est l'acte qui produit en s ∈ S le mixage de la loterie produite
en s par f et de la loterie produite en s par g.
Exemple 17
Considérons le PE à 2 couleurs et plus particulièrement les actes
produit des loteries dégénérées.
αr1 ⊕ (1 − α)n1 (R1 R2 ) = (100, α; 0, 1 − α)
αr1 ⊕ (1 − α)n1 (R1 N2 ) = (100, α; 0, 1 − α)
αr1 ⊕ (1 − α)n1 (N1 R2 ) = (0, α; 100, 1 − α)
αr1 ⊕ (1 − α)n1 (N1 N2 ) = (0, α; 100, 1 − α)
r1
et
n1 .
Chaque acte
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
24
L'évaluation d'un acte f se fait en prenant l'espérance d'utilité subjective dénie
sur...l'espérance d'utilité objective :
AA(f ) =
P
s∈S
P
P (s) × E[u, f (s)] =
s∈S
P
P (s) ×
f (s)(c) × u(c)
c∈C
Exemple 18
Evaluons l'acte
αr1 ⊕ (1 − α)n1
:
AA(αr1 ⊕ (1 − α)n1 ) = P (R1 R2 ).100α + P (R1 N2 ).(100α)) + P (N1 R2 ).100(1 − α) +
P (N1 N2 ).100.(1 − α)
AA(αr2 ⊕ (1 − α)n2 ) = P (R1 ).100α + P (N1 ).100.(1 − α)
AA(αr2 ⊕ (1 − α)n2 ) = 1/2.100α + 1/2.(100.(1 − α)) = 50
Modèle Anscombe-Aumann (AA)
(AA0) L'agent peut choisir entre les diérents actes f
est l'ensemble des fonctions f : S → ∆(C).
∈ F,
où F
(AA1) est une relation de préférence rationnelle
(AA2) pour tout f, g, h ∈ F , si f g h, il existe α, β ∈ (0, 1) ts
αf ⊕ (1 − α)h g βf ⊕ (1 − beta)h
(AA3) ∀f, g, h ∈ F et α ∈ (0, 1),
f g ssi αf ⊕ (1 − α)h αg ⊕ (1 − α)h
(AA4) ∀f, g ∈ F , si f (s) g(s) pour tout s ∈ S , f g
(AA5) il existe certains x, y ∈ C tels que x y
(AA C) L'agent, s'il en existe au moins un, choisit un acte maximal
Théorème 2 (théorème de représentation)
Si la relation
sur
F
satisfait (AA1)-(AA5)), alors
(i) il existe une unique distribution de probabilité
(ii) il existe une fonction
u : C → R,
P
sur
(S, ℘(S))
unique à une transformation ane croissante près,
telles que
∀f, g ∈ F , f g
ssi
P
s∈S
P (s) × E[u, f (s)] ≥
P
s∈S
P (s) × E[u, g(s)]
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
Revenons maintenant au modèle multi-prior de Gilboa-Schmeidler. Comme on peut
s'y attendre, c'est l'axiome d'indépendance qui va être modié. Plus précisément, on va le
remplacer par les deux axiomes suivants :
•
C-indépendance
f g
: ∀f, g ∈ F , h ∈ F constant et α ∈ (0, 1),
ssi αf ⊕ (1 − α)h αg ⊕ (1 − α)h
L'axiome de C-indépendance est un aaiblissement de l'axiome d'indépendance : il impose
l'indépendance uniquement quand le troisième acte est constant.
Aversion à l'incertitude
αf ⊕ (1 − α)g f
: ∀f, g ∈ F , si f ∼ g, alors pour α ∈ (0, 1),
Autrement dit, l'agent a une préférence pour le mixage.
Exemple 19
Pr la probabilité telle que Pr (R1 ) = 1 tandis que Pr (N1 ) = 0 et Pn la probabilité telle
que Pn (R1 ) = 0 tandis que Pn (N1 ) = 0. Pr est la distribution de probabilité qui induisait
l'EU minimale pour n1 (=0), et Pn est celle qui induisait l'EU minimale pour r1 (=0).
Regardons ce qui se passe avec αr2 ⊕ (1 − α)n2 ) :
Soit
EUPr (αr1 ⊕ (1 − α)n1 ) = Pr (R1 ).100α + Pr (N1 ).(100.(1 − α))
EUPr (αr1 ⊕ (1 − α)n1 ) = 1.100α + 0.(100.(1 − α)) = 100α
Symétriquement,
EUPn (αr1 ⊕ (1 − α)n1 ) = Pn (R1 ).100α + Pn (N1 ).(100.(1 − α))
EUPn (αr1 ⊕ (1 − α)n1 ) = 0.100α + 1.(100.(1 − α)) = 100.(1 − α)
De manière générale, pour
Pβ
telle que
Pβ (R1 ) = β
tandis que
Pβ (N1 ) = 1 − β ,
EUPβ (αr1 ⊕ (1 − α)n1 ) = β.100α + (1 − β).(100.(1 − α))
EUPβ (αr1 ⊕ (1 − α)n1 ) = 100(1 − β) − α + 2αβ)
Or [si je ne me trompe pas],
1 − β − α + 2αβ ≥ 0
donc
minP ∈P E[u, P ](αr1 ⊕ (1 − α)n1 ) ≥ minP ∈P E[u, P ](r1 ) = minP ∈P E[u, P ](n1 ) = 0
- ce qui illustre l'axiome d'aversion pour l'incertitude.
25
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
6
26
Références
6.1 généralités
•
D. Kreps (1988), Notes on the Theory of Choice, Westview Press
• Gilboa, I. (2007), Lecture Notes on the Theory of Decision under Uncertainty, Mimeo,
http://www.tau.ac.il/~igilboa/pdf/Gilboa_Lecture_Notes.pdf
•
L. Savage (1954/1972), The Foundations of Statistics, Dover
6.2 dépendance des probabilités sur les états de la nature à l'égard
des actes
• Gibbard, A. & Harper, W.L. (1978) Counterfactuals and Two Kinds of Expected
Utility in Hooker, Linch & McClennen (eds) Foundations and Applications of Decision
Theory, vol.I, pp. 125-62 [l'une des premières et des plus célèbres versions de la théorie
causale de la décision, fondée sur la notion de conditionnel contrefactuel]
•
R. Jerey (1965/1983), The Logic of Decision
Joyce, J.M. (1999) The Foundations of Causal Decision Theory, Cambridge UP [ouvrage très dicile ; ce qui se fait de plus sophistiqué en matière de théorie causale de la
décision]
•
Nozick, R. (1969) Newcomb's Problem and Two Principles of Choice, in Rescher,
N. (ed.) Essays in Honor of Carl G. Hempel, Reidel, Dordrecht [l'article qui a introduit le
problème de Newcomb dans la communauté philosophique]
•
6.3 dépendance de l'utilité et des préférences à l'égard des états
de la nature
Aumann, R. (1971), Lettre à L. Savage, 8 janvier 1971 dans J.H. Drèze (ed.), Essays
on Economic Decisions under Uncertainty, pp. 76-8, Cambridge UP, Cambridge
• Karni (1996), Probabilities and Beliefs, Journal of Risk and Uncertainty, 13 :249-62
•
•
Savage, L. (1971), Lettre à R.Aumann, 27 janvier 1971 dans J.H. Drèze (ed.), Essays
, pp. 78-81, Cambridge UP, Cambridge
on Economic Decisions under Uncertainty
M. Cozic - Philosophie de l'économie 2009/2010 - DA n7 - Le choix incertain
6.4 sur le Paradoxe d'Ellsberg
•
D. Ellsberg (1961), Risk, Ambiguity and the Savage Axioms, Quaterly Journal of
, 75 :643-69
Economics
•
Gilboa & Schmeidler (1989), Maxmin Expected Utility with a Non-Unique Prior,
, 18 :141-53
Journal of Mathematical Economics
27