CEA 2013 Première année Examen de probabilités et statistique 15

Transcription

CEA 2013 Première année Examen de probabilités et statistique 15
CEA 2013 Première année
Examen de probabilités et statistique
15/11/2014
Éléments de corrigé
S=
H
X
Mi +
i=1
K
X
Cj
(1)
j=1
où :
• les variables aléatoires H , K , M1 , M2 , . . . , C1 , C2 , . . . sont mutuellement indépendantes
• H suit la loi de Poisson de parmètre λ et K la loi de Poisson de paramètre µ
• les Mi suivent la même loi qu'une variable M et les Cj qu'une variable C , avec pour tout nombre
réel positif x, les notations :
SM (x) = P [M ≥ x]
SC (x) = P [C ≥ x]
LM (x) = E(e−x M )
LC (x) = E(e−x C ) .
Partie 1 : calcul de lois et simulation
Si les sinistres sont classés par date de survenance, sans qu'apparaisse sur chaque che la nature du
sinistre, mais seulement son coût, le montant aléatoire cumulé des sinistres s'écrit :
S=
H+K
X
W`
(2)
`=1
où les variables aléatoires X` représentent des coûts de sinistres matériels ou corporels.
1.
a) Comme les deux variables aléatoires H et K sont indépendantes et suivent des lois de
Poisson de paramètres λ et µ, leur somme H + K suit la loi de Poisson de paramètre λ + µ.
b) Soit t ∈ R.
E(tH+K ) =
+∞
X
tn P [H + K = n] =
n=0
+∞
X
n=0
tn
(λ + µ)n −λ−µ
e
= e(t−1)(λ+µ)
n!
c) E(tH+K ) = gH+K (t) est la valeur en t de la fonction génératrice de H + K .
Pour toute variable aléatoire à valeurs dans N, la fonction génératrice, dénie au minimum sur
le segment [−1, +1], caractérise la loi de la variable aléatoire.
Dans le cas des variables de Poisson, elle est dénie sur R et son utilisation permet de prouver
aisément la propriété d'additivité utilisée en a).
2. Soit x ≥ 0.
a) Soit h ∈ N∗ .
h
X
−x
Mi
h
Y
i=1
E e
=E
e−xMi .
i=1
Comme les variables aléatoires Mi sont mutuellement indépendantes, les variables e−xMi le
sont aussi et on a donc :
−x
E e
h
X
i=1
Mi
=
h
Y
i=1
1
h
E e−xMi = LM (x) .
b) On utilise ici l'espérance conditionnelle sachant H .
Grâce à l'indépendance de H et des Mi , le résultat précédent permet d'écrire, pour tout h ∈ N :
−x
E
d'où
−x
E e
H
X
i=1
Mi
H=h
e
−x
= E EH e
H
X
Mi
i=1
H
X
i=1
Mi h
= LM (x)
H = E LM (x)
= eλ(LM (x) − 1) .
−x
H
X
Mi
−x
K
X
Mi
c) Par le "lemme des coalitions", les variables aléatoires e
et e
(qui
ne dépendent que de H et des Mi pour la première, que de K et des Cj pour la seconde) sont
indépendantes, de sorte que l'espérance de leur produit est égale au produit de leurs espérances :
i=1
−x
E e−xS = E e
3.
H
X
i=1
−x
Mi
K
X
Cj
j=1
×E e
j=1
a) Si dans la décomposition indiérenciée S =
= eλ(LM (x) − 1) + µ(LC (x) − 1)
H+K
X
W` , on suppose les variables W` sont
`=1
indépendantes de H + K , indépendantes entre elles, et de même loi qu'une variable de référence
W , on aura, en notant LW (x) = E(e−x W ) pour tout réel positif x :
E e−xS = e(λ + µ)(LW (x) − 1) .
Les deux modèles (1) et (2) seront équivalents si la fonction LW vérie :
e(λ + µ)(LW (x) − 1) = eλ(LM (x) − 1) + µ(LC (x) − 1)
c'est-à-dire
LW (x) =
µ
λ
LM (x) +
LC (x) .
λ+µ
λ+µ
Comme la transformée de Laplace d'une variable aléatoire positive caractérise sa loi, l'égalité
précédente ne peut être vériée pour tout x ≥ 0 que si la loi de W est le mélange de la loi de M
λ
µ
et de la loi de C , pondérées par
et
.
λ+µ
λ+µ
On peut donc, sans changer de modélisation, considérer que dans l'écriture (2), les variables
aléatoires W` sont indépendantes de H + K , indépendantes entre elles, et vérient pour tout
réel x ≥ 0 :
P [W` ≥ x] =
On notera désormais αm =
µ
λ
SM (x) +
SC (x)
λ+µ
λ+µ
(3) .
λ
µ
et αc =
.
λ+µ
λ+µ
b) Dans le modèle initial, associé à la formule (1), les deux paramètres αm et αc représentent
les poids moyens relatifs, en fréquence, des sinistres matériels d'une part, des sinistres corporels
d'autre part : le nombre moyen de sinistres matériels (resp. corporels) au cours d'une période
est dans la proportion αm (resp. αc ) vis-à-vis du nombre moyen de sinistres, dans son ensemble,
sur la même période.
2
Dans le modèle associé aux formules (2) et (3), αm et αc représentent les probabilités pour qu'un
sinistre soit purement matériel ou non.
c) L'espérance d'une loi-mélange étant le mélange dans les mêmes proportions des espérances
des lois qui la composent, on a :
E(W` ) = αm E(M ) + αc E(C) .
d) De même : E(W` 2 ) = αm E(M 2 ) + αc E(C 2 ), qui permet de valculer la variance de W` .
= αm
2
2
V (W` ) = E(W` 2 ) − E(W` ) = αm E(M 2 ) + αc E(C 2 ) − αm E(M ) + αc E(C)
V (M )+(E(M ))2 +αc V (C)+(E(C))2 −αm 2 (E(M ))2 −αc 2 (E(C))2 −2αm αc E(M )E(C)
d'où, en utilisant l'égalité αm + αc = 1 :
2
V (W` ) = αm V (M ) + αc V (C) + αm αc E(C) − E(M ) .
4. Simulations
a) Le principe de cette simulation sous Excel consiste à chercher (par la fonction RECHERCHE) la position d'une fréquence aléatoire comprise entre 0 et 1 (générée par ALEA)
dans un vecteur de probabilités cumulées attachées aux premiers nombres entiers, calculées
(à l'aide de la fonction LOI.POISSON) jusqu'à des valeurs proches de 1. Le nombre aléatoire
correspondant à cette position fournira alors la valeur simulée pour la variable de Poisson.
Pour les détails et les codes Excel, on se reportera à la correction de l'exercice 2 du TD 2 sur la
simulation.
b) Disposant de deux simulations initiales h et k de H et K , la méthode de la fonction
de répartition réciproque permet de simuler des valeurs mi et cj . Plutôt que leurs fonctions de
répartition usuelles (cumulatives), on peut d'ailleurs utiliser aussi bien les fonctions de répartition
décumulatives SM et SC des variables à simuler.
Par exemple, dans l'hypothèse où la variable M possède une densité de probabilité strictement
positive sur [0, +∞[ ou seulement sur un intervalle [0, Mmax ], la fonction de répartition décumu−1
lative SM admet une fonction réciproque SM
. Appliquée à un nombre aléatoire compris entre 0
et 1 (généré par ALEA), cette fonction réciproque fournit une valeur simulée de M . En répétant
l'opération h fois et en cumulant les simulations obtenues, on obtient une simulation du montant
cumulé des sinistres matériels. On procède ensuite de même pour les sinistres corporels et on en
déduit une simulation de S par addition des montants cumulés associés aux deux catégories de
sinistres.
Techniquement, cette méthode est applicable dès qu'il est possible d'évaluer, analytiquement ou
seulement numériquement, les quantiles des lois de M et de C .
c) Pour simuler S à l'aide de la formule (2), on peut procéder comme en b), en eectuant n
simulations d'une variable aléatoire W dont la fonction de répartition décumulative serait celle
des W` , donnée par (3).
L'évaluation des quantiles de W pouvant s'avérer dicile, on peut aussi se ramener à la simulation décrite en b) en reconstituant le couple (h, k) à partir de n, grâce à la loi conditionnelle de
H sachant que H + K = n, qui est donnée par :
λh −λ
µn−h −µ
e ×
e
P [H = h, K = n − h]
h!
(n − h!
n
h
H+K=n
=
=
(αm ) (1 − αm )n−h .
P
[H = h] =
h
(λ + µ)n −(λ+µ)
P [H + K = n]
e
n!
On voit donc que la loi conditionnelle de H sachant que H + K = n est la loi binomiale B(n, αm )
qu'il sut de simuler à partir de la valeur simulée n pour obtenir une simulation h du nombre
de sinistres matériels, puis de poser k = n − h pour obtenir le nombre simulé de sinistres de la
seconde catégorie. Il ne reste plus alors qu'à appliquer la méthode de b) pour simuler S .
3
Partie 2 : estimation de la fréquence relative de chaque catégorie
1. Estimation à l'aide de H et K .
a) On a vu plus haut que la loi conditionnelle de H sachant que H + K = n est la loi
binomiale B(n, αm ). Il en résulte que, pour tout n ≥ 1 :
E H+K=n (
H
1
n αm
) = E H+K=n (H) =
= αm .
H +K
n
n
b) Du résultat précédent, on déduit : E H+K>0 (
H
) = αm .
H +K
H
En toute rigueur, on ne peut pas dire que
soit un estimateur sans biais de αm , puisqu'il
H +K
n'est pas déni lorsque H + K = 0.
Cependant, en convenant d'une valeur arbitraire α̂m0 pour l'estimation de αm dans ce cas, on
obtient un estimateur α̂m dont l'espérance est
0
0
E(α̂m ) = P [H + K = 0] α̂m
+ P [H + K > 0] αm = αm + (α̂m
− αm )P [H + K = 0] .
Cette valeur moyenne se réduit à αm si on considère la probabilité P [H + K = 0] comme
négligeable, ce qui paraît légitime ici : il s'agit en eet de la probabilité, théorique, pour qu'aucun
sinistre ne survienne pendant une période de un ou plusieurs exercices (le rêve inaccessible de
tout assureur !).
S
des
c) Pour estimer le coût moyen E(W ) des sinistres, on peut utiliser la moyenne
H +K
coûts observés.
Comme le quotient précédent, cette moyenne ne serait pas dénie en l'absence de sinistre, mais
en convenant d'une estimation arbitraire pour ce cas fort improbable, on obtient un estimateur
qu'on peut assimiler à un estimateur sans biais.
2. Estimation à l'aide de sinistres indiérenciés.
Pour tout x > 0, on note N (x) le nombre d'indices ` tels que W` soit au moins égal à x.
a) La loi conditionnelle de N (x) sachant que N = n est la loi binomiale B(n, P [W ≥ x]).
De l'égalité P [W ≥ x]) = αm SM (x) + αc Sc (x), on déduit donc que :
E N =n (
N (x)
1
) = E N =n (N (x)) = αm SM (x) + αc Sc (x) ·
N
n
N (x)
b) Prolongé par une estimation arbitraire prévue pour le cas où N = 0,
N
un estimateur, sans biais ou presque, de
fournit donc
SW (x) = αm SM (x) + αc Sc (x) = Sc (x) + αm (SM (x) − Sc (x)) ,
en tenant compte de l'égalité αm + αc = 1.
En considérant que les sinistres corporels sont plus coûteux que les sinistres matériels, on pourra
admettre que, même pour de faibles valeurs de x, SC (x) est strictement supérieur à SM (x), et
écrire αm comme quotient de deux nombres positifs, sous la forme :
αm =
SC (x) − SW (x)
.
SC (x) − SM (x)
4
On peut donc, avec les mêmes précautions que dans la question précédente, assimiler
N (x)
N
=
SC (x) − SM (x)
SC (x) −
α̂m,x
à un estimateur sans biais de αm , par linéarité de l'espérance.
c) L'estimateur α̂m,x est d'autant plus précis que sa variance est plus faible. On choisira
donc x de telle manière que l'écart SC (x) − SM (x) soit aussi grand que possible.
d) Le théorème de la limite centrée pouvant être étendu au cas d'échantillons de taille
N (x)
aléatoire, la variable aléatoire
suit approximativement une loi normale lorsque la variable
N
aléatoire N ne prend que de grandes valeurs.
On pourrait donc obtenir un intervalle de conance de niveau "asymptotique" donné pour le
paramètre αm à l'aide d'une estimation v̂m,x de la variance de son estimateur, qui suit lui-même
approximativement une loi normale.
h
i
Cet intervalle serait de la forme α̂m,x − c v̂m,x , α̂m,x + c v̂m,x , pour un réel c choisi de telle
manière que P [−c ≤ N (0, 1) ≤ +c] soit égale au niveau de conance recherché.
Partie 3 : primes et chargements de sécurité
Z
+∞
1. La formule E(X) =
P [X ≥ x] dx peut être démontrée par une intégration par parties,
0
facile à justier dans la cas où X possède une densité continue par morceaux mais également
applicable dans le cas général dès lors que X admet une espérance :
Z
E(X) =
+∞
h
i∞ Z
x dFX (x) = − x SX (x)
+
0
0
+∞
Z
+∞
P [X ≥ x] dx =
0
P [X ≥ x] dx ·
0
• Si X suit la loi exponentielle E(λ) (> 0), on a, pour tout x ≥ 0 :
Z
+∞
λ e−λt dt = e−λx
SX (x) =
x
d'où
+∞
Z
+∞
Z
e−λx dx =
SX (x) dx =
0
0
1
= E(X) .
λ
• Si X suit la loi géométrique G(p) (0 < p < 1), on a, pour tout x ≥ 0 :
+∞
X
SX (x) = P [X > x] = P (X ≥ bxc + 1) =
p (1 − p)k−1 = (1 − p)bxc
k=bxc+1
d'où
Z
+∞
SX (x) dx =
0
+∞ Z
X
k=0
k
k+1
SX (x) dx =
+∞ Z
X
k=0
5
k
k+1
(1 − p)k dx =
+∞
X
(1 − p)k =
k=0
1
= E(X) .
p
2.
a) Premier exemple
gα est la fonction ane par morceaux donnée



0u
gα (u) =
α


1
par :
si u = 0
si 0 < u < α
·
si α ≤ u ≤ 1
Elle est visiblement continue et croissante, et elle est concave parce que c'est la borne inférieure
de deux fonctions anes, donc concaves. La concavité de gα est également visible sur son graphe
puisque ses cordes sont situées au dessous de lui, quelles que soient leurs extrémités.
b) Deuxième exemple
Soit α ∈ ] 0, 0.5 ] et wα la fonction dénie sur [0, 1] par :



0 si u = 0
−1
−1
wα (u) = Φ Φ (u) − Φ (α)
si 0 < u < 1


1
si u = 1
où Φ désigne la fonction de répartition de la loi normale centrée réduite.
i) Comme Φ−1 (0, 5) = 0, on a :


0 si u = 0
w0,5 (u) = u si 0 < u < 1


1 si u = 1
ii) Calculer à l'aide d'Excel quelques valeurs de w 0.2 et donner l'allure de son graphe.
iii) La continuité de Φ−1 sur ]0, 1[ et celle de Φ sur R permettent d'armer par composition la continuité de wα sur ]0, 1[.
La continuité (à droite) en 0 et la continuité (à gauche) en 1 sont aisées à vérier par passage à
la limite :
• quand x tend vers 0+, Φ−1 (x) − Φ−1 (α) tend vers −∞, donc wα (x) vers 0 = wα (0)
• quand x tend vers 1−, Φ−1 (x) − Φ−1 (α) tend vers +∞, donc wα (x) vers 1 = wα (1) .
Sur l'intervalle ouvert ]0, 1[, la fonction Φ−1 est de classe C 1 , en tant que bijection récoproque
d'une fonction de classe C 1 dont la dérivée ne s'annule pas.
Par la formule de dérivation d'une fonction composée, on obtient sa dérivée en tout point x de
l'intervalle ouvert ]0, 1[ :
wα0 (x) = Φ 0 Φ−1 (x) − Φ−1 (α) Φ−1 0 (x) = φ Φ−1 (x) − Φ−1 (α)
1
φ Φ−1 (x)
d'où
w 0α (x)
= exp
2 1
2
1
− Φ−1 (x) − Φ−1 (α) + Φ−1 (x)
2
2
= exp Φ
−1
−1
(α)Φ
Φ−1 (α)
(x) −
2
2 .
Sur l'intervalle ]0, 1[, la fonction w 0α est strictement positive et décroissante, parce que les fonctions exp et Φ−1 sont croissantes et Φ−1 (α) < 0 (car α < 1/2).
Il en résulte que wα est strictement croissante et concave sur ]0, 1[, ce qui permet d'armer que
wα est une fonction de distorsion.
6
3. La prime pure d'un contrat qui couvrirait pour une durée égale à la période d'étude, sans
franchise ni plafond de garantie, l'ensemble des dommages, est l'espérance du montant cumulé
de tous les sinistres, rapportée à un seul contrat :
λE(M ) + µE(C)
E(S)
=
nombre de contrats
nombre de contrats
E(R) =
où R est le montant cumulé des sinistres (éventuels) liés à un contrat sur la durée considérée.
4.
a) Comme toute fonction de distorsion g est concave, son graphe est situé au dessus de la
corde joignant ses points d'abscisses 0 et 1, ce qui s'écrit : g(x) ≥ x, pour tout x ∈ [0, 1].
Il en résulte, par intégration que :
Z
+∞
g SR (x) dx ≥
Eg (R) =
Z
+∞
SR (x) dx = E(R) .
0
0
La prime pure corrigée par g d'un contrat est donc au moins égale à sa prime pure. Les deux
primes sont égales pour la fonction de distorsion w0.5 = g1 , qui ne présente donc pas d'intérêt.
Les espérances E(X) et Eg (X) sont aussi égales lorsque la variable aléatoire ne prend qu'une
seule valeur (presque certainement), ce qui ne peut pas produire dans le cadre du modèle étudié.
b) Soit v le nombre (il s'agit de la "value at risk" V aR(α, R) associée au risque R ; cf examen
2009), tel que : SR (vα ) = α.
La prime pure corrigée par gα , pour un contrat de risque R est égale à :
v
Z
Egα (R) =
+∞
Z
dx +
0
v
SR (x)
dx = v + E R>v (R) .
α
L'écart entre la prime corrigée et la prime pure est égal à l' "expected shortfall" (notée ES(α, R),
dans l'énoncé de 2009), ce qui illustre les liens étroits entre mesures du risque et espérances
corrigées.
c) Pour estimer la prime pure corrigée par wα , on peut appliquer le principe général de
substitution des quantités empiriques aux quantités théoriques pour estimer un paramètre, en
remplaçant dans l'expression de Eg (R) la fonction de répartition décumulative théorique SR par
la fonction empirique correspondante. On obtient ainsi l'estimation :
+∞
Z
Êg (R) =
g
0
7
N (x) dx .
N