I. Mod`ele statistique, identifiabilité, domination I.1. Exercice*. (1

Transcription

I. Mod`ele statistique, identifiabilité, domination I.1. Exercice*. (1
I. Modèle statistique, identifiabilité, domination
I.1. Exercice*.
(1) Etudier, dans chacun des cas, l’identifiabilité et la domination du modèle statistique
E engendré par l’observation de la variable aléatoire X – pour le paramètre inconnu
θ –, lorsque
(a) la variable aléatoire X suit la loi uniforme sur [0, θ] avec θ > 0.
(b) la variable aléatoire X suit la loi uniforme sur {0, 1, . . . , θ}, et θ est un entier
non nul.
(c) la variable aléatoire X suit la loi N (µ, σ 2 ), et θ = (µ, σ 2 ) ∈ R×]0, +∞[.
(2) Soit l’expérience produit E ⊗n obtenue en considérant l’observation de n variables
indépendantes de même loi que X. Etudier alors dans chacun des cas précédents
l’identifiabilité et la domination du modèle.
I.2. Exercice*. Soit ε1 , . . . , ε4 quatre variables aléatoires indépendantes de loi N (0, 1). On
suppose que l’on observe
σ
Y1 = µ1 + σε1 , Y2 = µ2 + √ ε2 ,
3
σ
Y3 = µ2 + σε3 , Y4 = µ3 + √ ε4 ,
2
où σ > 0 est connu et µ = (µ1 , µ2 , µ3 , µ4 ) ∈ R4 est inconnu.
(1) Est-ce un modèle linéaire au sens du cours ? Quelle transformation peut-on appliquer
aux observations pour se ramener à un modèle linéaire ?
(2) Déterminer la loi de l’estimateur µ̂2 := 12 (Y2 + Y3 ) et étudier son risque quadratique
c’est-à-dire
Eµ (µ̂2 − µ2 )2
(3) Comparer µ̂2 à la famille d’estimateurs
µ̂(α)
:= αY2 + (1 − α)Y3 , 0 ≤ α ≤ 1.
2
(en comparant les risques quadratiques)
I.3. Exercice. Soit Y1 , Y2 et ξ trois variables aléatoires définies sur le même espace telles
que :
− ξ est indépendante de Y1 ,
ξ est indépendante de Y2 ,
− P (ξ = 1) = P (ξ = 0) = 1/2,
− Y1 ∼ N (µ1 , 1), Y2 ∼ N (µ2 , 1)
où le couple (µ1 , µ2 ) ∈ R2 est inconnu. On observe
X = ξY1 + (1 − ξ)Y2 .
(1)
(2)
(3)
(4)
Expliciter le modèle statistique associé.
Le modèle est-il identifiable ?
Calculer l’espérance et la variance de X.
On fait l’hypothèse que µ1 ≤ µ2 . Montrer que le nouveau modèle est identifiable.
1
Université Paris-Diderot - M1- Statistique fondamentale
2
I.4. Exercice. Soit Y1 , Y2 et ξ trois variables aléatoires définies sur le même espace telles
que :
− ξ est indépendante de Y1 ,
− P (ξ = 1) = 1/2,
ξ est indépendante de Y2 ,
P (ξ = 0) = 1/2,
− Y1 ∼ N (0, v1 ), Y2 ∼ N (0, v2 )
où le couple (v1 , v2 ) ∈ R∗+ × R∗+ est inconnu. On observe
X = ξY1 + (1 − ξ)Y2 .
(1) Expliciter le modèle statistique associé.
(2) Le modèle est-il identifiable ?
(3) Calculer
2
1
E(X 4 ) − E(X 2 ) .
3
On rappelle que E(ξ4 ) = 3 si ξ est une variable aléatoire de loi N (0, 1).
(4) On fait l’hypothèse que v1 ≤ v2 . Montrer que le nouveau modèle est identifiable.
I.5. Exercice*. Soient X1 , . . . , Xn , i.i.d. de loi
µθ (dx) = exp(θ − x)1[θ,+∞[ (x)dx, θ > 0.
(1) Ecrire le modèle statistique associé. Est-il identifiable, dominé ?
(2) Calculer Eθ {X1 } et en déduire un estimateur de θ que l’on notera θ̂n .
(3) Etudier le risque quadratique Enθ {(θ̂n −θ)2 } de l’estimateur θ̂n . En déduire un intervalle
de confiance non-asymptotique pour θ au niveau de risque 0 < α < 1.
(4) Montrer que l’estimateur θn? := min1≤i≤n Xi est meilleur que θ̂n , par exemple en comparant leurs risques quadratiques.
I.6. Exercice. Montrer que le modèle engendré par l’observation de θX, où X suit une loi
de Poisson de paramètre 1 et θ ∈ R n’est pas dominé. Généraliser.
I.7. Exercice. On dispose d’un ensemble de n individus et on suppose que chaque individu i
a une ”propension à contracter la grippe”, Yi , déterminée par
Yi = α + β.agei + ei
où agei est l’âge de l’individu i en années, et les v.a.r. e1 , ..., en sont i.i.d. de loi N (0, σ 2 ),
avec (α, β) ∈ R2 et σ > 0 paramètres inconnus. L’individu i contracte la grippe si et
seulement si Yi > 0.
(1) On suppose que l’on peut observer Y = (Y1 , ..., Yn ). Ecrire le modèle sous la forme
d’un modèle linéaire gaussien.
(2) Bien entendu, dans la réalité, on ne peut pas observer les variable Yi . On observe
uniquement la variable Zi = 1
. Ecrire le modèle statistique associé. Le
{Yi > 0}
paramètre (α, β, σ) est-il identifiable ?