Feuille 5

Transcription

Feuille 5
Maîtrise 2003/2004.
Statistique. Feuille 5.
Exercice 1. Soit (X1 , . . . , Xn ) un échantillon d’une certaine loi. Calculer l’information de
Fisher dans les cas suivants :
1) X1 suit une loi de Bernoulli de paramètre p ∈ (0, 1).
2) X1 suit une loi exponentielle de paramètre λ > 0.
3) X1 suit une de Poisson de paramètre λ > 0.
Exercice 2.
1) On admet que la durée de vie, exprimée dans une unité de temps convenablement choisie,
d’un certain type de matériel est représenté par une variable aléatoire X suivant une loi de
Weibull de paramètre θ, a et c positifs. Cette loi, notée W (θ, a, c) a pour fonction de répartition
(x − a)c
F (x) = 1 − exp −
1I(x ≥ a).
θ
a?
1.1) Calculer la densité f de X.
1.2) Montrer que la variable Y = 2θ (X − a)c suit la loi du χ22 . Que représente le paramètre
1.3) Pour x ≥ a, on appelle taux de panne instantané à l’instant x, la quantité
F (x + ∆x) − F (x)
f (x)
=
.
∆x→0
∆x(1 − F (x))
1 − F (x)
τ (x) = lim
Quelle interprétation peut-on donner? Déduire la valeur de τ (x) pour une loi de Weibull. En
fonction des valeurs de c, donner les trois classes typiques d’appareils.
2) Dans la suite on supposera connus les paramètres a et c de la loi W (θ, a, c), le paramètre θ
étant inconnu. De plus, on diposera d’un échantillon (X1 , . . . , Xn ) des durées de vie observées
sur n matériels du type considéré, Xi étant des réalisations i.i.d. de la variable X.
2.1) Construire l’estimateur du maximum de vraisemblance θ̂n de θ.
2.2) Cet estimateur est-il consistant ?
3) Construire un intervalle de confiance pour θ de niveau 90%, puis l’intervalle de confiance
asymptotique de niveau 90%.
Application numérique : n = 50, θ̂n = 2.3.
1
Exercice 3. (Problème de sondage)
Soit N le nombre total d’habitants d’un pays. On entreprend un sondage de popularité de deux
candidats (candidat A et candidat B) pour les élections. On choisit un échantillon de n habitants
et on pose à chacun d’eux la question : “ Pour qui voterez-vous aux élections ?”. A l’issue de
ce sondage, on obtient les données X1 , . . . , Xn , où pour i = 1, . . . , n,
1, si le i-ème habitant préfère le candidat A,
Xi =
0, si le i-ème habitant préfère le candidat B.
Pour des raisons évidentes, il est impossible de questionner tous les habitants. Donc n < N (en
pratique n << N ). Le but du sondage est d’estimer la part µ d’habitants du pays qui préfèrent
le candidat A.
Il est pratique d’introduire les valeurs non aléatoires x1 , . . . , xN , où pour j = 1, . . . , N,
1, si le j − me habitant prfre le candidat A,
xj =
0, si le j − me habitant prfre le candidat B.
Avec cette notation µ =
1
N
PN
j=1
xj .
1) Discuter du modèle. Donner la loi de Xi pour tout i. Donner la loi de nX̄n . Montrer que
E(X̄n ) = µ.
2) Montrer que Cov(Xi , Xj ) = −σ 2 /(N − 1), i 6= j, où
N
1 X
σ =
(xj − µ)2 ,
N j=1
2
est la variance de la population, puis que
σ2
Var(X̄n ) =
n
3) Calculer E(s2 ), où s2 =
1
n
Pn
i=1
n−1
1−
.
N −1
(Xi − X̄n )2 .
4) On considère ici l’asymptotique quand N → ∞ et n = n(N ) → ∞, n/N → 0.
4.1) Montrer que X̄n est un estimateur consistant de µ et s2 est un estimateur consistant de
2
σ .
4.2) Prouver la normalité asymptotique
√
n(X̄n − µ) L
→ N (0, 1),
s
puis donner l’intervalle de confiance asymptotique de niveau 1 − α pour µ (0 < α < 1).
Application numérique : Donner les
Pnintervalles de confiance asymptotiques au niveau 95%
pour µ, avec N = 30M, n1 /n =
i=1 1I(Xi = 1)/n = 0.52 et n prenant les valeurs n =
100, 1000, 10000.
2