connue

Transcription

connue
Master Mathématiques et Applications
Spécialité Statistique
Septembre 2016
Fiche 6
Intervalles de confiance
1
Estimation de la moyenne, variance connue, cas gaussien
On dispose d’un n-échantillon X1 , . . . , Xn i.i.d. tel que Xi suit une loi normale N (µ, σ 2 ). L’objectif
est d’estimer µ. Supposons dans un premier temps la variance σ 2 connue. Un estimateur ponctuel
de la moyenne µ est donné par la moyenne empirique :
n
1X
X̄n =
Xi .
n
i=1
Soit α ∈ (0, 1) fixé. On veut construire un intervalle de confiance de niveau 1 − α pour µ.
1. Rappeler la loi de X̄n .
2. En déduire un intervalle aléatoire [A, B] tel que :
P(µ ∈ [A, B]) = 1 − α.
La longueur de cet intervalle est-elle aléatoire ? Que vaut-elle ?
3. Simuler un échantillon de taille 100 d’une loi N (5, 1). Calculer un intervalle de confiance de
niveau 95% pour µ à partir de cet échantillon. La vraie moyenne, c’est-à-dire 5, appartientelle à cet intervalle de confiance ?
4. Toujours pour σ = 1 et n = 100, créer une fonction qui admet en entrée un échantillon ainsi
qu’un niveau α et fournit en sortie un intervalle de confiance pour la moyenne µ de niveau
1 − α.
5. Refaire la question précédente 1000 fois. Combien de fois 5 est-il dans l’intervalle de confiance ?
2
Estimation de la moyenne, variance inconnue, cas gaussien
On dispose toujours d’un n-échantillon X1 , . . . , Xn i.i.d. tel que Xi suit une loi normale N (µ, σ 2 ),
mais on suppose désormais que la variance σ 2 n’est pas connue non plus, le but étant toujours
d’estimer µ.
1. Donner un estimateur non biaisé σ̂ 2 de σ 2 .
2. Quelle est la loi de la variable aléatoire (n − 1)σ̂ 2 /σ 2 ?
3. Donner la loi de la variable aléatoire
T =
√
1
n
X̄n − µ
.
σ̂
4. En déduire un intervalle aléatoire [A, B] tel que :
P(µ ∈ [A, B]) = 1 − α.
5. Simuler un échantillon de taille 100 d’une loi N (5, 2). Calculer un intervalle de confiance de
niveau 95% pour µ à partir de la question précédente.
6. Reprendre la question précédente en utilisant la fonction t.test.
7. Vérifier que les intervalles des deux questions précédentes sont les mêmes.
3
Estimation de la moyenne, variance inconnue, cas général
En pratique, la variance est inconnue et les données ne sont pas forcément gaussiennes. Cependant,
lorsque n est grand (typiquement supérieur à 30), nous allons voir que la méthode de la Section 2
s’applique encore, au moins “approximativement”. On dispose d’un n-échantillon X1 , . . . , Xn i.i.d.,
avec E[Xi ] = µ inconnue et Var(Xi ) = σ 2 également inconnue. On ne suppose pas les variables Xi
gaussiennes.
1. Rappeler l’énoncé du Théorème Central Limite.
2. Donner un estimateur non biaisé σ̂ 2 de σ 2 .
3. Grâce au Lemme de Slutsky, en déduire un intervalle de confiance asymptotique de niveau
1 − α pour µ.
4. Simuler un échantillon de taille 100 d’une loi exponentielle de moyenne µ = 2. Calculer un
intervalle de confiance asymptotique de niveau 95% pour µ à partir de cet échantillon et en
appliquant le résultat de la question 3.
5. Reprendre la question précédente en utilisant la fonction t.test. Pourquoi les résultats sont-ils
comparables ?
4
Application sur données réelles
Le fichier poulpeF.csv contient le poids de 240 poulpes femelles. On souhaite connaı̂tre un intervalle
de confiance de niveau 95% du poids moyen d’un poulpe femelle.
1. Importer le fichier de données. Afficher un résumé.
2. Représenter les données sous forme d’histogramme. Grâce à la fonction density, superposer
à cet histogramme un estimateur à noyau de la densité. Les données vous semblent-elles
gaussiennes ?
3. Calculer un intervalle de confiance de niveau 95% du poids moyen en appliquant la méthode
de la Section 3, question 3.
4. Retrouver le résultat à l’aide de la fonction t.test.
5. On souhaite maintenant obtenir un intervalle de confiance de niveau 90%. Avant tout calcul,
pouvez-vous dire si cet intervalle de confiance sera plus grand ou plus petit que celui de niveau
95% ? Calculer cet intervalle de confiance.
2