connue
Transcription
connue
Master Mathématiques et Applications Spécialité Statistique Septembre 2016 Fiche 6 Intervalles de confiance 1 Estimation de la moyenne, variance connue, cas gaussien On dispose d’un n-échantillon X1 , . . . , Xn i.i.d. tel que Xi suit une loi normale N (µ, σ 2 ). L’objectif est d’estimer µ. Supposons dans un premier temps la variance σ 2 connue. Un estimateur ponctuel de la moyenne µ est donné par la moyenne empirique : n 1X X̄n = Xi . n i=1 Soit α ∈ (0, 1) fixé. On veut construire un intervalle de confiance de niveau 1 − α pour µ. 1. Rappeler la loi de X̄n . 2. En déduire un intervalle aléatoire [A, B] tel que : P(µ ∈ [A, B]) = 1 − α. La longueur de cet intervalle est-elle aléatoire ? Que vaut-elle ? 3. Simuler un échantillon de taille 100 d’une loi N (5, 1). Calculer un intervalle de confiance de niveau 95% pour µ à partir de cet échantillon. La vraie moyenne, c’est-à-dire 5, appartientelle à cet intervalle de confiance ? 4. Toujours pour σ = 1 et n = 100, créer une fonction qui admet en entrée un échantillon ainsi qu’un niveau α et fournit en sortie un intervalle de confiance pour la moyenne µ de niveau 1 − α. 5. Refaire la question précédente 1000 fois. Combien de fois 5 est-il dans l’intervalle de confiance ? 2 Estimation de la moyenne, variance inconnue, cas gaussien On dispose toujours d’un n-échantillon X1 , . . . , Xn i.i.d. tel que Xi suit une loi normale N (µ, σ 2 ), mais on suppose désormais que la variance σ 2 n’est pas connue non plus, le but étant toujours d’estimer µ. 1. Donner un estimateur non biaisé σ̂ 2 de σ 2 . 2. Quelle est la loi de la variable aléatoire (n − 1)σ̂ 2 /σ 2 ? 3. Donner la loi de la variable aléatoire T = √ 1 n X̄n − µ . σ̂ 4. En déduire un intervalle aléatoire [A, B] tel que : P(µ ∈ [A, B]) = 1 − α. 5. Simuler un échantillon de taille 100 d’une loi N (5, 2). Calculer un intervalle de confiance de niveau 95% pour µ à partir de la question précédente. 6. Reprendre la question précédente en utilisant la fonction t.test. 7. Vérifier que les intervalles des deux questions précédentes sont les mêmes. 3 Estimation de la moyenne, variance inconnue, cas général En pratique, la variance est inconnue et les données ne sont pas forcément gaussiennes. Cependant, lorsque n est grand (typiquement supérieur à 30), nous allons voir que la méthode de la Section 2 s’applique encore, au moins “approximativement”. On dispose d’un n-échantillon X1 , . . . , Xn i.i.d., avec E[Xi ] = µ inconnue et Var(Xi ) = σ 2 également inconnue. On ne suppose pas les variables Xi gaussiennes. 1. Rappeler l’énoncé du Théorème Central Limite. 2. Donner un estimateur non biaisé σ̂ 2 de σ 2 . 3. Grâce au Lemme de Slutsky, en déduire un intervalle de confiance asymptotique de niveau 1 − α pour µ. 4. Simuler un échantillon de taille 100 d’une loi exponentielle de moyenne µ = 2. Calculer un intervalle de confiance asymptotique de niveau 95% pour µ à partir de cet échantillon et en appliquant le résultat de la question 3. 5. Reprendre la question précédente en utilisant la fonction t.test. Pourquoi les résultats sont-ils comparables ? 4 Application sur données réelles Le fichier poulpeF.csv contient le poids de 240 poulpes femelles. On souhaite connaı̂tre un intervalle de confiance de niveau 95% du poids moyen d’un poulpe femelle. 1. Importer le fichier de données. Afficher un résumé. 2. Représenter les données sous forme d’histogramme. Grâce à la fonction density, superposer à cet histogramme un estimateur à noyau de la densité. Les données vous semblent-elles gaussiennes ? 3. Calculer un intervalle de confiance de niveau 95% du poids moyen en appliquant la méthode de la Section 3, question 3. 4. Retrouver le résultat à l’aide de la fonction t.test. 5. On souhaite maintenant obtenir un intervalle de confiance de niveau 90%. Avant tout calcul, pouvez-vous dire si cet intervalle de confiance sera plus grand ou plus petit que celui de niveau 95% ? Calculer cet intervalle de confiance. 2