Exercice corrigé - R2math
Transcription
Exercice corrigé - R2math
EXERCICE CORRIGE Une laiterie produit des camemberts commercialisés sous la marque « Le moine gourmand ». La masse X, exprimée en g, d’un camembert tiré au hasard dans la production, est distribuée selon une loi normale. On tire un échantillon simple de 17 camemberts que l’on pèse et dont le tableau suivant fournit les masses : 250 252 254 251 1- a) En utilisant une calculatrice donner la moyenne et la variance de cet échantillon. b) Donner une estimation ponctuelle de la variance σ² de la production. Déterminer une estimation par intervalle de confiance à 95% de la masse moyenne μ de la production. Le responsable de fabrication des camemberts « Le moine gourmand » souhaite savoir quelle taille minimale donner à un échantillon aléatoire simple pour obtenir un intervalle de confiance pour μ, au niveau 95 %, d’amplitude inférieure à 1. a) On indique au responsable que l’on ne peut pas répondre à sa question sans un renseignement supplémentaire sur la variance de la production. Pourquoi la connaissance de cette variance est-elle nécessaire pour répondre à cette question ? b) Le responsable précise alors que σ ² = 6,25. Calculer la taille minimale que doit avoir un échantillon pour que l’intervalle de confiance à 95 % pour μ ait une amplitude inférieure à 1. Le responsable de fabrication estime que plus de 15 % des camemberts de la production ont une masse supérieure à 257 g. On tire un échantillon aléatoire simple de 200 camemberts. On constate que 40 d’entre eux pèsent plus de 257 g. Au vu de cet échantillon, peut-on conclure, au seuil de signification 5 %, que le responsable de fabrication a raison ? _________________________ 23- 4- 254 255 253 256 250 257 251 253 255 250 255 252 261 Eléments de correction : 1. a) x = 253,5 g b) σ̂ ² = n s² n −1 s² = 8,01 σ̂ 2 = 8,51 2. La population est normale, sa variance est inconnue, on utilise une loi de Student. La variable aléatoire T, définie par T = ( X −μ) où X est la moyenne de l’échantillon S n −1 aléatoire de taille n de la variable aléatoire X, est distribuée selon la loi de Student à n-1 ddl n = 17, T = X −μ , T est distribuée selon la loi de Student à 16 ddl. S 4 Si t = t0,975 ; 16 alors P(-t < T < t) = 0,95. On lit dans la table : t0,975 ; 16 = 2,12. On obtient l’intervalle de confiance aléatoire au niveau 95% : ENFA - Bulletin du GRES n°9 – février 2000 Contact : Conf [email protected] page 5 S S⎤ ⎡ X − 2 , 12 × ; X + 2 , 12 × ⎢⎣ 4 4 ⎥⎦ x = 253,5 g et s = 2,8 g sont les valeurs observées de X et S sur l’échantillon prélevé d’où une estimation de μ par intervalle de confiance au niveau 95 % 2 ,8 2 ,8 ⎤ ⎡ 253 , 5 − 2 , 12 × ; 253 , 5 + 2 , 12 × ⎢⎣ 4 4 ⎥⎦ [252,0 ; 255,0] est un intervalle de confiance de μ au niveau 95 % 3. a) Si X est de loi normale la variable T, définie par T = X −μ où X est la S n −1 moyenne de l’échantillon aléatoire de taille n de la variable aléatoire X, est distribuée selon la loi de Student à n-1 ddl. Ce qui fait l’intérêt de la variable de Student T, c’est qu’elle ne dépend pas de l’écart type σ de la variable mère X. On utilise ce résultat chaque fois σ est inconnu. Si X est distribuée selon une loi normale, de moyenne μ et d’écart type σ inconnus, l’intervalle de confiance aléatoire de la moyenne μ au niveau 95% est : S S ⎤ ⎡ X t ; X t − + 0 , 975 ; n − 1 0 , 975 ; n − 1 ⎢ n −1 n − 1 ⎥⎦ ⎣ S Cet intervalle a pour amplitude 2 × t 0 ,975;n −1 . n −1 Le problème posé par le responsable de fabrication correspond à la résolution de l’inéquation S ≤ 1. n −1 n − 1 et t 0 ,975;n −1 dépendent de n. En l’absence de données supplémentaires on ne peut 2 × t 0 ,975;n−1 Or S, pas résoudre cette inéquation. b) X est de loi normale et on connaît maintenant sa variance σ ². Sous ces conditions X est distribuée selon la loi N(μ, σ X −μ ), et U, définie par U = , selon la loi normale σ n n N(0 ; 1). L’intervalle de confiance aléatoire de la moyenne μ au niveau 95% ⎡ est : ⎢ X − u 0 ,975 ⎣ σ σ ⎤ . ; X + u 0 ,975 n n ⎥⎦ Cet intervalle a pour amplitude 2 × u 0 ,975 σ . Pour obtenir un intervalle d’amplitude n inférieure ou égale à 1, il suffit de choisir n tel que 2 × u 0 ,975 σ ≤ 1 soit n n ≥ ( 2 × u 0 ,975 )2 × σ 2 Application numérique : n ≥ ( 2 × 1,96 )2 × 6 ,25 ENFA - Bulletin du GRES n°9 – février 2000 Contact : Conf [email protected] page 6 n ≥ 96,04 Un échantillon doit comporter au minimum 97 camemberts pour que l’intervalle de confiance à 95% correspondant ait une amplitude inférieure à 1 . 4. Hypothèses : ⎧ H 0 : p = p0 ⎨ ⎩H 1 : p > p 0 avec p0 = 0 ,15 ⎧H 0 : p = 0 ,15 soit ⎨ hypothèse alternative fournie par l' énoncé ⎩ H1 : p > 0 ,15 Seuil de signification : α = 5% Conditions d’application : grand échantillon n = 200 np0 ≥ 5 et n(1-p0) ≥ 5 Variable de décision : On utilise pour ce test la statistique F qui prend pour valeur la proportion des camemberts de l’échantillon pesant plus de 257 g. Sous l’hypothèse Ho, nF est distribuée selon la loi binomiale B( n; p 0 ) . p0 ( 1− p0 ) n Les conditions d’application rendent légitime l’approximation de B( n; p 0 ) par la loi E(nF) = np0 ; V(nF) = np0(1-p0) d’où E(F) = p0 ; V(nF) = normale N(np0, np0 ( 1− p0 ) ). Sous l’hypothèse Ho, F est approximativement distribuée selon la loi normale ⎛ p0 (1 − p 0 ) ⎞ ⎟ N ⎜⎜ p 0 , ⎟ n ⎝ ⎠ On prend soit ici U = pour variable de décision U, définie par U= F − p0 p0 ( 1− p0 ) n F − 0 ,15 0 ,15 × 0 ,85 200 Sous l’hypothèse Ho, U est approximativement distribuée selon la loi normale N(0 ; 1). Règle de décision : La valeur critique uc de la variable U dépend de l’hypothèse alternative H1. Le test est unilatéral à droite, uc est définie par P(U ≤ uc) 0,95 = 0,95 0,05 0 uc = u0,95 On lit dans la table de la fonction de répartition de la loi normale centrée réduite uc = u0,95 = 1,64. Règle de décision :soit uobs la valeur de la variable U observée sur l’échantillon, si uobs > uc on rejette l’hypothèse nulle, si uobs < uc on ne rejette pas l’hypothèse nulle nonderejet de Hobservée H0= 40 0 : rejet defobs Calcul la valeur 200 ENFA - Bulletin du GRES n°9 – février 2000 Contact : Conf [email protected] soit fobs = 0,2 page 7 u obs = f obs − 0 ,15 0,20 − 0 ,15 d’où u obs = soit uobs = 1,98 0,15 × 0 ,85 0 ,15 × 0 ,85 200 200 Décision et conclusion : Au seuil de signification 5% et au vu de l’échantillon on rejette l’hypothèse nulle H0. Plus de 15% des camemberts de la production ont une masse supérieure à 257g. Le responsable de production n’a pas tort. ≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈ ENFA - Bulletin du GRES n°9 – février 2000 Contact : Conf [email protected] page 8