Exercice corrigé - R2math

Transcription

Exercice corrigé - R2math
EXERCICE CORRIGE
Une laiterie produit des camemberts commercialisés sous la marque « Le moine gourmand ».
La masse X, exprimée en g, d’un camembert tiré au hasard dans la production, est distribuée
selon une loi normale.
On tire un échantillon simple de 17 camemberts que l’on pèse et dont le tableau suivant fournit
les masses :
250
252
254
251
1-
a) En utilisant une calculatrice donner la moyenne et la variance de cet échantillon.
b) Donner une estimation ponctuelle de la variance σ² de la production.
Déterminer une estimation par intervalle de confiance à 95% de la masse moyenne μ de
la production.
Le responsable de fabrication des camemberts « Le moine gourmand » souhaite savoir
quelle taille minimale donner à un échantillon aléatoire simple pour obtenir un intervalle
de confiance pour μ, au niveau 95 %, d’amplitude inférieure à 1.
a) On indique au responsable que l’on ne peut pas répondre à sa question sans un
renseignement supplémentaire sur la variance de la production.
Pourquoi la connaissance de cette variance est-elle nécessaire pour répondre à cette
question ?
b) Le responsable précise alors que σ ² = 6,25. Calculer la taille minimale que doit avoir
un échantillon pour que l’intervalle de confiance à 95 % pour μ ait une amplitude
inférieure à 1.
Le responsable de fabrication estime que plus de 15 % des camemberts de la production
ont une masse supérieure à 257 g. On tire un échantillon aléatoire simple de 200
camemberts. On constate que 40 d’entre eux pèsent plus de 257 g.
Au vu de cet échantillon, peut-on conclure, au seuil de signification 5 %, que le
responsable de fabrication a raison ?
_________________________
23-
4-
254
255
253
256
250
257
251
253
255
250
255
252
261
Eléments de correction :
1. a) x = 253,5 g
b) σ̂ ² =
n
s²
n −1
s² = 8,01
σ̂ 2 = 8,51
2. La population est normale, sa variance est inconnue, on utilise une loi de Student. La
variable aléatoire T, définie par T =
( X −μ)
où X est la moyenne de l’échantillon
S
n −1
aléatoire de taille n de la variable aléatoire X, est distribuée selon la loi de Student à n-1 ddl
n = 17, T =
X −μ
, T est distribuée selon la loi de Student à 16 ddl.
S
4
Si t = t0,975 ; 16 alors P(-t < T < t) = 0,95. On lit dans la table : t0,975 ; 16 = 2,12.
On obtient l’intervalle de confiance aléatoire au niveau 95% :
ENFA - Bulletin du GRES n°9 – février 2000
Contact : Conf [email protected]
page 5
S
S⎤
⎡
X
−
2
,
12
×
;
X
+
2
,
12
×
⎢⎣
4
4 ⎥⎦
x = 253,5 g et s = 2,8 g sont les valeurs observées de X et S sur l’échantillon prélevé d’où une
estimation de μ par intervalle de confiance au niveau 95 %
2 ,8
2 ,8 ⎤
⎡
253
,
5
−
2
,
12
×
;
253
,
5
+
2
,
12
×
⎢⎣
4
4 ⎥⎦
[252,0 ; 255,0] est un intervalle de confiance de μ au niveau 95 %
3. a) Si X est de loi normale la variable T, définie par T =
X −μ
où X est la
S
n −1
moyenne de l’échantillon aléatoire de taille n de la variable aléatoire X, est distribuée selon la
loi de Student à n-1 ddl.
Ce qui fait l’intérêt de la variable de Student T, c’est qu’elle ne dépend pas de l’écart type σ de
la variable mère X. On utilise ce résultat chaque fois σ est inconnu.
Si X est distribuée selon une loi normale, de moyenne μ et d’écart type σ inconnus, l’intervalle
de
confiance
aléatoire
de
la
moyenne
μ
au
niveau
95%
est :
S
S ⎤
⎡
X
t
;
X
t
−
+
0
,
975
;
n
−
1
0
,
975
;
n
−
1
⎢
n −1
n − 1 ⎥⎦
⎣
S
Cet intervalle a pour amplitude 2 × t 0 ,975;n −1
.
n −1
Le problème posé par le responsable de fabrication correspond à la résolution de l’inéquation
S
≤ 1.
n −1
n − 1 et t 0 ,975;n −1 dépendent de n. En l’absence de données supplémentaires on ne peut
2 × t 0 ,975;n−1
Or S,
pas résoudre cette inéquation.
b) X est de loi normale et on connaît maintenant sa variance σ ². Sous ces conditions X
est distribuée selon la loi N(μ,
σ
X −μ
), et U, définie par U =
, selon la loi normale
σ
n
n
N(0 ; 1). L’intervalle de confiance aléatoire de la moyenne μ au niveau 95%
⎡
est : ⎢ X − u 0 ,975
⎣
σ
σ ⎤
.
; X + u 0 ,975
n
n ⎥⎦
Cet intervalle a pour amplitude 2 × u 0 ,975
σ
. Pour obtenir un intervalle d’amplitude
n
inférieure ou égale à 1, il suffit de choisir n tel que
2 × u 0 ,975
σ
≤ 1 soit
n
n ≥ ( 2 × u 0 ,975 )2 × σ 2
Application numérique :
n ≥ ( 2 × 1,96 )2 × 6 ,25
ENFA - Bulletin du GRES n°9 – février 2000
Contact : Conf [email protected]
page 6
n ≥ 96,04
Un échantillon doit comporter au minimum 97 camemberts pour que l’intervalle de
confiance à 95% correspondant ait une amplitude inférieure à 1 .
4. Hypothèses :
⎧ H 0 : p = p0
⎨
⎩H 1 : p > p 0
avec p0 = 0 ,15
⎧H 0 : p = 0 ,15
soit ⎨
hypothèse alternative fournie par l' énoncé
⎩ H1 : p > 0 ,15
Seuil de signification : α = 5%
Conditions d’application : grand échantillon
n = 200
np0 ≥ 5 et n(1-p0) ≥ 5
Variable de décision : On utilise pour ce test la statistique F qui prend pour valeur la proportion
des camemberts de l’échantillon pesant plus de 257 g.
Sous l’hypothèse Ho, nF est distribuée selon la loi binomiale B( n; p 0 ) .
p0 ( 1− p0 )
n
Les conditions d’application rendent légitime l’approximation de B( n; p 0 ) par la loi
E(nF) = np0 ; V(nF) = np0(1-p0) d’où E(F) = p0 ; V(nF) =
normale N(np0,
np0 ( 1− p0 ) ).
Sous l’hypothèse Ho, F est approximativement distribuée selon la loi normale
⎛
p0 (1 − p 0 ) ⎞
⎟
N ⎜⎜ p 0 ,
⎟
n
⎝
⎠
On
prend
soit ici U =
pour
variable
de
décision
U,
définie
par
U=
F − p0
p0 ( 1− p0 )
n
F − 0 ,15
0 ,15 × 0 ,85
200
Sous l’hypothèse Ho, U est approximativement distribuée selon la loi normale N(0 ; 1).
Règle de décision :
La valeur critique uc de la variable U dépend
de l’hypothèse alternative H1. Le test est
unilatéral à droite, uc est définie par P(U ≤ uc)
0,95
= 0,95
0,05
0
uc = u0,95
On lit dans la table de la fonction de répartition
de la loi normale centrée réduite uc = u0,95 =
1,64.
Règle de décision :soit uobs la valeur de la
variable U observée sur l’échantillon,
si uobs > uc on rejette l’hypothèse nulle,
si uobs < uc on ne rejette pas l’hypothèse nulle
nonderejet
de Hobservée
H0= 40
0
: rejet defobs
Calcul
la valeur
200
ENFA - Bulletin du GRES n°9 – février 2000
Contact : Conf [email protected]
soit fobs = 0,2
page 7
u obs =
f obs − 0 ,15
0,20 − 0 ,15
d’où u obs =
soit uobs = 1,98
0,15 × 0 ,85
0 ,15 × 0 ,85
200
200
Décision et conclusion :
Au seuil de signification 5% et au vu de l’échantillon on rejette l’hypothèse nulle H0. Plus
de 15% des camemberts de la production ont une masse supérieure à 257g. Le responsable
de production n’a pas tort.
≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈
ENFA - Bulletin du GRES n°9 – février 2000
Contact : Conf [email protected]
page 8