Intervalles de confiance et tests portant sur la moyenne d`une loi
Transcription
Intervalles de confiance et tests portant sur la moyenne d`une loi
Master de mathématiques 2011/2012 Intervalles de confiance et tests portant sur la moyenne et la variance d’une loi gaussienne Table des matières A Intervalle de confiance 1 B Intervalles de confiance et tests pour connue B.1 Intervalle de confiance bilatéral . . . . B.2 Intervalles de confiance unilatéraux . . B.3 Test bilatéral . . . . . . . . . . . . . . B.4 Tests unilatéraux . . . . . . . . . . . une moyenne quand la variance est C Intervalles de confiance et tests pour connue C.1 Intervalle de confiance bilatéral . . . . C.2 Intervalles de confiance unilatéraux . . C.3 Test bilatéral . . . . . . . . . . . . . . C.4 Tests unilatéraux . . . . . . . . . . . C.5 Réalisation avec le logiciel R . . . . . une moyenne quand la variance est . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 2 2 4 . . . . . 5 6 6 6 7 8 . . . . . . 8 8 9 9 9 10 10 E Intervalles de confiance obtenus par l’inégalité de Bienaymé-Tchebychev 10 . . . . . . . . . . D Intervalle de confiance pour une variance D.1 Cas où la moyenne est connue . . . . . . D.2 Cas où la moyenne est inconnue . . . . . D.2.1 Intervalle de confiance . . . . . . . D.2.2 Tests unilatéraux . . . . . . . . . D.2.3 Test bilatéral . . . . . . . . . . . . D.2.4 Remarque . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . (cas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . gaussien) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A Intervalle de confiance X=(X1 ,..,Xn ) Soit (Ω, F, (Pθ )θ∈T ) −−−−−−−→ (S, S, (Qθ )θ∈T ) une structure statistique, où T est une partie de R et la loi de X sous Pθ est Qθ . Si α est un élément de ]0, 1[, un intervalle de confiance du paramètre θ de niveau 1 − α est déterminé par la donnée de deux estimateurs A et B de S dans R vérifiant a) pour tout s ∈ S A(s) ≤ B(s) b) ∀θ ∈ T Qθ (A ≤ θ ≤ B) ≥ 1 − α. Une fois une mesure x = (x1 , .., xn ) effectuée, on dira que l’intervalle [A(x), B(x)] est un intervalle de confiance de niveau 1 − α du paramètre θ. B Intervalles de confiance et tests pour une moyenne quand la variance est connue Un phénomène obéit à une loi normale N (m, σ 2 ), où la moyenne m est inconnue. Pour estimer m on réalise n mesures indépendantes x1 , ..., xn . On pose x = (x1 , ..., xn ) et on note xn = n1 (x1 + ... + xn ) la moyenne empirique obtenue, qui est une estimation ponctuelle de m. B.1 Intervalle de confiance bilatéral Le modèle statistique correspondant est X=(X1 ,...,Xn ) (Ω, F, (Pm )m∈R ) −−−−−−−−→ (Rn , Bn , N (m, σ 2 )⊗n ), où σ est un réel > 0 fixé, et où sous Pm la suite X = (X1 , ..., Xn ) est un n-échantillon de N (m, σ 2 ). variable aléatoire X n = Pn Le comportement probabiliste de σx2 n est modélisé par la X n√ −m 1 i=1 Xi qui suit sous Pm la loi N (m, n ). La variable Z = σ/ n suis donc sous Pm la n loi N (0, 1). On se donne un réel α ∈]0, 1[, et on désire construire un intervalle de confiance de m de niveau (1 − α) × 100%. On note zα/2 le réel vérifiant Z +zα/2 1 x2 Pm (−zα/2 ≤ Z ≤ zα/2 ) = √ exp{− }dx = 1 − α, 2 2π −zα/2 i.e. le réel zα/2 tel que −zα/2 soit le quantile d’ordre Pm (−zα/2 ≤ α 2 de la loi N (0, 1). On peut alors écrire Xn − m σ σ √ ≤ zα/2 ) = 1 − α ⇐⇒ Pm (X n − zα/2 √ ≤ m ≤ X n + zα/2 √ ) = 1 − α. σ/ n n n 2 Un intervalle de confiance de niveau (1 − α) × 100% de la moyenne m est donc σ σ [xn − zα/2 √ , xn + zα/2 √ ]. n n σ La quantité zα/2 √ est appelée erreur moyenne. n B.2 Intervalles de confiance unilatéraux On peut selon les mêmes principes utilisés plus haut construire des intervalle de confiance unilatéraux. Si -zα est le quantile d’ordre α de la loi N (0, 1), les intervalles σ σ [xn − zα √ , +∞[ et ] − ∞ , xn + zα √ ] n n sont des intervalle de confiance de la moyenne de niveau (1 − α) × 100%. B.3 Test bilatéral On se donne un réel m0 et on désire tester H0 : m = m0 contre H1 : m 6= m0 . Un test se réalise par l’intermédiaire d’une règle de décision, qui doit préciser une statistique de test et la région de rejet associée à cette statistique. Compte tenu du paragraphe précédent, il est naturel de prendre pour statistique l’application a − m n √ 0 , t : Rn → R+ , a = (a1 , ..., an ) → t(a) = σ/ n P où an = n1 ni=1 ai . Si H0 est vraie, on s’attend à observer une valeur de t(x) plus petite que si H1 était vraie. √ 0 a pour loi N (0, 1). Sous H0 la variable Xσ/n −m n Région de rejet a priori La région de rejet a priori (i.e. avant d’avoir effectué les mesures) associée à la statistique t est un intervalle de la forme [c, +∞[,c ≥ 0. Région de rejet a posteriori La région de rejet a posteriori est la plus petite région de rejet a priori contenant t(x), c’est à dire l’intervalle [t(x), +∞[. P-valeur 3 La p-valeur est la probabilité pour que sous H0 t(X) appartienne à la région de rejet a posteriori, i.e. γ = Pm0 (t(X) ∈ [t(x), +∞[) X n − m0 x −m √ | ≥ | n √ 0 |) σ/ n σ/ n = N (0, 1)(] − ∞, −t(x)] ∪ [t(x), +∞[) xn − m0 √ ), = 2Φ(− σ/ n = Pm0 (| où Φ désigne la fonction de répartition de la loi normale N (0, 1). Test de taille donnée Soit α ∈]0, 0.5[. Le test de région de rejet l’intervalle [zα/2 , +∞[ est de taille α puisque Pm0 (| X n − m0 X −m X −m √ | ≥ zα/2 ) = Pm0 ( n √ 0 ≤ −zα/2 )+Pm0 ( n √ 0 ≥ zα/2 ) = 2Φ(−zα/2 ) = α. σ/ n σ/ n σ/ n On rejette H0 au niveau α si t(x) ≥ zα/2 , et on ne rejette pas H0 si t(x) < zα/2 . Comme t(x) ≥ zα/2 équivaut à γ = Pm0 (t(X) ≥ t(x)) ≤ Pm0 (t(X) ≥ zα/2 )) = α, on voit qu’il est équivalent de rejeter H0 au niveau α si α ≥ γ. Lien avec l’intervalle de confiance On établit facilement l’équivalence σ σ t(x) ≤ zα/2 ⇐⇒ m0 ∈ [xn − zα/2 √ , xn + zα/2 √ ]. n n B.4 Tests unilatéraux On se donne un réel m0 et on désire tester H0 : m = m0 ( ou m ≥ m0 ) contre H1 : m < m 0 . La statistique de test est dans ce cas l’application s : Rn → R+ , a = (a1 , ..., an ) → s(a) = an − m0 √ , σ/ n P où an = n1 ni=1 ai . La région de rejet a priori associée à la statistique s est de la forme ] − ∞, c], et la région n −m √ 0 ]. de rejet a posteriori est ] − ∞, s(x)] =] − ∞, xσ/ n 4 La p-valeur est γ = Pm0 (s(X) ≤ s(x)) X n − m0 xn − m0 √ √ ) ≤ σ/ n σ/ n = N (0, 1)(] − ∞, s(x)]) xn − m0 √ ). = Φ( σ/ n = Pm0 ( On traiterait de façon analogue le test de H0 : m = m0 contre H1 : m > m0 , dont la région n −m √ 0 , +∞[ et la p-valeur 1 − Φ( xn −m √ 0 ). de rejet a posteriori est [s(x), +∞[= [ xσ/ n σ/ n Fonction puissance d’un test de taille donnée Supposons que µ0 = 10, σ = 3, x = 9, n = 36. Le test bilatéral de taille 0, 05 a pour région de rejet (relative à la statistique t) l’intervalle [z, +∞[, où z = t0,05 est déterminé par P10 (t(X) ≥ z) = 0, 05. Le réel z est le quantile d’ordre 1 − 0,05 2 = 0, 975 de la loi N (0, 1). Ce quantile vaut approximativement 1, 959964. La fonction puissance du test est l’application de R − {10} dans [0, 1] qui à m associe π(m) = Pm (t(X) ≥ z). Sous Pm X n a pour loi 9 n −10 N (m, 36 ) = N (m, 41 ) ; X3/6 a par conséquent pour loi N (2(m − 10), 1). Donc π(m) = N (2(m − 10), 1)([−z, z]c ) = 1 − N (2(m − 10), 1)([−z, z] = 1 − N (0, 1)([−z − 2(m − 10), z − 2(m − 10)]). Remarque 1 Les valeurs les plus utilisées par α et les valeurs approchées correspondantes de zα/2 sont données dans le tableau ci-dessous. α 0, 1 0, 05 0, 01 1−α 0, 9 0, 95 0, 99 zα/2 1, 645 1, 96 2, 576 5 y 0.2 0.3 0.4 La figure ci-dessous illustre le cas α = 0, 1. 0.1 1-0,1=0,90 0,1/2=0,05 0.0 0,1/2=0,05 -3 -2 -1 0 1 2 3 x C Intervalles de confiance et tests pour une moyenne quand la variance est connue Rappel 2 (Loi de Student) La loi de Student tn est la loi d’un quotient √U , où U et V sont des variables aléatoires V /n réelles indépendantes, U suivant une loi normale N (0, 1) et V une loi du χ2 à n degrés de liberté. Les densités des lois de Student sont paires. C.1 Intervalle de confiance bilatéral Le modèle statistique correspondant est X (Ω, F, (P(m,σ) )(m,σ)∈R×R∗+ ) − → (Rn , Bn , N (m, σ 2 )⊗n ), 2 où sous P(m,σ) la suite X = (X1 , ..., Xn ) est un n-échantillon de N (m, σ ). Pn 1 ∗2 2 La variance inconnue est estimée par sn = n−1 i=1 (xi −xn ) , dont la variable aléatoire Pn 1 2 ∗2 associée est Sn∗2 = n−1 i=1 (Xi − X n ) . On rappelle que sous P(m,σ) les variables X n et Sn 6 ∗2 sont indépendantes, que la variable Sn∗2 a pour espérance σ 2 , et que la loi de n−1 σ Sn est la loi de khi-deux à n − 1 degrés de liberté χ2n−1 . Pour déterminer un intervalle de confiance de la moyenne de niveau (1 − α) on utilise la variable √ Xn − m n(X n − m) Sn∗ √ = [ ]/[ ] σ σ Sn∗ / n qui sous P(m,σ) suit la loi de Student à n−1 degrés de liberté. On note que P(m,σ) (Sn∗ = 0) = 0. Soit α ∈]0, 1[ et tα/2 = t(α/2, n − 1) le réel vérifiant tn−1 ([−tα/2 , tα/2 ]) = 1 − α, i.e. le quantile d’ordre 1 − 12 de la loi tn−1 . L’équivalence P(m,σ) (−tα/2 Sn∗ Sn∗ Xn − m ≤ ∗ √ ≤ tα/2 ) = 1−α ⇐⇒ P(m,σ) (X n −tα/2 √ ≤ m ≤ X n +tα/2 √ ) = 1−α. Sn / n n n montre que l’intervalle s∗ s∗ [xn − tα/2 √n , xn + tα/2 √n ] n n est un intervalle de confiance de la moyenne pour la moyenne de niveau (1 − α) × 100%. C.2 Intervalles de confiance unilatéraux On peut selon les mêmes principes utilisés plus haut construire des intervalle de confiance unilatéraux. Si tα est le quantile d’ordre 1 − α de la loi tn−1 , les intervalles s∗n s∗n [xn − tα √ , +∞[ et ] − ∞ , xn + tα √ ] n n sont des intervalle de confiance de niveau (1 − α) × 100%. C.3 Test bilatéral On se donne un réel m0 et on désire tester H0 : m = m0 contre H1 : m 6= m0 . Compte tenu du paragraphe précédent, on prend pour statistique de test l’application an − m 0 n √ , t : R \∆n → R+ , a = (a1 , ..., an ) → t(a) = ∗ σ (a)/ n où an = 1 n n X i=1 ai , v u n u 1 X ∗ t σ (a) = (ai − an )2 , n − 1 i=1 et ∆n = {(a1 , ..., an ) ∈ Rn : ∀(i, j) ∈ [1..n] ai = aj }. La région de rejet à priori associée à la statistique t est un intervalle de la forme [c, +∞[. 7 La région de rejet a posteriori une fois observées les valeurs x1 , ..., xn , réels que l’on supposera xn − m0 non tous égaux, est par conséquent [t(x), +∞[= [| ∗ √ |, +∞[. sn / n La p-valeur du test vaut γ = P(m0 ,σ) (t(X) ∈ [t(x), +∞[) X n − m0 xn − m0 √ √ |) | ≥ | Sn∗ / n s∗n / n xn − m0 = 2Ftn−1 (−| ∗ √ |), sn / n = P(m0 ,σ) (| où Ftn−1 désigne la fonction de répartition de la loi de Student à n − 1 degrés de liberté. Si l’on s’est donné un niveau α ∈]0, 1[, on rejette H0 si α > γ, et on ne rejette pas H0 si α ≤ γ. C.4 Tests unilatéraux H0 : m = m0 (ou m ≥ m0 ) contre H1 : m < m 0 . La région de rejet a priori associée à la statistique s : Rn \∆n → R+ , a = (a1 , ..., an ) → s(a) = où an = 1 n n X i=1 ai , an − m 0 √ , σ ∗ (a)/ n v u n u 1 X ∗ σ (a) = t (ai − an )2 , n − 1 i=1 et ∆n = {(a1 , ..., an ) ∈ Rn : ∀(i, j) ∈ [1..n] ai = aj }, xn − m0 est de la forme ] − ∞, c], et la région de rejet a posteriori est ] − ∞, ∗ √ ]. sn / n La p-valeur est X n − m0 xn − m0 √ √ ) ≤ Sn∗ / n s∗n / n xn − m0 = Ftn−1 ( ∗ √ ) sn / n = Ftn−1 (s(x)). γ = P(m0 ,σ) ( On traiterait de façon analogue le test H0 : m = m0 contre H1 : m > m0 . 8 C.5 Réalisation avec le logiciel R Si x = (x1 , ..., xn ) est la suite des mesures, 1 − α le niveau de confiance, la commande √ 0 , la p-valeur - t.test(x, alt = ”g”, mu = m0 , conf.level = 0.9) fournit l’estimation xsn∗ −m n/ n √ 0 , +∞[) = 1 − Ft √ 0 ) du test de H0 : m = m0 contre H1 : m > m0 , ainsi ( xn −m tn−1 ([ xsn∗ −m n−1 s∗ / n n/ n n que l’intervalle de confiance unilatéral de niveau 1 − α = 0, 9 √ 0 , la p-valeur Ft √ 0 ) du test de - t.test(x, alt = ”l”, mu = m0 ) fournit l’estimation xsn∗ −m ( xn −m n−1 s∗ / n / n n n H0 : m = m0 contre H1 : m < m0 , ainsi que l’intervalle de confiance unilatéral du niveau par défaut 95% xn −m xn −m 0 0 √ √ - t.test(x, alt = ”t”) fournit l’estimation s∗ / n , la p-valeur 2Ftn−1 (− s∗ / n ) du test bilatéral n n de H0 : m = 0 contre H1 : m 6= 0, ainsi que l’intervalle de confiance bilatéral du niveau par défaut 95%. D Intervalle de confiance pour une variance (cas gaussien) Un phénomène obéit à une loi normale N (m, σ 2 ), où la variance σ 2 est inconnue. Pour estimer σ 2 on réalise n mesures indépendantes x1 , ..., xn . D.1 Cas où la moyenne est connue P P On estime σ 2 par s2n = n1 ni=1 (xi −m)2 ; la variable associée est Sn2 = n1 ni=1 (Xi −m)2 . 2 2 n On sait que la variable nS 2 σ suit la loi du khi-deux à n degrés de liberté χn . Etant donné α ∈]0, 1[ on détermine les réels k1 (α) et k2 (α) vérifiant χ2n ([0, k1 (α)]) = α 2 χ2n ([k2 (α), +∞[) = et α . 2 2 n On a alors χ2n ([k1 (α), k2 (α)]) = 1 − α, et de façon équivalente Pσ2 (k1 (α) ≤ nS σ 2 ≤ k2 (α)) = 1 − α, 2 nSn2 2 n soit encore Pσ2 ( knS ≤ σ ≤ k1 (α) ) = 1 − α. 2 (α) Un intervalle de confiance de niveau (1 − α) × 100% de la variance σ 2 est par conséquent ns2n ns2n [ , ]. k2 (α) k1 (α) 9 D.2 Cas où la moyenne est inconnue D.2.1 Intervalle de confiance Pn Pn 1 1 2 ∗2 = x et la variance par s i n i=1 i=1 (xi −xn ) , n n−1 Pn (n−1)Sn∗2 1 2 Sn∗2 = n−1 a pour i=1 (Xi − X n ) . La variable σ2 La moyenne est estimée par xn = dont la variable aléatoire associée est loi χ2n−1 . Si k1 (α) et k2 (α) sont les réels vérifiant α α χ2n−1 ([0, k1 (α)]) = et χ2n−1 ([k2 (α), +∞[) = , 2 2 on voit comme ci-dessus que l’intervalle ∗2 (n − 1)s∗2 n (n − 1)sn [ , ] k2 (α) k1 (α) est un intervalle de confiance de niveau (1 − α) × 100% de la variance σ 2 . D.2.2 Tests unilatéraux On se donne un réel σ0 > 0 et on désire tester contre H1 : σ 2 > σ02 . H0 : σ 2 = σ02 Le test se réalise par l’intermédiaire de la statistique n−1 S ∗2 , qui suit sous H0 la loi σ02 n χ2n−1 . La région de rejet à priori qui de la forme [c, +∞[. La région de rejet a posteriori associée aux mesures indépendantes x1 , ..., xn est par conséquent [ n−1 s∗2 , +∞[. σ02 n La p-valeur du test vaut n−1 n − 1 ∗2 n − 1 ∗2 2 γ = P(m,σ02 ) ( 2 Sn∗2 ≥ s s , +∞[). ) = χ ([ n−1 σ0 σ02 n σ02 n Si l’on s’est donné un niveau α ∈]0, 1[, on rejette H0 si α ≥ γ, et on ne rejette pas H0 si α < γ. Le test H0 : σ 2 ≤ σ02 contre H1 : σ 2 > σ02 possède la même p-valeur. D.2.3 Test bilatéral Du fait de la dissymétrie de la loi χ2n−1 il est impossible de préciser une région de rejet a priori pour le test de H0 : σ 2 = σ02 contre H1 : σ 2 6= σ02 . On se fixe donc au préalable un niveau α ∈]0, 1[, puis on détermine ensuite les réels χ1 et χ2 vérifiant α α χ2n−1 ([0, χ1 ]) = et χ2n−1 ([χ2 , +∞[) = . 2 2 Comme alors sous H0 n−1 P(m,σ02 ) ( 2 Sn∗2 ∈ [χ1 , χ2 ]) = χ2n−1 ([χ1 , χ2 ]) = 1 − α, σ0 l’ensemble [χ1 , χ2 ]c est une région de rejet du test pour le niveau α. 10 D.2.4 Remarque Les résultats de la partie D restent valables pour de grands échantillons ( n ≥ 30) dans le cas de variables indépendantes et de même loi admettant un moment d’ordre deux ∗2 fini. Ceux de la partie C ne s’appliquent qu’au cas gaussien car la loi de la variable n−1 σ 2 Sn peut s’écarter nettement de la loi χ2n−1 lorsque les variables Xn ne sont pas gaussiennes, même ∗2 lorsque n est grand (on dira que la distribution d’échantillonnage de la variable n−1 σ 2 Sn est peu robuste vis-à-vis de l’hypothèse gaussienne). Plus précisément si (Xn )n≥ est une suite indépendante de variables aléatoires réelles de P n 1 même loi admettant un moment d’ordre 4, et si comme ci-dessus Sn∗2 = n−1 i=1 (Xi − X n )2 , √ la suite n(Sn∗2 − σ 2 ) converge en loi vers une loi normale N (0, µ4 − σ 4 ), où µ4 est le moment centré d’ordre 4 E(X1 − EX1 )4 . Si les variables Xn suivent une loi normale, µ4 = 3σ 4 , et donc µ4 − σ 4 = 2σ 4 . Les tests de la partie C restent par conséquent valides pour une loi pour laquelle µ4 = 3σ 4 . E Intervalles de confiance obtenus par l’inégalité de Bienaymé-Tchebychev Quand l’approximation normale n’est pas valide, on peut utiliser l’inégalité de BienayméTchebychev pour obtenir intervalle de confiance . Un phénomène obéit à une loi P sur R, de moyenne m, dont la variance σ 2 est connue. Pour estimer m on réalise n mesures indépendantes x1 , ..., xn et l’on note xn = n1 (x1 + ... + xn ) la moyenne empirique qui est une estimation ponctuelle de m. Si (X1 , ..., Xn ) est un n-échantillon de P , on a pour tout réel t > 0 l’inégalité √ 1 √ 1 P ( n (X n − m)/σ ≥ t) ≤ 2 V [ n(X n − m)/σ] = 2 , t t d’où √ 1 P ( n(X n − m)/σ ≤ t) ≥ 1 − 2 . t √ Soit α ∈]0, 1[ et soit lα = 1/ α. On a √ P ( n(X n − m)/σ ≤ lα ) ≥ 1 − α, ce qui s’écrit encore σ σ P (X n − lα √ ≤ m ≤ X n + lα √ ) ≥ 1 − α. n n L’intervalle σ σ [xn − lα √ ≤ m ≤ xn + lα √ ] n n est un intervalle de confiance de niveau au moins égal à 1 − α. Exemple 11 On reprend les données utilisée dans la section B (variance connue), i.e. on suppose que P a pour écart-type σ = 3, et que la moyenne empirique est x = 9, la taille de l’échantillon étant n = 36. Si α = 0, 1, on a 1 3 1 3 σ σ ' 7.42 et xn − lα √ = 9 − √ ' 10.58, xn − lα √ = 9 − √ n n 0, 1 6 0, 1 6 si bien que l’intervalle de confiance de niveau supérieur ou égal à 0, 90 est [7.42 , 10.58], à comparer à l’intervalle [8.178, 9.822] obtenu dans le cas gaussien. Compléments On pourra consulter le site http://www.stat.sc.edu/~west/javahtml/ConfidenceInterval.html ainsi que le chapitre 18 du site http://stat-www.berkeley.edu/users/stark/SticiGui/index.htm. 12