Tests - wwwdfr

Transcription

Tests - wwwdfr
Tests : Introduction
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Les faiseurs de pluie 1 : L’insémination des nuages par des
sels d’argent augmentent-elle le niveau des précipitations ?
(H0 ) Niveau naturel annuel des pluies dans la Beauce
X ∼ N (600mm, σ = 100mm)
µ = µ0 = 600
(H1 ) En inséminant avec des sels d’argent, augmente-t-on en
moyenne de 50 mm par an les précipitations ?
µ = µ1 = 650
I
Introduction
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
Choisir entre deux hypothèses (H0 ) et (H1 ), en calibrant
le risque de première espèce α (5%, 10%,..) de choisir
(H1 ) à tort.
1. Saporta, Probabilités Analyse de Données et Statistiques, Technip
67/88
Les faiseurs de pluie (suite)
I
I
Statistique X̄ , moyenne des pluies annuelles sur n = 9
années
Loi sous (H0 ),
√ X̄ − µ0
σ2
∼ N (0, 1)
X̄ ∼ N (µ0 , ) soit T = n
n
σ
I
choisir a priori un niveau α, calibrant la probabilité de
rejet de (H0 ) à tort (α = 5% par exemple)
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Introduction
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
∗
T > q1−α
)
| {z }
R: Région de rejet fct de T
σ
∗
√
X̄ > µ0 + q1−α
n
|
{z
}
Région de rejet fct de X̄
α = IP(H0 ) (
= IP(H0 )
∗
avec q1−α
le quantile d’une loi N (0, 1) d’ordre 1 − α
68/88
Les faiseurs de pluie (suite)
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Introduction
I
I
I
I
Modèle
Démarche
Décider :
si T est dans la région de rejet, on rejette H0
sinon, on conserve (H0 ) faute de preuves suffisantes
ici, x̄ = 610mm,
tobs
610 − 600
√ = 0.3 < 1.64
=
100/ 9
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
au niveau 5%, les données ne sont pas significatives
pour rejeter (H0 ) qu’on conserve.
I
avec quelle erreur ?
69/88
Modélisation
Statistique
(MAP-STA1)
Les faiseurs de pluie (suite)
Christine Keribin
Introduction
Une autre façon de se tromper : l’erreur de seconde espèce β
I
ne pas rejeter (H0 ) alors que (H1 ) est vraie
I
Sous (H1 ),
X̄ ∼ N (µ1 ,
σ2
)
n
σ
∗
√ )=β
IP(H1 ) (X̄ < µ0 + q(1−α)
n
I
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
App.Num : β ' 0.56
pnorm(600+1.644*100/3,650,100/sqrt(9))
la puissance π = 1 − β n’est pas très grande
70/88
Représentation graphique
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Introduction
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
71/88
Procédure de test
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Introduction
Définition
I
Un test est une procédure de décision qui permet de
trancher, au vu des résultats d’un échantillon, entre
deux hypothèses l’hypothèse nulle (H0 ) et une
hypothèse alternative (H1 ), dont une seule est vraie.
I
La région critique ou région de rejet R est l’ensemble
des valeurs de la variable de décision T qui conduisent à
écarter (H0 ) au profit de (H1 ).
I
La région d’acceptation du test est R.
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
72/88
Modélisation
Statistique
(MAP-STA1)
Procédure de test
Christine Keribin
Introduction
A l’issue du test, les quatre situations suivantes sont
possibles
(H0 ) vraie
(H1 ) vraie
Choix (H0 )
1−α
bonne décision
β = IP(T ∈
/ R|(H1 ))
erreur seconde espèce
mauvaise décision
Choix (H1 )
α = IP(T ∈ R|(H0 ))
erreur première espèce
mauvaise décision
π =1−β
puissance
bonne décision
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
73/88
Construire un test
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Choisir entre deux hypothèses (H0 ) et (H1 ), en calibrant le
risque de choisir (H1 ) à tort.
I
Définir le modèle
I
Définir les hypothèses nulle (H0 ) et alternative (H1 )
I
Choisir une statistique de test T (X ), calculer sa loi sous
(H0 )
I
Définir la règle de décision en calibrant la région de
rejet R suivant le risque α
I
Calcul éventuel de la puissance β
I
Calcul de la statistique observée et décision : rejet ou
acceptation de (H0 ).
Introduction
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
74/88
La décision
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Introduction
Modèle
Démarche
La décision du test, à partir de la valeur observée t de la
statistique de test T est :
I
I
si t ∈ R, on rejette (H0 ) au risque α : l’erreur commise
est α.
si t 6∈ R, on conserve (H0 ) dans le test de risque α : les
données ne sont pas significatives pour accepter (H1 ).
L’erreur de seconde espèce β commise n’est en général
pas connue.
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
75/88
Dissymétrie de la situation de test
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Introduction
Modèle
Démarche
I
le risque n’est contrôlé que pour (H0 )
,→ la véritable décision est celle qui rejette (H0 ).
,→ (H0 ) et (H1 ) ne sont pas interchangeables.
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
I
il faut connaı̂tre la loi de la statistique de test sous (H0 )
Intervalle de
confiance
I
il faut que cette loi soit différente sous (H1 )
Tests
I
entre deux tests de même niveau, il faut choisir le plus
puissant
76/88
Modélisation
Statistique
(MAP-STA1)
p-value
Christine Keribin
I
I
C’est le plus petit niveau qui fait rejeter (H0 ) au vu des
données
C’est une variable aléatoire
p-value = α
b = inf P(T ∈ Rα )
α∈[0,1]
Dans un test de niveau α, (H0 ) est rejetée si α > p-value,
conservée si α < p-value :
I
si 0.05 > p-value > 0.01, le test est significatif,
I
si 0.01 > p-value > 0.001, le test est très significatif,
I
si 0.001 > p-value, le test est hautement significatif.
Introduction
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
,→ dessin !
,→ AN : 1-pnorm(610 ,600,100/3)=0.38
77/88
Formes d’hypothèses
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
I
Hypothèses simples
(H0 ) : θ = θ0 contre (H1 ) : θ = θ1
I
test bilaréral pour une hypothèse nulle simple
(H0 ) : θ = θ0 contre (H1 ) : θ 6= θ0
I
test unilatéral pour une hypothèse nulle composite
Introduction
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
(H0 ) : θ ≤ θ0 contre (H1 ) : θ > θ0
I
De façon générale :
(H0 ) : θ ∈ Θ0 contre (H1 ) : θ ∈ Θ1 = Θ \ Θ0
78/88
Les risques du test
Soit R la région de rejet du test.
I
Risque de 1ère espèce : proba. de rejeter (H0 ) à tort :
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Introduction
Modèle
Démarche
θ ∈ Θ0 , α(θ) = IPθ ({T ∈ R})
I
Taille du test : supα∈Θ0 α(θ). Un test est de niveau α si
sa taille ≤ α
I
Risque de 2nde espèce : proba. de conserver (H0 ) à tort
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
θ ∈ Θ1 , β(θ) = IPθ ({T ∈
/ R}).
I
Puissance du test : proba. de refuser (H0 ) à raison :
θ ∈ Θ1 , π(θ) = IPθ ({T ∈ R}) = 1 − β(θ).
I
Le test sans biais si 1 − β(θ) = π(θ) > α pour tout
θ ∈ Θ1
79/88
Test optimal de θ = θ0 vs θ = θ1 au niveau α
Soit X un n-échantillon d’une variable à densité, et L(θ, x) la
vraisemblance de X . Soit W une région de rejet de niveau
α:
Z
L(θ0 ; x)dx = α.
W
On veut maximiser la puissance correspondante :
Z
Z
L(θ1 ; x)
L(θ0 ; x)dx.
π =1−β =
L(θ1 ; x)dx =
W
W L(θ0 ; x)
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Introduction
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
Théorème (Neyman-Pearson)
La région critique optimale est définie pour l’ensemble des
points de IRn tels que
L(θ1 ; x)
> kα
L(θ0 ; x)
80/88
Test optimal de θ = θ0 vs θ = θ1 au niveau α
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Introduction
Propriétés : le test de Neyman-Pearson est
I
sans biais : 1 − β = π > α sur Θ1 ;
I
consistant (convergent) : la suite des puissances πn (θ)
tend vers 1 avec n
Si on dispose de plus d’une statistique exhaustive d’un
paramètre scalaire, la région critique en dépend
exclusivement et le test de NP se réduit à
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
g (t; θ1 )
> kα
g (t; θ0 )
81/88
Tests hyp. simple contre hyp. composite
La puissance est une fonction de θ
Définition
Un test est uniformément plus puissant (UPP) si, quelle que
soit la valeur de θ, sa puissance π(θ) est supérieure à la
puissance de tout autre test de niveau α.
I
I
θ = θ0 contre θ > θ0 est UPP sous certaines conditions
θ = θ0 contre θ 6= θ0 n’est pas UPP
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Introduction
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
82/88
TRV entre deux hypothèse composites
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Introduction
Théorème (rapport de vraisemblance monotone)
S’il existe une statistique T telle que le rapport
L(θ1 ; x)/L(θ0 ; x) soit une fonction monotone de T , alors il
existe un test UPP de θ < θ0 contre θ ≥ θ0
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
I
(H0 ) : θ ≤ θ0 et RV fct % de T : R = {T > k}
Intervalle de
confiance
I
(H0 ) : θ ≤ θ0 et RV fct & de T : R = {T < k}
Tests
I
(H0 ) : θ ≥ θ0 et RV fct % de T : R = {T < k}
I
(H0 ) : θ ≥ θ0 et RV fct & de T : R = {T > k}
,→ cas des statistiques exhaustives des familles
exponentielles de loi.
83/88
Test du rapport de vraisemblances maximales
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Cas d’hypothèses paramétriques plus générales
Introduction
Modèle
Démarche
Définition
Soit une famille paramétrique IPθ , θ ⊂ Θ et les hypothèses
(H0 ) : θ ∈ Θ0 contre (H1 ) : θ ∈ Θ1 = Θ − Θ0 . On appelle
rapport de vraisemblance généralisé, la fonction TRV (X )
telle que
supθ∈Θ0 L(θ; x)
TRV (X ) =
supθ∈Θ L(θ; x)
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
Le test du rapport de vraisemblance est le test défini par une
région de rejet de la forme
R = {TRV (X ) < kα ≤ 1}.
84/88
Modélisation
Statistique
(MAP-STA1)
Asymptotique du TRV
Christine Keribin
Introduction
Modèle
Démarche
Théorème
Soit une famille paramétrique IPθ , θ ⊂ Θ. Si θ0 définit une
sous-hypothèse linéaire de Θ, dim(Θ0 ) = q, dim(Θ) = p, et
sous les conditions de régularité de l’EMV, alors, sous (H0 )
L
2
−2 log(TRV ) −→ χ (p − q)
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
La région de rejet {−2 log(TRV ) > qχ2 (r ) (1 − α)} du test
de rapport de vraisemblances maximales est
asymptotiquement de niveau α.
85/88
Test de Wald :
(H0 ) : Aθ = Aθ0 contre (H1 ) : Aθ 6= Aθ0
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Théorème
Introduction
Soit une famille paramétrique IPθ , θ ∈ Θ et A est une matrice
de dimension q × p de rang r . Si θbn est un estimateur
asymptotiquement normal (par ex, l’EMV), alors sous (H0 )
L
Vn−1 (θbn − θ0 ) −→ N (0, Idp )
et
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
L
W = (θbn − θ0 )0 A0 (A0 Vn A)−1 A(θbn − θ0 ) −→ χ2 (r )
W est la statistique de Wald.
La région de rejet {W > qχ2 (r ) (1 − α)} du test de Wald est
asymptotiquement de niveau α.
86/88
Lien entre intervalle de confiance et test
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
I
si RC est une région de confiance de niveau 1 − α de θ,
alors pour tout θ? ,
δ(X ) = 1I(θ? ∈
/ RC )
est un test de niveau α pour tester (H0 ) : θ = θ? contre
(H1 ) : θ 6= θ?
I
si pour tout θ? on dispose d’un test δθ? (X ) de niveau α
de (H0 ) : θ = θ? contre (H1 ) : θ 6= θ? , alors la région
d’acceptation
Introduction
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
RC = {θ ∈ Θ : δθ? (X ) = 0}
est une région de confiance de niveau 1 − α pour θ
87/88
Exemples de tests paramétriques usuels
I
Test bilateral de l’espérance d’une loi N (µ, σ 2 ) à
variance inconnue : la variable de décision est la
statistique pivotale
Tn =
√
n qP
i (Xi
X̄ − µ
− X̄ )2 /(n − 1)
∼(H0 ) T (n − 1)
R = {|T | > qt(n − 1, 1 − α/2)}, IP(H0 ) (R) = α
I
Modélisation
Statistique
(MAP-STA1)
Christine Keribin
Introduction
Modèle
Démarche
Estimation
ponctuelle
Estimateur
Estimateur des
moments
EMV
Intervalle de
confiance
Tests
Test unilatéral σ < σ0 contre σ > σ0 sur la variance
d’une loi N (µ, σ 2 )
P
(Xi − X̄ )2
∼(H0 ) χ2n−1
Tn = i
σ2
R = {T > qchisq(1 − α, n − 1)}, IP(H0 ) (R) = α
88/88

Documents pareils