UE4 Comparaisons de variances

Transcription

UE4 Comparaisons de variances
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
UE4
Comparaisons de variances
Pr. Nicolas MEYER
———————
Laboratoire de Biostatistique et Informatique Médicale
Fac. de Médecine de Strasbourg
———————
Janvier 2011
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Divers
Les livres recommandés :
1
Biostatistique. Régis Beuscart, (Bénichou, Roy et Quantin)
Edition Omnisciences. 2009.
2
Mathématiques L1/L2 : Statistique et Probabilités en 30
fiches. Daniel Fredon, Myriam Maumy-Bertrand, Frédéric
Bertrand. Editions Dunod, 2009.
Contexte
Comparaison d’une variance à une référence
Plan
1
Contexte
2
Comparaison d’une variance à une référence
3
Comparaison de deux variances
Test en situation bilatérale
Test en situation unilatérale
Comparaison de deux variances
Contexte
Comparaison d’une variance à une référence
Plan
1
Contexte
2
Comparaison d’une variance à une référence
3
Comparaison de deux variances
Comparaison de deux variances
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Comparaison de variances : contexte
La variance (paramètre de dispersion) caractérise une distribution
au même titre que la moyenne
• deux contextes différents :
comparaison de la variabilité d’une mesure dans deux groupes
évaluation de la précision d’une mesure (un groupe unique)
Quelques exemples :
savoir si le dosage d’une molécule par deux techniques
différentes présente la même variabilité
savoir si la variabilité d’un dosage dépend de la température
de dosage (dosage à deux tp diff.)
savoir si la variabilité d’un paramètre présente la même
dispersion dans deux populations différentes
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Comparaison de deux variances : contexte
Deux applications différentes :
(1) les tests de comparaison de moyennes ⇒ homoscédasticité
hypothèse à tester par une comparaison de variances
si rejet de l’homoscédasticité, test t de Student non applicable
(2) comparaison de deux populations
Ex. effet du tabac sur le poids de naisssance
si effet (( simple )) : décalage des poids de naissance vers le bas
mais l’effet pourrait dépendre en plus de caractéristiques du
foetus et/ou de la mère et donc introduire une sous- ou une
sur-dispersion des valeurs fonction des moyennes de chaque
groupe → porteur d’information
Contexte
Comparaison d’une variance à une référence
Plan
1
Contexte
2
Comparaison d’une variance à une référence
3
Comparaison de deux variances
Comparaison de deux variances
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
comparaison d’une variance à une référence
La situation est peu fréquente.
2
H0 : σ 2 = σR
2
H1 : σ 2 6= σR
soit une V.A. X → N (µ ; σ)
soit s 2 la valeur observée dans un échantillon de taille n
alors, sous H0 est vraie, F =
d’où le test : calcul de F =
s2
2
σR
s2
2
σR
n−1
→ F∞
n−1 et comparaison à la
→ F∞
valeur seuil de la loi de Fisher (ou Fisher-Snedecor) avec n − 1
et ∞ ddl.
Contexte
Comparaison d’une variance à une référence
Rappel : la loi de Fisher est définie sur [0, ∞[
Comparaison de deux variances
Contexte
Comparaison d’une variance à une référence
Test en situation bilatérale
Plan
1
Contexte
2
Comparaison d’une variance à une référence
3
Comparaison de deux variances
Test en situation bilatérale
Test en situation unilatérale
Comparaison de deux variances
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Test en situation bilatérale
Comparaison de deux variances
• On cherche à comparer la variabilité d’une mesure entre deux
groupes
• Les hypothèses du test (en bilatéral) sont :
2 = σ2
H0 : σA
B
2 6= σ 2
H1 : σA
B
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Test en situation bilatérale
Fluctuation d’échantillonnage sous H0
• Soit une V.A. X et deux populations A et B dont les variances
2 et σ 2
sont σA
B
• Si X → N (µ,σ), alors :
YA = sA2
nA − 1
nB − 1
→ χ2nA −1 et YB = sB2
→ χ2nB −1
2
2
σA
σB
Si les deux échantillons sont indépendants, alors, par définition de
la loi de Fisher :
F =
YA /(nA − 1)
YB /(nB − 1)
suit une loi de Fisher à nA − 1 et nB − 1 ddl.
Contexte
Comparaison d’une variance à une référence
Test en situation bilatérale
Fluctuation d’échantillonnage sous H0
Alors, en remplacant les valeurs de YA et YB , on a :
sA2 σB2
F = 2 2
sB σA
Donc, sous H0 , le rapport
σB2
=1
σA2
Comparaison de deux variances
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Test en situation bilatérale
Fluctuation d’échantillonnage sous H0
• Si les deux échantillons sont indépendants, alors, le rapport
sA2
−1
∼ FnnBA−1
2
sB
• c-à-d. le rapport suit une loi de Fisher F à nA − 1 et nB − 1 d.d.l
• où, par convention, on choisit A et B tels que sA2 > sB2
• Rappel : Loi de Fisher = Loi de Fisher-Snedecor
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Test en situation bilatérale
Comparaison de deux variances : le test
Le test de Fisher de comparaison de deux variances :
consiste à calculer F =
2
sA
2
sB
à partir des valeurs observées des variances, dans chaque
groupe
comparaison de la valeur de F avec la table de répartition de
la loi de Fisher à nA − 1 et nB − 1 ddl.
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Test en situation bilatérale
Comparaison de deux variances : le test bilatéral
Les hypothèses sont :
2 = σ2
H0 : σA
B
2 6= σ 2
H1 : σA
B
On réalise le calcul : F =
2
sA
2
sB
on conclut H1 quand le rapport s’éloigne trop de 1, vers le
haut ou vers le bas
donc deux valeurs seuil Finf et Fsup à définir :
−1
−1
Pr (FnnBA−1
> Fsup ) = α/2 et Pr (FnnBA−1
< Finf ) = α/2
lecture de la table
en pratique les seuils pour les rapports supérieurs et inférieurs
sont l’inverse l’un de l’autre
Contexte
Comparaison d’une variance à une référence
Test en situation bilatérale
Rappel : la loi de Fisher est définie sur [0, ∞[
Comparaison de deux variances
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Test en situation bilatérale
Table de Fisher-Snedecor
La table donne la limite supérieure de F =
2
sA
2 ,
sB
pour le risque 2,5%
(valeur ayant 2,5% chances sur 100 d’être égalée ou dépassée), en
fonction des nombres de degrés de liberté lA et lB ,
Tab.: Table de F (point 2,5%)
PP lA
lB PP
P
1
2
3
4
5
6
7
8
9
1
10
11
647,79
6,94
6,72
799,48
5,46
5,26
864,15
4,83
4,63
899,6
4,47
4,28
921,83
4,24
4,04
937,11
4,07
3,88
948,20
3,95
3,76
956,64
3,85
3,66
963,28
3,78
3,59
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Test en situation bilatérale
Exemple
• On veut comparer les variances de deux groupes pour une
variable aléatoire X afin de réaliser un test de Student.
• On dispose de deux échantillons de taille 10 et 12
respectivement, avec des variances s 2 = 10,2 et s 2 = 3,1.
• On pose :
2 = σ2
H0 : les deux variances ne diffèrent pas : σA
B
2 6= σ 2
H1 : les deux variances diffèrent : σA
B
un risque α = 0,05
• On identifie A et B de manière à ce que : sA2 = 10,2 soit plus
grande que sB2 = 3,1 et donc nA = 10 et nB = 12.
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Test en situation bilatérale
Exemple
On calcule :
F =
10,2
= 3,29
3,1
On compare cette valeur à la valeur du F dans la table du F au
−1
9
seuil de 0,025 : FnnBA−1
; α/2 = F11 ; 0,025 = 3,59
Tab.: Table de F (point 2,5%)
PP lA
lB PP
P
1
2
3
4
5
6
7
8
9
1
10
11
647,79
6,94
6,72
799,48
5,46
5,26
864,15
4,83
4,63
899,6
4,47
4,28
921,83
4,24
4,04
937,11
4,07
3,88
948,20
3,95
3,76
956,64
3,85
3,66
963,28
3,78
3,59
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Test en situation bilatérale
Exemple
• On conclut que le rapport observé est plus petit que le rapport
9
de référence : F < F11
; 0,025 et donc on ne rejette pas H0 .
• On admet que les variances ne diffèrent pas et on peut donc
réaliser le test de Student.
Contexte
Comparaison d’une variance à une référence
Test en situation unilatérale
Plan
1
Contexte
2
Comparaison d’une variance à une référence
3
Comparaison de deux variances
Test en situation bilatérale
Test en situation unilatérale
Comparaison de deux variances
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Test en situation unilatérale
Comparaison de deux variances : le test unilatéral
Les hypothèses sont :
2 = σ2
H0 : σA
B
2 > σ2
H1 : σA
B
On réalise le calcul : Fobs =
2
sA
2
sB
on conclut H1 quand le rapport s’éloigne trop de 1, vers le
haut
Rem. si Fobs est d’emblée inférieur à 1, le test est inutile
−1
si Fobs > FnnBA−1
: rejet de H0
sinon, acceptation de H0
Contexte
Comparaison d’une variance à une référence
Test en situation unilatérale
Rappel : la loi de Fisher est définie sur [0, ∞[
Comparaison de deux variances
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Test en situation unilatérale
Comparaison de deux variances : le test unilatéral
On veut comparer la précision de deux appareils de dosage, le
nouveau (B) devant être plus précis que l’ancien (A).
dosage d’une solution de référence, de concentration connue
dosage réalisé 13 et 15 fois avec A et B resp.
2 = σ2
H0 : σA
B
2 > σ2
H1 : σA
B
on observe sA2 = 6,3 et sB2 = 3,2
Fobs = 6,3/3,2 = 1,97
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Test en situation unilatérale
Tab.: Table de F (point 5%)
PP
lB
l
A
PP
P
1
13
14
15
10
12
15
20
24
30
40
60
120
+∞
241,88
2,67
2,60
2,54
243,9
2,60
2,53
2,48
245,95
2,53
2,46
2,40
248,02
2,46
2,39
2,33
249,05
2,42
2,35
2,29
250,1
2,38
2,31
2,25
251,14
2,34
2,27
2,20
252,2
2,30
2,22
2,16
253,25
2,25
2,18
2,11
254,31
2,21
2,13
2,07
−1
12 = 2,53
la valeur seuil (5%) de la loi de Fisher FnnBA−1
= F14
12 = 2,53, donc on ne rejette pas H
Fobs < F14
0
on admet que le nouvel appareil n’est pas plus précis que
l’ancien
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Test en situation unilatérale
Commentaires
1) Sur le test unilatéral :
2 < σ 2 (au lieu de >)
parfois on veut tester H1 : σA
B
les tables de la loi de Fisher donnent habituellement les
−1
probabilités de dépasser FnnBA−1
−1
la solution : inverser le rapport et comparer à FnnAB−1
2 ⇔ tester supériorité σ 2
tester infériorité de σA
B
2) Sur l’indépendance des mesures : les échantillons doivent être
indépendants pour que le test soit valide. Or ici, mesure sur le
même objet.
population : population de mesure
unité statistique : la mesure et pas la solution de référence
Contexte
Comparaison d’une variance à une référence
Comparaison de deux variances
Test en situation unilatérale
synthèse
un test de comparaison de variances peut être :
unilatéral
bilatéral
test d’un paramètre observé contre un paramètre de référence
test de comparaison de deux paramètres observés
basée sur la loi de Fisher-Snedecor