ANOVA Simple

Transcription

ANOVA Simple
Dr Bourouba Statistiques
ANOVA RANDOMISEE
ANALYSE DE VARIANCE SIMPLE
Domaine d’application du test :
Données quantitatives
Plusieurs échantillons INDEPENDANTS
Distributions normales
Comparaison d’échantillons
1/Ranger les données sous forme de tableau
1/Exemple pratique :
On considère trois milieux nutritifs A, B et C, dans lesquels on compte le nombre de colonies
de streptocoques. Existe t-il une différence entre ces milieux ?
Expérience Milieu A
Milieu B
Milieu C
na=4
nb=5
nc=3
1
3
10
13
2
5
8
3
6
5
4
3
7
11
5
5
8
2/Calculer la variance Intercolonne Qa
2
2

X  
X 




Qa =
−
 n  

N

 

N = Effectif total
n = Effectif de chaque série
2
2
2
2

Xa
Xb
Xc  
X 




Qa =
+
+
−
 na
 

nb
nc
N

 

2/Dans notre exemple :
Milieu A
Milieu B
Milieu C
1
3
10
13
2
5
8
3
6
5
4
3
7
11
5
5
8
ΣX
Σ Xa=17
Σ Xb=35
Σ Xc=32
ΣΣX=84
ΣΣ
2
2
2
2
(ΣX)
(Σ
(ΣXa)
(Σ
=289 (ΣXb)
(Σ
=1225 (ΣXc)
(Σ
=1024 (ΣΣX)
(ΣΣ 2=7056
∑
(∑ )
(∑ )
(∑ ∑ )
(∑ )
(∑ )
17 2 35 2 32 2  7056
Qa = 
+
+
−
5
3 
12
 4
Qa = 70.58
(∑ ∑ )
Dr Bourouba Statistiques
3/Calcul de la variance totale Qt
(∑ ∑ X )
−
2
Qt =
∑∑X
2
N
3/Dans notre exemple :
Milieu A
Milieu B
2
Xa
Xa
Xb
Xb2
1
3
9
10
100
2
5
25
8
64
3
6
36
5
25
4
3
9
7
49
5
5
25
2
2
Σ X Σ Xa=17 Σ(Xa)
Σ(
= 79 Σ Xb=35 Σ(Xb)
Σ(
= 263
2
 (17 + 35 + 32) 

Qt = 79 + 263 + 354 − 

12


Q t = 108
4/Calculer la variance résiduelle Qr
Qr = Q t − Qa
4/Dans notre exemple :
Qr = 108 – 70.58
Qr = 37.42
5/Calculer Va
Qr
Va =
C−1
C étant le nombre de colonnes
5/Dans notre exemple :
70.58
Va =
3 −1
Va = 35.29
6/Calculer Vr
Qr
Vr =
N−C
6/Dans notre exemple :
37.42
Vr =
12 − 3
Vr = 4.15
7/Calculer F
V
Fc = a
Vr
7/Dans notre exemple :
35.29
Fc =
4.16
Fc = 8.48
Milieu C
Xc
13
11
8
Σ Xc=32
Xc2
169
121
64
2
Σ(Xc)
Σ(
= 354
Dr Bourouba Statistiques
EN RESUME :
Somme des
variances
Intercolonne A
Somme des
carrés
QA
Degré de liberté
V
C-1
VA
Intracolonne B
QB
N-C
VB
Total T
QT
N-1
F
F=
VA
VB
8/Comparer le Fc calcule au Ft de la table de Fischer Snedecor
Avec un degré de liberté ν
ν 1 = (C − 1)
et
ν 2 = (N − C)
C est le nombre de colonnes
N est l’effectif total
Si Fc est supérieur au Ft, il existe donc une différence significative entre les séries
pour le critère étudié.
Si Fc est inférieur au Ft, il n’existe pas de différence significative entre les séries pour
le critère étudié.
8/Dans notre exemple :
ν1 = 3 – 1 = 2
ν2 = 12 - 3 = 9
Le F de la table correspondant à ν1 en rangée et ν2 en colonne est Ft = 4.26
Fc=18.48 est supérieur a Ft=4.26, donc il existe une différence significative entre les milieux
de culture.
REMARQUE IMPORTANTE :
Pour savoir quelle série est différente de l’autre :
-Si les effectifs de chaque série sont les mêmes , on applique le test de Newman Keuls
-Si les effectifs de chaque série ne sont pas les mêmes , on applique le LSD test (Least
Significant Difference)
Dans notre exemple :
Les trois séries ont des effectifs différents
na=4 nb=5 nc=3 donc on applique le LSD test pour savoir quelle série est différente de
l’autre.
Dr Bourouba Statistiques
LSD TEST
LEAST SIGNIFICANT DIFFERENCE
Domaine d’application du test :
Teste la différence entre chaque série d’effectif diffèrent, après une analyse de variance
significative.
1/Caculer les moyennes de chaque série
1/Reprenons l’exemple de l’ANOVA randomisée
m a = 4.25 ⇒ n a = 4
mb = 7 ⇒ nb = 5
m c = 10.66 ⇒ n c = 3
2/Ordonner les moyennes par ordre décroissant
2/Dans notre exemple
mI : mc = 10.66
mII : mb = 7
mIII : ma = 4.25
3/Calculer les différences entre les moyennes
d 1 = mI − mII
d 2 = mII − mIII
d 3 = mI − mIII
3/Dans notre exemple
d1 = 10.66 – 7 = 3.66
d2 = 7 – 4.25 = 2.75
d3 = 10.66 – 4.25 = 6.41
4/Calculer les LSD des séries prises deux à deux
V
V
LSD 1,2 = tν r + r
n1 n 2
et t est lu sur la table de Student avec ν = N- C
N étant l’effectif total
C étant le nombre de colonne
n1 étant l’effectif de la 1ere série
n2 étant l’effectif de la 2eme série
Vr étant la variance résiduelle
4/Dans notre exemple
ν = 12 – 3 = 9
tν = 2.26
4.15 4.15
LSD1 = 2.26
+
= 2.72
3
5
LSD 2 = 2.26
4.15 4.15
+
= 3.08
5
4
LSD 3 = 2.26
4.15 4.15
+
= 3.51
3
4
Dr Bourouba Statistiques
5/Comparer les différences des moyennes avec les LSD respectifs :
Si la différence est supérieure au LSD, il existe donc une différence entre les deux
séries
Si la différence est inférieure au LSD, il n’existe pas de différence entre les deux séries
5/Dans notre exemple :
d1 = 3.66 et LSD1 = 2.72 ; d1 < LSD1 donc pas de différence entre les milieux C et B
d2 = 2.75 et LSD2 = 3.8 ; d2 < LSD2 donc pas de différence entre les milieux A et B
d3 = 6.41 et LSD3 = 3.5 ; d3 < LSD3 donc pas de différence entre les milieux A et C
Dr Bourouba Statistiques
TEST DE NEWMAN KEULS
RANGE STUDENTISE
Teste la différence entre chaque série, de même effectif
1/Classer les moyennes de chaque série, par ordre croissant
1/Reprenons l’exemple précèdent :
1
2
3
4
5
Moyenne
Méthode
A
9
11
14
10
4
9.6
B
16
12
15
11
6
12
C
19
24
13
16
11
16.6
mI ⇒ m A = 9.6
mII ⇒ m B = 12
mIII ⇒ m C = 16.6
2/Calculer les différences, en valeur absolue, des moyennes respectives
2/Dans notre exemple :
m A − m B = 2.4
mA − mC = 7
m B − m C = 4 .6
3/Lire sur la table de Newman Keuls, la valeur correspondant à :
k = nombre de moyennes et
ν = (N − 1) − [(C − 1) + (R + 1)]
N étant l’effectif total
C étant le nombre de colonnes
R étant le nombre de rangées
3/Dans notre exemple :
k=3
ν = (15 − 1) − [(3 − 1) + (5 − 1)] = 8
Sur la table la valeur correspondante est 4.04 pour k=3 et 3.26 pour k=2
4/Comparer les différences de moyennes
avec la valeur de k=3 pour I / II et I / II
et avec la valeur k=2 pour II / III
Si la valeur est inférieure à la différence des moyennes, alors il existe une différence
entre les séries étudiées
Si la valeur est supérieure à la différence des moyennes, alors il n’existe pas de
différence entre les séries étudiées
4/Dans notre exemple :
Pour k = 3 et ν = 8, la valeur lue est 4.04
Différence de moyenne I / II = 2.04 est inférieure à 4.04, donc pas de différence entre
la série A et la série B
Différence de moyenne I / III = 7 est supérieure à 4.04, donc il existe une différence
entre la série A et la série C
Pour k = 2 et ν = 8, la valeur lue est 3.26
Différence de moyenne II / III = 4.26 est supérieure à 3.26, donc il existe une
différence entre la série B et la série C
Dr Bourouba Statistiques
TABLEAU DU F DE FISCHER SNEDECOR
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
∞
1
161.4
18.51
10.13
7.71
6.61
5.99
5.59
5.32
5.12
4.96
4.84
4.75
4.67
4.60
4.54
4.49
4.45
4.41
4.38
4.35
4.32
4.30
4.28
4.26
4.24
4.23
4.21
4.20
4.18
4.17
4.08
4.00
3.92
3.84
2
199.5
19.00
9.55
6.94
5.79
5.14
4.74
4.46
4.26
4.10
3.98
3.89
3.81
3.74
3.68
3.63
3.59
3.55
3.52
3.49
3.47
3.44
3.42
3.40
3.39
3.37
3.35
3.34
3.33
3.32
3.23
3.15
3.07
3.00
3
215.7
19.16
9.28
6.59
5.41
4.76
4.35
4.07
3.86
3.71
3.59
3.49
3.41
3.34
3.29
3.24
3.20
3.16
3.13
3.10
3.07
3.05
3.03
3.01
2.99
2.98
2.96
2.95
2.93
2.92
2.84
2.76
2.68
2.60
4
224.6
19.25
9.12
6.39
5.19
4.53
4.12
3.84
3.63
3.48
3.36
3.26
3.18
3.11
3.06
3.01
2.96
2.93
2.90
2.87
2.84
2.82
2.80
2.78
2.76
2.74
2.73
2.71
2.70
2.69
2.61
2.53
2.45
2.37
5
230.2
19.30
9.01
6.26
5.05
4.39
3.97
3.69
3.48
3.33
3.20
3.11
3.03
2.96
2.90
2.85
2.81
2.77
2.74
2.71
2.68
2.66
2.64
2.62
2.60
2.59
2.57
2.56
2.55
2.53
2.45
2.37
2.29
2.21
6
234.8
19.35
8.89
6.09
4.88
4.21
3.79
3.50
3.29
3.14
3.01
2.91
2.83
2.76
2.71
2.66
2.61
2.58
2.54
2.51
2.49
2.46
2.44
2.42
2.40
2.39
2.37
2.36
2.35
2.33
2.25
2.17
2.09
2.01
7
236.8
19.35
8.89
6.09
4.88
4.21
3.79
3.50
3.29
3.14
3.01
2.91
2.83
2.7
2.71
2.66
2.61
2.58
2.54
2.51
2.49
2.46
2.44
2.42
2.40
2.39
2.37
2.36
2.35
2.33
2.25
2.17
2.09
2.01
8
238.9
19.37
8.85
6.04
4.82
4.15
3.73
3.44
3.23
3.07
2.95
2.85
2.77
2.70
2.64
2.59
2.55
2.51
2.48
2.45
2.42
2.40
2.37
2.36
2.34
2.32
2.31
2.29
2.28
2.27
2.18
2.10
2.02
1.94
9
240.5
19.38
8.81
6.00
4.77
4.10
3.68
3.39
3.18
3.02
2.90
2.80
2.71
2.65
2.59
2.54
2.46
2.49
2.46
2.42
2.39
2.37
2.34
2.32
2.30
2.28
2.27
2.25
2.24
2.22
2.12
2.04
1.96
1.88
10
241.9
19.40
8.79
5.96
4.74
4.05
3.64
3.35
3.14
2.98
2.85
2.75
2.67
2.62
2.54
2.49
2.45
2.41
2.38
2.35
2.32
2.30
2.27
2.25
2.24
2.22
2.20
2.19
2.18
2.16
2.08
1.99
1.91
1.83
12
243.9
19.41
8.74
5.91
4.68
4.00
3.57
3.28
3.07
2.91
2.79
2.69
2.60
2.53
2.48
2.42
2.38
2.34
2.31
2.28
2.25
2.23
2.20
2.18
2.16
2.15
2.13
2.12
2.10
2.09
2.00
1.92
1.83
1.75
15
245.9
19.43
8.70
5.86
4.62
3.94
3.51
3.22
3.01
2.85
2.72
2.62
2.53
2.46
2.40
2.35
2.31
2.27
2.23
2.20
2.18
2.15
2.13
2.11
2.09
2.07
2.06
2.04
2.03
2.01
1.92
1.84
1.75
1.67
20
248.0
19.45
8.66
5.80
4.56
3.87
3.44
3.15
2.94
2.77
2.65
2.54
2.46
2.39
2.33
2.28
2.23
2.19
2.16
2.12
2.10
2.07
2.05
2.03
2.01
1.99
1.97
1.96
1.94
1.93
1.84
1.75
1.66
1.57
24
249.1
19.45
8.64
5.77
4.53
3.84
3.41
3.12
2.90
2.74
2.61
2.51
2.42
2.35
2.29
2.24
2.19
2.15
2.11
2.08
2.05
2.03
2.01
1.98
1.96
1.95
1.93
1.91
1.90
1.89
1.79
1.70
1.61
1.52
30
250.1
19.46
8.62
5.75
4.50
3.81
3.38
3.08
2.86
2.70
2.57
2.47
2.38
2.31
2.25
2.19
2.15
2.11
2.07
2.04
2.01
1.98
1.96
1.94
1.92
1.90
1.88
1.87
1.85
1.84
1.74
1.65
1.55
1.46
40
60
251.1 252.2
19.47 19.48
8.59
8.57
5.72
5.69
4.46
4.43
3.77
3.74
3.34
3.30
3.04
3.01
2.83
2.79
2.66
2.62
2.53
2.49
2.43
2.38
2.34
2.30
2.27
2.22
2.20
2.16
2.15
2.11
2.10
2.06
2.06
2.02
2.03
1.98
1.99
1.95
1.96
1.92
1.94
1.89
1.91
1.86
1.89
1.84
1.87
1.82
1.85
1.80
1.84
1.79
1.82
1.77
1.81
1.75
1.79
1.74
1.69
1.64
1.59
1.53
1.50
1.43
1.39
1.32
120
253.3
19.49
8.55
5.66
4.40
3.70
3.27
2.97
2.75
2.58
2.45
2.34
2.25
2.18
2.11
2.06
2.01
1.97
1.93
1.90
1.87
1.84
1.81
1.79
1.77
1.75
1.73
1.71
1.70
1.68
1.58
1.47
1.35
1.22
∞
254.3
19.50
8.53
5.63
4.36
3.67
3.23
2.93
2.71
2.54
2.40
2.30
2.21
2.13
2.07
2.01
1.96
1.92
1.88
1.84
1.81
1.78
1.76
1.73
1.71
1.69
1.67
1.65
1.64
1.62
1.51
1.39
1.25
1.00
Dr Bourouba Statistiques
TABLE DE NEWMAN - KEULS
RANGE STUDENTISE
k
ν
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
24
30
40
60
120
∞
2
3
4
5
6
7
8
9
10
18
6.08
4.5
3.93
3.64
3.46
3.34
3.26
3.2
3.15
3.11
3.08
3.06
3.03
3.01
3
2.98
2.97
2.96
2.95
2.92
2.89
2.86
2.83
2.80
2.77
27
8.33
5.91
5.04
4.60
4.34
4.16
4.04
3.95
3.88
3.82
3.77
3.73
3.70
3.67
3.65
3.63
3.61
3.59
3.58
3.53
3.49
3.44
3.40
3.36
3.31
32.8
9.8
6.82
5.76
5.22
4.9
4.68
4.53
4.41
4.33
4.26
4.2
4.15
4.1
4.08
4.05
4.02
4
3.98
3.96
3.90
3.85
3.79
3.74
3.68
3.63
37.1
10.9
7.5
6.29
5.67
5.3
5.06
4.89
4.76
4.65
4.57
4.51
4.45
4.41
4.37
4.33
4.30
4.28
4.25
4.23
4.17
4.10
4.04
3.98
3.92
3.86
40.4
11.7
8.04
6.71
6.03
5.63
5.36
5.17
5.02
4.91
4.82
4.75
4.69
4.64
4.59
4.56
4.52
4.49
4.47
4.45
4.37
4.30
4.23
4.16
4.10
4.03
43.1
12.4
8.48
7.05
6.33
5.9
5.61
5.4
5.24
5.12
5.03
7.95
4.88
4.83
4.78
4.74
4.70
4.67
4.65
4.62
4.54
4.46
4.39
4.31
4.24
4.17
45.4
13
8.85
7.35
6.58
6.12
5.82
5.6
5.43
5.30
5.2
5.12
5.05
4.99
4.94
4.90
4.86
4.82
4.79
4.77
4.68
4.60
4.52
4.44
4.36
4.29
47.4
13.5
9.18
7.60
6.8
6.32
6
5.77
5.59
5.46
5.35
5.27
5.19
5.13
5.08
5.03
4.99
4.96
4.92
4.90
4.81
4.72
4.63
4.55
4.47
4.39
49.1
14
9.46
7.83
6.99
6.49
6.16
5.92
5.74
5.6
5.49
5.39
5.32
5.25
5.20
5.15
5.11
5.07
5.04
5.01
4.92
4.82
4.73
4.65
4.56
4.47