ANOVA Simple
Transcription
ANOVA Simple
Dr Bourouba Statistiques ANOVA RANDOMISEE ANALYSE DE VARIANCE SIMPLE Domaine d’application du test : Données quantitatives Plusieurs échantillons INDEPENDANTS Distributions normales Comparaison d’échantillons 1/Ranger les données sous forme de tableau 1/Exemple pratique : On considère trois milieux nutritifs A, B et C, dans lesquels on compte le nombre de colonies de streptocoques. Existe t-il une différence entre ces milieux ? Expérience Milieu A Milieu B Milieu C na=4 nb=5 nc=3 1 3 10 13 2 5 8 3 6 5 4 3 7 11 5 5 8 2/Calculer la variance Intercolonne Qa 2 2 X X Qa = − n N N = Effectif total n = Effectif de chaque série 2 2 2 2 Xa Xb Xc X Qa = + + − na nb nc N 2/Dans notre exemple : Milieu A Milieu B Milieu C 1 3 10 13 2 5 8 3 6 5 4 3 7 11 5 5 8 ΣX Σ Xa=17 Σ Xb=35 Σ Xc=32 ΣΣX=84 ΣΣ 2 2 2 2 (ΣX) (Σ (ΣXa) (Σ =289 (ΣXb) (Σ =1225 (ΣXc) (Σ =1024 (ΣΣX) (ΣΣ 2=7056 ∑ (∑ ) (∑ ) (∑ ∑ ) (∑ ) (∑ ) 17 2 35 2 32 2 7056 Qa = + + − 5 3 12 4 Qa = 70.58 (∑ ∑ ) Dr Bourouba Statistiques 3/Calcul de la variance totale Qt (∑ ∑ X ) − 2 Qt = ∑∑X 2 N 3/Dans notre exemple : Milieu A Milieu B 2 Xa Xa Xb Xb2 1 3 9 10 100 2 5 25 8 64 3 6 36 5 25 4 3 9 7 49 5 5 25 2 2 Σ X Σ Xa=17 Σ(Xa) Σ( = 79 Σ Xb=35 Σ(Xb) Σ( = 263 2 (17 + 35 + 32) Qt = 79 + 263 + 354 − 12 Q t = 108 4/Calculer la variance résiduelle Qr Qr = Q t − Qa 4/Dans notre exemple : Qr = 108 – 70.58 Qr = 37.42 5/Calculer Va Qr Va = C−1 C étant le nombre de colonnes 5/Dans notre exemple : 70.58 Va = 3 −1 Va = 35.29 6/Calculer Vr Qr Vr = N−C 6/Dans notre exemple : 37.42 Vr = 12 − 3 Vr = 4.15 7/Calculer F V Fc = a Vr 7/Dans notre exemple : 35.29 Fc = 4.16 Fc = 8.48 Milieu C Xc 13 11 8 Σ Xc=32 Xc2 169 121 64 2 Σ(Xc) Σ( = 354 Dr Bourouba Statistiques EN RESUME : Somme des variances Intercolonne A Somme des carrés QA Degré de liberté V C-1 VA Intracolonne B QB N-C VB Total T QT N-1 F F= VA VB 8/Comparer le Fc calcule au Ft de la table de Fischer Snedecor Avec un degré de liberté ν ν 1 = (C − 1) et ν 2 = (N − C) C est le nombre de colonnes N est l’effectif total Si Fc est supérieur au Ft, il existe donc une différence significative entre les séries pour le critère étudié. Si Fc est inférieur au Ft, il n’existe pas de différence significative entre les séries pour le critère étudié. 8/Dans notre exemple : ν1 = 3 – 1 = 2 ν2 = 12 - 3 = 9 Le F de la table correspondant à ν1 en rangée et ν2 en colonne est Ft = 4.26 Fc=18.48 est supérieur a Ft=4.26, donc il existe une différence significative entre les milieux de culture. REMARQUE IMPORTANTE : Pour savoir quelle série est différente de l’autre : -Si les effectifs de chaque série sont les mêmes , on applique le test de Newman Keuls -Si les effectifs de chaque série ne sont pas les mêmes , on applique le LSD test (Least Significant Difference) Dans notre exemple : Les trois séries ont des effectifs différents na=4 nb=5 nc=3 donc on applique le LSD test pour savoir quelle série est différente de l’autre. Dr Bourouba Statistiques LSD TEST LEAST SIGNIFICANT DIFFERENCE Domaine d’application du test : Teste la différence entre chaque série d’effectif diffèrent, après une analyse de variance significative. 1/Caculer les moyennes de chaque série 1/Reprenons l’exemple de l’ANOVA randomisée m a = 4.25 ⇒ n a = 4 mb = 7 ⇒ nb = 5 m c = 10.66 ⇒ n c = 3 2/Ordonner les moyennes par ordre décroissant 2/Dans notre exemple mI : mc = 10.66 mII : mb = 7 mIII : ma = 4.25 3/Calculer les différences entre les moyennes d 1 = mI − mII d 2 = mII − mIII d 3 = mI − mIII 3/Dans notre exemple d1 = 10.66 – 7 = 3.66 d2 = 7 – 4.25 = 2.75 d3 = 10.66 – 4.25 = 6.41 4/Calculer les LSD des séries prises deux à deux V V LSD 1,2 = tν r + r n1 n 2 et t est lu sur la table de Student avec ν = N- C N étant l’effectif total C étant le nombre de colonne n1 étant l’effectif de la 1ere série n2 étant l’effectif de la 2eme série Vr étant la variance résiduelle 4/Dans notre exemple ν = 12 – 3 = 9 tν = 2.26 4.15 4.15 LSD1 = 2.26 + = 2.72 3 5 LSD 2 = 2.26 4.15 4.15 + = 3.08 5 4 LSD 3 = 2.26 4.15 4.15 + = 3.51 3 4 Dr Bourouba Statistiques 5/Comparer les différences des moyennes avec les LSD respectifs : Si la différence est supérieure au LSD, il existe donc une différence entre les deux séries Si la différence est inférieure au LSD, il n’existe pas de différence entre les deux séries 5/Dans notre exemple : d1 = 3.66 et LSD1 = 2.72 ; d1 < LSD1 donc pas de différence entre les milieux C et B d2 = 2.75 et LSD2 = 3.8 ; d2 < LSD2 donc pas de différence entre les milieux A et B d3 = 6.41 et LSD3 = 3.5 ; d3 < LSD3 donc pas de différence entre les milieux A et C Dr Bourouba Statistiques TEST DE NEWMAN KEULS RANGE STUDENTISE Teste la différence entre chaque série, de même effectif 1/Classer les moyennes de chaque série, par ordre croissant 1/Reprenons l’exemple précèdent : 1 2 3 4 5 Moyenne Méthode A 9 11 14 10 4 9.6 B 16 12 15 11 6 12 C 19 24 13 16 11 16.6 mI ⇒ m A = 9.6 mII ⇒ m B = 12 mIII ⇒ m C = 16.6 2/Calculer les différences, en valeur absolue, des moyennes respectives 2/Dans notre exemple : m A − m B = 2.4 mA − mC = 7 m B − m C = 4 .6 3/Lire sur la table de Newman Keuls, la valeur correspondant à : k = nombre de moyennes et ν = (N − 1) − [(C − 1) + (R + 1)] N étant l’effectif total C étant le nombre de colonnes R étant le nombre de rangées 3/Dans notre exemple : k=3 ν = (15 − 1) − [(3 − 1) + (5 − 1)] = 8 Sur la table la valeur correspondante est 4.04 pour k=3 et 3.26 pour k=2 4/Comparer les différences de moyennes avec la valeur de k=3 pour I / II et I / II et avec la valeur k=2 pour II / III Si la valeur est inférieure à la différence des moyennes, alors il existe une différence entre les séries étudiées Si la valeur est supérieure à la différence des moyennes, alors il n’existe pas de différence entre les séries étudiées 4/Dans notre exemple : Pour k = 3 et ν = 8, la valeur lue est 4.04 Différence de moyenne I / II = 2.04 est inférieure à 4.04, donc pas de différence entre la série A et la série B Différence de moyenne I / III = 7 est supérieure à 4.04, donc il existe une différence entre la série A et la série C Pour k = 2 et ν = 8, la valeur lue est 3.26 Différence de moyenne II / III = 4.26 est supérieure à 3.26, donc il existe une différence entre la série B et la série C Dr Bourouba Statistiques TABLEAU DU F DE FISCHER SNEDECOR 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 ∞ 1 161.4 18.51 10.13 7.71 6.61 5.99 5.59 5.32 5.12 4.96 4.84 4.75 4.67 4.60 4.54 4.49 4.45 4.41 4.38 4.35 4.32 4.30 4.28 4.26 4.24 4.23 4.21 4.20 4.18 4.17 4.08 4.00 3.92 3.84 2 199.5 19.00 9.55 6.94 5.79 5.14 4.74 4.46 4.26 4.10 3.98 3.89 3.81 3.74 3.68 3.63 3.59 3.55 3.52 3.49 3.47 3.44 3.42 3.40 3.39 3.37 3.35 3.34 3.33 3.32 3.23 3.15 3.07 3.00 3 215.7 19.16 9.28 6.59 5.41 4.76 4.35 4.07 3.86 3.71 3.59 3.49 3.41 3.34 3.29 3.24 3.20 3.16 3.13 3.10 3.07 3.05 3.03 3.01 2.99 2.98 2.96 2.95 2.93 2.92 2.84 2.76 2.68 2.60 4 224.6 19.25 9.12 6.39 5.19 4.53 4.12 3.84 3.63 3.48 3.36 3.26 3.18 3.11 3.06 3.01 2.96 2.93 2.90 2.87 2.84 2.82 2.80 2.78 2.76 2.74 2.73 2.71 2.70 2.69 2.61 2.53 2.45 2.37 5 230.2 19.30 9.01 6.26 5.05 4.39 3.97 3.69 3.48 3.33 3.20 3.11 3.03 2.96 2.90 2.85 2.81 2.77 2.74 2.71 2.68 2.66 2.64 2.62 2.60 2.59 2.57 2.56 2.55 2.53 2.45 2.37 2.29 2.21 6 234.8 19.35 8.89 6.09 4.88 4.21 3.79 3.50 3.29 3.14 3.01 2.91 2.83 2.76 2.71 2.66 2.61 2.58 2.54 2.51 2.49 2.46 2.44 2.42 2.40 2.39 2.37 2.36 2.35 2.33 2.25 2.17 2.09 2.01 7 236.8 19.35 8.89 6.09 4.88 4.21 3.79 3.50 3.29 3.14 3.01 2.91 2.83 2.7 2.71 2.66 2.61 2.58 2.54 2.51 2.49 2.46 2.44 2.42 2.40 2.39 2.37 2.36 2.35 2.33 2.25 2.17 2.09 2.01 8 238.9 19.37 8.85 6.04 4.82 4.15 3.73 3.44 3.23 3.07 2.95 2.85 2.77 2.70 2.64 2.59 2.55 2.51 2.48 2.45 2.42 2.40 2.37 2.36 2.34 2.32 2.31 2.29 2.28 2.27 2.18 2.10 2.02 1.94 9 240.5 19.38 8.81 6.00 4.77 4.10 3.68 3.39 3.18 3.02 2.90 2.80 2.71 2.65 2.59 2.54 2.46 2.49 2.46 2.42 2.39 2.37 2.34 2.32 2.30 2.28 2.27 2.25 2.24 2.22 2.12 2.04 1.96 1.88 10 241.9 19.40 8.79 5.96 4.74 4.05 3.64 3.35 3.14 2.98 2.85 2.75 2.67 2.62 2.54 2.49 2.45 2.41 2.38 2.35 2.32 2.30 2.27 2.25 2.24 2.22 2.20 2.19 2.18 2.16 2.08 1.99 1.91 1.83 12 243.9 19.41 8.74 5.91 4.68 4.00 3.57 3.28 3.07 2.91 2.79 2.69 2.60 2.53 2.48 2.42 2.38 2.34 2.31 2.28 2.25 2.23 2.20 2.18 2.16 2.15 2.13 2.12 2.10 2.09 2.00 1.92 1.83 1.75 15 245.9 19.43 8.70 5.86 4.62 3.94 3.51 3.22 3.01 2.85 2.72 2.62 2.53 2.46 2.40 2.35 2.31 2.27 2.23 2.20 2.18 2.15 2.13 2.11 2.09 2.07 2.06 2.04 2.03 2.01 1.92 1.84 1.75 1.67 20 248.0 19.45 8.66 5.80 4.56 3.87 3.44 3.15 2.94 2.77 2.65 2.54 2.46 2.39 2.33 2.28 2.23 2.19 2.16 2.12 2.10 2.07 2.05 2.03 2.01 1.99 1.97 1.96 1.94 1.93 1.84 1.75 1.66 1.57 24 249.1 19.45 8.64 5.77 4.53 3.84 3.41 3.12 2.90 2.74 2.61 2.51 2.42 2.35 2.29 2.24 2.19 2.15 2.11 2.08 2.05 2.03 2.01 1.98 1.96 1.95 1.93 1.91 1.90 1.89 1.79 1.70 1.61 1.52 30 250.1 19.46 8.62 5.75 4.50 3.81 3.38 3.08 2.86 2.70 2.57 2.47 2.38 2.31 2.25 2.19 2.15 2.11 2.07 2.04 2.01 1.98 1.96 1.94 1.92 1.90 1.88 1.87 1.85 1.84 1.74 1.65 1.55 1.46 40 60 251.1 252.2 19.47 19.48 8.59 8.57 5.72 5.69 4.46 4.43 3.77 3.74 3.34 3.30 3.04 3.01 2.83 2.79 2.66 2.62 2.53 2.49 2.43 2.38 2.34 2.30 2.27 2.22 2.20 2.16 2.15 2.11 2.10 2.06 2.06 2.02 2.03 1.98 1.99 1.95 1.96 1.92 1.94 1.89 1.91 1.86 1.89 1.84 1.87 1.82 1.85 1.80 1.84 1.79 1.82 1.77 1.81 1.75 1.79 1.74 1.69 1.64 1.59 1.53 1.50 1.43 1.39 1.32 120 253.3 19.49 8.55 5.66 4.40 3.70 3.27 2.97 2.75 2.58 2.45 2.34 2.25 2.18 2.11 2.06 2.01 1.97 1.93 1.90 1.87 1.84 1.81 1.79 1.77 1.75 1.73 1.71 1.70 1.68 1.58 1.47 1.35 1.22 ∞ 254.3 19.50 8.53 5.63 4.36 3.67 3.23 2.93 2.71 2.54 2.40 2.30 2.21 2.13 2.07 2.01 1.96 1.92 1.88 1.84 1.81 1.78 1.76 1.73 1.71 1.69 1.67 1.65 1.64 1.62 1.51 1.39 1.25 1.00 Dr Bourouba Statistiques TABLE DE NEWMAN - KEULS RANGE STUDENTISE k ν 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120 ∞ 2 3 4 5 6 7 8 9 10 18 6.08 4.5 3.93 3.64 3.46 3.34 3.26 3.2 3.15 3.11 3.08 3.06 3.03 3.01 3 2.98 2.97 2.96 2.95 2.92 2.89 2.86 2.83 2.80 2.77 27 8.33 5.91 5.04 4.60 4.34 4.16 4.04 3.95 3.88 3.82 3.77 3.73 3.70 3.67 3.65 3.63 3.61 3.59 3.58 3.53 3.49 3.44 3.40 3.36 3.31 32.8 9.8 6.82 5.76 5.22 4.9 4.68 4.53 4.41 4.33 4.26 4.2 4.15 4.1 4.08 4.05 4.02 4 3.98 3.96 3.90 3.85 3.79 3.74 3.68 3.63 37.1 10.9 7.5 6.29 5.67 5.3 5.06 4.89 4.76 4.65 4.57 4.51 4.45 4.41 4.37 4.33 4.30 4.28 4.25 4.23 4.17 4.10 4.04 3.98 3.92 3.86 40.4 11.7 8.04 6.71 6.03 5.63 5.36 5.17 5.02 4.91 4.82 4.75 4.69 4.64 4.59 4.56 4.52 4.49 4.47 4.45 4.37 4.30 4.23 4.16 4.10 4.03 43.1 12.4 8.48 7.05 6.33 5.9 5.61 5.4 5.24 5.12 5.03 7.95 4.88 4.83 4.78 4.74 4.70 4.67 4.65 4.62 4.54 4.46 4.39 4.31 4.24 4.17 45.4 13 8.85 7.35 6.58 6.12 5.82 5.6 5.43 5.30 5.2 5.12 5.05 4.99 4.94 4.90 4.86 4.82 4.79 4.77 4.68 4.60 4.52 4.44 4.36 4.29 47.4 13.5 9.18 7.60 6.8 6.32 6 5.77 5.59 5.46 5.35 5.27 5.19 5.13 5.08 5.03 4.99 4.96 4.92 4.90 4.81 4.72 4.63 4.55 4.47 4.39 49.1 14 9.46 7.83 6.99 6.49 6.16 5.92 5.74 5.6 5.49 5.39 5.32 5.25 5.20 5.15 5.11 5.07 5.04 5.01 4.92 4.82 4.73 4.65 4.56 4.47