UE4 Comparaisons de variances
Transcription
UE4 Comparaisons de variances
Contexte Comparaison d’une variance à une référence Comparaison de deux variances UE4 Comparaisons de variances Pr. Nicolas MEYER ——————— Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg ——————— Janvier 2011 Contexte Comparaison d’une variance à une référence Comparaison de deux variances Divers Les livres recommandés : 1 Biostatistique. Régis Beuscart, (Bénichou, Roy et Quantin) Edition Omnisciences. 2009. 2 Mathématiques L1/L2 : Statistique et Probabilités en 30 fiches. Daniel Fredon, Myriam Maumy-Bertrand, Frédéric Bertrand. Editions Dunod, 2009. Contexte Comparaison d’une variance à une référence Plan 1 Contexte 2 Comparaison d’une variance à une référence 3 Comparaison de deux variances Test en situation bilatérale Test en situation unilatérale Comparaison de deux variances Contexte Comparaison d’une variance à une référence Plan 1 Contexte 2 Comparaison d’une variance à une référence 3 Comparaison de deux variances Comparaison de deux variances Contexte Comparaison d’une variance à une référence Comparaison de deux variances Comparaison de variances : contexte La variance (paramètre de dispersion) caractérise une distribution au même titre que la moyenne • deux contextes différents : comparaison de la variabilité d’une mesure dans deux groupes évaluation de la précision d’une mesure (un groupe unique) Quelques exemples : savoir si le dosage d’une molécule par deux techniques différentes présente la même variabilité savoir si la variabilité d’un dosage dépend de la température de dosage (dosage à deux tp diff.) savoir si la variabilité d’un paramètre présente la même dispersion dans deux populations différentes Contexte Comparaison d’une variance à une référence Comparaison de deux variances Comparaison de deux variances : contexte Deux applications différentes : (1) les tests de comparaison de moyennes ⇒ homoscédasticité hypothèse à tester par une comparaison de variances si rejet de l’homoscédasticité, test t de Student non applicable (2) comparaison de deux populations Ex. effet du tabac sur le poids de naisssance si effet (( simple )) : décalage des poids de naissance vers le bas mais l’effet pourrait dépendre en plus de caractéristiques du foetus et/ou de la mère et donc introduire une sous- ou une sur-dispersion des valeurs fonction des moyennes de chaque groupe → porteur d’information Contexte Comparaison d’une variance à une référence Plan 1 Contexte 2 Comparaison d’une variance à une référence 3 Comparaison de deux variances Comparaison de deux variances Contexte Comparaison d’une variance à une référence Comparaison de deux variances comparaison d’une variance à une référence La situation est peu fréquente. 2 H0 : σ 2 = σR 2 H1 : σ 2 6= σR soit une V.A. X → N (µ ; σ) soit s 2 la valeur observée dans un échantillon de taille n alors, sous H0 est vraie, F = d’où le test : calcul de F = s2 2 σR s2 2 σR n−1 → F∞ n−1 et comparaison à la → F∞ valeur seuil de la loi de Fisher (ou Fisher-Snedecor) avec n − 1 et ∞ ddl. Contexte Comparaison d’une variance à une référence Rappel : la loi de Fisher est définie sur [0, ∞[ Comparaison de deux variances Contexte Comparaison d’une variance à une référence Test en situation bilatérale Plan 1 Contexte 2 Comparaison d’une variance à une référence 3 Comparaison de deux variances Test en situation bilatérale Test en situation unilatérale Comparaison de deux variances Contexte Comparaison d’une variance à une référence Comparaison de deux variances Test en situation bilatérale Comparaison de deux variances • On cherche à comparer la variabilité d’une mesure entre deux groupes • Les hypothèses du test (en bilatéral) sont : 2 = σ2 H0 : σA B 2 6= σ 2 H1 : σA B Contexte Comparaison d’une variance à une référence Comparaison de deux variances Test en situation bilatérale Fluctuation d’échantillonnage sous H0 • Soit une V.A. X et deux populations A et B dont les variances 2 et σ 2 sont σA B • Si X → N (µ,σ), alors : YA = sA2 nA − 1 nB − 1 → χ2nA −1 et YB = sB2 → χ2nB −1 2 2 σA σB Si les deux échantillons sont indépendants, alors, par définition de la loi de Fisher : F = YA /(nA − 1) YB /(nB − 1) suit une loi de Fisher à nA − 1 et nB − 1 ddl. Contexte Comparaison d’une variance à une référence Test en situation bilatérale Fluctuation d’échantillonnage sous H0 Alors, en remplacant les valeurs de YA et YB , on a : sA2 σB2 F = 2 2 sB σA Donc, sous H0 , le rapport σB2 =1 σA2 Comparaison de deux variances Contexte Comparaison d’une variance à une référence Comparaison de deux variances Test en situation bilatérale Fluctuation d’échantillonnage sous H0 • Si les deux échantillons sont indépendants, alors, le rapport sA2 −1 ∼ FnnBA−1 2 sB • c-à-d. le rapport suit une loi de Fisher F à nA − 1 et nB − 1 d.d.l • où, par convention, on choisit A et B tels que sA2 > sB2 • Rappel : Loi de Fisher = Loi de Fisher-Snedecor Contexte Comparaison d’une variance à une référence Comparaison de deux variances Test en situation bilatérale Comparaison de deux variances : le test Le test de Fisher de comparaison de deux variances : consiste à calculer F = 2 sA 2 sB à partir des valeurs observées des variances, dans chaque groupe comparaison de la valeur de F avec la table de répartition de la loi de Fisher à nA − 1 et nB − 1 ddl. Contexte Comparaison d’une variance à une référence Comparaison de deux variances Test en situation bilatérale Comparaison de deux variances : le test bilatéral Les hypothèses sont : 2 = σ2 H0 : σA B 2 6= σ 2 H1 : σA B On réalise le calcul : F = 2 sA 2 sB on conclut H1 quand le rapport s’éloigne trop de 1, vers le haut ou vers le bas donc deux valeurs seuil Finf et Fsup à définir : −1 −1 Pr (FnnBA−1 > Fsup ) = α/2 et Pr (FnnBA−1 < Finf ) = α/2 lecture de la table en pratique les seuils pour les rapports supérieurs et inférieurs sont l’inverse l’un de l’autre Contexte Comparaison d’une variance à une référence Test en situation bilatérale Rappel : la loi de Fisher est définie sur [0, ∞[ Comparaison de deux variances Contexte Comparaison d’une variance à une référence Comparaison de deux variances Test en situation bilatérale Table de Fisher-Snedecor La table donne la limite supérieure de F = 2 sA 2 , sB pour le risque 2,5% (valeur ayant 2,5% chances sur 100 d’être égalée ou dépassée), en fonction des nombres de degrés de liberté lA et lB , Tab.: Table de F (point 2,5%) PP lA lB PP P 1 2 3 4 5 6 7 8 9 1 10 11 647,79 6,94 6,72 799,48 5,46 5,26 864,15 4,83 4,63 899,6 4,47 4,28 921,83 4,24 4,04 937,11 4,07 3,88 948,20 3,95 3,76 956,64 3,85 3,66 963,28 3,78 3,59 Contexte Comparaison d’une variance à une référence Comparaison de deux variances Test en situation bilatérale Exemple • On veut comparer les variances de deux groupes pour une variable aléatoire X afin de réaliser un test de Student. • On dispose de deux échantillons de taille 10 et 12 respectivement, avec des variances s 2 = 10,2 et s 2 = 3,1. • On pose : 2 = σ2 H0 : les deux variances ne diffèrent pas : σA B 2 6= σ 2 H1 : les deux variances diffèrent : σA B un risque α = 0,05 • On identifie A et B de manière à ce que : sA2 = 10,2 soit plus grande que sB2 = 3,1 et donc nA = 10 et nB = 12. Contexte Comparaison d’une variance à une référence Comparaison de deux variances Test en situation bilatérale Exemple On calcule : F = 10,2 = 3,29 3,1 On compare cette valeur à la valeur du F dans la table du F au −1 9 seuil de 0,025 : FnnBA−1 ; α/2 = F11 ; 0,025 = 3,59 Tab.: Table de F (point 2,5%) PP lA lB PP P 1 2 3 4 5 6 7 8 9 1 10 11 647,79 6,94 6,72 799,48 5,46 5,26 864,15 4,83 4,63 899,6 4,47 4,28 921,83 4,24 4,04 937,11 4,07 3,88 948,20 3,95 3,76 956,64 3,85 3,66 963,28 3,78 3,59 Contexte Comparaison d’une variance à une référence Comparaison de deux variances Test en situation bilatérale Exemple • On conclut que le rapport observé est plus petit que le rapport 9 de référence : F < F11 ; 0,025 et donc on ne rejette pas H0 . • On admet que les variances ne diffèrent pas et on peut donc réaliser le test de Student. Contexte Comparaison d’une variance à une référence Test en situation unilatérale Plan 1 Contexte 2 Comparaison d’une variance à une référence 3 Comparaison de deux variances Test en situation bilatérale Test en situation unilatérale Comparaison de deux variances Contexte Comparaison d’une variance à une référence Comparaison de deux variances Test en situation unilatérale Comparaison de deux variances : le test unilatéral Les hypothèses sont : 2 = σ2 H0 : σA B 2 > σ2 H1 : σA B On réalise le calcul : Fobs = 2 sA 2 sB on conclut H1 quand le rapport s’éloigne trop de 1, vers le haut Rem. si Fobs est d’emblée inférieur à 1, le test est inutile −1 si Fobs > FnnBA−1 : rejet de H0 sinon, acceptation de H0 Contexte Comparaison d’une variance à une référence Test en situation unilatérale Rappel : la loi de Fisher est définie sur [0, ∞[ Comparaison de deux variances Contexte Comparaison d’une variance à une référence Comparaison de deux variances Test en situation unilatérale Comparaison de deux variances : le test unilatéral On veut comparer la précision de deux appareils de dosage, le nouveau (B) devant être plus précis que l’ancien (A). dosage d’une solution de référence, de concentration connue dosage réalisé 13 et 15 fois avec A et B resp. 2 = σ2 H0 : σA B 2 > σ2 H1 : σA B on observe sA2 = 6,3 et sB2 = 3,2 Fobs = 6,3/3,2 = 1,97 Contexte Comparaison d’une variance à une référence Comparaison de deux variances Test en situation unilatérale Tab.: Table de F (point 5%) PP lB l A PP P 1 13 14 15 10 12 15 20 24 30 40 60 120 +∞ 241,88 2,67 2,60 2,54 243,9 2,60 2,53 2,48 245,95 2,53 2,46 2,40 248,02 2,46 2,39 2,33 249,05 2,42 2,35 2,29 250,1 2,38 2,31 2,25 251,14 2,34 2,27 2,20 252,2 2,30 2,22 2,16 253,25 2,25 2,18 2,11 254,31 2,21 2,13 2,07 −1 12 = 2,53 la valeur seuil (5%) de la loi de Fisher FnnBA−1 = F14 12 = 2,53, donc on ne rejette pas H Fobs < F14 0 on admet que le nouvel appareil n’est pas plus précis que l’ancien Contexte Comparaison d’une variance à une référence Comparaison de deux variances Test en situation unilatérale Commentaires 1) Sur le test unilatéral : 2 < σ 2 (au lieu de >) parfois on veut tester H1 : σA B les tables de la loi de Fisher donnent habituellement les −1 probabilités de dépasser FnnBA−1 −1 la solution : inverser le rapport et comparer à FnnAB−1 2 ⇔ tester supériorité σ 2 tester infériorité de σA B 2) Sur l’indépendance des mesures : les échantillons doivent être indépendants pour que le test soit valide. Or ici, mesure sur le même objet. population : population de mesure unité statistique : la mesure et pas la solution de référence Contexte Comparaison d’une variance à une référence Comparaison de deux variances Test en situation unilatérale synthèse un test de comparaison de variances peut être : unilatéral bilatéral test d’un paramètre observé contre un paramètre de référence test de comparaison de deux paramètres observés basée sur la loi de Fisher-Snedecor