Tests de comparaison de distributions

Transcription

Tests de comparaison de distributions
Tests de comparaison de distributions
Cette section doit être placée à la suite du cours sur les tests (après le test de Bartlett). Elle en
constitue la dernière partie.
Les tests de comparaison de distribution sont généralement des tests "non paramétriques", c’est à dire
qu’ils ne nécessitent pas de supposer que les observations suivent telle ou telle loi (gausienne par exemple).
Les anlo-saxons les appellent "distribution-free". Ils permettent de tester l’adéquation d’une distribution
empirique à une distribution théorique. C’est à dire qu’ils permettent de répondre à la question suivante
: étant donné un échantillon X1 ; :::; Xn i.i.d de loi inconnue L, a-t-on L = L0 où L0 est, elle, connue et
…xée par le statisticien. Ainsi la loi L0 pourra être une loi normale (0; 1) ; une loi exponentielle, une loi
de Poisson, etc. On rappelle qu’une loi de probabilité est entièrement déterminée par sa densité ou sa
fonction de répartition. Ce qui signi…e aussi que le test
H0 : L = L0
H1 : L 6= L0
(1)
mentionné ci-dessus peut se résoudre à
H0 : F =F0
H1 : F 6=F0
où F est la fonction de répartition associée à l’échantillon et F0 une fonction de répartition …xée et connue.
Ces tests permettent aussi de comparer la distribution de deux échantillons. Typiquement on dispose
de deux échantillons X1 ; :::; Xn et Y1 ; :::; Ym de lois respectives LX et LY : Ils permettent de tester H0
contre H1 avec :
H0 : LX = LY
(2)
H1 : LX 6= LY
Là encore les anglo-saxons parlent de "two sample tests" alors que les test correpondant au problème (1)
sont plutôt connus sous la dénomination "one sample tests".
1
Le cas des variables discrètes : le Chi-Deux d’ajustement
Commençons par un exemple. On dispose d’un dé à jouer et l’on souhaite savoir si ce dé est truqué. On
va jeter ce dé n fois et on va noter les valeurs lues au cours de ces n jetés. Les résultats seront résumés
dans un tableau du type :
Face
Totaux observés
Fréquences observés
Fréquences théoriques
1
n1
f1
1=6
2
n2
f2
1=6
3
n3
f3
1=6
4
n4
f4
1=6
5
n5
f5
1=6
6
n6
f6
1=6
avec n = n1 + ::: + n6 , n1 le nombre de 1 sortis au cours des n lancers, f1 = n1 =n: La fréquence théorique
corrsepond à une distribution uniforme sur l’ensemble f1; :::; 6g : Clairement les fi doivent être comparés
à 1=6: S’ils sont tous assez proches on considérera que le dé n’est pas truqué.
Pour cela on construit la statistique suivante :
T6 =
6
X
(ni
i=1
2
n=6)
n=6
Intuitivement T6 va nous donner une indication sur la proximité des fi et des fréquence "théoriques". Au
dénominateur apparaît un terme correctif.
1
Généralisons le raisonnement précédent. Supposons que l’on dispose de variables aléatoires discrètes
X1 ; :::; Xn qui prennent des valeurs comprises entre 1 et k. On peut à nouveau dresser une table récapitulative :
Valeur observée pour Xi 1
2
3
... ... k
Totaux observés
n1 n2 n3 ::: ::: nk
Fréquences observés
f1 f2 f3 ::: ::: fk
Fréquences théoriques
p1 p2 p3 ::: ::: pk
On a toujours n = n1 + ::: + nk ; fi = ni =n et les pi correspondent à la distribution de référence (ou
"théorique") a laquelle on souhaite comparer l’échantillon. On construit alors
Tk =
k
X
(ni
i=1
k
2
2
X
(fi pi )
npi )
=n
npi
pi
i=1
Le terme au dénominateur est très important. Supposons en e¤et que pour tout i ni npi = c’est à
dire que la di¤érence absolue entre totaux observés et totaux théoriques est constante. On voit alors
2
(ni npi )
que ti =
sera plus grand pour des cases à faible e¤ectif théorique, plus petit pour des cases à
npi
fort e¤ectif théorique. Autrement dit le dénominateur permet de voir ti comme une di¤érence relative
entre e¤ectifs théoriques et observés.
On peut alors montrer que si n est assez grand (supérieur à 30) avec au moins 5 observations pour
chaque valeur observée
2
Tk
(k 1)
La statistique Tk est appelée "Chi-Deux d’ajustement"
Remarque 1 Le Chi-Deux d’ajustement peut être utilisé pour des variables aléatoires réelles (donc non
discrètes) regroupées en classes
Classe
Total Observés
Fréquence théorique
[a1 ; a2 [
n1
p1
[a2 ; a3 [
n2
p2
[a3 ; a4 [
n3
p3
...
:::
:::
...
:::
:::
[ak ; ak+1 [
nk
pk
Dans ce cas les fréquences théoriques pi sont calculées à partir de la loi connue de référence de densité f0
et de fonction de répartition F0 par :
Z ai+1
pi =
f0 (t) dt = F0 (ai+1 ) F0 (ai )
ai
2
Le test de Kolmogorov-Smirnov
Le test de Komogorov-Smirnov est un test d’ajustement à une loi continue qui prend en compte l’ensemble
des quantiles. L’idée est la suivante : si la vrai fonction de répartition de l’échantillon est F0 ; la fonction
de répartition empirique Fbn (Cf le cours de stat I) sera proche de F0 : On rappelle queFbn est une fonction
en escalier dé…nie pour tout x par
8
>
< 0 si x < X(1)
i
b
Fn (x) =
si x 2 X(i) ; X(i+1)
>
: n
1 si x X(n)
où X(1)
:::
X(n) est l’échantillon X1 ; :::; Xn ordonné. On mesure l’adéquation de Fbn à F0 par la
distance de Kolmogorov-Smirnov
dKS Fbn ; F0 = sup Fbn (x)
F0 (x)
x2R
En fait il est assez simple de montrer que dKS Fbn ; F0 peut se réécrire plus simplement :
dKS Fbn ; F0 = max
1 i n
F0 X(i)
i
; F0 X(i)
n
i
1
n
(...si, si, je vous promets que c’est plus simple !!!) On a alors le résultat suivant :
2
p
Théorème 2 Quand H0 : F = F0 est vraie ndKS Fbn ; F0 est une nombre aléatoire positif dont la
distribution asymptotique (quand n est grand) ne dépend pas de F0 ; est tabulée et connue sous le nom de
p
distribution de Kolmogorov-Smirnov. Si H0 est fausse, ndKS Fbn ; F0 tend vers +1.
Le test de Kolmogorov-Smirnov s’étend très simplement au cas où l’on veut tester l’égalité de distribution de deux échantillons i.i.d (cas du test (2)). Dans ce cas on construit
bn
dKS Fbn ; G
b n celle du deuxième échantillon.
où Fbn est la fonction de répartition associée au premier échantillon et G
p
b n est inférieur à un seuil lu dans la table de Kolmogorov-Smirnov on
Dans ce cas si ndKS Fbn ; G
déduira que F = G c’est à dire que les deux échantillons sont issus de la même loi.
D’autres tests d’ajustement basés sur la fonction de répartition existent : tests de Cramer-Von Mises
d’Anderson-Darling...
3
Test de rangs : tests de Wilcoxon et de Mann-Whitney
Ce sont des tests sur échantillons doubles (Cf intro du chapitre formule (2)). Ils ne nécessitent pas de
connaître les valeurs des échantillons mais leurs rangs. On suppose donc toujours que l’on dispose de
deux échantillons X1 ; :::; Xn et Y1 ; :::; Ym de lois respectives LX et LY :
3.1
Le test de Wilcoxon
L’idée du test est la suivante : si on rassemble les deux échantillons et que l’on range les valeurs dans
l’ordre croissant l’alternance des Xi et des Yj devrait être assez régulière. On aura des doutes sur H0
si les Yj sont plutôt plus grands que les Xi ; ou plus petits ou plus fréquents dans une certaine plage de
valeurs. On procède comme suit :
1. On commence par écrire la statistique d’ordre de l’échantillon global (i.e. on mélange les valeurs des
Xi et des Yj puis on les classe par ordre croissant s’il y a des ex-aequo on les permute au hasard).
On obtient ainsi une suite mélangée des Xi et des Yj .
2. On calcule la somme des rangs des Xi notée WX (c’est la statistique de Wilcoxon).
3. Sous l’hypothèse nulle et si n + m est assez grand, WX suit approximativement une loi
N
n (n + m + 1) nm (n + m + 1)
;
2
12
ce qui permet de bâtir une procédure de test.
Exemple : voici deux échantillons :
X : 5,7 3,2 8,4 4,1 6,9 5,3 1,7 3,2 2,5 7,4
Y : 8,1 5,5 3,4 7,9 4,6 1,6 8,5 7,1 8,7 5,7.
Première étape : on ordonne l’échantillon global (les X sont en gras)
1,6 1,7 2,5 3,2 3,2 3,4 4,1 4,6 5,3 5,5 5,7 5,7 6,9 7,1 7,4 7,9 8,1 8,4 8,5 8,7 et
WX = 2 + 3 + 4 + 4 + 5 + 9 + 12 + 13 + 15 + 18 = 88
Ici on peut montrer que la p-value est p (88) = 0:1: On accepte donc H0 au niveau 95% et on la rejette
au niveau 85%
3
3.2
Le test de Mann-Whitney
Il provient d’une autre approche mais il est équivalent au précédent. En e¤et on peut décider de compter
le nombre de couples (Xi ; Yj ) pour lesquels Xi > Yj (avec choix aléatoire en cas d’ex-aequo). Avec des
symboles mathématiques on construit une statistique :
U=
n X
m
X
i=1 j=1
1I fXi > Yj g
où 1I fXi > Yj g vaut 1 si Xi > Yj et 0 sinon. On peut alors véri…er que
n(n + 1)
2
U = WX
Les deux tests sont donc formellement équivalents.
Ce cours est associé à un TD que vous devez essayer de traiter et qui peut être téléchargé
sur ma page web.
4