Kappa, C, V et Phi - Département de science politique

Transcription

Kappa, C, V et Phi - Département de science politique
Les mesures basées sur le Khi deux : Le C; le V et le Φ
Nous avons vu que l’interprétation du Khi deux se fait à l’aide d’une table. Cependant,
lorsque l’on désire examiner deux Khi carré (Khi deux) l’un par rapport à l’autre il est
nécessaire d’utiliser d’autres calculs. Les articles scientifiques utilisent principalement le
seuil de signification du test d’hypothèse pour accepter ou rejeter l’hypothèse ulle. Il
existe également des mesures qui permettent de « qualifier » le Khi deux. Cette utilisation
est moins fréquente dans les analyses mais méritent quand même une certaine attention
puisqu’elles peuvent s’avérer utiles dans certaines situations.
Le coefficient de contingence (C)
Le coefficient de contingence (C) permet d’estimer la « force » de l’association entre les
deux variables. La valeur de C s’étend de 0 à, théoriquement, 1. Nous soulignons le terme
théoriquement puisque cette valeur est impossible à atteindre. En effet la formule du
coefficient de contingence est :
C=
χ2
χ2 + N
Il est impossible d’avoir un Khi deux s’il n’y a aucune observation (si N=0) et comme C
ne peut prendre la valeur de 1 que si N=0 il est logique de prétendre que C ne peut
prendre la valeur de 1. Aussi, le résultat maximal du C dépend de la taille du tableau. Par
exemple le résultat maximal pour un tableau 2x2 est de ,707 et de ,816 pour un tableau
3x3.1 La limite supérieure du C est donc sensible à la taille du tableau ou, du nombre de
colonnes et du nombre de rangées. Pour palier à cet inconvénient on utilise le calcul du V
de Cramer.
Le V de Cramer (V)
L e V de Cramer est similaire au C mais il s’ajuste au nombre de colonnes et de rangées
de telle manière qu’il est possible d’obtenir la valeur maximale de 1. La formule est la
suivante :
V=
χ2
(N )MIN (r − 1, c − 1) )
Veuillez prendre note que MIN signifie le moindre entre le nombre de rangée et le
nombre de colonne. Par exemple pour un tableau avec 3 rangées et 2 colonnes, le
moindre du nombre de rangées et du nombre de colonnes est 2.
1
Voir Howell p.181 in David C. Howell, Méthodes statistiques en sciences humaines , De Boeck
Université, Paris, 1998.
Le Phi Φ
Le phi (prononcez fi) est utilisé lorsque l’on a affaire à un tableau 2X2. Si on utilise le
Phi pour un tableau de plus grande dimension, il est possible que le Phi dépasse la valeur
de 1,002. Pour palier à cela certains chercheurs utilisent Φ2. Il est important de noter que
les valeurs minima et maxima de ces trois mesures se situent entre 0 et 13. Nous
pourrions examiner cette question plus en profondeur mais ceci n’est pas l’objectif du
présent texte. Il faut surtout retenir que ces trois mesures nous offre une appréciation de
la « force » du résultat du Khi deux et qu’il est possible de les utiliser pour comparer les
résultats de deux Khi deux.
La formule est la suivante: Φ =
χ2
N
Exemple4 :
Supposons que nous avons les résultats suivants :
Un premier résultat porte sur le tabagisme. Nous obtenons un tableau croisé comme suit :
Homme
Femme
Total
Non-fumeurs
350
400
750
Fumeurs
150
100
250
Total
500
500
1000
Le χ2 donne 13,333
Un deuxième résultat porte sur le principal responsable des courses alimentaires.
Nous obtenons un tableau croisé comme suit :
Homme
Femme
Total
OUI
15
4
19
NON
4
15
19
Total
19
19
38
Le χ2 donne 12,737
On remarque que le résultat des deux Khi deux est relativement semblable. Dans les deux
cas il y a rejet de l’hypothèse nulle à un niveau de .001 (p<.001). Cependant on remarque
que les résultats ne se basent pas sur le même nombre de répondants. Comme nous avons
affaire à deux tableaux 2x2 nous utiliseront le Phi. Comme ce calcul permet de mesurer le
degré d’association il sera ainsi possible de comparer les deux résultats.
2
Pour cela il faut que le khi deux soit supérieur au N.
Il est bien entendu que la valeur 0 n’est pas atteignable (voir commentaires dans le cours)
4
Cet exemple se retrouve aux pages 180-181 du livre de Howell.
3
Comme les khi deux sont respectivement 13,333 et 12,737 nous obtenons des Phi de .12
et .58. Comme on peut le constater à la lecture des tableaux la force de l’association est
plus forte pour le deuxième tableau.
Phi pour le tabagisme =
13,333
=.115=.12
1000
Phi pour les courses alimentaires =
12,737
= .578 = .58
38
Dans le cas d’un tableau 2x2 le phi est égale au V de Cramèr.
Le Kappa (κ)
Le Kappa est une mesure d’accord entre deux juges. Lorsqu’il y a plusieurs juges il est
nécessaire d’utiliser d’autres mesures. En suivant l’exemple d’Howell5 il nous sera
possible de comprendre son calcul et son utilisation.
Supposons que deux juges évaluent les problèmes comportementaux de 30 personnes tel
que :
JugeI
JugeII
Pas de problèmes
Intériorisation
Extériorisation
Total
Pas de problèmes
Intériorisation
15
(10,67)
1
2
3
20
Extériorisation
0
3
(1,20)
1
2
6
3
(1,07)
3
4
Total
16
6
30
Il est facile de calculer que les deux juges avaient la même opinion 70% des fois. Pour
cela il suffit d’examiner la diagonale. Pas de problèmes/ Pas de problèmes = 15;
Intériorisation/Intériorisation= 3; Extériorisation/Extériorisation =3. Donc 15+3+3=21 et
21/30 = 70%. Nous pourrions donc dire que les juges étaient d’accord 70% des fois.
Cependant comme les juges ne sont pas toujours d’accord, nous devons nous interroger à
savoir si ces derniers sont tombés d’accord mais par hasard. C’est ce que le Kappa nous
permet de faire en ajustant l’effet du hasard.
5
Howell, David C. Méthodes Statistiques en Sciences Humaines, Bruxelles, Deboeck Université, 1999.
La formule du Kappa est la suivante :
Κ=
∑ fo − ∑ fe
N − ∑ fe
tel que
∑ fo = La somme des fréquences observées (sur la diagonale seulement)
∑ fe = La somme des fréquences théoriques (sur la diagonale seulement)
N = Le nombre total d’observations
∑ fo = 15+3+3=21
Ici ∑ fe = 10,67 + 1,2 + 1,07 = 12,94 (Les fe sont toujours représentées entre
Ici
parenthèses)
Nous avons donc
∑ fo − ∑ fe =
N − ∑ fe
21 − 12,94
8,06
= ,47
=
30 − 12,94 17,06
Le Kappa nous donne ,47 et il veut dire qu’une fois l’effet du hasard pris en compte les
juges étaient réellement d’accords 47% des fois et non 70%. La différence entre le 70% et
le 47% pourrait être dû au hasard.

Documents pareils