Kappa, C, V et Phi - Département de science politique
Transcription
Kappa, C, V et Phi - Département de science politique
Les mesures basées sur le Khi deux : Le C; le V et le Φ Nous avons vu que l’interprétation du Khi deux se fait à l’aide d’une table. Cependant, lorsque l’on désire examiner deux Khi carré (Khi deux) l’un par rapport à l’autre il est nécessaire d’utiliser d’autres calculs. Les articles scientifiques utilisent principalement le seuil de signification du test d’hypothèse pour accepter ou rejeter l’hypothèse ulle. Il existe également des mesures qui permettent de « qualifier » le Khi deux. Cette utilisation est moins fréquente dans les analyses mais méritent quand même une certaine attention puisqu’elles peuvent s’avérer utiles dans certaines situations. Le coefficient de contingence (C) Le coefficient de contingence (C) permet d’estimer la « force » de l’association entre les deux variables. La valeur de C s’étend de 0 à, théoriquement, 1. Nous soulignons le terme théoriquement puisque cette valeur est impossible à atteindre. En effet la formule du coefficient de contingence est : C= χ2 χ2 + N Il est impossible d’avoir un Khi deux s’il n’y a aucune observation (si N=0) et comme C ne peut prendre la valeur de 1 que si N=0 il est logique de prétendre que C ne peut prendre la valeur de 1. Aussi, le résultat maximal du C dépend de la taille du tableau. Par exemple le résultat maximal pour un tableau 2x2 est de ,707 et de ,816 pour un tableau 3x3.1 La limite supérieure du C est donc sensible à la taille du tableau ou, du nombre de colonnes et du nombre de rangées. Pour palier à cet inconvénient on utilise le calcul du V de Cramer. Le V de Cramer (V) L e V de Cramer est similaire au C mais il s’ajuste au nombre de colonnes et de rangées de telle manière qu’il est possible d’obtenir la valeur maximale de 1. La formule est la suivante : V= χ2 (N )MIN (r − 1, c − 1) ) Veuillez prendre note que MIN signifie le moindre entre le nombre de rangée et le nombre de colonne. Par exemple pour un tableau avec 3 rangées et 2 colonnes, le moindre du nombre de rangées et du nombre de colonnes est 2. 1 Voir Howell p.181 in David C. Howell, Méthodes statistiques en sciences humaines , De Boeck Université, Paris, 1998. Le Phi Φ Le phi (prononcez fi) est utilisé lorsque l’on a affaire à un tableau 2X2. Si on utilise le Phi pour un tableau de plus grande dimension, il est possible que le Phi dépasse la valeur de 1,002. Pour palier à cela certains chercheurs utilisent Φ2. Il est important de noter que les valeurs minima et maxima de ces trois mesures se situent entre 0 et 13. Nous pourrions examiner cette question plus en profondeur mais ceci n’est pas l’objectif du présent texte. Il faut surtout retenir que ces trois mesures nous offre une appréciation de la « force » du résultat du Khi deux et qu’il est possible de les utiliser pour comparer les résultats de deux Khi deux. La formule est la suivante: Φ = χ2 N Exemple4 : Supposons que nous avons les résultats suivants : Un premier résultat porte sur le tabagisme. Nous obtenons un tableau croisé comme suit : Homme Femme Total Non-fumeurs 350 400 750 Fumeurs 150 100 250 Total 500 500 1000 Le χ2 donne 13,333 Un deuxième résultat porte sur le principal responsable des courses alimentaires. Nous obtenons un tableau croisé comme suit : Homme Femme Total OUI 15 4 19 NON 4 15 19 Total 19 19 38 Le χ2 donne 12,737 On remarque que le résultat des deux Khi deux est relativement semblable. Dans les deux cas il y a rejet de l’hypothèse nulle à un niveau de .001 (p<.001). Cependant on remarque que les résultats ne se basent pas sur le même nombre de répondants. Comme nous avons affaire à deux tableaux 2x2 nous utiliseront le Phi. Comme ce calcul permet de mesurer le degré d’association il sera ainsi possible de comparer les deux résultats. 2 Pour cela il faut que le khi deux soit supérieur au N. Il est bien entendu que la valeur 0 n’est pas atteignable (voir commentaires dans le cours) 4 Cet exemple se retrouve aux pages 180-181 du livre de Howell. 3 Comme les khi deux sont respectivement 13,333 et 12,737 nous obtenons des Phi de .12 et .58. Comme on peut le constater à la lecture des tableaux la force de l’association est plus forte pour le deuxième tableau. Phi pour le tabagisme = 13,333 =.115=.12 1000 Phi pour les courses alimentaires = 12,737 = .578 = .58 38 Dans le cas d’un tableau 2x2 le phi est égale au V de Cramèr. Le Kappa (κ) Le Kappa est une mesure d’accord entre deux juges. Lorsqu’il y a plusieurs juges il est nécessaire d’utiliser d’autres mesures. En suivant l’exemple d’Howell5 il nous sera possible de comprendre son calcul et son utilisation. Supposons que deux juges évaluent les problèmes comportementaux de 30 personnes tel que : JugeI JugeII Pas de problèmes Intériorisation Extériorisation Total Pas de problèmes Intériorisation 15 (10,67) 1 2 3 20 Extériorisation 0 3 (1,20) 1 2 6 3 (1,07) 3 4 Total 16 6 30 Il est facile de calculer que les deux juges avaient la même opinion 70% des fois. Pour cela il suffit d’examiner la diagonale. Pas de problèmes/ Pas de problèmes = 15; Intériorisation/Intériorisation= 3; Extériorisation/Extériorisation =3. Donc 15+3+3=21 et 21/30 = 70%. Nous pourrions donc dire que les juges étaient d’accord 70% des fois. Cependant comme les juges ne sont pas toujours d’accord, nous devons nous interroger à savoir si ces derniers sont tombés d’accord mais par hasard. C’est ce que le Kappa nous permet de faire en ajustant l’effet du hasard. 5 Howell, David C. Méthodes Statistiques en Sciences Humaines, Bruxelles, Deboeck Université, 1999. La formule du Kappa est la suivante : Κ= ∑ fo − ∑ fe N − ∑ fe tel que ∑ fo = La somme des fréquences observées (sur la diagonale seulement) ∑ fe = La somme des fréquences théoriques (sur la diagonale seulement) N = Le nombre total d’observations ∑ fo = 15+3+3=21 Ici ∑ fe = 10,67 + 1,2 + 1,07 = 12,94 (Les fe sont toujours représentées entre Ici parenthèses) Nous avons donc ∑ fo − ∑ fe = N − ∑ fe 21 − 12,94 8,06 = ,47 = 30 − 12,94 17,06 Le Kappa nous donne ,47 et il veut dire qu’une fois l’effet du hasard pris en compte les juges étaient réellement d’accords 47% des fois et non 70%. La différence entre le 70% et le 47% pourrait être dû au hasard.