Représentations graphiques des tableaux de Contingence. Le
Transcription
Représentations graphiques des tableaux de Contingence. Le
Représentations graphiques des tableaux de Contingence. IUT Bordeaux Montesquieu - Département Tech De Co - Bernard Andruccioli – Septembre 2005 Ce document complète les informations disponibles en ligne (http://andruccioli.u-bordeaux4.fr). Il s’agit d’un support de cours, et d’un complément qui ne peut en aucun cas se substituer au cours. Le Diagramme en Mosaïque La représentation graphique des tableaux de contingence n’est pas simple puisqu’elle fait intervenir les deux caractères et les effectifs. On se trouve donc face à trois dimensions qui sont difficiles à faire tenir sur un plan. Si les courbes de régression apportent un début de réponse, elles ne sont possibles que lorsque les caractères sont quantitatifs ce qui réduit leur intérêt. D’autre part leur construction délicate nécessite le calcul des éléments conditionnels, ce qui rend la lecture de ces courbes difficile. L’intérêt du diagramme en mosaïque est grand puisqu’il permet une représentation sur un plan de cette situation. La lecture est beaucoup plus aisée puisque cette représentation nécessite peu de calculs préalables et intègre les valeurs de départ du tableau concerné. Remarque : un article remarquable de Monique Le Guen se trouve à cette adresse : http://matisse.univ-paris1.fr/leguen/leguen2001b.pdf Présentation Objectif : représenter schématiquement un tableau de contingence Bien que possible d’un simple clic de souris les représentations basiques des tableaux de contingence que l’on eut faire avec un tableau ne sont que rarement exploitables au niveau de l’analyse. Exemple avec les données suivantes : Effectifs observés P1 P2 H 15 12 F 62 28 Total 77 40 P3 24 59 83 P4 Total 40 91 6 155 46 246 Effectifs théoriques P1 P2 H 28 15 F 49 25 Total 77 40 P3 31 52 83 P4 Total 17 91 29 155 46 246 Les graphiques de base proposés par Excel sont souvent jolis fais peu utiles… Effectifs observés 70 60 50 40 P1 30 P2 20 P3 10 P4 0 P1 P2 F P3 P4 H 1 Effectifs théoriques 60 50 40 P1 30 P2 20 P3 P4 10 0 P1 P2 F P3 H P4 Si le second type permet un début de comparaison intéressant, celui de gauche semble peu propice à un développement constructif. Mise en oeuvre Le diagramme en Mosaïque va représenter les effectifs d’un tableau de contingence par des mosaïques (rectangles ou carrés) dont la surface est proportionnelle aux effectifs représentés. La lecture est donc facilitée, et l’interprétation possible. Regardons le tableau des fréquences absolues P1 6% 25% 31% H F Total P2 5% 11% 16% P3 10% 24% 34% P4 Total 16% 37% 2% 63% 19% 100% Les fréquences relatives au sexe et aux produits son intéressantes ; leur représentation est aisée. P1 H 1 F P2 1 P3 P4 0% 20% 40% 60% 80% 100% 0% 20% 40% 60% 80% 100% On sent bien que la surface représentée par les hommes consommant P2 sera plus petite que celle des femmes achetant P1. On sait que leurs effectifs théoriques respectifs sont bien différents. (12 contre 62). Ce diagramme sera donc composé d’autant de rectangles (et/ou carrés) qu’il y a cellules dans le tableau de contingence de départ. Pour la représentation de chaque mosaïque la largeur de la bande sera proportionnelle aux fréquences marginales (dans notre exemple 37% pour les hommes, et 63% pour les femmes.) La hauteur de chaque mosaïque sera proportionnelle au rapport de l’effectif de la cellule sur le total de la colonne. Les bandes verticales (pour les hommes et les femmes ci-dessous) ne sont pas coupées de manière homogène pour la bonne raison que la consommation de chaque produit (P1 à P4) va concerner un nombre d’hommes et de femmes différent. 2 Effectifs Observés f P4 P3 P2 P1 h La représentation des effectifs théoriques (représentatifs d’une situation d’indépendance entre les caractères, donc de l’hypothèse H0 du test du Khi2) va donner un diagramme bien différente et plus homogène. C’est logique puisque on applique la norme observée sur la population étudiée pour chaque produit. On fait donc comme si pour chaque produit le pourcentage d’hommes et de femmes concernés était celui observé globalement, à savoir 37% et 63%. (Or ce n’est pas le cas…) Donc : 3 Analyse avec les écarts : P1 -13 13 H F P2 P3 -3 3 P4 -7 7 23 -23 Graphiquement : Pour les femmes : -10 -10 -5 0 -5 5 0 10 5 15 10 20 Pour les hommes P1 P2 P3 P4 Test du khi2 Avec R chisq.test(tab) Pearson's Chi-squared test data: tab X-squared = 62.5618, df = 3, p-value = 1.666e-13 Avec Excel: Représentation avec l’exemple de la page 19: 4 Effectifs observés Josrac Medelin Pinmou Josrac Gralence Pinmou Tagnan Tagnan Lornont Lornont Gralence Medelin Effectifs thoriques Test du Khi2 avec R > chisq.test(obs) Pearson's Chi-squared test data: obs X-squared = 15.5232, df = 4, p-value = 0.003731 Remarque pour conclure La plupart des tableurs, dont Excel, ne disposent pas d’assistant graphique permettant de produire de tels diagrammes. Il est possible de certaines macros le fassent (Xlstat par exemple mais je n’ai pas vérifié). Les logiciels de statistiques le permettent. Sur ce document nous avons donc utilisé R pour produire ces mosaïques en utilisant la syntaxe de base : > tableau [,1] [,2] [,3] [1,] 4 32 36 [2,] 5 5 21 [3,] 8 8 5 [4,] 12 78 4 [5,] 4 5 12 > mosaicplot(tableau) 1.2 1.3 1.4 1.5 2.3 2.2 2.1 1.1 http://andrucccioli.u-bordeaux4.fr - [email protected] 5