Représentations graphiques des tableaux de Contingence. Le

Transcription

Représentations graphiques des tableaux de Contingence. Le
Représentations graphiques des tableaux de Contingence.
IUT Bordeaux Montesquieu - Département Tech De Co - Bernard Andruccioli – Septembre 2005
Ce document complète les informations disponibles en ligne (http://andruccioli.u-bordeaux4.fr). Il s’agit d’un
support de cours, et d’un complément qui ne peut en aucun cas se substituer au cours.
Le Diagramme en Mosaïque
La représentation graphique des tableaux de contingence n’est pas
simple puisqu’elle fait intervenir les deux caractères et les effectifs.
On se trouve donc face à trois dimensions qui sont difficiles à faire
tenir sur un plan. Si les courbes de régression apportent un début
de réponse, elles ne sont possibles que lorsque les caractères sont
quantitatifs ce qui réduit leur intérêt. D’autre part leur
construction délicate nécessite le calcul des éléments
conditionnels, ce qui rend la lecture de ces courbes difficile.
L’intérêt du diagramme en mosaïque est grand puisqu’il permet
une représentation sur un plan de cette situation. La lecture
est beaucoup plus aisée puisque cette représentation nécessite
peu de calculs préalables et intègre les valeurs de départ du tableau
concerné.
Remarque : un article remarquable de Monique Le Guen se trouve à cette adresse :
http://matisse.univ-paris1.fr/leguen/leguen2001b.pdf
Présentation
Objectif : représenter schématiquement un tableau de contingence
Bien que possible d’un simple clic de souris les représentations basiques des tableaux de
contingence que l’on eut faire avec un tableau ne sont que rarement exploitables au niveau de
l’analyse.
Exemple avec les données suivantes :
Effectifs observés
P1
P2
H
15
12
F
62
28
Total
77
40
P3
24
59
83
P4
Total
40
91
6
155
46
246
Effectifs théoriques
P1
P2
H
28
15
F
49
25
Total
77
40
P3
31
52
83
P4
Total
17
91
29
155
46
246
Les graphiques de base proposés par Excel sont souvent jolis fais peu utiles…
Effectifs observés
70
60
50
40
P1
30
P2
20
P3
10
P4
0
P1
P2
F
P3
P4
H
1
Effectifs théoriques
60
50
40
P1
30
P2
20
P3
P4
10
0
P1
P2
F
P3
H
P4
Si le second type permet un début de comparaison intéressant, celui de gauche semble peu propice
à un développement constructif.
Mise en oeuvre
Le diagramme en Mosaïque va représenter les effectifs d’un tableau de contingence par des
mosaïques (rectangles ou carrés) dont la surface est proportionnelle aux effectifs représentés. La
lecture est donc facilitée, et l’interprétation possible.
Regardons le tableau des fréquences absolues
P1
6%
25%
31%
H
F
Total
P2
5%
11%
16%
P3
10%
24%
34%
P4
Total
16%
37%
2%
63%
19%
100%
Les fréquences relatives au sexe et aux produits son intéressantes ; leur représentation est aisée.
P1
H
1
F
P2
1
P3
P4
0%
20%
40%
60%
80%
100%
0%
20%
40%
60%
80%
100%
On sent bien que la surface représentée par les hommes consommant P2 sera plus petite que celle
des femmes achetant P1. On sait que leurs effectifs théoriques respectifs sont bien différents. (12
contre 62).
Ce diagramme sera donc composé d’autant de rectangles (et/ou carrés) qu’il y a cellules dans le
tableau de contingence de départ. Pour la représentation de chaque mosaïque la largeur de la bande
sera proportionnelle aux fréquences marginales (dans notre exemple 37% pour les hommes, et 63%
pour les femmes.) La hauteur de chaque mosaïque sera proportionnelle au rapport de l’effectif de la
cellule sur le total de la colonne. Les bandes verticales (pour les hommes et les femmes ci-dessous)
ne sont pas coupées de manière homogène pour la bonne raison que la consommation de chaque
produit (P1 à P4) va concerner un nombre d’hommes et de femmes différent.
2
Effectifs Observés
f
P4
P3
P2
P1
h
La représentation des effectifs théoriques (représentatifs d’une situation d’indépendance entre les
caractères, donc de l’hypothèse H0 du test du Khi2) va donner un diagramme bien différente et plus
homogène. C’est logique puisque on applique la norme observée sur la population étudiée pour
chaque produit. On fait donc comme si pour chaque produit le pourcentage d’hommes et de femmes
concernés était celui observé globalement, à savoir 37% et 63%. (Or ce n’est pas le cas…) Donc :
3
Analyse avec les écarts :
P1
-13
13
H
F
P2
P3
-3
3
P4
-7
7
23
-23
Graphiquement :
Pour les femmes
:
-10
-10
-5
0
-5
5
0
10
5
15
10
20
Pour les hommes
P1
P2
P3
P4
Test du khi2
Avec R
chisq.test(tab)
Pearson's Chi-squared test
data: tab
X-squared = 62.5618, df = 3, p-value = 1.666e-13
Avec Excel:
Représentation avec l’exemple de la page 19:
4
Effectifs observés
Josrac
Medelin
Pinmou
Josrac
Gralence
Pinmou
Tagnan
Tagnan
Lornont
Lornont
Gralence
Medelin
Effectifs thoriques
Test du Khi2 avec R
> chisq.test(obs)
Pearson's Chi-squared test
data: obs
X-squared = 15.5232, df = 4, p-value = 0.003731
Remarque pour conclure
La plupart des tableurs, dont Excel, ne disposent pas d’assistant graphique permettant de produire
de tels diagrammes. Il est possible de certaines macros le fassent (Xlstat par exemple mais je n’ai
pas vérifié). Les logiciels de statistiques le permettent. Sur ce document nous avons donc utilisé R
pour produire ces mosaïques en utilisant la syntaxe de base :
> tableau
[,1] [,2] [,3]
[1,]
4
32
36
[2,]
5
5
21
[3,]
8
8
5
[4,]
12
78
4
[5,]
4
5
12
> mosaicplot(tableau)
1.2
1.3
1.4
1.5
2.3
2.2
2.1
1.1
http://andrucccioli.u-bordeaux4.fr - [email protected]
5

Documents pareils