Matrices de Bertin - Huma-Num
Transcription
Matrices de Bertin - Huma-Num
Matrices de Bertin graphique pour lire l’information contenue dans une matrice rectangulaire Jean-Hugues CHAUCHAT Labo ERIC Université de Lyon – Lyon2 Et Alban RISSON & Pham Nguyen KHANG Jacques Bertin (1918 – 2010) cartographe français, père de la « Sémiologie graphique » (aussi appelée « la graphique ». Un graphique doit se lire d’un coup d’œil alors qu’un tableau se lit case par case. Le graphique doit montrer à voir la structure de l’information • • Un exemple pédagogique de Jacques Bertin Les colonnes : lesde communes, par ordre alphabétique Matrice «Présence / Absence » Les lignes : des caractéristiques On réordonne les lignes Puis les colonnes La structure apparait « O/1 table », Optimal Scaling, Correspondance Factorial Analysis and Blocks Model Block Model W7 W13 W3 W11 W9 W1 W4 W10 W12 W6 W8 W14 W5 W2 0/1 table a6 a17 a12 a2 a18 a22 a24 a19 a13 a8 a11 a3 a23 a9 a20 a1 a15 a25 a5 a16 a14 a7 a21 a4 a10 1 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 1 1 0 1 1 1 1 1 0 1 0 1 1 1 0 1 1 0 1 1 0 1 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0 1 0 0 1 1 0 1 1 1 1 1 0 1 0 1 1 1 0 1 1 0 1 1 0 1 0 1 1 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0 1 0 1 1 1 0 1 1 1 1 1 1 1 0 1 1 1 0 1 1 0 1 1 1 1 0 1 0 1 1 0 1 1 1 1 1 0 1 0 1 1 1 0 1 1 0 1 1 0 1 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 1 1 0 1 1 1 1 1 0 1 0 1 0 1 0 1 1 0 1 1 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0 1 0 Block Model Amado Graph a6a17a12a2a18a22a24a19a13a8a11a3a23a9a20a1a15a25a5a16a14a7a21a4a10 1 1 0 0 1 1 0 0 1 0 0 0 0 0 0 1 1 1 1 1 1 0 0 1 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 0 1 1 0 0 0 0 0 0 0 1 1 1 1 1 1 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 1 0 1 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 1 0 0 1 0 1 0 0 0 0 1 0 0 0 1 1 1 0 0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 W1 W4 W10 W6 W8 0 0 W11 W12 0 1 0 1 0 1 0 0 1 1 1 1 0 0 0 1 1 0 0 0 1 0 0 1 1 0 0 0 W3 W9 0 1 1 W7 W13 1 1 1 0 1 0 0 1 0 0 1 0 0 1 1 1 0 0 0 1 0 1 0 0 1 0 1 0 0 1 1 1 0 0 0 1 1 0 1 0 1 0 W14 W5 W2 Block Model = Amado Graph after ranking rows and columns along the first Correspondance Analysis Axis a17a12a18a22a24a19a13a11a23a20a15a25a16a14a21a9a10a6 a8 a7 a2 a3 a1 a5 a4 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 W14 W13 W11 W12 W10 W7 W9 W8 W3 W1 W4 W6 W5 W2 Les liens entre : * Matrices de Bertin * Analyse Factorielle des Correspondances * Optimal Scaling (Dual Scaling) Les mêmes techniques portent des noms différents selon les 16 personnes : Le tableau croisé des couleurs des yeux et des cheveux fair Hair black Hair red Hair X \ Y fair Hair black Hair red Hair 3 1 blue eyes 3 0 1 4 blue eyes 0 2 brown eyes 1 1 2 4 1 1 brown eyes 4 black eyes 0 4 0 4 0 0 black eyes 3 green eyes 0 1 3 4 1 0 4 6 6 16 green eyes Les 16 personnes : la Base de Données Individu alpha X Y 1 brown eyes red Hair 2 green eyes red Hair 3 green eyes black Hair 4 black eyes black Hair 5 black eyes black Hair 6 blue eyes fair Hair 7 brown eyes red Hair 8 brown eyes fair Hair 9 brown eyes black Hair 10 black eyes black Hair 11 green eyes red Hair 12 green eyes red Hair 13 blue eyes fair Hair 14 black eyes black Hair 15 blue eyes red Hair 16 blue eyes fair Hair On cherche les codages X et Y qui maximisent R² Codage optimal Individu X Y codage X codage Y 1 brown eyes red Hair 0,24 0,33 2 green eyes red Hair -0,06 0,33 3 green eyes black Hair -0,06 -1,20 4 black eyes black Hair -1,50 -1,20 5 black eyes black Hair -1,50 -1,20 6 blue eyes fair Hair 1,25 1,24 7 brown eyes red Hair 0,24 0,33 8 brown eyes fair Hair 0,24 1,31 9 brown eyes black Hair 0,24 -1,20 10 black eyes black Hair -1,50 -1,20 11 green eyes red Hair -0,06 0,33 12 green eyes red Hair -0,06 0,33 13 blue eyes fair Hair 1,32 1,31 14 black eyes black Hair -1,50 -1,20 15 blue eyes red Hair 1,32 0,33 16 blue eyes fair Hair 1,32 1,31 0,00 0,00 1 1 ro= 0,80 ro²= 0,64 Moyenne = Sigma = On cherche deux ensembles de nombres Xi = valeur pour la modalité « i » Yeux marrons => 0,24 ….. Yj = valeur pour la modalité « j » Cheveux roux => 0,33 …. Tels que : R2 soit maximum avec moyenne de X = 0 moyenne de Y = 0 et variance X = 1 variance de Y = 1 Codage optimal avec (SPSS) 2000 Fair Hair Red Hair CODAGE_Y Blac k Hair 1000 0 -1000 -2000 -2000 COGAGE_X Black Eyes -1000 Green Eyes 0 1000 Brow n Eyes Blue Eyes 2000 Optimal Scaling (SPSS) Optimal Ranking (AMADO) 2000 black eyes green eyes brown eyes blue eyes 3 1000 1 0 fair Hair 0 3 0 2 1 red Hair 0 4 CODAGE_Y -1000 1 -2000 -2000 COGAGE_X -1000 0 1000 2000 1 0 black Hair Fair Hair Optimal Scaling gives the first factor of Correspondence Analysis Fair Hair Red Hair Black Hair Green Blue BlackEyes Brown Eyes Eyes Eyes Red Hair Green Black EyesEyes Brown Eyes Blue Eyes Black Hair Black Hair Green Black Eyes Eyes Red Hair Brown Eyes Fair Hair Blue Eyes Second Optimal Scaling gives the Second factor of Correspondence Analysis and so on … Let X1 and Y1 the first Optimal Scalling solution. Now we are looking for a second Optimal Coding solution, non correlated to the first one: X2i = value for modality « i » Y2j = value for modality « j » So that: R2 is Maximized Looking for 2 sets of numbers X2 and Y X2 average = 0 Y2 average = 0 X2 variance = 1 black eyes green eyes brown eyes blue eyes 3 1 0 fair Hair 0 3 2 1 red Hair 0 4 1 1 0 black Hair