1 Lien entre couleur des yeux et des cheveux
Transcription
1 Lien entre couleur des yeux et des cheveux
Master d’économie Cours de J. Rynkiewicz Sondage et analyse de données Université Paris 1 Analyse des correspondances 1 Lien entre couleur des yeux et des cheveux On considère la table de contingence suivante : Couleur des yeux marron noisette bleu Couleur brun 68 15 25 des châtain 145 68 144 cheveux blond 7 10 110 1. Quelles sont les tables des fréquences, profils lignes et profils colonnes 2. On admettra que la matrice S (relative aux points lignes) est : 0.24 0.19 0.11 0.64 0.62 0.54 0.13 0.19 0.35 Montrer que u1 = (−0.22, −0.17, 0.39)T et u2 = (−0.32, 0.46, −0.14)T sont vecteurs propres de S, pour des valeurs propres non triviales : λ1 = 0.196 et λ2 = 0.008. 3. On admettra que la matrice T (relative aux points colonnes) est : 0.46 0.40 0.29 0.17 0.17 0.14 0.36 0.43 0.57 Montrer que u1 = (−0.42, −0.07, 0.49)T et u2 = (0.25, −0.36, 11)T sont vecteurs propres de T. Quelles sont les valeurs propres associées? 4. Quelles sont les coordonnées factorielles des profils lignes et des profils colonnes? 5. Calculer les contributions. Comment pouvez-vous interpréter les axes? 6. Calculer les cosinus carrés relatifs aux profils lignes. En déduire les profils lignes les mieux représentés par chaque axe. 1 2 Collèges On dispose des mentions (Passable, Assez Bien, Bien, Très bien) au brevet des collèges pour certains collèges publics (PU) ou bien privés (PR): Fidelis P 20 AB 18 B 4 TB 6 TYPE PR Camus Politzer Matisse 48 33 29 27 9 25 11 9 13 3 3 9 PU PU PR Lenain 45 15 5 1 PU Berthelot 39 29 17 11 PU StLouis 20 73 70 25 PR ClFabien 49 25 21 11 PU On réalise une analyse des correspondances et on obtient les résultats suivants pour les cosinus carrés : Fidelis Camus Politzer Matisse Lenain Berthelot StLouis ClFabien PElluard P AB B TB Dim 1 0.153682395 0.862101090 0.829681984 0.008112994 0.976320729 0.223136071 0.993713539 0.569870123 0.480934097 Dim 1 0.9950992 0.6156049 0.8777513 0.6797894 Dim 2 0.838228467 0.004728559 0.153077067 0.890789888 0.005128444 0.463639729 0.001737052 0.111121318 0.510492032 Dim 2 0.004370394 0.283451908 0.121940853 0.090081504 Dim 3 0.008089138 0.133170351 0.017240949 0.101097118 0.018550826 0.313224201 0.004549409 0.319008558 0.008573871 Dim 3 0.0005304036 0.1009432283 0.0003078578 0.2301291153 et pour les contributions : Dim 1 Dim 2 Dim 3 Fidelis 0.686373251 46.0446161 0.9998855 Camus 9.077011891 0.6123416 38.8064586 Politzer 8.352237708 18.9531561 4.8035699 Matisse 0.008787198 11.8665580 3.0305385 Lenain 22.054957021 1.4248842 11.5981499 Berthelot 0.207116007 5.2930348 8.0465729 StLouis 57.176353374 1.2292730 7.2447263 2 PElluard 29 23 23 8 PU ClFabien PElluard 1.617872708 3.8801281 25.0658566 0.819290842 10.6960080 0.4042418 Dim 1 Dim 2 Dim 3 P 57.346623 3.097721 0.8459792 AB 6.224864 35.252295 28.2498885 B 28.890769 49.364765 0.2804462 TB 7.537745 12.285219 70.6236861 0.4 0.6 CA factor map Fidelis 0.2 Matisse ● Berthelot 0.0 Camus Lenain AB ● StLouis ● P ClFabien ● ● ● ● PElluard ● Politzer B ● −0.4 −0.2 TB −0.6 Dim 2 (7.276%) ● −0.5 0.0 Dim 1 (89.49%) 3 0.5 1. Donner une interprétation des deux premiers axes. 2. Pensez-vous qu’il y a une différence entre les collèges privés et publics? 3 Perception des professions On veut mieux connaı̂tre la perception des personnes sympathiques. Pour cela on a interrogé des personnes dans la population française appartenant à 8 catégories professionnelles : paysan (pays), ouvrier (ouvr), vendeur (vend), commerçant (comm), employé (empl), technicien (tech), universitaire (univ), profession libérale (libe). Elles avaient à choisir 3 qualités pour définir un homme sympathique parmi une liste de 9 : sérieux (seri), généreux (gene), gai (gai), honnête (honn), intelligent (intl), serviable (serv), courageux (cour), compréhensif (comp) et discret (disc). Le tableau suivant donne un résumé des réponses : pays ouvr vend comm empl tech univ libe total seri gene gai honn intl serv cour comp disc total 20 9 9 27 10 16 20 4 8 123 42 10 22 51 18 28 38 12 22 243 11 2 5 14 8 7 5 8 6 66 8 9 12 23 14 16 14 12 12 120 19 10 16 52 32 25 22 25 30 231 10 5 12 23 20 13 11 13 10 117 2 8 7 6 15 6 6 9 4 63 8 42 23 24 46 22 22 34 16 237 120 95 106 220 163 133 138 117 108 1200 1. Peut-on dire avec un risque de se tromper de 1% que pour un un ouvrier il est plus courant de penser qu’un homme sérieux est sympathique que pour un paysan? On rappelle que P (N (0, 1) > 2.33) = 0.01. 2. L’analyse des correspondances produit les valeurs propres non-triviales suivantes : λ1 λ2 λ3 λ4 λ5 λ6 λ7 0.0980 0.0220 0.0049 0.0030 0.0012 0.0009 0.0001 le tableau des contributions des colonnes pour les 5 premiers axes 4 principaux : Contributions seri gene gai honn intl serv cour comp disc 1 26.43 28.02 0.52 11.12 16.11 0.81 3.83 12.35 0.77 2 3 4 5 Cos2 1 2 3 4 5 10.03 36.21 13.05 0.13 seri 0.85 0.07 0.05 0.01 0.00 33.97 6.56 16.96 0.27 gene 0.76 0.20 0.01 0.01 0.00 0.66 2.30 28.65 32.04 gai 0.25 0.07 0.06 0.41 0.19 7.81 5.72 1.10 12.78 honn 0.82 0.13 0.02 0.00 0.01 4.53 13.83 8.07 32.86 intl 0.86 0.05 0.03 0.01 0.02 0.04 4.93 5.52 0.18 serv 0.51 0.01 0.15 0.11 0.00 14.87 7.43 10.19 0.15 cour 0.48 0.41 0.04 0.04 0.00 11.25 7.60 7.72 14.87 comp 0.78 0.16 0.02 0.01 0.01 16.80 15.39 8.70 6.67 disc 0.13 0.63 0.13 0.04 0.01 les tableau des contributions et des cosinus carrés des lignes pour les 5 premiers axes principaux : Cos2 1 2 3 4 Contributions 1 2 3 4 5 pays 9.59 21.42 2.47 0.00 41.99 pays 0.63 0.31 0.01 0.00 ouvr 26.30 11.56 1.31 3.02 15.58 ouvr 0.89 0.08 0.00 0.00 vend 2.05 3.63 40.25 21.70 2.97 vend 0.36 0.14 0.35 0.11 comm 0.02 0.98 22.64 9.80 26.14 comm 0.01 0.01 0.50 0.01 empl 0.71 40.83 12.64 9.87 7.20 empl 0.06 0.83 0.05 0.03 tech 0.02 9.73 11.42 2.80 2.65 tech 0.01 0.58 0.15 0.22 univ 11.38 0.00 9.07 19.81 2.82 univ 0.90 0.00 0.04 0.04 libe 49.91 11.82 0.16 10.44 0.61 libe 0.94 0.05 0.00 0.00 (a) Interpréter les deux axes factoriels (quelles sont les modalités qui les définissent). (b) Quelles sont les modalités (lignes et colonnes) qui sont particulièrement bien représentées par le premier plan factoriel? Quelles sont celles qui sont particulièrement mal représentées? 3. La projection des points lignes et des points colonnes sur le premier plan factoriel est la suivante : (a) Que peut on déduire du fait que les ouvriers et les paysans sont proches sur le graphique? Même question pour les vendeurs et “honnête” ainsi que“commerçant” et “gai” . (b) Quelles sont les professions qui ont les jugements les plus éloignés ( justifier votre réponse). 5 5 0.00 0.01 0.01 0.14 0.01 0.01 0.00 0.00 0.4 0.6 CA factor map 0.2 pays seri ● cour ouvr● ● 0.0 serv libe gai ● ● univ ● comm −0.2 honn ● intl vend ● tech ● disc comp empl −0.4 Dim 2 (16.76%) gene −0.6 −0.4 −0.2 0.0 0.2 Dim 1 (75.50%) 6 0.4 0.6