1 Lien entre couleur des yeux et des cheveux

Transcription

1 Lien entre couleur des yeux et des cheveux
Master d’économie
Cours de J. Rynkiewicz
Sondage et analyse de données
Université Paris 1
Analyse des correspondances
1
Lien entre couleur des yeux et des cheveux
On considère la table de contingence suivante :
Couleur
des
yeux
marron
noisette
bleu
Couleur
brun
68
15
25
des
châtain
145
68
144
cheveux
blond
7
10
110
1. Quelles sont les tables des fréquences, profils lignes et profils colonnes
2. On admettra que la matrice S (relative aux points lignes) est :
0.24 0.19 0.11
0.64 0.62 0.54
0.13 0.19 0.35
Montrer que u1 = (−0.22, −0.17, 0.39)T et u2 = (−0.32, 0.46, −0.14)T
sont vecteurs propres de S, pour des valeurs propres non triviales :
λ1 = 0.196 et λ2 = 0.008.
3. On admettra que la matrice T (relative aux points colonnes) est :
0.46 0.40 0.29
0.17 0.17 0.14
0.36 0.43 0.57
Montrer que u1 = (−0.42, −0.07, 0.49)T et u2 = (0.25, −0.36, 11)T sont
vecteurs propres de T. Quelles sont les valeurs propres associées?
4. Quelles sont les coordonnées factorielles des profils lignes et des profils
colonnes?
5. Calculer les contributions. Comment pouvez-vous interpréter les axes?
6. Calculer les cosinus carrés relatifs aux profils lignes. En déduire les
profils lignes les mieux représentés par chaque axe.
1
2
Collèges
On dispose des mentions (Passable, Assez Bien, Bien, Très bien) au brevet
des collèges pour certains collèges publics (PU) ou bien privés (PR):
Fidelis
P
20
AB
18
B
4
TB
6
TYPE PR
Camus Politzer Matisse
48
33
29
27
9
25
11
9
13
3
3
9
PU
PU
PR
Lenain
45
15
5
1
PU
Berthelot
39
29
17
11
PU
StLouis
20
73
70
25
PR
ClFabien
49
25
21
11
PU
On réalise une analyse des correspondances et on obtient les résultats suivants pour les cosinus carrés :
Fidelis
Camus
Politzer
Matisse
Lenain
Berthelot
StLouis
ClFabien
PElluard
P
AB
B
TB
Dim 1
0.153682395
0.862101090
0.829681984
0.008112994
0.976320729
0.223136071
0.993713539
0.569870123
0.480934097
Dim 1
0.9950992
0.6156049
0.8777513
0.6797894
Dim 2
0.838228467
0.004728559
0.153077067
0.890789888
0.005128444
0.463639729
0.001737052
0.111121318
0.510492032
Dim 2
0.004370394
0.283451908
0.121940853
0.090081504
Dim 3
0.008089138
0.133170351
0.017240949
0.101097118
0.018550826
0.313224201
0.004549409
0.319008558
0.008573871
Dim 3
0.0005304036
0.1009432283
0.0003078578
0.2301291153
et pour les contributions :
Dim 1
Dim 2
Dim 3
Fidelis
0.686373251 46.0446161 0.9998855
Camus
9.077011891 0.6123416 38.8064586
Politzer
8.352237708 18.9531561 4.8035699
Matisse
0.008787198 11.8665580 3.0305385
Lenain
22.054957021 1.4248842 11.5981499
Berthelot 0.207116007 5.2930348 8.0465729
StLouis
57.176353374 1.2292730 7.2447263
2
PElluard
29
23
23
8
PU
ClFabien
PElluard
1.617872708 3.8801281 25.0658566
0.819290842 10.6960080 0.4042418
Dim 1
Dim 2
Dim 3
P 57.346623 3.097721 0.8459792
AB 6.224864 35.252295 28.2498885
B 28.890769 49.364765 0.2804462
TB 7.537745 12.285219 70.6236861
0.4
0.6
CA factor map
Fidelis
0.2
Matisse
●
Berthelot
0.0
Camus
Lenain
AB
●
StLouis
●
P
ClFabien
●
●
●
●
PElluard
●
Politzer
B
●
−0.4
−0.2
TB
−0.6
Dim 2 (7.276%)
●
−0.5
0.0
Dim 1 (89.49%)
3
0.5
1. Donner une interprétation des deux premiers axes.
2. Pensez-vous qu’il y a une différence entre les collèges privés et publics?
3
Perception des professions
On veut mieux connaı̂tre la perception des personnes sympathiques. Pour
cela on a interrogé des personnes dans la population française appartenant
à 8 catégories professionnelles : paysan (pays), ouvrier (ouvr), vendeur
(vend), commerçant (comm), employé (empl), technicien (tech), universitaire (univ), profession libérale (libe). Elles avaient à choisir 3 qualités
pour définir un homme sympathique parmi une liste de 9 : sérieux (seri),
généreux (gene), gai (gai), honnête (honn), intelligent (intl), serviable (serv),
courageux (cour), compréhensif (comp) et discret (disc). Le tableau suivant
donne un résumé des réponses :
pays
ouvr
vend
comm
empl
tech
univ
libe
total
seri gene gai honn intl serv cour comp disc total
20
9
9
27
10
16
20
4
8
123
42
10
22
51
18
28
38
12
22
243
11
2
5
14
8
7
5
8
6
66
8
9
12
23
14
16
14
12
12
120
19
10
16
52
32
25
22
25
30
231
10
5
12
23
20
13
11
13
10
117
2
8
7
6
15
6
6
9
4
63
8
42
23
24
46
22
22
34
16
237
120
95 106 220 163 133 138
117 108 1200
1. Peut-on dire avec un risque de se tromper de 1% que pour un un ouvrier
il est plus courant de penser qu’un homme sérieux est sympathique que
pour un paysan? On rappelle que P (N (0, 1) > 2.33) = 0.01.
2. L’analyse des correspondances produit les valeurs propres non-triviales
suivantes :
λ1
λ2
λ3
λ4
λ5
λ6
λ7
0.0980 0.0220 0.0049 0.0030 0.0012 0.0009 0.0001
le tableau des contributions des colonnes pour les 5 premiers axes
4
principaux :
Contributions
seri
gene
gai
honn
intl
serv
cour
comp
disc
1
26.43
28.02
0.52
11.12
16.11
0.81
3.83
12.35
0.77
2
3
4
5
Cos2
1
2
3
4
5
10.03 36.21 13.05 0.13 seri 0.85 0.07 0.05 0.01 0.00
33.97 6.56 16.96 0.27 gene 0.76 0.20 0.01 0.01 0.00
0.66 2.30 28.65 32.04 gai 0.25 0.07 0.06 0.41 0.19
7.81 5.72 1.10 12.78 honn 0.82 0.13 0.02 0.00 0.01
4.53 13.83 8.07 32.86 intl 0.86 0.05 0.03 0.01 0.02
0.04 4.93 5.52 0.18 serv 0.51 0.01 0.15 0.11 0.00
14.87 7.43 10.19 0.15 cour 0.48 0.41 0.04 0.04 0.00
11.25 7.60 7.72 14.87 comp 0.78 0.16 0.02 0.01 0.01
16.80 15.39 8.70 6.67 disc 0.13 0.63 0.13 0.04 0.01
les tableau des contributions et des cosinus carrés des lignes pour les
5 premiers axes principaux :
Cos2
1
2
3
4
Contributions
1
2
3
4
5
pays
9.59 21.42 2.47 0.00 41.99 pays 0.63 0.31 0.01 0.00
ouvr
26.30 11.56 1.31 3.02 15.58 ouvr 0.89 0.08 0.00 0.00
vend
2.05 3.63 40.25 21.70 2.97 vend 0.36 0.14 0.35 0.11
comm
0.02 0.98 22.64 9.80 26.14 comm 0.01 0.01 0.50 0.01
empl
0.71 40.83 12.64 9.87 7.20 empl 0.06 0.83 0.05 0.03
tech
0.02 9.73 11.42 2.80 2.65
tech 0.01 0.58 0.15 0.22
univ
11.38 0.00 9.07 19.81 2.82 univ 0.90 0.00 0.04 0.04
libe
49.91 11.82 0.16 10.44 0.61
libe 0.94 0.05 0.00 0.00
(a) Interpréter les deux axes factoriels (quelles sont les modalités qui
les définissent).
(b) Quelles sont les modalités (lignes et colonnes) qui sont particulièrement bien représentées par le premier plan factoriel? Quelles
sont celles qui sont particulièrement mal représentées?
3. La projection des points lignes et des points colonnes sur le premier
plan factoriel est la suivante :
(a) Que peut on déduire du fait que les ouvriers et les paysans sont
proches sur le graphique? Même question pour les vendeurs et
“honnête” ainsi que“commerçant” et “gai” .
(b) Quelles sont les professions qui ont les jugements les plus éloignés
( justifier votre réponse).
5
5
0.00
0.01
0.01
0.14
0.01
0.01
0.00
0.00
0.4
0.6
CA factor map
0.2
pays
seri
●
cour
ouvr●
●
0.0
serv
libe
gai
●
●
univ
●
comm
−0.2
honn
●
intl
vend
●
tech
●
disc
comp
empl
−0.4
Dim 2 (16.76%)
gene
−0.6
−0.4
−0.2
0.0
0.2
Dim 1 (75.50%)
6
0.4
0.6

Documents pareils