1 ACP et analyse factorielle après rotation varimax Le Monde

Transcription

1 ACP et analyse factorielle après rotation varimax Le Monde
1
ACP et analyse factorielle après rotation varimax
Le Monde Dossiers et Documents (n° 266, Juin 98) a consacré un dossier aux classes
sociales aujourd’hui. Dans un des articles consacrés à ce sujet figurait le tableau suivant
qui retrace pour 11 catégories de profession figurant en lignes le pourcentage de
personnes interrogées se sentant appartenir à l’une des 6 classes sociales proposées. (ex:
43% des agriculteurs se sont auto-décrits comme appartenant à la classe moyenne
inférieure). Les absences de réponses ne figurent pas dans ce tableau, ce qui explique
que les sommes par lignes ne soient pas égales à 100.
PRIVilégié
AGRIculteur
INDEpendant
AISE
Classe
Moyenne
SUpérieure
Classe
Moyenne
INférieure
CLasses
POpulaires
DEFAvoris
é
4,7
3,7
15
43
19,6
11,2
3,9
8,3
6,1
33,7
35,4
12,2
CAdre
SUpérieur
ENSeignanT
5,8
14,6
56,3
18,8
2,9
4
8,7
7,9
54,8
26,2
0
1,6
PRofessions
INtellectuelles
CONTremaitre
5,3
4,7
40,8
37,7
8,9
1,1
6,9
3,5
34,2
43,1
9,9
2
4,3
3,3
24,1
46,9
14,9
3,9
1,3
14,5
42,1
25
13,2
2,5
2,5
16,6
40,7
24,6
11,3
5
9,5
40,5
36,4
6,8
1,8
10,1
5,1
19,7
36,5
18,5
9,6
EMPLoyé
SERVices
OUVRiers
ETUDiants
FEmme au
FOyer
5,7
La première étape est de créer ce tableau de données, labels des variables, types (8.1).
On utilise une colonne supplémentaire labelig pour donner des noms aux professions
que l’on utilisera sur les graphiques :
2
La seconde étape est l’ACP proprement dite en utilisant le menu :
:
On choisit toutes les variables autres que labelig pour faire l’analyse:
L’ACP consiste à calculer de nouvelles variables, les facteurs, qui sont fonction des
anciennes et qui sont le plus informatives possibles à propos de l’ensemble des relations
entre variables initiales et des ressemblances-dissemblances entre lignes-professions.
Pour faire cela, on utilise à la base un indice qui mesure la quantité d’information
initiale dans le tableau. Cette quantité, pour des raisons que l’on comprend difficilement
sans une approche plus mathématique est égale à p=le nombre de variables=6. Chaque
facteur va traduire une partie de cette information. Pour choisir le nombre de facteurs
3
intéressants à analyser, on s’intéresse dans un premier temps à la quantité d’information
extraite par chacun d’entre eux.
Pour étudier cet aspect, on utilise dans un premier temps, la seule option
.
Par défaut les réglages sont les suivants:
Dans
, les valeurs propres (ou eigenvalues en anglais) correspondent
aux quantités d’information extraites par chacun des facteurs. Par défaut SPSS propose
de conserver tout facteur qui extrait une quantité d’information (valeur propre)
supérieure à 1. Ceci se comprend dans la mesure où une variable prise isolément est
porteuse d’une quantité d’information égale à 1. Un facteur qui extrait une quantité
d’information moindre que 1 est donc moins porteur d’information qu’une variable
prise isolément et par conséquence n’a en général pas grand intérêt. Par contre s’il porte
une information supérieure à 1, il est plus informatif qu’une variable prise isolément, et
donc peut avoir de l’intérêt.
Cette règle, logique, est cependant peu performante. En effet lorsque l’on a beaucoup
de variables, il y a un grand nombre de facteurs porteurs d’une quantité d’information
supérieure à 1 et donc par cette règle, on retiendra beaucoup de facteurs, dont le nombre
en rend l’interprétation souvent délicate. Au contraire, lorsqu’il y a peu de variables, on
a souvent qu’une seule valeur propre supérieure à 1 et donc on ne retiendra qu’un
facteur. Ceci est souvent dommage, car avoir un ou deux facteurs n’entraîne pas de
difficultés d’interprétation très différentes, et en avoir 2 reste de toute manière plus
informatif qu’en avoir 1 seul.
La première étape est donc de lui demander de produire les valeurs propres pour
qu’on les étudie et que l’on fixe sur cette base le nombre de facteurs que l’on va
souhaiter utiliser. Ce qui se fait en réglant comme ceci le menu ci-dessus:
4
Cela fait, on peut envoyer l’analyse. La première chose qui en sort est le graphique
des valeurs propres qui est un graphique qui présente par ordre d’importance les valeurs
propress associées aux facteurs (le 1er étant toujours celui associé à la plus grande):
Graphique des valeurs propres
5
4
3
Valeur propre
2
1
0
1
2
3
4
5
6
Numéro du facteur
ou encore, après transformation à l’aide de l’éditeur graphique de SPSS:
Graphique des valeurs propres
5
4
3
Valeur propre
2
1
0
1
2
Numéro du facteur
3
4
5
6
5
On voit qu’est associé au premier facteur une valeur propre de 4 et quelque càd qu’il
est porteur d’une quantité de 4,? d’information, soit 70% à peu près de l’info totale
présente dans le tableau (4,?/6). Le second est beaucoup moins informatif avec une
quantité d’à peu près 0,8, soit moins qu’une variable prise isolément. Le 3ème encore
moins et les derniers n’apportent quasiment aucune information.
On peut aller vérifier cela sur l’output:
Variance totale expliquée
Composante
1
2
3
4
5
6
Valeurs propres initiales
% de la
Total
% cumulés
variance
4,262
71,026
71,026
,826
13,759
84,785
,760
12,671
97,455
,118
1,962
99,418
,033
,550
99,967
,002
,033
100,000
Méthode d'extraction : Analyse en composantes principales.
Sous « Composante », on a le n° du facteur; lui correspond sous « Total » la quantité
d’information qu’il porte (4,26 pour le 1er; 0,83 pour le 2ème, ...); sous « % de la
variance » on a le % d’info contenue dans le tableau qui est extrait par ce facteur (71%
pour 1; 13,8% pour 2, ...) et enfin sous « % cumulées» figure le % cumulé d’info extrait
par les facteurs (par exemple, si on retenait 3 facteurs, alors le % d’info extrait serait de
97,5%).
Pour choisir combien de facteurs retenir, on a 2 règles:
1) On élimine les facteurs qui portent moins que 1, c’est-à-dire moins qu’une
variable prise isolément.
2) Il intervient généralement une voire plusieurs rupture de pente sur le graphique
des valeurs propres. C’est-à-dire que l’on passe d’un facteur représentant beaucoup
d’informations à un autre en représentant nettement moins. On s’arrêtera au facteur
précédant cette rupture de pente. Sur le graphique (a) ci-dessous on retiendrait donc
seulement les deux premiers facteurs. D’autres configurations sont aussi possibles, par
exemple un premier facteur qui représentera une relativement très forte part
d’information puis deux axes suivants qui représenteront une relative forte part, puis
une rupture de pente avec des valeurs propres suivantes qui se suivent et se ressemblent
((b) ci-dessous). On retiendra ici 3 valeurs propres (3 facteurs).
6
(a)
(b)
Exemples de courbes des valeurs propres associées à une analyse factorielle. Ces
valeurs sont égales à la somme des carrés des rapports de corrélation des
facteurs avec les variables. En (a) on retiendra 2 axes. En (b) on en retiendra 3.
Dans le cas qui nous concerne, les 2 règles coïncident: on devrait logiquement ne
retenir qu’un facteur. Cependant, on en retiendra en fait 2 car cela apporte un peu plus
d’information sans pour autant rendre l’interprétation beaucoup plus complexe (mais
nous sommes dans un cas très particulier car le tableau de données est très simple).
On peut ensuite réellement aller faire l’analyse Î retourner dans Analyse :
Factorisation : Analyse factorielle
propose plusieurs méthodes d’extraction. Pour faire une analyse
standard, on ne touchera pas à cette option. On enlèvera la croix dans Graphique des
valeurs propres (on a déjà utilisé ce graphique) et on demandera à retenir 2 facteurs,
d’après l’étape précédente. On demandera en plus l’option « Structure factorielle sans
rotation » qui permet d’obtenir sur le plan numérique les corrélations entre les variables
et les facteurs.
7
On pourra ensuite régler un certain nombre d’options :
Dans
, on pourra obtenir des statistiques descriptives de base sur
les variables Æ On prendra ici
qui donne moyennes et écarttypes et
inter-variables.
dans
qui donne la matrice des corrélations
permet d’utiliser une analyse avec rotation. Dans un premier temps,
on s’en passera pour étudier les associations entre variables sous forme de continuum.
La seule option que nous cocherons est
fourniture des plans factoriels associés aux variables.
Enfin
variables
qui correspond à la
permet d’avoir les scores des lignes (professions ici) sur les
que sont les facteurs. On cochera l’option
qui amène le logiciel à sauvegarder ces scores dans le
fichier initial à l’aide de nouvelles colonnes.
synthétiques
L’étape suivante est celle de l’interprétation du coté variable (catégorie). La première
chose est d’aller voir les moyennes et les variances dans l’output:
8
Statistiques descriptives
PRIV
AISE
CMSU
CMIN
CLPO
DEFA
Moyenne
5,9545
5,6545
31,8364
36,9818
13,0273
5,9455
Ecart-type
2,30103
3,79720
15,21041
8,13914
8,32155
4,53219
n analyse
11
11
11
11
11
11
Æ On voit que les classes pour lesquelles les % moyens de sentiment d’appartenance
sont les plus forts sont les classes moyennes: plus particulièrement inférieure et en
partie supérieure. Viennent ensuite les classes populaires puis les classes “honteuses”:
défavorisée, aisée et privilégiée.
En termes de variance, il est clair que plus les % moyens sont élevés et plus cela varie
et inversement. On notera quand même la variance particulièrement forte de CMSU
relativement à sa moyenne: il est clair que certaines professions ont dû particulièrement
éviter cette dénomination alors que d’autres y adhérent allègrement. Il en est un peu de
même pour CLPO.
Ces choses en tête, on peut aller ensuite regarder les corrélations inter-variables via le
graphique (plan 1-2) des corrélations des variables avec les 2 premiers facteurs. Le
graphique qui sort automatiquement pour celles-ci est:
Diagramme de composantes
1,0
priv
,5
cmin
clpo
0,0cmsu
defa
Composante 2
aise
-,5
-1,0
-1,0
-,5
0,0
,5
1,0
Composante 1
Celui-ci nous dit qu’il existe des corrélations fortement positives entre cmin, clpo et
defa avec le 1er facteur càd qu’à de fortes valeurs du facteur correspondent de fortes
valeurs de ces variables et vice-versa. Par un principe de transitivité, on en conclut que
ces variables sont fortement corrélées positivement, ce qui signifie que les professions
où l’on a le plus un sentiment d’appartenance à clpo par exemple sont aussi celles où on
a les plus forts sentiments d’appartenance à defa et cmin. Attention cependant ! Ceci ne
signifie pas que les professions qui ont de fortes coordonnées sur le facteur se sentent
9
très clpo ou defa par exemple (cf. les moyennes: ces 2 classes sont en moyenne très peu
représentées). Ceci signifie que les plus forts sentiments d’appartenance à ces classes
ont été donné par les mêmes professions, relativement aux autres professions (p.e.
11,2% d’agriculteur se sentent défavorisés,ce qui est moins par rapport aux 15% qui se
sentent dans cmsu, cependant, relativement aux autres professions (en moyenne), c’est
un score très important).
De même, il existe des corrélations fortement positives entre cmsu et aisé et dans une
moindre mesure avec priv: les professions se sentant les plus cmsu sont aussi celles qui
se sentent les plus aisé ou priv (ici aussi, cela ne signifie pas qu’elles se sentent
majoritairement priv ou aisé, mais que relativement aux autres professions, elles se
sentent parmi les plus priv ou aisé).
Les 2 paquets de variables étant opposés sur l’axe 1, il existe une corrélation
fortement négative entre les variables y participant: les professions répondant le plus
dans un des groupes sont aussi celles qui répondent le moins dans l’autre et vice-versa.
Enfin, priv se différencie sur l’axe 2: certaines professions se sentant à la fois aisé,
cmsu et priv se sentent plus particulièrement priv et celles-ci apparaîtront sur l’axe 2.
remarque:
Ceci souligne l’aspect marginal de cet axe qui ne porte de l’information intéressante
qu’à propos d’une des variables. C’est très souvent le cas en acp, où les axes d’ordre
éloigné traduisent une information très réduite. Ceci est apparent en général dès
l’observation de la courbe des valeurs propres.
Cette première interprétation peut être confirmée en jetant un coup d’œil sur la
matrice des corrélations. On y voit apparaître les 2 grands groupes de variables
corrélées de manière interne positivement et négativement d’un groupe à l’autre. On
voit que PRIV, bien que corrélée positivement avec cmsu et aisé l’est moins que le sont
ces deux variables entre elles; et bien que corrélée négativement aux variables de
l’autre groupe, l’est moins que ne le sont cmsu et aisé.
Matrice de corrélation
Corrélation
PRIV
AISE
CMSU
CMIN
CLPO
DEFA
PRIV
1,000
,282
,353
-,395
-,437
-,359
AISE
,282
1,000
,818
-,882
-,767
-,529
CMSU
,353
,818
1,000
-,805
-,966
-,839
D’autres informations apparaissent dans l’ouput:
CMIN
-,395
-,882
-,805
1,000
,690
,392
CLPO
-,437
-,767
-,966
,690
1,000
,899
DEFA
-,359
-,529
-,839
,392
,899
1,000
10
a) liste des corrélations variables-facteurs (-0,50153=correl entre facteur 1 et PRIV):
Matrice des composantes a
PRIV
AISE
CMSU
CMIN
CLPO
DEFA
Composante
1
2
-,502
,782
-,874
-,326
-,975
-,106
,839
,242
,963
-,047
,814
-,188
Méthode d'extraction : Analyse en composantes principales.
a. 2 composantes extraites.
b) Pour chaque variable, part de variances prise en compte par les 2 premiers facteurs
(Extraction) Î plus c’est élevé (proche de 1), mieux l’ensemble de l’information
contenue dans la variable (et ses relations avec les autres variables à forte Extraction)
est prise en compte.
Qualité de représentation
PRIV
AISE
CMSU
CMIN
CLPO
DEFA
Initial
1,000
1,000
1,000
1,000
1,000
1,000
Extraction
,863
,870
,962
,763
,930
,699
Méthode d'extraction : Analyse en composantes principales.
c) enfin le logiciel sauvegarde les facteurs dans le tableau de données sous la forme de
2 nouvelles variables:
Ce qui permet d’aller étudier sous forme d’un graphique bivarié les professions au
regard des variables qui les caractérisent:
11
Il faut régler ici les options pour que le graphique présente effectivement les étiquettes
des professions en cliquant sur
:
On obtiendra (après un petit travail sous l’éditeur graphique):
12
2,0
FEFO
1,5
CONT
INDE
1,0
ENSE
,5
PRIN
EMPL
0,0
AGRI
SERV
ETUD
-,5
facteur 1
-1,0
OUVR
-1,5
CASU
-2,0
-2,0
-1,5
-1,0
-,5
0,0
,5
1,0
1,5
2,0
facteur 2
L’interprétation se fait alors au regard de ce que l’on a dit pour les variables:
OUVR, SERV, AGRI et dans une moindre mesure EMPL sont les professions qui se
sentent parmi les plus DEFA, CLPO et CMIN. Il existe de petites variations à
l’intérieur de ce groupe: Parmi celles-ci, les OUVR sont ceux qui se sentent le moins
CMIN (descente le long de l’axe 2), il est aussi possible que leur sentiment très faible
par rapport aux autres professions de se sentir PRIV explique cette descente le long de
l’axe 2.
ENSE et CASU se sentent parmi les plus aisés et cmsu. L’aspect PRIV fait alors la
différence entre les 2: les ENSE font leur mea culpa alors que les CASU estiment
certainement qu’ils le méritent bien (donc ne sont pas PRIV).
Enfin, il y a un certain nombre de professions “intermédiaires” qui se sentent
manifestement très partagées entre ces divers postes: ETUD, PRIN plutôt cmsu et aisé
mais avec de forts pourcentages pour CMIN. INDE et CONTR très partagés entre
CMIN et CMSUP (un peu plus sup cependant) et enfin FEFO plutôt CMIN mais là
aussi très partagé. On voit que l’aspect PRIV joue un rôle finalement non négligeable
qui positionne ces indécis le long de l’axe 2: les Fefo se sentent, relativement aux autres
professions, plus priv, de même mais dans une moindre mesure les INDE et les CONT.
Les étudiants par contre sont plutôt peu nombreux (ici aussi par rapport aux % donnés
par les autres professions) à se sentir PRIV.
Dans certains cas, il est intéressant de pousser plus loin l’analyse en utilisant des
rotations qui appuient plus particulièrement sur les dimensions importantes. Utiliser une
rotation varimax est très simple dans SPSS: une fois que l’analyse précédente a été
faite, il suffit de la refaire en utilisant dans la partie
l’option:
du menu principal
et en demandant à nouveau de sauvegarder les facteurs qui en sont issus.
13
Les résultats au niveau graphiques (mêmes procédures que pour l’analyse sans
rotation) sont alors les suivants:
Pour les variables-classes sociales:
Diagramme de composantes dans l'espace après rotation
1,0
priv
,5
cmsu
aise
Composante 2
0,0
cmin
defa
-,5
-1,0
-1,0
-,5
0,0
,5
clpo
1,0
Composante 1
Pour les individus-professions (qu’il faudrait retravailler pour avoir des formats
correspondant aux échelles):
14
1,5
FEFO
ENSE
INDE
CONT
1,0
,5
PRIN
0,0
EMPL
ETUD
-,5
AGRI
CASU
SERV
facteur 1
-1,0
OUVR
-1,5
-2,0
-2,5
-2,0
-1,5
-1,0
-,5
0,0
,5
1,0
1,5
facteur 2
On voit ici que cette analyse diffère peu de la précédente si ce n’est qu’elle a
“orthogonalisé” la variable PRIV par rapport aux autres groupes; ce qui apparaît à la
limite comme regrettable ici car c’est une variable qui n’est pas du tout indépendante
des autres. Ainsi par exemple, les ENST se sentent d’abord CMSU et ensuite seulement
priv, ce qui n’est pas évident à lire ici.
On utilisera donc ce type de rotations lorsque les associations entre variables sont si
imbriquées que l’analyse en est rendu difficile et qu’un autre point de vue sur les
données “éliminant” les associations les plus faibles pour ne garder que les plus
importantes peut s’avérer utile pour l’interprétation.
Remarque: les rotations ne donnent pas le même résultat selon le nombre de facteurs
retenus. D'où la nécessité encore plus grande de bien choisir son nombre de facteurs. En
général, la règle de décroissance des valeurs propres permet de bien faire ressortir les
dimensions importantes. Pour de petits fichiers, retenir les facteurs de valeurs propres
supérieures à 1 amène, sauf cas particulier, au même résultat. Pour de gros fichiers, la
première règle amène en général à retenir moins de facteurs que la seconde. Le résultat
en est souvent qu’au niveau des rotations, on fera ressortir avec la seconde soit des
facteurs redondants càd que certaines variables auront une expression au niveau de
plusieurs facteurs-dimensions mis en évidence par la rotation ou encore que certaines
variables s’exprimeront seules sur des facteurs-dimensions mises en évidence. Il n’y a
cependant pas de règle unique et la meilleure stratégie est de creuser dans ses données
en faisant éventuellement tourner plusieurs fois les analyses en retenant des nombres
différents de facteurs à chaque fois. Pour des solutions concurrentes, comme
d’habitude, l’outil statistique s’efface devant l’argumentation expérimentale.
15
ACP sur les lignes
Bien que ceci ne soit pas tout à fait orthodoxe, nous pouvons inverser le rôle des
professions et des classes d’appartenance pour réaliser une seconde ACP. Ceci nous
permettra un second point de vue sur les observations. Pour obtenir cette analyse, il faut
d’abord transposer le tableau à l’aide de:
On obtient alors le tableau:
dans lequel les colonnes correspondent maintenant aux professions et seront traitées en
tant que variables dans l’ACP future et les lignes sont les classes sociales qui seront
traitées en tant qu’individus. La colonne case-lbl permet de conserver les étiquettes
initiales des classes sociales pour les graphiques. Les mêmes procédures que
précédemment amènent aux graphiques et résultats suivants:
16
Statistiques descriptives
AGRI
INDE
CASU
ENSE
PRIN
CONT
EMPL
SERV
OUVR
ETUD
FEFO
Moyenne
16,2000
16,6000
17,0667
16,5333
16,4167
16,6000
16,5333
16,6667
16,3667
16,6667
16,5833
Ecart-type
14,45503
14,18196
20,23222
20,92861
17,88568
17,52575
16,87716
15,04748
14,63006
17,10715
11,24925
n analyse
6
6
6
6
6
6
6
6
6
6
6
Les moyennes ont peu d’intérêt car il s’agit d’un % moyen de réponse dans les
diverses classes, qui est à peu près égal à 100/6=16,6667. Les indécis ne figurant pas
dans le tableau, ces % moyens devraient être proches mais inférieurs à ce nombre. On
voit que l’un d’entre eux dépasse: 100% des CASU ont répondu, ce qui permet de
souligner certainement une erreur de saisie (même au Monde !), dont on supposera
qu’elle n’a pas trop d’incidence sur les interprétations que l’on pourra faire.
Les variances, qui soulignent les sentiments plus ou moins homogènes des professions
sont plus intéressantes: les fefoy sont les moins identifiées à une classe particulière (Î
des scores qui pour chaque classe, ne s’éloignent en moyenne pas trop de la moyenne
Î une faible variance), viennent ensuite les INDE, AGRI, CASU,...;, les CASU et
ENST sont ceux qui ont les choix (ou les évitements) les plus ciblés => certains postes
sont très éloignés de la moyenne des réponses, ce qui crée de la variance. Evidemment
ces réflexions s’appuient à la fois sur les variances et sur le tableau initial.
Les valeurs propres soulignent la présence d’un facteur très important (77,4% de
l’ensemble de l’info portée par les professions est traduite par ce facteur), puis d’un
autre nettement moins (21,5%) mais qui se détache cependant nettement des suivants
(0,8%; 0,3%,...) Î on gardera ici aussi 2 facteurs.
Graphique des valeurs propres
10
8
6
4
Valeur propre
2
0
-2
1
2
3
Numéro de composant
4
5
6
7
8
9
10
11
17
Variance totale expliquée
Extraction Sommes des carrés des
facteurs retenus
Valeurs propres initiales
% de la
% de la
Composante
Total
% cumulés
Total
% cumulés
variance
variance
1
8,516
77,420
77,420
8,516
77,420
77,420
2
2,362
21,468
98,888
2,362
21,468
98,888
3
,085
,774
99,662
4
,028
,257
99,919
5
,009
,081
100,000
6
5,54E-16 5,035E-15
100,000
7
9,37E-17 8,519E-16
100,000
8
7,96E-17 7,240E-16
100,000
9
-2,5E-16 -2,23E-15
100,000
10
-4,6E-16 -4,14E-15
100,000
11
-7,6E-16 -6,90E-15
100,000
Méthode d'extraction : Analyse en composantes principales.
Les corrélations soulignent que toutes les professions ont à peu près répondu de la
même manière (corrélations fortement positives avec le premier axe Î corrélations
positives entre professions). L’axe 2 permet cependant d’éclater un peu ces professions:
CASU et ENST vers le haut; OUVR, AGRI, SERV vers le bas: ces deux grands
groupes sont ceux qui ont répondu de la manière la plus différenciée. Au milieu
viennent les autres professions qui peuvent tendre plutôt vers un groupe ou plutôt vers
l’autre.
Diagramme de composantes
1,0
casu
ense
,5
etud
prin
inde
cont
0,0
empl
Composante 2
fefo
agri
ouvr
serv
-,5
-1,0
-1,0
-,5
Composante 1
0,0
,5
1,0
18
Matrice de corrélation
AGRI
INDE
CASU
ENSE
PRIN
CONT
EMPL
SERV
OUVR
ETUD
FEFO
AGRI
1,000
,740
,121
,284
,670
,801
,951
,983
,982
,619
,971
INDE
,740
1,000
,733
,845
,993
,991
,907
,671
,723
,975
,855
CASU
,121
,733
1,000
,972
,804
,656
,401
,045
,129
,839
,283
ENSE
,284
,845
,972
1,000
,898
,789
,556
,197
,269
,917
,454
PRIN
,670
,993
,804
,898
1,000
,975
,861
,595
,654
,991
,794
CONT
,801
,991
,656
,789
,975
1,000
,946
,725
,767
,956
,898
EMPL
,951
,907
,401
,556
,861
,946
1,000
,897
,920
,827
,982
SERV
,983
,671
,045
,197
,595
,725
,897
1,000
,994
,527
,944
OUVR
,982
,723
,129
,269
,654
,767
,920
,994
1,000
,592
,955
ETUD
,619
,975
,839
,917
,991
,956
,827
,527
,592
1,000
,738
La carte factorielle 1-2 des lignes classes sociales permet de conclure: L’axe 1 est
essentiellement déterminé par l’opposition classes moyennes-autres classes: toutes les
professions se reconnaissent majoritairement dans les classes moyennes et très peu dans
les classes “extrêmes”. Le second axe nuance les choses essentiellement en mettant en
évidence que CMIN est plus particulièrement choisie par AGRI, OUVR, EMP, SERV
et CMSU par ENST et CASU; les autres professions jouant des rôles intermédiaires ici.
De plus CLPO se trouve du côté de CMIN (ainsi que dans une moindre mesure DEFA
et inversement pour PRIV et AISE): cette classe se caractérise principalement par de
forts choix des AGRI, OUVR, ...
2,0
CMSU
1,5
1,0
,5
AISE
PRIV
0,0
facteur 2
DEFA
-,5
CMIN
CLPO
-1,0
-1,0
-,5
0,0
,5
1,0
1,5
2,0
facteur 1
Pour ne pas conclure, on peut dire que ces deux analyses se révèlent très
complémentaires:
-la première souligne l’opposition classique “sentiment de richesse ”-“sentiment de
pauvreté” ainsi qu’une dimension qui, bien que se trouvant majoritairement du côté des
“riches” a aussi une expression du côté des “pauvres”: le sentiment d’être privilégié
tient à priori surtout à des conditions de travail annexes au côté purement matériel des
choses: (à priori indépendance pour les INDE; culpabilité et rôle bien intégré pour
FEFO; culpabilité pour les ENST; mélange des genres chez les CONT; ...).
FEFO
,971
,855
,283
,454
,794
,898
,982
,944
,955
,738
1,000
19
-la seconde souligne combien les antagonismes sont faibles: tout le monde se sent CM
et ce n’est que sur les marges que certaines professions ont des identifications plus
fortes (OUVR et CLPO ou DEFA; CASU et AISE;...). On retrouvait cela, mais de
manière beaucoup moins détaillée en analysant les moyennes initiales pour les classes
sociales.
Les deux points de vue sur les données se révèlent donc assez informatifs. Le premier
amène à une typologie des professions en fonction des classes sociales; le second à une
typologie des classes sociales en fonction des professions.