une comparaison entre modèles d`analyse factorielle no

Transcription

une comparaison entre modèles d`analyse factorielle no
Texte préparé pour les
16èmes Journées de psychologie différentielle
Université du Luxembourg
15-17 septembre 2004
Structure interne d’un inventaire d’Estime de Soi :
une comparaison entre méthodes d’analyse factorielle exploratoire
pour données dichotomiques
Jacques Juhel 1
Université Rennes 2
L’application du modèle en facteurs communs (AF) à des corrélations de Pearson
réduites à des coefficients phi dans le cas de données dichotomiques conduit souvent à
une surestimation du nombre de facteurs (niveaux communs de difficulté ou de
sévérité), à une sous-estimation des saturations et à des tests de signification et des
erreurs-type biaisés (Kubinger, 2003 ; Woods, 2002). Malgré ces limites, les
méthodes traditionnelles d’analyse factorielle exploratoire restent encore d’usage
fréquent dans l’étude de la structure interne de tests ou de questionnaires constitués
d’items de type binaire. Des méthodes alternatives d’analyse factorielle pour données
dichotomiques sont pourtant disponibles. C’est en particulier le cas de l’analyse
factorielle des corrélations tétrachoriques (Christoffersson, 1975 ; Muthén, 1978), de
l’analyse factorielle non linéaire (McDonald, 1967) et de l’analyse factorielle à
information complète (Bock et Aitkin, 1981). Les caractéristiques essentielles de ces
modèles sont d’abord brièvement présentées. Ceux-ci sont ensuite appliqués à l’étude
exploratoire de la structure interne d’un questionnaire d’estime de soi (18 items
dichotomiques) appliqué à 186 participants. Les résultats montrent que les estimations
fournies sont à peu de choses près les mêmes quel que soit le modèle, le modèle de
McDonald paraissant sur cet ensemble de données un peu plus robuste que les deux
autres.
1
Groupe de recherche en psychologie différentielle – Laboratoire de psychologie expérimentale Centre de Recherche Psychologie, Cognition, Communication - Université Rennes 2 - Place du Recteur
Henri Le Moal - CS 24307 - 35043 Rennes cedex. Courriel : [email protected]
Jacques Juhel
16èmes Journées de psychologie différentielle
Modèles d’analyse factorielle pour données dichotomiques
L’analyse factorielle des corrélations tétrachoriques
Les modèles d’analyse factorielle pour données dichotomiques ne peuvent pas,
comme les modèles d’analyse factorielle pour données continues, faire l’hypothèse
d’un processus de réponse directement observable. Cette hypothèse est remplacée par
celle d’une fonction de réponse continue non observable yij dichotomisée en un score
observé 1 ou 0 selon que le niveau de compétence de l’individu i est inférieur ou
supérieur à un certain seuil2 γ j pour l’item j soit :
1 si yij ≥ γ j
xij = 
0 si yij < γ j
Dans un tel modèle factoriel, cette variable latente, continue et normale par hypothèse,
est définie comme une combinaison linéaire de m variables latentes θki de distribution
normale, pondérées par les saturations λ jk soit :
yij = λ j1θ1i + λ j 2 θ 2i + ... + λ jm θ mi + δi
Les mêmes techniques d’analyse factorielle sont donc applicables aux estimations des
corrélations entre les fonctions de réponse yij . Ces corrélations tétrachoriques peuvent
être calculées à l’aide par exemple du programme PRELIS (fourni avec LISREL
8.50 ; Jöreskog et Sörbom, 2001) qui permet d’évaluer le respect des hypothèses soustendant la procédure d’estimation3 (Muthén et Hofacker, 1988), leur non respect
pouvant biaiser la solution factorielle (Reckase et al., 1985).
La méthode la plus immédiate est celle des moindres carrés non pondérés (ULS).
Celle-ci est robuste, peu sensible au non respect de l’hypothèse de normalité du trait
latent mais ne fournit ni estimation des erreurs-type de mesure, ni test statistique
permettant de juger de l’ajustement du modèle. Elle postule en outre que les
corrélations entre items sont indépendantes et ont une variance d’erreur constante.
Cette hypothèse étant peu réaliste, Christoffersson (1975) puis Muthén (1978, 1984)
ont proposé un modèle d’analyse moins étroitement linéaire dans lequel les
paramètres du modèle normal en trait latent sont estimés avec la méthode des
moindres carrés pondérés (WLS) -la matrice de pondérations contient les variances et
covariances des corrélations tétrachoriques- afin de corriger l’hétérogénéité des
variances d’erreur et les dépendances entres corrélations.
Le programme Mplus (Muthén, 2002 ; Muthén et Muthén, 1998-2004) est
actuellement le plus intéressant pour effectuer une AFWLS exploratoire de données
dichotomiques. Il offre aussi, entre autres avantages, des procédure d’estimation plus
robustes que WLS (WLSM : moindres carrés ajustés à la moyenne ; WLSMV :
moindres carrés ajustés à la moyenne et la variance) qui ne nécessitent pas l’inversion
de la matrice de pondérations, souvent définie non positive. L’ajustement du modèle
2
Le seuil d’un item dichotomique est l’écart normal spécifiant l’aire sous la courbe normale égale au
pourcentage de réponses incorrectes à l’item.
3
Trait latent continu, distribué normalement ; normalité de distribution, indépendance et homogénéité
de variance des erreurs.
2
Jacques Juhel
16èmes Journées de psychologie différentielle
peut être évalué au moyen de divers indices. Le RMSEA (Root Mean Square Error of
Approximation : mesure de la qualité de la reconstruction, par degré de liberté, de la
matrice de corrélations tétrachoriques par la matrice ajustée) rend compte de la
quantité d’information résiduelle. Des indices comparatifs permettant de juger de
l’ajustement du modèle sont également fournis (comparaison entre le modèle testé et
le modèle nul ajusté aux degrés de liberté avec le CFI : Comparative Fit Index et le
TLI ou NNFI : Tucker Lewis Index). L’ajustement est considéré comme acceptable
lorsque CFI ≥ .95, TLI ≥ .95 et RMSEA ≤.08 (Hu et Bentler, 1995). Signalons
également que Mplus offre plusieurs méthodes d’estimation de modèles pour données
incomplètes (estimation optimale des données manquantes par maximum de
vraisemblance à information complète), ce qui constitue un atout précieux lorsque les
effectifs n’atteignent pas le minimum souhaité (200 sujets au moins).
L’analyse factorielle non linéaire
Ce modèle d’analyse (AFNL) a été proposé par McDonald (1967, 1982, 1997). Les
postulats en sont les mêmes que dans l’AFWLS : fonctions de réponse à l’item à ogive
normale, erreurs de mesure multinormales, existence de dépendances statistiques entre
items d’ordre supérieur à 2 (indépendance locale faible4). Le modèle à 2 paramètres
définit la probabilité de bonne réponse de l’individu i à l’item j par l’équation :
(
)
(
P xij = 1 θi = N β j 0 + β j1θ1i + ... + β jk θ ki
)
avec N(.) la fonction ogive normale, β jk élément de la matrice de structure B = [β jk ] et
k facteurs standardisés θ ki . Il peut être représenté sous la forme d’une régression
polynomiale infinie des données sur les facteurs5, McDonald ayant démontré que 4
termes suffisent pour approximer le modèle à ogive normale.
L’AFNL peut être mise en œuvre à l’aide du programme NOHARM (Normal Ogive
Harmonic Analysis Robust Method; Fraser et McDonald, 1988 ; Fraser, 1998).
L’information analysée est la matrice de moment-produit6 de l’échantillon. Les
paramètres du modèle sont estimés par minimisation d’une fonction des moindres
carrés non pondérés (ULS) des proportions marginales de 1er de 2nd ordre. Les seuils tj
et les saturations f jk des items sont déduits des estimations des paramètres β jk et des
covariances entre facteurs. L’ajustement du modèle et le respect du principe
d’indépendance locale peuvent être évalués en examinant la matrice résiduelle des
covariances entre items et les indices d’ajustement fournis par le programme, le
RMSR (Root Mean Square of Residuals) et le GFI (Tanaka index of goodness of fit).
L’exigence d’indépendance locale est faible (resp. forte) si les k composantes de θ rendent
théoriquement compte de toutes les covariances entre items (resp. de toutes les relations entre les
probabilités de bonne réponse aux items).
5
La fonction ogive normale permet le développement de séries harmoniques du type :
P( xij = 1 | θ i ) = f j 0 + f j1θ i + f j 2 θ i2 + ... où fjk est la saturation du facteur f sur l’item j.
6
La matrice de moment-produit est obtenue en multipliant la matrice de données binaires par sa
transposée.
4
3
Jacques Juhel
16èmes Journées de psychologie différentielle
L’analyse factorielle à « information complète »
Les modèles correspondants, strictement non linéaires, sont basés sur les Modèles
Multidimensionnels de Réponse à l’Item (MMRI). On cherche cette fois à reproduire
toute l’information de la matrice de données binaires (exigence d’indépendance locale
forte) et non plus seulement les corrélations tétrachoriques ou la matrice de momentproduit. Par exemple, dans le MMRI à ogive normale à 2 paramètres qui offre
l’avantage d’être en lien direct avec la théorie classique des tests (Embretson et Reise,
2000), la probabilité P(xij=1) pour que l’individu i réponde affirmativement à l’item j
est représentée par l’équation :
∞
-[1/ 2]t
P(xij =1θ) = 1
e
dt ,
∫
2π − (θi −b j ) / σ j
2
où σj = 1/aj est la dispersion de l’item, aj est la puissance discriminante de l’item (la
proportion de changement de la probabilité de répondre affirmativement en fonction
des changements du niveau en trait latent des individus), bj la difficulté de l’item et θi
le niveau de l’individu i par rapport au trait latent continu. Le logit, zj = aj(θi - bj) s’écrit
sous la forme zj = ajθi + cj où aj est la pente et cj = - ajbj l’intercept de l’item.
Dans l’extension multidimensionnelle de ce modèle (Bock, Gibbons et Muraki, 1988),
le logit zj devient alors :
zj = Σkajkθik + cj,
où les ajk sont les paramètres de discrimination de l’item par rapport aux traits latents
(k=1,2,…m), cj est l’intercept de l’item et les θik sont les niveaux de l’individu i par
rapport aux traits latents. Les paramètres du modèle factoriel peuvent en être aisément
dérivés, les relations entre les paramètres aj et cj d’une part, les saturations αjk et la
difficulté standardisée δj de l’item j d’autre part étant définies par :
α jk =
a jk
c
, δ j = j k =1,2,...m, avec d j = 1+a 2j1+a2j2 +...+a 2jm ,
dj
dj
où ajk est la pente de l’item j par rapport à la dimension k et cj son intercept.
Le modèle à ogive normale à 2 paramètres est implémenté dans le programme
TESTFACT (Wilson, Wood et Gibbons, 1991). Le programme effectue tout d’abord
une analyse en facteurs principaux (ULS) sur la matrice de corrélations tétrachoriques
-si nécessaire préalablement transformée par «lissage» en une matrice définie positive
(Knol et Berger, 1991)- afin de disposer d’estimations initiales pour la suite de la
procédure. Le modèle à ogive normale à 2 paramètres est ensuite ajusté à l’aide de la
méthode du maximum de vraisemblance marginale (MML). Le principe général est
d’estimer de manière conjointe les valeurs –inconnues- des paramètres d’items et de
loi du trait latent θ qui maximisent la vraisemblance de l’ensemble des observations
relatives au modèle. L’estimation qui nécessite d’intégrer des paramètres sur une
distribution normale divisée en plusieurs intervalles représentés chacun par une
certaine valeur -le point de quadrature- et sur lesquels on attend une certaine
4
Jacques Juhel
16èmes Journées de psychologie différentielle
probabilité de réalisation -le poids de quadrature- repose sur une procédure itérative
d’optimisation numérique par espérance maximum (EM). TESTFACT fournit pour
chaque item une estimation de l’intercept, du seuil, de la pente, de la difficulté
standardisée, de la communauté et de la saturation. Plusieurs pentes et saturations sont
estimées par item dans le cas multidimensionnel. On peut aussi obtenir les estimations
des rotations Varimax et Promax. L’emploi de la méthode MML offre la possibilité de
calculer un χ2 du rapport de vraisemblance (G2) associé à des degrés de liberté dont le
nombre est fonction du nombre d’items et de la dimensionnalité du modèle. Le gain
d’ajustement apporté par l’introduction d’un facteur supplémentaire peut alors être
mesuré par un G2 partiel (distribué comme le χ2) dont la signification statistique peut
être évaluée.
Comparaison entre méthodes
Ces trois modèles d’analyse factorielle pour données binaires sont plus proches les
uns des autres qu’ils n’y paraissent. Bien que les procédures employées soient
différentes, les modèles de Christoffersson, Muthén et McDonald s’inspirent
clairement d’une même conception générale. D’une certaine façon, ces modèles sont
des approximations du modèle plus général qu’est l’analyse factorielle à information
complète (McLeod, Swygert et Thissen, 2001). Takane et de Leeuw (1987) ont
d’ailleurs apporté la preuve de la similitude formelle entre l’analyse factorielle à
information complète (AFMMRI) et l’AFWLS pour le modèle à ogive normale à 2
paramètres (voir Glöckner-Rist et Hoijtink, 2003, pour une comparaison entre AF et
MRI).
La comparaison des résultats obtenus avec l’une ou l’autre de ces méthodes avec ceux
de l’AF traditionnelle a été l’objet de plusieurs recherches. A l’exception de celle de
Parry et McArdle (1991) qui soulignent le bon comportement (y compris pour des
effectifs de petite taille et des données –simulées- dissymétriques) de l’AF de
corrélations phi ou de corrélations tétrachoriques calculées à partir des fréquences
marginales, les études effectuées démontrent en général la supériorité des modèles
d’analyse factorielle pour données binaires. Woods (2002) par exemple analyse les
réponses de 1080 participants au Maudsley Obsessional Compulsive Inventory. Les
résultats montrent une invariance de structure quelle que soit la méthode utilisée mais
des saturations et des corrélations entre facteurs plus fortes avec l’AFWLS ou l’AFMMRI
qu’avec l’AF traditionnelle.
Quelques études ont également comparé ces méthodes entre elles, généralement à
partir de données simulées. Knol et Berger (1988, 1991) concluent que l’AFWLS des
corrélations tétrachoriques est au moins aussi efficace que l’AFNL ou l’AFMMRI. Cette
opinion est partagée par De Champlain (1999), Ferrando et Lorenzo Seva (2001) ou
Woods (2002) à propos de l’AFWLS et de l’AFMMRI. Quelques résultats récents
semblent cependant démontrer une certaine supériorité de l’AFNL tant du point de vue
des possibilités d’application à des effectifs réduits (100 sujets ; Maydeu-Olivares,
2001) que de la précision des estimations fournies (Finger, 2002). En tout état de
5
Jacques Juhel
16èmes Journées de psychologie différentielle
cause, la majorité des auteurs s’accorde à reconnaître que les résultats de ces
comparaisons dépendent très largement des caractéristiques des données soumises à
analyse. C’est pourquoi il nous a paru intéressant d’appliquer ces trois méthodes à un
même corpus de données d’observation (comparaison along a case study, Woods,
2002).
Méthode
Les données analysées sont les réponses fournies par 186 étudiants, tous inscrits à
l’Université Rennes 2 dans des filières autres que la psychologie (1ère et 2nde année), à
un questionnaire d’Estime de soi construit pour l’occasion. Présenté comme destiné à
mesurer la perception que l’on a de soi-même, le questionnaire comporte 18 items
dichotomiques dont 11 sont inversés (Tableau 1).
Les analyses factorielles exploratoires sont effectuées avec les logiciels suivants: a)
Mplus 3.01 (AFWLS : analyse factorielle WLS des corrélations tétrachoriques) ; b)
NOHARM 98 (AFNL : analyse harmonique du modèle à ogive normale) ; c)
TESTFACT 4.0 (AFMMRI : analyse factorielle à information complète). Les fichiers
génériques de commande sont présentés en annexe.
Résultats
Les statistiques descriptives apparaissent dans le tableau ci-dessous.
n° item
1
Il m’arrive de penser que les autres s’organisent beaucoup mieux que moi (I)
2
Il m’arrive de penser que je fais bonne impression à autrui.
3
4
Je pense que j’ai besoin de plus de confiance en moi. (I)
Il m’arrive de penser que les personnes avec lesquelles je suis sont heureuses d’être avec moi.
5
Je trouve que les gens aiment parler avec moi.
6
Il m’arrive d’avoir l’impression d’être une personne compétente, au moins autant que les autres.
7
Dans l’ensemble, je me trouve vraiment quelconque. (I)
8
J’ai l’impression de me faire marcher sur les pieds plus souvent que les autres. (I)
9
Je suis très tendu quand je suis avec des inconnus.(I)
10 Il m’arrive de penser que mes amis ont une très bonne opinion de moi.
11 Il m’arrive d’avoir l’impression que les gens ne m’aimeraient pas s’ils me connaissaient vraiment bien. (I)
12 Il m’arrive de souhaiter pouvoir avoir plus de respect pour moi-même. (I)
13 Il m’arrive de me sentir à part lorsque je sors. (I)
14 Je pense que mes ami(e)s me trouvent intéressant(e).
15 Avoir l’air ridicule aux yeux des autres est quelque chose dont il m’arrive d’avoir peur. (I)
16
Il m’arrive de penser que je suis une personne ennuyeuse.(I)
17 Je me dis que je suis quelqu’un dont la personnalité est agréable.
18 Il m’arrive de me sentir réellement inutile.(I)
oui (%)
23,30
80,60
70,40
86,00
88,20
83,90
29,50
18,30
40,90
76,90
14,80
11,00
18,30
90,30
41,90
11,80
90,90
12,40
rbis rpoint-bis
0,52 0,38
0,83 0,58
0,68 0,51
0,58 0,37
0,47 0,29
0,62 0,41
0,71 0,54
0,49 0,33
0,77 0,61
0,62 0,45
0,43 0,20
0,74 0,52
0,77 0,53
0,63 0,36
0,78 0,62
0,72 0,44
0,65 0,37
0,88 0,54
Tableau 1 – Statistiques descriptives fournies par TESTFACT (pourcentage de réponse
d’acquiescement, coefficients de corrélation bisérielle et point-bisérielle - N = 186).
6
Jacques Juhel
16èmes Journées de psychologie différentielle
Les coefficients de corrélation bisérielle7 sont relativement élevés (alpha de Cronbach
de 0,776), ce qui témoigne d’une homogénéité satisfaisante des items. La corrélation
tétrachorique moyenne est de 0,296.
Dimensionnalité du questionnaire
On effectue tout d’abord une analyse en facteurs principaux de la matrice des
corrélations phi entre les 18 items du questionnaire (logiciel SPSS). Celle-ci aboutit à
5 valeurs propres initiales supérieures à 1 (3,881 ; 2,067 ; 1,439 ; 1,211 ; 1,067),
résultat qui, classiquement, conduit à rechercher une solution à 5 facteurs. Les valeurs
propres de la matrice lissée des corrélations tétrachoriques sont ensuite calculées avec
TESTFACT (méthode ULS). Constatant que seules les 3 premières valeurs propres
sont supérieures à 1 (5,697 ; 2,152 ; 1,103), on choisit de n’examiner que les solutions
à 1, 2 et 3 facteurs, stratégie plus économique que celle suggérée par les résultats de
l’analyse factorielle de la matrice des corrélations phi.
L’AFWLS, l’AFNL puis l’AFMMRI sont ensuite respectivement appliquées à la matrice
de corrélations tétrachoriques (Mplus), la matrice de moment-produit (NOHARM) et
la matrice de données binaires (TESTFACT). Une solution oblique (rotation Promax)
est estimée dans le cas des modèles à 2 et 3 facteurs. La matrice de corrélations
tétrachoriques n’étant pas définie positive (échec de la méthode WLS), la méthode
d’estimation WLSMV, disponible sur Mplus, est utilisée pour en effectuer l’analyse.
Les problèmes éventuellement rencontrés et les indices d’ajustement fournis par
chaque programme pour chaque solution testée apparaissent dans le tableau 2.
Modèle
AFWLSMV
AFNL
AFMMRI
Nombre
Problèmes
de facteurs
d'estimation
1
non
2
non
3
Heywood: i11-F3
1
non
2
non
3
non
1
non
2
non
3
Heywood: i4-F2
χ
ddl
p
109,276
63,471
49,106
43
42
45
0,000
0,018
0,312
2
836,11
744,58
710,36
149
132
116
RMSEA RMSR
0,091
0,052
0,022
0,1847
0,1233
0,0904
0,0123
0,0082
0,0068
GFI
0,91
0,96
0,97
0,000
0,000
0,000
Tableau 2 – Indices d’ajustement fournis par Mplus (AFWLSMV), NOHARM (AFNL) et TESTFACT
(AFMMRI). Cas de Heywwod : item et facteur concerné (N = 186).
7
Le coefficient de corrélation bisérielle est une estimation de la relation entre le score total et le score,
par hypothèse normalement distribué, de l’échelle continue qui sous-tend les réponses d’assentiment ou
de désaccord à l’item. Celui-ci est fonctionnellement relié aux 2 paramètres d’item du modèle à ogive
normale c’est-à-dire à la pente ou discrimination aj et le seuil ou sévérité bj de l’item (Lord et Novick,
1968). Il présente aussi l’avantage d’être moins influencé par la sévérité de l’item que ne l’est le
coefficient classique de corrélation point-bisérielle.
7
Jacques Juhel
16èmes Journées de psychologie différentielle
L’examen des indices d’ajustement montre que la solution à 3 facteurs semble
reconstruire le mieux les données mais les modèles d’AFWLSMV et d’AFMMRI se
heurtent à des problèmes d’estimation, une saturation estimée étant à chaque fois
supérieure à 1 (cas de Heywood). L’AFNL apparaît donc sur cet échantillon de petite
taille comme une méthode plus robuste que l’AFWLSMV et l’AFMMRI, des problèmes
d’estimation n’étant rencontrés avec l’AFNL qu’à partir de la solution à 4 facteurs (cas
de Heywood : i11-F3). On remarquera cependant que le gain d’ajustement apporté par
le troisième facteur est modeste (faible baisse du RMSR, GFI supérieur au seuil
d’acceptabilité du modèle dans les 2 cas), la préférence pour une solution à 3 facteurs
dépendant alors des possibilités d’interprétation offertes. L’objectif étant ici de
comparer les résultats obtenus avec les 3 modèles, nous avons fixé à 2 le nombre des
facteurs de la solution factorielle.
Comparaison des résultats
Les estimations des saturations et des corrélations entre facteurs sont présentées dans
le tableau 3. Les résultats de l’analyse traditionnelle en facteurs communs
apparaissent également dans ce tableau.
F1
N° item
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
rF1F2
AFWLSMV
AF
0,244 0,235
0,529 0,592
0,506 0,835
0,118 -0,158
0,075 -0,135
0,342 0,307
0,604 0,815
0,325 0,549
0,523 0,571
0,253 0,101
0,160 0,377
0,467 0,536
0,485 0,619
0,147 -0,046
0,649 0,827
0,459 0,752
0,181 0,049
0,547 0,758
F2
AFNL
0,184
0,649
0,866
-0,184
-0,111
0,408
0,857
0,593
0,626
0,066
0,240
0,518
0,566
-0,083
0,868
0,688
0,016
0,745
AFMMRI
0,231
0,610
0,806
-0,156
-0,130
0,358
0,824
0,513
0,584
0,099
0,266
0,533
0,562
-0,046
0,799
0,669
0,095
0,788
AFWLSMV
AF
0,221
0,274
0,298
0,190
0,089 -0,152
0,700
0,955
0,450
0,669
0,176
0,176
0,016 -0,255
-0,043 -0,291
0,224
0,353
0,469
0,631
0,064
0,067
0,251
0,206
0,216
0,140
0,574
0,836
0,155 -0,111
0,071 -0,103
0,502
0,736
0,191
0,081
0,295
0,325
AFNL
0,272
0,294
-0,065
0,923
0,690
0,299
-0,168
-0,220
0,340
0,610
-0,193
0,208
0,111
0,791
-0,012
-0,140
0,714
0,104
0,411
AFMMRI
0,198
0,181
-0,099
0,956
0,640
0,137
-0,257
-0,210
0,305
0,539
0,090
0,151
0,121
0,772
-0,032
-0,080
0,649
-0,027
0,343
Tableau 3 – Solution à 2 facteurs : estimations fournies par l’analyse traditionnelle en facteurs
communs (AF) et par les modèles d’analyse factorielle des corrélations tétrachoriques (AFWLSMV),
d’analyse harmonique du modèle à ogive normale (AFNL) et d’analyse factorielle à information
complète. En gras les saturations supérieures à .350 (N = 186).
Globalement, la structure factorielle est la même quel que soit le modèle d’analyse
factorielle pour données dichotomiques employé. Les solutions de l’AFNL et de
l’AFMMRI sont identiques, une divergence mineure étant observée pour l’AFWLSMV
8
Jacques Juhel
16èmes Journées de psychologie différentielle
(item 11). La divergence est un peu plus marquée pour l’AF (items 8 et 9). Le 1er
facteur peut être interprété sous l’angle de la « valeur générale accordée à soi-même »
(avoir besoin de plus de confiance en soi, se trouver vraiment quelconque,…), le 2nd
en termes d’estime de soi sociale ou publique (penser que les personnes avec
lesquelles on est sont heureuses d’être avec soi, que nos amie(e)s nous trouvent
intéressant(e),…).
Les différences entre l’AF traditionnelle et les modèles d’analyse factorielle pour
données dichotomiques apparaissent surtout à la lecture des estimations des
saturations. L’ampleur de ces différences peut s’apprécier à l’aide du pourcentage de
variance expliquée par les 2 facteurs : 25,37% pour l’AF traditionnelle, 43,59% pour
le modèle d’analyse factorielle à information complète (estimation TESTFACT). Les
saturations restent très stables d’un modèle d’analyse factorielle pour données
dichotomiques à l’autre. Tout au plus peut-on signaler que l’AFWLSMV fournit une
estimation de la saturation de l’item 11 sur le 1er facteur un peu plus élevée que celles
fournies par les 2 autres modèles et que l’AFNL conduit en moyenne à des estimations
légèrement supérieures des saturations et de la corrélation entre facteurs.
Conclusion
Il n’est évidemment pas question de se prononcer à partir des résultats précédents sur
l’efficacité respective des modèles employés dans ce travail. Une telle ambition, pour
être satisfaite, nécessiterait par exemple d’évaluer leur capacité à identifier dans des
conditions précises d’effectif, de distribution des variables observées, etc., tel ou tel
type de structure factorielle définie a priori. Notre démarche ne vise ici qu’à apporter
quelques éléments d’information sur les modèles auxquels il est possible de recourir
dans l’analyse factorielle exploratoire de données dichotomiques. Les résultats
obtenus sur ce corpus de données sont à cet égard intéressants sur plusieurs points.
Ces modèles présentent tout d’abord l’avantage par rapport à l’analyse factorielle
exploratoire traditionnelle de conduire, pour un même pourcentage de variance
expliquée à des solutions factorielles plus économiques, moins « distribuées ». Elles
conduisent aussi, pour un même nombre de facteurs cette fois, à un pourcentage
supérieur de variance expliquée. Pour cette raison au moins, l’emploi dans l’analyse
factorielle exploratoire de données dichotomiques de l’un ou l’autre de ces modèles
d’AFWLSMV, d’AFNL ou d’AFMMRI est donc à préférer à celui de l’analyse factorielle
traditionnelle.
Le second point, plutôt rassurant, est celui de la similitude des estimations fournies
par les trois modèles d’analyse factorielle pour données dichotomiques alors même
que ceux-ci reposent sur des procédures différentes. On retiendra cependant qu’avec
notre effectif de taille réduite (N<250), l’AFNL paraît plus robuste et efficace que
l’AFWLSMV et l’AFMMRI dont on sait qu’elles nécessitent des effectifs plus importants.
Il est également possible que ces méthodes d’analyse factorielle pour données
9
Jacques Juhel
16èmes Journées de psychologie différentielle
dichotomiques aboutissent à des résultats moins superposables pour des solutions
factorielles plus complexes.
Le choix entre ces trois méthodes est donc question d’opportunité et de préférence
personnelle. NOHARM peut selon nous être employé systématiquement car robuste
et… disponible gratuitement. TESTFACT et Mplus n’ayant pas cette avantageuse
caractéristique, leur utilisation est avant tout une question de possibilité d’accès.
Elaborés en référence à deux traditions de recherche distinctes, l’un et l’autre de ces
programmes ne présentent pas les mêmes avantages.
TESTFACT qui s’inscrit dans une perspective psychométrique est particulièrement
adapté pour étudier le comportement des items. Des aménagements récents permettent
cependant d’estimer dans un cadre restrictif les paramètres de la solution bi-factorielle
à 1 facteur général et s facteurs de groupe orthogonaux originellement proposée par
Holzinger (Gibbons et Hedeker, 1992). Les restrictions de ce modèle rendent ainsi
possible l’analyse de solutions présentant un nombre important de facteurs de groupes
et qui autorisent la dépendance conditionnelle entre items d’un même groupe tout en
offrant l’avantage de permettre une représentation des patrons de réponses plus
parsimonieuse que celle donnée par une solution exploratoire.
Mplus est un programme hautement intégré de modélisation statistique en variables
latentes plus complet que les programmes classiques de modèlisation structurale (i.e.,
AMOS, LISREL, EQS, etc.). Ce programme dit de 2nde génération est à ce titre
particulièrement recommandé pour effectuer l’analyse factorielle exploratoire ou
exploratoire-restrictive, éventuellement hiérarchique, de données di- ou
polychotomiques.
En résumé, NOHARM est particulièrement bien adapté pour effectuer l’analyse
factorielle exploratoire initiale d’une matrice de données binaires. TESTFACT mérite
d’être utilisé en complément pour étudier avec plus de précision le comportement
psyschométrique des items, ce qu’il est par exemple nécessaire de faire si l’on
souhaite réduire le nombre d’items d’un questionnaire. Mplus enfin est l’outil de
modélisation le plus complet, celui avec lequel on peut par exemple chercher à
évaluer l’ajustement de la solution factorielle identifiée de manière exploratoire,
estimer une solution hiérarchique ou calculer des scores factoriels.
10
Jacques Juhel
16èmes Journées de psychologie différentielle
Références
Bock, R. D. & Aitkin, M. (1981). Marginal maximum likelihood estimation of item parameters:
Application of an EM algorithm. Psychometrika, 46, 443-459.
Bock, R. D., Gibbons, R., & Muraki, E. (1988). Full-information factor analysis. Applied
Psychological Measurement, 12, 261-280.
Christoffersson, A. (1975). Factor analysis of dichotomized variables. Psychometrika, 40, 5-32.
De Champlain, A.-F. (1999). An Overview of Nonlinear Factor Analysis and Its Relationship to Item
Response Theory. Statistical Report. LSAC Research Report Series.
Embretson, S.E., & Reise, S.P. (2000). Item Response Theory for psychologists. Mahwah: Erlbaum.
Finger, M.-S. (2002). A comparison of full-information and unweighted least-squares limitedinformation methods used with the 2-parameter normal ogive model. Dissertation Abstracts
International: Section B: The Sciences and Engineering, 62(9-B), 4266.
Fraser, C., & McDonald, R. P. (1988). NOHARM: Least squares item factor analysis. Multivariate
Behavioral Research, 23, 267-269.
Gibbons, R.D., & Hedeker, D.R. (1992). Full-information item bi-factor analysis. Psychometrika, 57,
423-436.
Glöckner-Rist, A., & Hoijtink, H. (2003). The best of both worlds: Factor analysis of dichotomous data
using item response theory and structural equation modeling. Structural Equation Modeling, 10, 544565.
Hu, L.T., & Bentler, P.M. (1995). Evaluating model fit. In R.H. Hoyle (Ed.), Strucural equation
modeling: concepts, issues and applications (pp. 76-99). London: Sage.
Jöreskog, K.G., & Sörbom, D. (2000). LISREL 8.50. User's reference guide. Chicago: SSI, Inc.
Knol, D.L., & Berger, M.P.F. (1988). Empirical Comparison between Factor Analysis and Item
Response Models. Project Psychometric Aspects of Item Banking No. 37. Research Report 88-11.
Twente University.
Knol, D. L., & Berger, M. P. (1991). Empirical comparison between factor analysis and
multidimensional item response models. Multivariate Behavioral Research, 26, 457-477.
Kubinger, K.D. (2003). On artificial results due to using factor analysis for dichotomous variables.
Psychology Science, 45, 106-110.
Maydeu-Olivares, A. (2001). Multidimensional item response theory modeling of binary data: Large
sample properties of NOHARM estimates. Journal of Educational and Behavioral Statistics, 26, 51-71.
McDonald, R. P. (1967). Nonlinear factor analysis. Psychometric Monographs (n°15).
McDonald, R. P. (1982). Linear versus nonlinear models in latent trait theory. Applied Psychological
Measurement, 6, 379-396.
McDonald, R. P. (1997). Normal ogive multidimensional model. In W. J. Van der Linden, & R. K.
Hambleton (Eds.), Handbook of modern item response theory (pp. 257-269). New York: Springer.
McLeod, L.D., Swygert, K.A., & Thissen, D. (2001). Factor analysis for items scored in two
categories. In D. Thissen & H. Wainer, Test scoring (pp. 189-216). Mahwah, N.J.: LEA.
Muthén, B. (1978). Contributions to factor analysis of dichotomous variables. Psychometrika, 43, 551560.
Muthen, B. (1984). A general structural equation model with dichotomous, ordered, categorical and
continuous latent variable indicators. Psychometrika, 49, 115-132.
Muthén, B. (2002). Beyond SEM: general latent variable modeling. Behaviormetrika, 29, 81-117.
Muthén, B., & Hofacker, C. (1988). Testing the assumptions underlying tetrachoric correlations.
Psychometrika, 53, 563-577.
Muthén, L.K., & Muthén, B.0. (1998-2004). Mplus 3.01 user’s guide. Los Angeles, CA : Muthén &
Muthén.
11
Jacques Juhel
16èmes Journées de psychologie différentielle
Parry, C.D., & McArdle, J.J. (1991). An applied comparison of methods for least-squares factor
analysis of dichotomous variables. Applied Psychological Measurement, 15, 35-46.
Reckase, M.D. et al. (1985). When Unidimensional Data Are Not Unidimensional. Paper presented at
the Annual Meeting of the Psychometric Society (50th, Nashville, TN, June 1-4, 1985).
Takane, Y., & De Leeuw, J. (1987). On the relationship between item response theory and factor
analysis of discretized variables. Psychometrika, 52, 393-408.
Wilson, D.T., Wood, R., & Gibbons, R. (1991). TESTFACT : Test scoring, item statistics, and item
factor analysis. Chicago: SSI, Inc.
Woods, C.M. (2002). Factor analysis of scales composed of binary items: Illustration with the
Maudsley Obsessional Compulsive Inventory. Journal of Psychopathology and Behavioral Assessment,
24, 215-223.
Annexe
1) Programme de commande pour Mplus
TITLE:
DATA:
VARIABLE:
ANALYSIS:
OUTPUT:
Analyse factorielle exploratoire pour donnees dichotomiques
Questionnaire recodé étudiants, N=186
File is ESRdicho.TXT;
NAMES ARE y1-y18;
CATEGORICAL ARE y1-y18;
TYPE = EFA 1 3;
! solutions à 1, 2 et 3 facteurs
ESTIMATOR = WLSMV;
! méthode d’estimation
SAMPSTAT;
2) Programme de commande pour NOHARM
Analyse factorielle non linéaire exploratoire
18 2 186 1 1 0 0 0
000000000000000000
0.747
0.618 0.806
…………….
! solution à 2 facteurs (ou 1, 3…)
! cj fixé à 0 : modèle à 2 paramètres
!matrice diagonale de moment-produit
3) Programme de commande pour TESTFACT
>TITLE
Analyse factorielle à information complète
Questionnaire d'Estime de Soi à 18 items
>PROBLEM
NITEMS=18, SELECT=18, RESPONSE=3;
>NAMES
i1,i2,i3,i4,i5,i6,i7,i8,i9,i10,i11,i12,i13,
i14,i15,i16,i17,i18;
>RESPONSE
'9','0','1';
>KEY
111111111111111111;
>SELECT
1(1)18;
>RELIABILITY ALPHA;
>TETRACHORIC RECODE, NDEC=3;
>FACTOR
NFAC=3,
! solution à 3 facteurs (ou 1, 2…)
NROOT=6, ROTATE=(PROMAX,3,2);
>FULL
CYCLES=100, RECODE;
>TECHNICAL PRECISION=0.005;
>SCORE
METHOD=2, LIST=10;
>INPUT
NIDCHAR=3, SCORES, FILE='dataESR.txt';
(3A1,18A1)
>STOP
12