une comparaison entre modèles d`analyse factorielle no
Transcription
une comparaison entre modèles d`analyse factorielle no
Texte préparé pour les 16èmes Journées de psychologie différentielle Université du Luxembourg 15-17 septembre 2004 Structure interne d’un inventaire d’Estime de Soi : une comparaison entre méthodes d’analyse factorielle exploratoire pour données dichotomiques Jacques Juhel 1 Université Rennes 2 L’application du modèle en facteurs communs (AF) à des corrélations de Pearson réduites à des coefficients phi dans le cas de données dichotomiques conduit souvent à une surestimation du nombre de facteurs (niveaux communs de difficulté ou de sévérité), à une sous-estimation des saturations et à des tests de signification et des erreurs-type biaisés (Kubinger, 2003 ; Woods, 2002). Malgré ces limites, les méthodes traditionnelles d’analyse factorielle exploratoire restent encore d’usage fréquent dans l’étude de la structure interne de tests ou de questionnaires constitués d’items de type binaire. Des méthodes alternatives d’analyse factorielle pour données dichotomiques sont pourtant disponibles. C’est en particulier le cas de l’analyse factorielle des corrélations tétrachoriques (Christoffersson, 1975 ; Muthén, 1978), de l’analyse factorielle non linéaire (McDonald, 1967) et de l’analyse factorielle à information complète (Bock et Aitkin, 1981). Les caractéristiques essentielles de ces modèles sont d’abord brièvement présentées. Ceux-ci sont ensuite appliqués à l’étude exploratoire de la structure interne d’un questionnaire d’estime de soi (18 items dichotomiques) appliqué à 186 participants. Les résultats montrent que les estimations fournies sont à peu de choses près les mêmes quel que soit le modèle, le modèle de McDonald paraissant sur cet ensemble de données un peu plus robuste que les deux autres. 1 Groupe de recherche en psychologie différentielle – Laboratoire de psychologie expérimentale Centre de Recherche Psychologie, Cognition, Communication - Université Rennes 2 - Place du Recteur Henri Le Moal - CS 24307 - 35043 Rennes cedex. Courriel : [email protected] Jacques Juhel 16èmes Journées de psychologie différentielle Modèles d’analyse factorielle pour données dichotomiques L’analyse factorielle des corrélations tétrachoriques Les modèles d’analyse factorielle pour données dichotomiques ne peuvent pas, comme les modèles d’analyse factorielle pour données continues, faire l’hypothèse d’un processus de réponse directement observable. Cette hypothèse est remplacée par celle d’une fonction de réponse continue non observable yij dichotomisée en un score observé 1 ou 0 selon que le niveau de compétence de l’individu i est inférieur ou supérieur à un certain seuil2 γ j pour l’item j soit : 1 si yij ≥ γ j xij = 0 si yij < γ j Dans un tel modèle factoriel, cette variable latente, continue et normale par hypothèse, est définie comme une combinaison linéaire de m variables latentes θki de distribution normale, pondérées par les saturations λ jk soit : yij = λ j1θ1i + λ j 2 θ 2i + ... + λ jm θ mi + δi Les mêmes techniques d’analyse factorielle sont donc applicables aux estimations des corrélations entre les fonctions de réponse yij . Ces corrélations tétrachoriques peuvent être calculées à l’aide par exemple du programme PRELIS (fourni avec LISREL 8.50 ; Jöreskog et Sörbom, 2001) qui permet d’évaluer le respect des hypothèses soustendant la procédure d’estimation3 (Muthén et Hofacker, 1988), leur non respect pouvant biaiser la solution factorielle (Reckase et al., 1985). La méthode la plus immédiate est celle des moindres carrés non pondérés (ULS). Celle-ci est robuste, peu sensible au non respect de l’hypothèse de normalité du trait latent mais ne fournit ni estimation des erreurs-type de mesure, ni test statistique permettant de juger de l’ajustement du modèle. Elle postule en outre que les corrélations entre items sont indépendantes et ont une variance d’erreur constante. Cette hypothèse étant peu réaliste, Christoffersson (1975) puis Muthén (1978, 1984) ont proposé un modèle d’analyse moins étroitement linéaire dans lequel les paramètres du modèle normal en trait latent sont estimés avec la méthode des moindres carrés pondérés (WLS) -la matrice de pondérations contient les variances et covariances des corrélations tétrachoriques- afin de corriger l’hétérogénéité des variances d’erreur et les dépendances entres corrélations. Le programme Mplus (Muthén, 2002 ; Muthén et Muthén, 1998-2004) est actuellement le plus intéressant pour effectuer une AFWLS exploratoire de données dichotomiques. Il offre aussi, entre autres avantages, des procédure d’estimation plus robustes que WLS (WLSM : moindres carrés ajustés à la moyenne ; WLSMV : moindres carrés ajustés à la moyenne et la variance) qui ne nécessitent pas l’inversion de la matrice de pondérations, souvent définie non positive. L’ajustement du modèle 2 Le seuil d’un item dichotomique est l’écart normal spécifiant l’aire sous la courbe normale égale au pourcentage de réponses incorrectes à l’item. 3 Trait latent continu, distribué normalement ; normalité de distribution, indépendance et homogénéité de variance des erreurs. 2 Jacques Juhel 16èmes Journées de psychologie différentielle peut être évalué au moyen de divers indices. Le RMSEA (Root Mean Square Error of Approximation : mesure de la qualité de la reconstruction, par degré de liberté, de la matrice de corrélations tétrachoriques par la matrice ajustée) rend compte de la quantité d’information résiduelle. Des indices comparatifs permettant de juger de l’ajustement du modèle sont également fournis (comparaison entre le modèle testé et le modèle nul ajusté aux degrés de liberté avec le CFI : Comparative Fit Index et le TLI ou NNFI : Tucker Lewis Index). L’ajustement est considéré comme acceptable lorsque CFI ≥ .95, TLI ≥ .95 et RMSEA ≤.08 (Hu et Bentler, 1995). Signalons également que Mplus offre plusieurs méthodes d’estimation de modèles pour données incomplètes (estimation optimale des données manquantes par maximum de vraisemblance à information complète), ce qui constitue un atout précieux lorsque les effectifs n’atteignent pas le minimum souhaité (200 sujets au moins). L’analyse factorielle non linéaire Ce modèle d’analyse (AFNL) a été proposé par McDonald (1967, 1982, 1997). Les postulats en sont les mêmes que dans l’AFWLS : fonctions de réponse à l’item à ogive normale, erreurs de mesure multinormales, existence de dépendances statistiques entre items d’ordre supérieur à 2 (indépendance locale faible4). Le modèle à 2 paramètres définit la probabilité de bonne réponse de l’individu i à l’item j par l’équation : ( ) ( P xij = 1 θi = N β j 0 + β j1θ1i + ... + β jk θ ki ) avec N(.) la fonction ogive normale, β jk élément de la matrice de structure B = [β jk ] et k facteurs standardisés θ ki . Il peut être représenté sous la forme d’une régression polynomiale infinie des données sur les facteurs5, McDonald ayant démontré que 4 termes suffisent pour approximer le modèle à ogive normale. L’AFNL peut être mise en œuvre à l’aide du programme NOHARM (Normal Ogive Harmonic Analysis Robust Method; Fraser et McDonald, 1988 ; Fraser, 1998). L’information analysée est la matrice de moment-produit6 de l’échantillon. Les paramètres du modèle sont estimés par minimisation d’une fonction des moindres carrés non pondérés (ULS) des proportions marginales de 1er de 2nd ordre. Les seuils tj et les saturations f jk des items sont déduits des estimations des paramètres β jk et des covariances entre facteurs. L’ajustement du modèle et le respect du principe d’indépendance locale peuvent être évalués en examinant la matrice résiduelle des covariances entre items et les indices d’ajustement fournis par le programme, le RMSR (Root Mean Square of Residuals) et le GFI (Tanaka index of goodness of fit). L’exigence d’indépendance locale est faible (resp. forte) si les k composantes de θ rendent théoriquement compte de toutes les covariances entre items (resp. de toutes les relations entre les probabilités de bonne réponse aux items). 5 La fonction ogive normale permet le développement de séries harmoniques du type : P( xij = 1 | θ i ) = f j 0 + f j1θ i + f j 2 θ i2 + ... où fjk est la saturation du facteur f sur l’item j. 6 La matrice de moment-produit est obtenue en multipliant la matrice de données binaires par sa transposée. 4 3 Jacques Juhel 16èmes Journées de psychologie différentielle L’analyse factorielle à « information complète » Les modèles correspondants, strictement non linéaires, sont basés sur les Modèles Multidimensionnels de Réponse à l’Item (MMRI). On cherche cette fois à reproduire toute l’information de la matrice de données binaires (exigence d’indépendance locale forte) et non plus seulement les corrélations tétrachoriques ou la matrice de momentproduit. Par exemple, dans le MMRI à ogive normale à 2 paramètres qui offre l’avantage d’être en lien direct avec la théorie classique des tests (Embretson et Reise, 2000), la probabilité P(xij=1) pour que l’individu i réponde affirmativement à l’item j est représentée par l’équation : ∞ -[1/ 2]t P(xij =1θ) = 1 e dt , ∫ 2π − (θi −b j ) / σ j 2 où σj = 1/aj est la dispersion de l’item, aj est la puissance discriminante de l’item (la proportion de changement de la probabilité de répondre affirmativement en fonction des changements du niveau en trait latent des individus), bj la difficulté de l’item et θi le niveau de l’individu i par rapport au trait latent continu. Le logit, zj = aj(θi - bj) s’écrit sous la forme zj = ajθi + cj où aj est la pente et cj = - ajbj l’intercept de l’item. Dans l’extension multidimensionnelle de ce modèle (Bock, Gibbons et Muraki, 1988), le logit zj devient alors : zj = Σkajkθik + cj, où les ajk sont les paramètres de discrimination de l’item par rapport aux traits latents (k=1,2,…m), cj est l’intercept de l’item et les θik sont les niveaux de l’individu i par rapport aux traits latents. Les paramètres du modèle factoriel peuvent en être aisément dérivés, les relations entre les paramètres aj et cj d’une part, les saturations αjk et la difficulté standardisée δj de l’item j d’autre part étant définies par : α jk = a jk c , δ j = j k =1,2,...m, avec d j = 1+a 2j1+a2j2 +...+a 2jm , dj dj où ajk est la pente de l’item j par rapport à la dimension k et cj son intercept. Le modèle à ogive normale à 2 paramètres est implémenté dans le programme TESTFACT (Wilson, Wood et Gibbons, 1991). Le programme effectue tout d’abord une analyse en facteurs principaux (ULS) sur la matrice de corrélations tétrachoriques -si nécessaire préalablement transformée par «lissage» en une matrice définie positive (Knol et Berger, 1991)- afin de disposer d’estimations initiales pour la suite de la procédure. Le modèle à ogive normale à 2 paramètres est ensuite ajusté à l’aide de la méthode du maximum de vraisemblance marginale (MML). Le principe général est d’estimer de manière conjointe les valeurs –inconnues- des paramètres d’items et de loi du trait latent θ qui maximisent la vraisemblance de l’ensemble des observations relatives au modèle. L’estimation qui nécessite d’intégrer des paramètres sur une distribution normale divisée en plusieurs intervalles représentés chacun par une certaine valeur -le point de quadrature- et sur lesquels on attend une certaine 4 Jacques Juhel 16èmes Journées de psychologie différentielle probabilité de réalisation -le poids de quadrature- repose sur une procédure itérative d’optimisation numérique par espérance maximum (EM). TESTFACT fournit pour chaque item une estimation de l’intercept, du seuil, de la pente, de la difficulté standardisée, de la communauté et de la saturation. Plusieurs pentes et saturations sont estimées par item dans le cas multidimensionnel. On peut aussi obtenir les estimations des rotations Varimax et Promax. L’emploi de la méthode MML offre la possibilité de calculer un χ2 du rapport de vraisemblance (G2) associé à des degrés de liberté dont le nombre est fonction du nombre d’items et de la dimensionnalité du modèle. Le gain d’ajustement apporté par l’introduction d’un facteur supplémentaire peut alors être mesuré par un G2 partiel (distribué comme le χ2) dont la signification statistique peut être évaluée. Comparaison entre méthodes Ces trois modèles d’analyse factorielle pour données binaires sont plus proches les uns des autres qu’ils n’y paraissent. Bien que les procédures employées soient différentes, les modèles de Christoffersson, Muthén et McDonald s’inspirent clairement d’une même conception générale. D’une certaine façon, ces modèles sont des approximations du modèle plus général qu’est l’analyse factorielle à information complète (McLeod, Swygert et Thissen, 2001). Takane et de Leeuw (1987) ont d’ailleurs apporté la preuve de la similitude formelle entre l’analyse factorielle à information complète (AFMMRI) et l’AFWLS pour le modèle à ogive normale à 2 paramètres (voir Glöckner-Rist et Hoijtink, 2003, pour une comparaison entre AF et MRI). La comparaison des résultats obtenus avec l’une ou l’autre de ces méthodes avec ceux de l’AF traditionnelle a été l’objet de plusieurs recherches. A l’exception de celle de Parry et McArdle (1991) qui soulignent le bon comportement (y compris pour des effectifs de petite taille et des données –simulées- dissymétriques) de l’AF de corrélations phi ou de corrélations tétrachoriques calculées à partir des fréquences marginales, les études effectuées démontrent en général la supériorité des modèles d’analyse factorielle pour données binaires. Woods (2002) par exemple analyse les réponses de 1080 participants au Maudsley Obsessional Compulsive Inventory. Les résultats montrent une invariance de structure quelle que soit la méthode utilisée mais des saturations et des corrélations entre facteurs plus fortes avec l’AFWLS ou l’AFMMRI qu’avec l’AF traditionnelle. Quelques études ont également comparé ces méthodes entre elles, généralement à partir de données simulées. Knol et Berger (1988, 1991) concluent que l’AFWLS des corrélations tétrachoriques est au moins aussi efficace que l’AFNL ou l’AFMMRI. Cette opinion est partagée par De Champlain (1999), Ferrando et Lorenzo Seva (2001) ou Woods (2002) à propos de l’AFWLS et de l’AFMMRI. Quelques résultats récents semblent cependant démontrer une certaine supériorité de l’AFNL tant du point de vue des possibilités d’application à des effectifs réduits (100 sujets ; Maydeu-Olivares, 2001) que de la précision des estimations fournies (Finger, 2002). En tout état de 5 Jacques Juhel 16èmes Journées de psychologie différentielle cause, la majorité des auteurs s’accorde à reconnaître que les résultats de ces comparaisons dépendent très largement des caractéristiques des données soumises à analyse. C’est pourquoi il nous a paru intéressant d’appliquer ces trois méthodes à un même corpus de données d’observation (comparaison along a case study, Woods, 2002). Méthode Les données analysées sont les réponses fournies par 186 étudiants, tous inscrits à l’Université Rennes 2 dans des filières autres que la psychologie (1ère et 2nde année), à un questionnaire d’Estime de soi construit pour l’occasion. Présenté comme destiné à mesurer la perception que l’on a de soi-même, le questionnaire comporte 18 items dichotomiques dont 11 sont inversés (Tableau 1). Les analyses factorielles exploratoires sont effectuées avec les logiciels suivants: a) Mplus 3.01 (AFWLS : analyse factorielle WLS des corrélations tétrachoriques) ; b) NOHARM 98 (AFNL : analyse harmonique du modèle à ogive normale) ; c) TESTFACT 4.0 (AFMMRI : analyse factorielle à information complète). Les fichiers génériques de commande sont présentés en annexe. Résultats Les statistiques descriptives apparaissent dans le tableau ci-dessous. n° item 1 Il m’arrive de penser que les autres s’organisent beaucoup mieux que moi (I) 2 Il m’arrive de penser que je fais bonne impression à autrui. 3 4 Je pense que j’ai besoin de plus de confiance en moi. (I) Il m’arrive de penser que les personnes avec lesquelles je suis sont heureuses d’être avec moi. 5 Je trouve que les gens aiment parler avec moi. 6 Il m’arrive d’avoir l’impression d’être une personne compétente, au moins autant que les autres. 7 Dans l’ensemble, je me trouve vraiment quelconque. (I) 8 J’ai l’impression de me faire marcher sur les pieds plus souvent que les autres. (I) 9 Je suis très tendu quand je suis avec des inconnus.(I) 10 Il m’arrive de penser que mes amis ont une très bonne opinion de moi. 11 Il m’arrive d’avoir l’impression que les gens ne m’aimeraient pas s’ils me connaissaient vraiment bien. (I) 12 Il m’arrive de souhaiter pouvoir avoir plus de respect pour moi-même. (I) 13 Il m’arrive de me sentir à part lorsque je sors. (I) 14 Je pense que mes ami(e)s me trouvent intéressant(e). 15 Avoir l’air ridicule aux yeux des autres est quelque chose dont il m’arrive d’avoir peur. (I) 16 Il m’arrive de penser que je suis une personne ennuyeuse.(I) 17 Je me dis que je suis quelqu’un dont la personnalité est agréable. 18 Il m’arrive de me sentir réellement inutile.(I) oui (%) 23,30 80,60 70,40 86,00 88,20 83,90 29,50 18,30 40,90 76,90 14,80 11,00 18,30 90,30 41,90 11,80 90,90 12,40 rbis rpoint-bis 0,52 0,38 0,83 0,58 0,68 0,51 0,58 0,37 0,47 0,29 0,62 0,41 0,71 0,54 0,49 0,33 0,77 0,61 0,62 0,45 0,43 0,20 0,74 0,52 0,77 0,53 0,63 0,36 0,78 0,62 0,72 0,44 0,65 0,37 0,88 0,54 Tableau 1 – Statistiques descriptives fournies par TESTFACT (pourcentage de réponse d’acquiescement, coefficients de corrélation bisérielle et point-bisérielle - N = 186). 6 Jacques Juhel 16èmes Journées de psychologie différentielle Les coefficients de corrélation bisérielle7 sont relativement élevés (alpha de Cronbach de 0,776), ce qui témoigne d’une homogénéité satisfaisante des items. La corrélation tétrachorique moyenne est de 0,296. Dimensionnalité du questionnaire On effectue tout d’abord une analyse en facteurs principaux de la matrice des corrélations phi entre les 18 items du questionnaire (logiciel SPSS). Celle-ci aboutit à 5 valeurs propres initiales supérieures à 1 (3,881 ; 2,067 ; 1,439 ; 1,211 ; 1,067), résultat qui, classiquement, conduit à rechercher une solution à 5 facteurs. Les valeurs propres de la matrice lissée des corrélations tétrachoriques sont ensuite calculées avec TESTFACT (méthode ULS). Constatant que seules les 3 premières valeurs propres sont supérieures à 1 (5,697 ; 2,152 ; 1,103), on choisit de n’examiner que les solutions à 1, 2 et 3 facteurs, stratégie plus économique que celle suggérée par les résultats de l’analyse factorielle de la matrice des corrélations phi. L’AFWLS, l’AFNL puis l’AFMMRI sont ensuite respectivement appliquées à la matrice de corrélations tétrachoriques (Mplus), la matrice de moment-produit (NOHARM) et la matrice de données binaires (TESTFACT). Une solution oblique (rotation Promax) est estimée dans le cas des modèles à 2 et 3 facteurs. La matrice de corrélations tétrachoriques n’étant pas définie positive (échec de la méthode WLS), la méthode d’estimation WLSMV, disponible sur Mplus, est utilisée pour en effectuer l’analyse. Les problèmes éventuellement rencontrés et les indices d’ajustement fournis par chaque programme pour chaque solution testée apparaissent dans le tableau 2. Modèle AFWLSMV AFNL AFMMRI Nombre Problèmes de facteurs d'estimation 1 non 2 non 3 Heywood: i11-F3 1 non 2 non 3 non 1 non 2 non 3 Heywood: i4-F2 χ ddl p 109,276 63,471 49,106 43 42 45 0,000 0,018 0,312 2 836,11 744,58 710,36 149 132 116 RMSEA RMSR 0,091 0,052 0,022 0,1847 0,1233 0,0904 0,0123 0,0082 0,0068 GFI 0,91 0,96 0,97 0,000 0,000 0,000 Tableau 2 – Indices d’ajustement fournis par Mplus (AFWLSMV), NOHARM (AFNL) et TESTFACT (AFMMRI). Cas de Heywwod : item et facteur concerné (N = 186). 7 Le coefficient de corrélation bisérielle est une estimation de la relation entre le score total et le score, par hypothèse normalement distribué, de l’échelle continue qui sous-tend les réponses d’assentiment ou de désaccord à l’item. Celui-ci est fonctionnellement relié aux 2 paramètres d’item du modèle à ogive normale c’est-à-dire à la pente ou discrimination aj et le seuil ou sévérité bj de l’item (Lord et Novick, 1968). Il présente aussi l’avantage d’être moins influencé par la sévérité de l’item que ne l’est le coefficient classique de corrélation point-bisérielle. 7 Jacques Juhel 16èmes Journées de psychologie différentielle L’examen des indices d’ajustement montre que la solution à 3 facteurs semble reconstruire le mieux les données mais les modèles d’AFWLSMV et d’AFMMRI se heurtent à des problèmes d’estimation, une saturation estimée étant à chaque fois supérieure à 1 (cas de Heywood). L’AFNL apparaît donc sur cet échantillon de petite taille comme une méthode plus robuste que l’AFWLSMV et l’AFMMRI, des problèmes d’estimation n’étant rencontrés avec l’AFNL qu’à partir de la solution à 4 facteurs (cas de Heywood : i11-F3). On remarquera cependant que le gain d’ajustement apporté par le troisième facteur est modeste (faible baisse du RMSR, GFI supérieur au seuil d’acceptabilité du modèle dans les 2 cas), la préférence pour une solution à 3 facteurs dépendant alors des possibilités d’interprétation offertes. L’objectif étant ici de comparer les résultats obtenus avec les 3 modèles, nous avons fixé à 2 le nombre des facteurs de la solution factorielle. Comparaison des résultats Les estimations des saturations et des corrélations entre facteurs sont présentées dans le tableau 3. Les résultats de l’analyse traditionnelle en facteurs communs apparaissent également dans ce tableau. F1 N° item 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 rF1F2 AFWLSMV AF 0,244 0,235 0,529 0,592 0,506 0,835 0,118 -0,158 0,075 -0,135 0,342 0,307 0,604 0,815 0,325 0,549 0,523 0,571 0,253 0,101 0,160 0,377 0,467 0,536 0,485 0,619 0,147 -0,046 0,649 0,827 0,459 0,752 0,181 0,049 0,547 0,758 F2 AFNL 0,184 0,649 0,866 -0,184 -0,111 0,408 0,857 0,593 0,626 0,066 0,240 0,518 0,566 -0,083 0,868 0,688 0,016 0,745 AFMMRI 0,231 0,610 0,806 -0,156 -0,130 0,358 0,824 0,513 0,584 0,099 0,266 0,533 0,562 -0,046 0,799 0,669 0,095 0,788 AFWLSMV AF 0,221 0,274 0,298 0,190 0,089 -0,152 0,700 0,955 0,450 0,669 0,176 0,176 0,016 -0,255 -0,043 -0,291 0,224 0,353 0,469 0,631 0,064 0,067 0,251 0,206 0,216 0,140 0,574 0,836 0,155 -0,111 0,071 -0,103 0,502 0,736 0,191 0,081 0,295 0,325 AFNL 0,272 0,294 -0,065 0,923 0,690 0,299 -0,168 -0,220 0,340 0,610 -0,193 0,208 0,111 0,791 -0,012 -0,140 0,714 0,104 0,411 AFMMRI 0,198 0,181 -0,099 0,956 0,640 0,137 -0,257 -0,210 0,305 0,539 0,090 0,151 0,121 0,772 -0,032 -0,080 0,649 -0,027 0,343 Tableau 3 – Solution à 2 facteurs : estimations fournies par l’analyse traditionnelle en facteurs communs (AF) et par les modèles d’analyse factorielle des corrélations tétrachoriques (AFWLSMV), d’analyse harmonique du modèle à ogive normale (AFNL) et d’analyse factorielle à information complète. En gras les saturations supérieures à .350 (N = 186). Globalement, la structure factorielle est la même quel que soit le modèle d’analyse factorielle pour données dichotomiques employé. Les solutions de l’AFNL et de l’AFMMRI sont identiques, une divergence mineure étant observée pour l’AFWLSMV 8 Jacques Juhel 16èmes Journées de psychologie différentielle (item 11). La divergence est un peu plus marquée pour l’AF (items 8 et 9). Le 1er facteur peut être interprété sous l’angle de la « valeur générale accordée à soi-même » (avoir besoin de plus de confiance en soi, se trouver vraiment quelconque,…), le 2nd en termes d’estime de soi sociale ou publique (penser que les personnes avec lesquelles on est sont heureuses d’être avec soi, que nos amie(e)s nous trouvent intéressant(e),…). Les différences entre l’AF traditionnelle et les modèles d’analyse factorielle pour données dichotomiques apparaissent surtout à la lecture des estimations des saturations. L’ampleur de ces différences peut s’apprécier à l’aide du pourcentage de variance expliquée par les 2 facteurs : 25,37% pour l’AF traditionnelle, 43,59% pour le modèle d’analyse factorielle à information complète (estimation TESTFACT). Les saturations restent très stables d’un modèle d’analyse factorielle pour données dichotomiques à l’autre. Tout au plus peut-on signaler que l’AFWLSMV fournit une estimation de la saturation de l’item 11 sur le 1er facteur un peu plus élevée que celles fournies par les 2 autres modèles et que l’AFNL conduit en moyenne à des estimations légèrement supérieures des saturations et de la corrélation entre facteurs. Conclusion Il n’est évidemment pas question de se prononcer à partir des résultats précédents sur l’efficacité respective des modèles employés dans ce travail. Une telle ambition, pour être satisfaite, nécessiterait par exemple d’évaluer leur capacité à identifier dans des conditions précises d’effectif, de distribution des variables observées, etc., tel ou tel type de structure factorielle définie a priori. Notre démarche ne vise ici qu’à apporter quelques éléments d’information sur les modèles auxquels il est possible de recourir dans l’analyse factorielle exploratoire de données dichotomiques. Les résultats obtenus sur ce corpus de données sont à cet égard intéressants sur plusieurs points. Ces modèles présentent tout d’abord l’avantage par rapport à l’analyse factorielle exploratoire traditionnelle de conduire, pour un même pourcentage de variance expliquée à des solutions factorielles plus économiques, moins « distribuées ». Elles conduisent aussi, pour un même nombre de facteurs cette fois, à un pourcentage supérieur de variance expliquée. Pour cette raison au moins, l’emploi dans l’analyse factorielle exploratoire de données dichotomiques de l’un ou l’autre de ces modèles d’AFWLSMV, d’AFNL ou d’AFMMRI est donc à préférer à celui de l’analyse factorielle traditionnelle. Le second point, plutôt rassurant, est celui de la similitude des estimations fournies par les trois modèles d’analyse factorielle pour données dichotomiques alors même que ceux-ci reposent sur des procédures différentes. On retiendra cependant qu’avec notre effectif de taille réduite (N<250), l’AFNL paraît plus robuste et efficace que l’AFWLSMV et l’AFMMRI dont on sait qu’elles nécessitent des effectifs plus importants. Il est également possible que ces méthodes d’analyse factorielle pour données 9 Jacques Juhel 16èmes Journées de psychologie différentielle dichotomiques aboutissent à des résultats moins superposables pour des solutions factorielles plus complexes. Le choix entre ces trois méthodes est donc question d’opportunité et de préférence personnelle. NOHARM peut selon nous être employé systématiquement car robuste et… disponible gratuitement. TESTFACT et Mplus n’ayant pas cette avantageuse caractéristique, leur utilisation est avant tout une question de possibilité d’accès. Elaborés en référence à deux traditions de recherche distinctes, l’un et l’autre de ces programmes ne présentent pas les mêmes avantages. TESTFACT qui s’inscrit dans une perspective psychométrique est particulièrement adapté pour étudier le comportement des items. Des aménagements récents permettent cependant d’estimer dans un cadre restrictif les paramètres de la solution bi-factorielle à 1 facteur général et s facteurs de groupe orthogonaux originellement proposée par Holzinger (Gibbons et Hedeker, 1992). Les restrictions de ce modèle rendent ainsi possible l’analyse de solutions présentant un nombre important de facteurs de groupes et qui autorisent la dépendance conditionnelle entre items d’un même groupe tout en offrant l’avantage de permettre une représentation des patrons de réponses plus parsimonieuse que celle donnée par une solution exploratoire. Mplus est un programme hautement intégré de modélisation statistique en variables latentes plus complet que les programmes classiques de modèlisation structurale (i.e., AMOS, LISREL, EQS, etc.). Ce programme dit de 2nde génération est à ce titre particulièrement recommandé pour effectuer l’analyse factorielle exploratoire ou exploratoire-restrictive, éventuellement hiérarchique, de données di- ou polychotomiques. En résumé, NOHARM est particulièrement bien adapté pour effectuer l’analyse factorielle exploratoire initiale d’une matrice de données binaires. TESTFACT mérite d’être utilisé en complément pour étudier avec plus de précision le comportement psyschométrique des items, ce qu’il est par exemple nécessaire de faire si l’on souhaite réduire le nombre d’items d’un questionnaire. Mplus enfin est l’outil de modélisation le plus complet, celui avec lequel on peut par exemple chercher à évaluer l’ajustement de la solution factorielle identifiée de manière exploratoire, estimer une solution hiérarchique ou calculer des scores factoriels. 10 Jacques Juhel 16èmes Journées de psychologie différentielle Références Bock, R. D. & Aitkin, M. (1981). Marginal maximum likelihood estimation of item parameters: Application of an EM algorithm. Psychometrika, 46, 443-459. Bock, R. D., Gibbons, R., & Muraki, E. (1988). Full-information factor analysis. Applied Psychological Measurement, 12, 261-280. Christoffersson, A. (1975). Factor analysis of dichotomized variables. Psychometrika, 40, 5-32. De Champlain, A.-F. (1999). An Overview of Nonlinear Factor Analysis and Its Relationship to Item Response Theory. Statistical Report. LSAC Research Report Series. Embretson, S.E., & Reise, S.P. (2000). Item Response Theory for psychologists. Mahwah: Erlbaum. Finger, M.-S. (2002). A comparison of full-information and unweighted least-squares limitedinformation methods used with the 2-parameter normal ogive model. Dissertation Abstracts International: Section B: The Sciences and Engineering, 62(9-B), 4266. Fraser, C., & McDonald, R. P. (1988). NOHARM: Least squares item factor analysis. Multivariate Behavioral Research, 23, 267-269. Gibbons, R.D., & Hedeker, D.R. (1992). Full-information item bi-factor analysis. Psychometrika, 57, 423-436. Glöckner-Rist, A., & Hoijtink, H. (2003). The best of both worlds: Factor analysis of dichotomous data using item response theory and structural equation modeling. Structural Equation Modeling, 10, 544565. Hu, L.T., & Bentler, P.M. (1995). Evaluating model fit. In R.H. Hoyle (Ed.), Strucural equation modeling: concepts, issues and applications (pp. 76-99). London: Sage. Jöreskog, K.G., & Sörbom, D. (2000). LISREL 8.50. User's reference guide. Chicago: SSI, Inc. Knol, D.L., & Berger, M.P.F. (1988). Empirical Comparison between Factor Analysis and Item Response Models. Project Psychometric Aspects of Item Banking No. 37. Research Report 88-11. Twente University. Knol, D. L., & Berger, M. P. (1991). Empirical comparison between factor analysis and multidimensional item response models. Multivariate Behavioral Research, 26, 457-477. Kubinger, K.D. (2003). On artificial results due to using factor analysis for dichotomous variables. Psychology Science, 45, 106-110. Maydeu-Olivares, A. (2001). Multidimensional item response theory modeling of binary data: Large sample properties of NOHARM estimates. Journal of Educational and Behavioral Statistics, 26, 51-71. McDonald, R. P. (1967). Nonlinear factor analysis. Psychometric Monographs (n°15). McDonald, R. P. (1982). Linear versus nonlinear models in latent trait theory. Applied Psychological Measurement, 6, 379-396. McDonald, R. P. (1997). Normal ogive multidimensional model. In W. J. Van der Linden, & R. K. Hambleton (Eds.), Handbook of modern item response theory (pp. 257-269). New York: Springer. McLeod, L.D., Swygert, K.A., & Thissen, D. (2001). Factor analysis for items scored in two categories. In D. Thissen & H. Wainer, Test scoring (pp. 189-216). Mahwah, N.J.: LEA. Muthén, B. (1978). Contributions to factor analysis of dichotomous variables. Psychometrika, 43, 551560. Muthen, B. (1984). A general structural equation model with dichotomous, ordered, categorical and continuous latent variable indicators. Psychometrika, 49, 115-132. Muthén, B. (2002). Beyond SEM: general latent variable modeling. Behaviormetrika, 29, 81-117. Muthén, B., & Hofacker, C. (1988). Testing the assumptions underlying tetrachoric correlations. Psychometrika, 53, 563-577. Muthén, L.K., & Muthén, B.0. (1998-2004). Mplus 3.01 user’s guide. Los Angeles, CA : Muthén & Muthén. 11 Jacques Juhel 16èmes Journées de psychologie différentielle Parry, C.D., & McArdle, J.J. (1991). An applied comparison of methods for least-squares factor analysis of dichotomous variables. Applied Psychological Measurement, 15, 35-46. Reckase, M.D. et al. (1985). When Unidimensional Data Are Not Unidimensional. Paper presented at the Annual Meeting of the Psychometric Society (50th, Nashville, TN, June 1-4, 1985). Takane, Y., & De Leeuw, J. (1987). On the relationship between item response theory and factor analysis of discretized variables. Psychometrika, 52, 393-408. Wilson, D.T., Wood, R., & Gibbons, R. (1991). TESTFACT : Test scoring, item statistics, and item factor analysis. Chicago: SSI, Inc. Woods, C.M. (2002). Factor analysis of scales composed of binary items: Illustration with the Maudsley Obsessional Compulsive Inventory. Journal of Psychopathology and Behavioral Assessment, 24, 215-223. Annexe 1) Programme de commande pour Mplus TITLE: DATA: VARIABLE: ANALYSIS: OUTPUT: Analyse factorielle exploratoire pour donnees dichotomiques Questionnaire recodé étudiants, N=186 File is ESRdicho.TXT; NAMES ARE y1-y18; CATEGORICAL ARE y1-y18; TYPE = EFA 1 3; ! solutions à 1, 2 et 3 facteurs ESTIMATOR = WLSMV; ! méthode d’estimation SAMPSTAT; 2) Programme de commande pour NOHARM Analyse factorielle non linéaire exploratoire 18 2 186 1 1 0 0 0 000000000000000000 0.747 0.618 0.806 ……………. ! solution à 2 facteurs (ou 1, 3…) ! cj fixé à 0 : modèle à 2 paramètres !matrice diagonale de moment-produit 3) Programme de commande pour TESTFACT >TITLE Analyse factorielle à information complète Questionnaire d'Estime de Soi à 18 items >PROBLEM NITEMS=18, SELECT=18, RESPONSE=3; >NAMES i1,i2,i3,i4,i5,i6,i7,i8,i9,i10,i11,i12,i13, i14,i15,i16,i17,i18; >RESPONSE '9','0','1'; >KEY 111111111111111111; >SELECT 1(1)18; >RELIABILITY ALPHA; >TETRACHORIC RECODE, NDEC=3; >FACTOR NFAC=3, ! solution à 3 facteurs (ou 1, 2…) NROOT=6, ROTATE=(PROMAX,3,2); >FULL CYCLES=100, RECODE; >TECHNICAL PRECISION=0.005; >SCORE METHOD=2, LIST=10; >INPUT NIDCHAR=3, SCORES, FILE='dataESR.txt'; (3A1,18A1) >STOP 12