Les modèles d`équations structurelles à variables - Cedric
Transcription
Les modèles d`équations structurelles à variables - Cedric
Les modèles d’équations structurelles à variables latentes Cours de Statistique Multivariée Approfondie [email protected] Modèles d’équations structurelles à variables latentes • Les modèles d’équation structurelles ou SEM permettent de quantifier des relations de cause à effet décrites par un modèle théorique • L'intérêt se concentre sur les variables latentes (non observables par une voie directe): les variables psychologiques abstraits comme «intelligence», «satisfaction», «statut social», «capacité», «confiance» • Les variables latentes sont mesurées par des indicateurs observables appelés variables manifestes. • Les modéles d’équations tructurelles font le pont entre l’analyse de régression, l’analyse utilisant des graphes (path analysis) et l’analyse factorielle Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 2 SEM: conventions de dessin η or η Latent Variables (LV) x or x Manifest Variables (VM) or Unidirectional Path (cause-effect) or Bidirectional Path (correlation) Feedback relation or reciprocal causation ε or ε or ε Errors Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 3 "Dessin" d'un modèle de régression Ce modèle de régression multiple y = β1x1 + β2x2 + ζ Peut etre “dessiné” avec un diagramme de chemin (Path Diagram) L’eereur est une variable latente ζ x1 1 β1 Variables Manifestes / Observées y x2 β2 Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 4 Modéles de chemin avec des variables manifestes Le modèle de régression multiple peut être généralisée à des chemins où les variables endogènes sont à leur fois causes d’autres variables endogènes. y1 = γ11 x1 + ζ1 y2 = β21 y1 + ζ2 ⎡ y ⎤ ⎡ γ 1 ⎥ Γ = ⎢ 11 y =⎢ ⎢⎣ y2 ⎥⎦ ⎢⎣ 0 ζ1 x1 γ11 y1 β21 ⎤ ⎡ 0 0 ⎤ ⎥ x = [ x1 ] Β = ⎢ ⎥ ⎥⎦ ⎢⎣ β21 0 ⎥⎦ ζ2 y2 ⎡ ζ ⎤ ζ =⎢ 1 ⎥ ⎢⎣ ζ 2 ⎥⎦ y = Γx + Βy + ζ Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 5 Modèle factoriel ξ1 x1 = λ11 ξ1 + δ1 λ11 x2 = λ21 ξ1 + δ2 x3 = λ31 ξ1 + δ3 ⎡ x ⎤ ⎢ 1 ⎥ x = ⎢ x2 ⎥ ⎢ ⎥ ⎣ x3 ⎦ ⎡λ11 ⎤ ⎢ ⎥ Λ x = ⎢λ21 ⎥ ⎢⎣λ31 ⎥⎦ ξ = [ξ1 ] λ21 λ31 x1 x2 x3 δ1 δ2 δ3 ⎡ δ ⎤ ⎢ 1 ⎥ δ = ⎢ δ2 ⎥ ⎢ ⎥ δ ⎣ 3 ⎦ x = Λ xξ + δ Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 6 Modèle factoriel multiple x1 = λ11 ξ1 + δ1 , x2 = λ21 ξ1 + λ22 ξ2 + δ2 x3 = λ31 ξ1 + δ3 x4 = λ42 ξ2 + δ4 x5 = λ52 ξ2 + δ5 x6 = λ62 ξ2 + δ6 " x1 % $ ' x =$ ' $#x 6 '& $λ11 & &λ21 &λ31 Λx = & &0 &0 & %0 € ξ1 λ11 0' ) λ22 ) 0) ) λ42 ) λ52 ) λ62 )( #ξ1 & ξ =% ( $ξ 2 ' λ21 λ31 ξ2 λ22 λ42 λ 52 x1 x2 x3 x4 δ1 δ2 δ3 δ4 x5 δ5 λ62 x6 δ6 #δ1 & % ( δ =% ( %$δ6 (' x = Λ xξ + δ € Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 7 Modéle de chemin avec des variables latentes x1 δ1 x2 δ2 λx x3 δ3 e1 Loadings e2 λx11 21 λx31 ξ1 γ11 y1 λy11 λy21 y2 γ21 Path Coefficients β21 ζ2 y3 λy32 η2 λy 72 λy y4 42 ε3 ε4 y5 λy52 λy62 y6 y7 η1 ζ1 Loadings ε5 ε6 ε7 Structural Model or inner model Measurement Model or outer model Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 8 Le modéle de mesure (externe) pour les VM exogènes δ1 δ2 x1 = λx11 ξ1 + δ1 x2 = λx21 ξ1 + δ2 x3 = λx31 ξ1 + δ3 δ3 ⎡ λx ⎡ x1 ⎤ ⎢ ⎢ ⎥ x = ⎢ x2 ⎥ Λ x = ⎢ λ x ⎢ x ⎢ x ⎥ ⎢ λ ⎣ ⎣ 3 ⎦ (P ×1) ⎤ 11 ⎥ ⎥ 21 ⎥ ⎥ 31 ⎦ (P × M ) x2 x1 λx11 λx21 ξ1 λx31 x3 ⎡ δ1 ⎢ ξ = [ξ1 ] δ = ⎢ δ 2 ⎢ δ ( M ×1) ⎣ 3 (P ×1) ⎤ ⎥ ⎥ ⎥ ⎦ x = Λ xξ + δ Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 9 Le modéle de mesure (externe) pour les VM endogènes y3 y1 = λ y11η1 + ε1 λy32 y2 = λ y21η1 + ε 2 y3 = λ η 2 + ε 3 y32 e 1 y4 = λ y42 η2 + ε 4 y5 = λ y52 η2 + ε 5 e y7 = λ y72 η2 + ε 7 y1 ⎤ ⎥ y2 ⎥ ⎥ y3 ⎥ y4 ⎥ ⎥ y5 ⎥ y6 ⎥ ⎥ y7 ⎥⎦ ⎛ ⎜ ⎜ ⎜ Λy = ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ y1 λy 11 λy y6 = λ y62 η2 + ε 6 ⎡ ⎢ ⎢ ⎢ ⎢ y =⎢ ⎢ ⎢ ⎢ ⎢ ⎢⎣ η2 2 λ11 λ21 0 0 0 0 0 ⎞ ⎟ 0 ⎟ ⎟ λ42 ⎟ λ52 ⎟ ⎟ λ62 ⎟ λ72 ⎟⎠ λy72 η1 λy y4 42 λy λy62 y7 21 ε3 52 ε4 y5 y6 ε5 ε6 ε7 y2 ⎡ ⎢ ⎢ ⎢ ⎡η1 ⎤ ⎢ η =⎢ ⎥ ε =⎢ ⎣η2 ⎦ ⎢ ⎢ ⎢ ⎢ ⎢⎣ ε1 ⎤ ⎥ ε2 ⎥ ⎥ ε3 ⎥ ε4 ⎥ ⎥ ε5 ⎥ ε6 ⎥ ⎥ ε 7 ⎥⎦ y = Λ yη + ε Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 10 Le modèle structurel (interne) ξ1 γ21 ζ2 η1 = γ11 ξ1 + ζ1 η2 η2 = γ21 ξ1 + β21η 1 + ζ2 γ11 β21 η1 ζ1 ⎡ η1 ⎤ ⎡ γ 11 ⎥ ξ = [ξ1 ] Γ = ⎢ η=⎢ ⎢⎣ γ 21 ⎢⎣ η2 ⎥⎦ ⎤ ⎡ ζ1 ⎡ 0 0 ⎤ ⎥ Β= ⎢ ⎥ ζ =⎢ β 0 ⎢⎣ 21 ⎥⎦ ⎥⎦ ⎢⎣ ζ 2 ⎤ ⎥ ⎥⎦ η = Γξ + Βη + ζ Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 11 Le modèle global x1 δ1 ξ1 x2 δ2 δ3 x3 ε1 y1 y2 y4 ε3 ε4 y5 η2 y6 y7 η1 ε2 y3 ζ2 ε5 ε6 ε7 ζ1 x = Λ xξ + δ y = Λ yη + ε Modèles de mesure Modéle structurel η = Γξ + Βη + ζ η = (I − B) (Γξ + ζ ) −1 Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 12 Two families of methods for estimating paths models with latent variables Méthodes basées sur la covariance Le but est de reproduire de matrice de covariance de l'échantillon des variables manifestes à l'aide des paramètres du modèle: • c'est une approche confirmative visant à valider un modèle SEM Le but est de fournir une estimation des scores de variables latentes • il est une approche plus exploratoire (stratégie opérationnel) Component-based Methods Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 13 Les hypothèses du modèle x1 δ1 ξ1 x2 δ2 δ3 ε1 ζ2 x3 y4 ε4 y6 y1 y7 y2 x = Λ xξ + δ y = Λ yη + ε ε3 y5 η2 η1 ε2 y3 ε5 ε6 η = (I − B) (Γξ + ζ ) −1 ε7 ζ1 E ( x ) = 0, E ( y ) = 0, E (ξ ) = 0, E (η) = 0, E (δ ) = 0, E (ε) = 0, E (ζ ) = 0 E (δε′) = 0, E ((ζδ ′)) = 0, E (ζε′) = 0 E (δξ ′) = 0, E (δη′) = 0, E (εξ ′) = 0, E (εη′) = 0 E (ζξ ′) = 0 Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 14 Covariance Structure Analysis (CSA, aka LISREL) x1 δ1 ξ1 x2 δ2 δ3 x3 ε1 y1 y4 ε3 ε4 y5 η2 y6 y7 η1 ε2 y3 ζ2 y2 ε5 ε6 ⎡Σ xx Σ=⎢ ⎣Σ yx ⎤ ⎥ Σ yy ⎦ ε7 ζ1 Une fois que le modèle est spécifié, la matrice de covariance des MV est exprimée en termes de paramètres du modèle Σ (Ω) = Σ (Γ,B,Λ x ,Λ y ,Φ, Ψ,Θδ ,Θε ) Path Coefficients Loadings Exog. LV Covariance Structural Error Covariance Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes Measurement Error Covariance 15 Analysing the covariance Estimation minimise une certaine fonction de la divergence entre la matrice de covariance (C) impliquée par le modèle et la matrice de covariance (S). ⎡Σ xx Σ=⎢ ⎣Σ yx ⎡sxx S =⎢ ⎣syx ⎤ ⎥ Σ yy ⎦ Empirical covariance matrix Population Covariance matrix ⎡ Λ x ΦΛ ' x + Θδ ⎢ Σ (Ω) = ⎢ −1 Λ I − B ) ΓΦ′Λ 'x ⎢ y( ⎣ ⎤ ⎥ syy ⎦ ⎤ ⎥ ⎡ ⎤ ⎥ −1 −1 Λ y ⎢( I − B) (ΓΦΓ′ + Ψ ) ( I − B)′ ⎥ Λ ' y + Θε ⎥ ⎣ ⎦ ⎦ “Implied” covariance matrix ⎡ Λ̂ x Φ̂Λ̂ ' x + Θ̂δ ⎢ Σ Ω̂ = C = ⎢ −1 ⎡ Λ̂ I − B̂ Γ̂Φ̂′Λ̂ ' x Λ̂ y ⎢ I − B̂ ⎢ y ⎣ ⎣ Estimated covariance matrix ( ) ( ) ( ) ( −1 ⎤ ⎥ −1' ⎤ ⎥ Γ̂Φ̂Γ̂′ + Ψ̂ I − B̂ ⎥ Λ̂ ' y + Θ̂ε ⎥ ⎦ ⎦ )( Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes ) S ≈C 16 Fonctions de divergence Maximum Likelihood FML = log C + tr (SC−1 ) − log S − ( p + q ) Unweighted Least Squares 1 ⎡ 2 FULS = tr ( S - C ) ⎤ ⎦ 2 ⎣ Generalised Least Squares FGLS 2⎤ 1 ⎡ −1 = tr ⎢W S - C ⎥ ⎦ 2 ⎣ ( ) Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 17 Considerations sur l’approache CSA • Estimateurs avec de bonnes propriétés statistiques • Les estimations sont obtenues au moyen de ML, ULS, WLS, GLS; • Taille de l'échantillon: 200-400 cas pour 10-15 variables observées; • L'identification du modèle (estimation unique des paramètres) peut être un problème (qui peut être résolu en imposant un ensemble de contraintes sur les paramètres) • Aucune estimation directe de variables latentes -> ce n'est pas son objectif!! Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 18 Références • K.A. Bollen : Structural Equations with Latent Variables, John Wiley & Sons., 1989 • R. Cudeck, S. Du Toit, D. Sörbom (Editors) : Structural Equation Modeling: Present and Future - A Festschrift in honor of Karl G. Jöreskog, Scientific Software International Chicago, 2001 • R. Hoyle : Structural equation modeling: concepts, issues and applications, SAGE Publications, 1995 • K.G. Jöreskog & D. Sörbom : Advances in Factor Analysis and Structural Equation Models, Abt Books, 1979 • K.G. Jöreskog, D. Sörbom, S. Du Toit, M. Du Toit : LISREL8: New Statistical Features, Second Printing with Revisions, Scientific Software International Chicago, 2000 • D. Kaplan : Structural Equation Modeling: Foundations and Extensions, SAGE Publications, 2000 • Rex B. Kline : Principles and Practice of Structural Equation Modeling, The Guilford Press, New York, 2005 D. Kaplan : Structural Equation Modeling: Foundations and Extensions, SAGE Publications, 2000 • Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes 19