Les modèles d`équations structurelles à variables - Cedric

Transcription

Les modèles d`équations structurelles à variables - Cedric
Les modèles d’équations structurelles
à variables latentes
Cours de Statistique Multivariée Approfondie
[email protected]
Modèles d’équations structurelles
à variables latentes
• 
Les modèles d’équation structurelles ou SEM permettent de quantifier des relations
de cause à effet décrites par un modèle théorique
• 
L'intérêt se concentre sur les variables latentes (non observables par une voie
directe): les variables psychologiques abstraits comme «intelligence»,
«satisfaction», «statut social», «capacité», «confiance»
• 
Les variables latentes sont mesurées par des indicateurs observables appelés
variables manifestes. • 
Les modéles d’équations tructurelles font le pont entre l’analyse de régression,
l’analyse utilisant des graphes (path analysis) et l’analyse factorielle
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
2 SEM: conventions de dessin
η
or
η
Latent Variables (LV)
x
or
x
Manifest Variables (VM)
or
Unidirectional Path
(cause-effect)
or
Bidirectional Path
(correlation)
Feedback relation or
reciprocal causation
ε
or
ε
or
ε
Errors
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
3 "Dessin" d'un modèle de régression
Ce modèle de régression multiple
y = β1x1 + β2x2 + ζ
Peut etre “dessiné” avec un diagramme de chemin
(Path Diagram)
L’eereur est une
variable latente
ζ
x1
1
β1
Variables Manifestes /
Observées
y
x2
β2
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
4 Modéles de chemin avec des variables
manifestes
Le modèle de régression multiple peut être généralisée à des chemins
où les variables endogènes sont à leur fois causes d’autres variables
endogènes.
y1 = γ11 x1 + ζ1
y2 = β21 y1 + ζ2
⎡ y ⎤
⎡ γ
1
⎥ Γ = ⎢ 11
y =⎢
⎢⎣ y2 ⎥⎦
⎢⎣ 0
ζ1
x1
γ11
y1
β21
⎤
⎡ 0 0 ⎤
⎥ x = [ x1 ] Β = ⎢
⎥
⎥⎦
⎢⎣ β21 0 ⎥⎦
ζ2
y2
⎡ ζ ⎤
ζ =⎢ 1 ⎥
⎢⎣ ζ 2 ⎥⎦
y = Γx + Βy + ζ
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
5 Modèle factoriel
ξ1
x1 = λ11 ξ1 + δ1
λ11
x2 = λ21 ξ1 + δ2 x3 = λ31 ξ1 + δ3 ⎡ x ⎤
⎢ 1 ⎥
x = ⎢ x2 ⎥
⎢
⎥
⎣ x3 ⎦
⎡λ11 ⎤
⎢ ⎥
Λ x = ⎢λ21 ⎥
⎢⎣λ31 ⎥⎦
ξ = [ξ1 ]
λ21
λ31
x1
x2
x3
δ1
δ2
δ3
⎡ δ ⎤
⎢ 1 ⎥
δ = ⎢ δ2 ⎥
⎢
⎥
δ
⎣ 3 ⎦
x = Λ xξ + δ
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
6 Modèle factoriel multiple
x1 = λ11 ξ1 + δ1 ,
x2 = λ21 ξ1 + λ22 ξ2 + δ2 x3 = λ31 ξ1 + δ3 x4 = λ42 ξ2 + δ4
x5 = λ52 ξ2 + δ5 x6 = λ62 ξ2 + δ6
" x1 %
$ '
x =$  '
$#x 6 '&
$λ11
&
&λ21
&λ31
Λx = &
&0
&0
&
%0
€
ξ1
λ11
0'
)
λ22 )
0)
)
λ42 )
λ52 )
λ62 )(
#ξ1 &
ξ =% (
$ξ 2 '
λ21
λ31
ξ2
λ22
λ42 λ
52
x1
x2
x3
x4
δ1
δ2
δ3
δ4
x5
δ5
λ62
x6
δ6
#δ1 &
% (
δ =% (
%$δ6 ('
x = Λ xξ + δ
€
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
7 Modéle de chemin avec des variables latentes
x1
δ1
x2
δ2
λx
x3
δ3
e1
Loadings
e2
λx11
21
λx31
ξ1
γ11
y1
λy11
λy21
y2
γ21
Path
Coefficients
β21
ζ2
y3
λy32
η2
λy
72
λy
y4
42
ε3
ε4
y5
λy52
λy62
y6
y7
η1
ζ1
Loadings
ε5
ε6
ε7
Structural Model or inner model
Measurement Model or outer model
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
8 Le modéle de mesure (externe) pour les VM
exogènes
δ1
δ2
x1 = λx11 ξ1 + δ1 x2 = λx21 ξ1 + δ2 x3 = λx31 ξ1 + δ3 δ3
⎡ λx
⎡ x1 ⎤
⎢
⎢
⎥
x = ⎢ x2 ⎥ Λ x = ⎢ λ x
⎢
x
⎢ x ⎥
⎢
λ
⎣
⎣ 3 ⎦
(P ×1)
⎤
11
⎥
⎥
21
⎥
⎥
31
⎦
(P × M )
x2
x1 λx11
λx21
ξ1
λx31
x3
⎡ δ1
⎢
ξ = [ξ1 ] δ = ⎢ δ 2
⎢ δ
( M ×1)
⎣ 3
(P ×1)
⎤
⎥
⎥
⎥
⎦
x = Λ xξ + δ
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
9 Le modéle de mesure (externe) pour les VM
endogènes
y3
y1 = λ y11η1 + ε1
λy32
y2 = λ y21η1 + ε 2
y3 = λ η 2 + ε 3
y32
e
1
y4 = λ y42 η2 + ε 4
y5 = λ y52 η2 + ε 5
e
y7 = λ y72 η2 + ε 7
y1 ⎤
⎥
y2 ⎥
⎥
y3 ⎥
y4 ⎥
⎥
y5 ⎥
y6 ⎥
⎥
y7 ⎥⎦
⎛
⎜
⎜
⎜
Λy = ⎜
⎜
⎜
⎜
⎜
⎝
y1
λy 11
λy
y6 = λ y62 η2 + ε 6
⎡
⎢
⎢
⎢
⎢
y =⎢
⎢
⎢
⎢
⎢
⎢⎣
η2
2
λ11
λ21
0
0
0
0
0 ⎞
⎟
0 ⎟
⎟
λ42 ⎟
λ52 ⎟
⎟
λ62 ⎟
λ72 ⎟⎠
λy72
η1
λy
y4
42
λy
λy62
y7
21
ε3
52
ε4
y5
y6
ε5
ε6
ε7
y2
⎡
⎢
⎢
⎢
⎡η1 ⎤
⎢
η =⎢ ⎥ ε =⎢
⎣η2 ⎦
⎢
⎢
⎢
⎢
⎢⎣
ε1 ⎤
⎥
ε2 ⎥
⎥
ε3 ⎥
ε4 ⎥
⎥
ε5 ⎥
ε6 ⎥
⎥
ε 7 ⎥⎦
y = Λ yη + ε
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
10 Le modèle structurel (interne)
ξ1
γ21
ζ2
η1 = γ11 ξ1 + ζ1 η2
η2 = γ21 ξ1 + β21η 1 + ζ2 γ11
β21
η1
ζ1
⎡ η1 ⎤
⎡ γ 11
⎥ ξ = [ξ1 ] Γ = ⎢
η=⎢
⎢⎣ γ 21
⎢⎣ η2 ⎥⎦
⎤
⎡ ζ1
⎡ 0 0 ⎤
⎥ Β= ⎢
⎥ ζ =⎢
β
0
⎢⎣ 21
⎥⎦
⎥⎦
⎢⎣ ζ 2
⎤
⎥
⎥⎦
η = Γξ + Βη + ζ
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
11 Le modèle global
x1
δ1
ξ1
x2
δ2
δ3
x3
ε1
y1
y2
y4
ε3
ε4
y5
η2
y6
y7
η1
ε2
y3
ζ2
ε5
ε6
ε7
ζ1
x = Λ xξ + δ
y = Λ yη + ε
Modèles de mesure
Modéle structurel
η = Γξ + Βη + ζ η = (I − B) (Γξ + ζ )
−1
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
12 Two families of methods for estimating paths
models with latent variables
Méthodes basées sur
la covariance
Le but est de reproduire de matrice de covariance de
l'échantillon des variables manifestes à l'aide des
paramètres du modèle: •  c'est une approche confirmative visant à valider un
modèle SEM
Le but est de fournir une estimation des scores de
variables latentes •  il est une approche plus exploratoire (stratégie
opérationnel)
Component-based
Methods
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
13 Les hypothèses du modèle
x1
δ1
ξ1
x2
δ2
δ3
ε1
ζ2
x3
y4
ε4
y6
y1
y7
y2
x = Λ xξ + δ
y = Λ yη + ε
ε3
y5
η2
η1
ε2
y3
ε5
ε6
η = (I − B) (Γξ + ζ )
−1
ε7
ζ1
E ( x ) = 0, E ( y ) = 0, E (ξ ) = 0, E (η) = 0, E (δ ) = 0, E (ε) = 0, E (ζ ) = 0
E (δε′) = 0, E ((ζδ ′)) = 0, E (ζε′) = 0
E (δξ ′) = 0, E (δη′) = 0, E (εξ ′) = 0, E (εη′) = 0
E (ζξ ′) = 0
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
14 Covariance Structure Analysis (CSA, aka LISREL)
x1
δ1
ξ1
x2
δ2
δ3
x3
ε1
y1
y4
ε3
ε4
y5
η2
y6
y7
η1
ε2
y3
ζ2
y2
ε5
ε6
⎡Σ xx
Σ=⎢
⎣Σ yx
⎤
⎥
Σ yy ⎦
ε7
ζ1
Une fois que le modèle est spécifié, la matrice de covariance des MV est
exprimée en termes de paramètres du modèle
Σ (Ω) = Σ (Γ,B,Λ x ,Λ y ,Φ, Ψ,Θδ ,Θε )
Path Coefficients
Loadings
Exog. LV
Covariance
Structural
Error
Covariance
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
Measurement
Error
Covariance
15 Analysing the covariance
Estimation minimise une certaine fonction de la divergence entre la matrice de
covariance (C) impliquée par le modèle et la matrice de covariance (S).
⎡Σ xx
Σ=⎢
⎣Σ yx
⎡sxx
S =⎢
⎣syx
⎤
⎥
Σ yy ⎦
Empirical covariance matrix
Population Covariance matrix
⎡
Λ x ΦΛ ' x + Θδ
⎢
Σ (Ω) = ⎢
−1
Λ
I
−
B
) ΓΦ′Λ 'x
⎢ y(
⎣
⎤
⎥
syy ⎦
⎤
⎥
⎡
⎤
⎥
−1
−1
Λ y ⎢( I − B) (ΓΦΓ′ + Ψ ) ( I − B)′ ⎥ Λ ' y + Θε ⎥
⎣
⎦
⎦
“Implied” covariance matrix
⎡
Λ̂ x Φ̂Λ̂ ' x + Θ̂δ
⎢
Σ Ω̂ = C = ⎢
−1
⎡
Λ̂
I
−
B̂
Γ̂Φ̂′Λ̂ ' x Λ̂ y ⎢ I − B̂
⎢ y
⎣
⎣
Estimated covariance matrix
( )
(
)
(
) (
−1
⎤
⎥
−1' ⎤
⎥
Γ̂Φ̂Γ̂′ + Ψ̂ I − B̂ ⎥ Λ̂ ' y + Θ̂ε ⎥
⎦
⎦
)(
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
)
S ≈C
16 Fonctions de divergence
Maximum Likelihood
FML = log C + tr (SC−1 ) − log S − ( p + q )
Unweighted Least Squares
1 ⎡
2
FULS = tr ( S - C ) ⎤
⎦
2 ⎣
Generalised Least Squares
FGLS
2⎤
1 ⎡ −1
= tr ⎢W S - C ⎥
⎦
2 ⎣
(
)
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
17 Considerations sur l’approache CSA
• 
Estimateurs avec de bonnes propriétés statistiques • 
Les estimations sont obtenues au moyen de ML, ULS, WLS, GLS;
• 
Taille de l'échantillon: 200-400 cas pour 10-15 variables observées; • 
L'identification du modèle (estimation unique des paramètres) peut être un
problème (qui peut être résolu en imposant un ensemble de contraintes sur les
paramètres)
• 
Aucune estimation directe de variables latentes -> ce n'est pas son objectif!! Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
18 Références
• 
K.A. Bollen : Structural Equations with Latent Variables, John Wiley & Sons., 1989
• 
R. Cudeck, S. Du Toit, D. Sörbom (Editors) : Structural Equation Modeling: Present and
Future - A Festschrift in honor of Karl G. Jöreskog, Scientific Software International Chicago,
2001
• 
R. Hoyle : Structural equation modeling: concepts, issues and applications, SAGE
Publications, 1995
• 
K.G. Jöreskog & D. Sörbom : Advances in Factor Analysis and Structural Equation Models,
Abt Books, 1979
• 
K.G. Jöreskog, D. Sörbom, S. Du Toit, M. Du Toit : LISREL8: New Statistical Features,
Second Printing with Revisions, Scientific Software International Chicago, 2000
• 
D. Kaplan : Structural Equation Modeling: Foundations and Extensions, SAGE Publications,
2000
• 
Rex B. Kline : Principles and Practice of Structural Equation Modeling, The Guilford Press,
New York, 2005
D. Kaplan : Structural Equation Modeling: Foundations and Extensions, SAGE Publications,
2000
• 
Giorgio Russolillo – Les modèles d’équations structurelles à variables latentes
19