ch6-Variables Instrumentales

Transcription

ch6-Variables Instrumentales
Chapitre 6
La méthode des variables
instrumentales
Licence Econométrie / MASS
Econométrie II, 2007-2008
Martin Fournier
[email protected]
Econométrie II - L3
Econométrie/Mass
1
1. Présentation du problème
La question de l’endogénéité
Econométrie II - L3
Econométrie/Mass
2
1.1 L’hypothèse d’éxogénéité
Les MCO supposent l’exogénéité des variables
explicatives, i.e.
Cov(x,u) = 0
Il existe de nombreuses situations où l’on doit
rejeter cette hypothèse
La méthode des variables instrumentales permet
de tenir compte de l’endogénéité de certaines
variables explicatives
Econométrie II - L3
Econométrie/Mass
3
1
1.2 Endogénéité et causalité
Une première source d’endogénéité concerne la
possibilité d’une causalité inverse.
On estime :
y = β0 + β 1x1 + β 2x2 + u
Alors qu’il existe une causalité inverse telle que :
x1 = δ0 + δ2x2 + Zγ + αy + v
Cov(x1,u) ≠ 0
Econométrie II - L3
Econométrie/Mass
4
1.3 Un exemple
On cherche à estimer une équation de croissance
économique :
ln(PIBt) – ln(PIBt-1) = β0 + β1INVt + β2EXPt + u
INV : taux d’investissement
EXP : taux d’exportations
Or on sait que :
INVt = δ0 + δ1PIBt-1 + Zδ + v
et
EXPt = γ0 + γ1PIBt-1 + Zγ + w
Econométrie II - L3
Econométrie/Mass
5
1.4 Endogénéité et variable omise
• Supposons que le modèle sous-jacent est :
y = β 0 + β 1x 1 + β 2x 2 + u
mais que l’on fasse une erreur de spécification en
omettant la variable x2. On estime donc :
y = δ0 + δ1x1 + v
avec v = β2x2 + u
• Si les variables x1 et x2 sont corrélées alors x1 est
également corrélé à v
Econométrie II - L3
Econométrie/Mass
6
2
1.5 Erreurs de mesure CEV
« Classical Error-in-Variables » (CEV) :
y = β 0 + β1 x1∗ + u
Avec une observation avec erreur : x1
e1 = x1 − x1∗
Équation estimée :
y = β 0 + β1 x1 + (u − β1e1 )
Avec x1 corrélé avec le terme d’erreur u-β1e1.
cov( x1 , u − β1e1 ) = − β1 cov(x1 , e1 ) = − β1σ e21
Econométrie II - L3
Econométrie/Mass
7
2. La méthode des variables
instrumentales
Le cas de la régression simple
Econométrie II - L3
Econométrie/Mass
8
2.1 Objectifs
Méthode qui permet d’estimer des
paramètres sans biais lorsqu’une variable
explicative est endogène (i.e. Cov(x,u) ≠ 0)
Causalité inverse
Biais de variable omise
CEV
Econométrie II - L3
Econométrie/Mass
9
3
2.2 Les instruments
y = β0 + β 1x1 + β 2x2 + u
avec Cov(x1,u) ≠ 0
On appelle instrument pour la variable x1 une
variable z qui vérifie les 2 propriétés suivantes :
1) z est une variable exogène :
Cov(z,u) = 0
2) z est une variable corrélée avec la variable x1 :
Cov(z,x1) ≠ 0
Econométrie II - L3
Econométrie/Mass
10
2.3 Trouver un instrument valide
La théorie économique (et le bon sens) permettent
(parfois) de trouver des instruments qu’il peut être
légitime de supposer exogènes (Cov(z,u) = 0)
On peut en revanche aisément tester formellement
la deuxième propriété (Cov(z,x1) ≠ 0) par un T-test
à partir d’une première estimation :
x = π0 + π1z + v
H0 : π1 = 0
Econométrie II - L3
Econométrie/Mass
11
2.4 Variables instrumentales –
Régression simple
Prenons le cas de la régression simple :
y = β 0 + β 1x + u
avec x endogène et z un instrument valide
On peut écrire :
L’estimateur IV de β1 est donc donné par :
Econométrie II - L3
Econométrie/Mass
12
4
2.5 Variables instrumentales –
Régression simple (2)
Sous l’hypothèse d’homoscédasticité
E(u2|z) = σ2 = Var(u)
On peut écrire la variance du paramètre estimé :
( )
σ2
nσ x2 ρ x2, z
( )
σˆ 2
Var βˆ1 =
Vaˆr βˆ1 =
SSTx Rx2, z
Econométrie II - L3
Econométrie/Mass
13
2.6 IV versus OLS
( )
σˆ 2
Vaˆr βˆ OLS =
SSTx
( )
Vaˆr βˆIV =
σˆ 2
SSTx Rx2, z
La variance de l’estimateurs IV ne diffère de celle des
MCO que par le R2 de la régression de x sur z
Comme R2 < 1, La variance de l’estimateurs IV est
plus grande que celle des MCO
NB : Mais l’estimateur MCO est biaisé si Cov(x,u) ≠ 0 !
Plus la corrélation entre z et x est forte, plus la variance
de l’estimateur IV est faible
Econométrie II - L3
Econométrie/Mass
14
2.7 Validité des instruments
Il est souvent difficile de tester l’hypothèse
d’exogénéité des instruments (Cov(z,u) = 0)
Si l’instrument n’est pas exogène, l’estimateur IV
sera également biaisé :
Corr ( z , u ) σ u
IV : plimβˆ1 = β1 +
•
Corr ( z , x) σ x
σ
~
OLS : plim β1 = β1 + Corr ( x, u ) • u
σx
L’estimateur IV sera préféré si :
Corr(z,u)/Corr(z,x) < Corr(x,u)
Econométrie II - L3
Econométrie/Mass
15
5
2.8 Variables instrumentales –
Doubles Moindres Carrés (2SLS)
y = β 0 + β 1x + u
x = π0 + π1z + v
L’estimateur IV est équivalent à une estimation
en deux étapes :
1) Estimation de l’équation d’instrumentation :
x = π0 + π1z + v
xˆ = π 0 + π 1 z
2) Estimation de l’équation d’intérêt sur x
y = δ 0 + δ1 xˆ + w
Econométrie II - L3
Econométrie/Mass
16
2.9 IV – Doubles Moindres
Carrés (2)
On peut montrer que :
δ1MCO = β1IV
La relation : y = δ 0 + δ1 xˆ + w peut être estimée par les
MCO avec :
δ1MCO =
=
π 1Cov( z , y )
Cov(π 0 + π 1 z , y )
=
Var (π 0 + π 1 z )
Cov(π 0 + π 1 z , x − u )
π 1Cov( z , y )
Cov( z , y )
=
= β1IV
π 1Cov( z , x) − Cov( z , u ) Cov( z , x)
Econométrie II - L3
Econométrie/Mass
17
3. La méthode des variables
instrumentales
Le cas de la régression multiple
Econométrie II - L3
Econométrie/Mass
18
6
3.1 IV et régression multiple
Les estimations IV peuvent être étendues
au cas de la régression multiple :
y1 = β0 + β1y2 + β2z1 + u1
avec y2 et y3 endogènes et z1 et z2 exogènes
Il est nécessaire d’avoir au moins un
instrument pour chaque variable
Econométrie II - L3
Econométrie/Mass
19
3.2 IV et régressions multiples (2)
Écrivons le modèle structurel comme :
y = β 0 + β 1x 1 + β 2x 2 + u
avec x1 endogène et x2 exogène
Soit z un instrument pour x1
Cov(z,u) = 0
x1 = π0 + π1z + π2x2 + v, avec π1 ≠ 0
NB : Cette équation régresse la variable endogène
sur toutes les variables exogènes et l’instrument
Econométrie II - L3
Econométrie/Mass
20
3.3 Doubles Moindres Carrés Two Stage Least Squares (2SLS)
y = β0 + β1x1 + β2x2 + u
Il est possible (et souhaitable) d’avoir plusieurs
instruments pour la même variable endogène :
x1 = π0 + π1z1 + π2z2 + π3z3 + v
Hypothèse : z2 et z3 sont des instruments valides
- Ils ne sont pas des déterminants directs de y1
- Ils sont non-corrélés avec le terme d’erreur u1
- Ils sont corrélés avec y2
Econométrie II - L3
Econométrie/Mass
21
7
3.4 L’estimateur IV et les 2SLS
On peut montrer (cf. cours de M1) que dans le cas général
l’estimateur IV est donné par :
β1IV = ( Z ' X ) −1 Z ' Y
avec Z : Ensemble des variables exogènes (explicatives non
endogènes + instruments)
Ce qui correspond à l’estimateur des doubles moindres
carrés :
β12 SLS = ( Xˆ ' Xˆ ) −1 Xˆ ' Y
Avec X̂ : Ensemble des variables explicatives simulées à
partir de l’équation d’instrumentation :
X = Zπ + v
Econométrie II - L3
Econométrie/Mass
22
3.5 L’estimateur IV et les 2SLS (2)
X = Zπ + v
β1IV = β12 SLS
⇒ πˆ MCO = ( Z ' Z ) −1 Z ' X
⇒ Xˆ = Zπˆ MCO = Z ( Z ' Z ) −1 Z ' X
Y = Xˆβ 2 SLS + u
⇒ βˆ 2 SLS = ( Xˆ ' Xˆ ) −1 Xˆ ' Y
[(
)(
'
= Z ( Z ' Z ) −1 Z ' X Z ( Z ' Z ) −1 Z ' X
= ( Z ' X ) −1 Z 'Y
)] (Z (Z ' Z )
−1
−1
)
'
Z' X Y
Econométrie II - L3
Econométrie/Mass
23
3.6 Doubles Moindres Carrés :
La forme de l’instrumentation
Remarque 1 :
Chacun des instruments pourrait être utilisé
indépendamment comme instrument
La meilleure forme d’instrumentation est une
combinaison linéaire de toutes les variables
exogènes
Remarque 2 :
Si les coefficients de l’estimateur IV et de
l’estimateur 2SLS sont égaux, la variance des
MCO pour l’estimation de deuxième étape est
Econométrie II - L3
invalide
Econométrie/Mass
24
8
3.7 Nombre d’instruments
Lorsqu’on a plusieurs variables endogènes,
il faut avoir au moins autant d’instruments
que de variables endogènes
Econométrie II - L3
Econométrie/Mass
25
4. Le cas particulier des erreurs
de mesure
Econométrie II - L3
Econométrie/Mass
26
4.1 Erreurs de mesure CEV et
estimations IV
Reprenons le modèle d’erreur de mesure CEV
y = β0 + β1x1* + β2x2 + u
- On observe x1 au lieu de x1*
- x 1 = x 1* + e 1
- e1 est non corrélé avec x1* et x2
- x1 est endogène
Si l’on peut trouver un instrument z pour x1 t.q.
Corr(z,u) = 0 et Corr(z,x1) ≠ 0
Alors l’estimation IV corrige le biais d’atténuation
Econométrie II - L3
Econométrie/Mass
27
9
5. Tester l’endogénéité d’une
variable
Econométrie II - L3
Econométrie/Mass
28
5.1 Test de Hausman
On sait que :
- Les estimateurs MCO et IV sont sans biais et
convergents sous l’hypothèse d’exogénéité
- Seul l’estimateur IV reste sans biais si
l’hypothèse d’exogénéité est rejetée
- L’estimateur MCO est préférable à l’estimateur
IV sous l’hypothèse d’exogénéité
L’idée du test de Hausman est de tester l’égalité
des estimateurs MCO et IV
Test disponible sous tous les logiciels usuels
Econométrie II - L3
Econométrie/Mass
29
5.2 Test de corrélation des erreurs
y = β0 + β1x1 + β2x2 + u
x1 = π0 + π1z1 + π2z2 + π3z3 + v
Si x1 est endogène et z un jeu d’instruments
valides alors le résidu de l’équation
d’instrumentation v est corrélé au résidu de
l’équation d’intérêt u
Tester directement cette hypothèse
Econométrie II - L3
Econométrie/Mass
30
10
5.3 Test de corrélation des erreurs (2)
Procédure en 3 étapes :
1) Estimation de l’équation d’instrumentation et
création d’une variables de résidus v
2) Inclusion du résidu v comme variable explicative de
l’équation d’intérêt
3) Test de significativité du coefficient associé à v
Si le coefficient est statistiquement différent de zéro,
l’hypothèse d’exogénéité est rejetée
NB : Si l’on a plusieurs variables endogène, il faut
tester conjointement la significativité des résidus de
chaque équation d’instrumentation
Econométrie II - L3
Econométrie/Mass
31
5.4 Tester des restrictions suridentifiées
Si l’on a un seul instrument pour la variable
endogène, il est impossible de tester l’absence de
corrélation entre l’instrument et le terme d’erreur :
Corr(z,u) = 0
Modèle « juste identifié »
Si l’on dispose de plusieurs instruments, le
modèle est « sur-identifié » et il est possible de
tester l’exogénéité d’un instrument
Econométrie II - L3
Econométrie/Mass
32
5.5 Le test OverID
Test en trois étapes :
1) Estimation de l’équation d’intérêt par IV et
construction du résidu empirique u
2) Regression du résidu u sur toutes les variables
exogènes du modèle (explicatives + instruments)
3) Test de la significativité jointe des coefficients
estimé par un test du multiplicateur de Lagrange :
Sous l’hypothèse nulle (exogénéité des
instruments) :
LM = nR2 ~ χq2
avec q le nombre d’instruments en excès
Econométrie II - L3
Econométrie/Mass
33
11
6. Exemple
Econométrie II - L3
Econométrie/Mass
34
6.1 Exemple : Equation de salaire
ln Wagei = β1 + β 2 Educi + β 3 Experi + β 4 Expersqi + U i
Dependent Variable: LWAGE
Method: Least Squares
Sample (adjusted): 1 428
Included observations: 428 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
EDUC
EXPER
EXPERSQ
-0.522041
0.107490
0.041567
-0.000811
0.198632
0.014146
0.013175
0.000393
-2.628179
7.598333
3.154906
-2.062833
0.0089
0.0000
0.0017
0.0397
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.156820
0.150855
0.666420
188.3052
-431.5990
1.960988
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
MCO
1.190173
0.723198
2.035509
2.073445
26.28616
0.000000
Econométrie II - L3
Econométrie/Mass
35
6.2 Exemple : Equation de salaire (2)
On suspecte l’éducation d’être endogène et on a instruments :
éducation de la mère (motheduc) et du père (fatheduc)
Dependent Variable: EDUC
Method: Least Squares
Equation d’instrumentation :
Les 2 instruments sont
significatifs
Sample: 1 428
Included observations: 428
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
EXPER
EXPERSQ
MOTHEDUC
FATHEDUC
9.102640
0.045225
-0.001009
0.157597
0.189548
0.426561
0.040251
0.001203
0.035894
0.033756
21.33958
1.123593
-0.838572
4.390609
5.615173
0.0000
0.2618
0.4022
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.211471
0.204014
2.038967
1758.575
-909.7168
1.939888
Mean dependent var
12.65888
S.D. dependent var
2.285376
Akaike info criterion
4.274378
Schwarz criterion
4.321797
F-statistic
Econométrie II - L328.36041
Prob(F-statistic)
Econométrie/Mass 0.000000
36
12
6.3 Exemple : Equation de salaire (3)
Dependent Variable: LWAGE
Method: Two-Stage Least Squares
Résultats (automatisé) des
Double Moindre Carrés
(2SLS)
Sample (adjusted): 1 428
Included observations: 428 after adjustments
Instrument list: EXPER EXPERSQ MOTHEDUC FATHEDUC
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
EDUC
EXPER
EXPERSQ
0.048100
0.061397
0.044170
-0.000899
0.400328
0.031437
0.013432
0.000402
0.120152
1.953024
3.288329
-2.237993
0.9044
0.0515
0.0011
0.0257
R-squared
Adjusted R-squared
S.E. of regression
Durbin-Watson stat
0.135708
0.129593
0.674712
1.945659
Mean dependent var
S.D. dependent var
Sum squared resid
Second-stage SSR
1.190173
0.723198
193.0200
212.2096
Econométrie II - L3
Econométrie/Mass
37
6.4 Exemple : Equation de salaire (4)
Dependent Variable: LWAGE
Method: Least Squares
Résultats (manuels) de
l’instrumentation
Sample: 1 428
Included observations: 428
Variable
Coefficient
Std. Error
t-Statistic
C
EDUCF
EXPER
EXPERSQ
0.048100
0.061397
0.044170
-0.000899
0.419756
0.032962
0.014084
0.000421
0.114591
1.862629
3.136129
-2.134408
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.049783
0.043059
0.707456
212.2096
-457.1743
1.958629
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
Prob.
0.9088
0.0632
0.0018
0.0334
1.190173
0.723198
2.155020
2.192956
7.404565
0.000076
Econométrie II - L3
Econométrie/Mass
38
6.5 Exemple : Test d’endogénéité
Dependent Variable: LWAGE
Method: Least Squares
Sample: 1 428
Included observations: 428
L’endogénéité de l’éducation ne peut
pas être rejetée au seuil de 10%
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
EDUC
EXPER
EXPERSQ
RESEDUC
0.048100
0.061397
0.044170
-0.000899
0.058167
0.394575
0.030985
0.013239
0.000396
0.034807
0.121904
1.981499
3.336272
-2.270622
1.671105
0.9030
0.0482
0.0009
0.0237
0.0954
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.162350
0.154429
0.665016
187.0701
-430.1908
1.931343
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Econométrie II - L3
Prob(F-statistic)
Econométrie/Mass
1.190173
0.723198
2.033602
2.081022
20.49612
0.000000
39
13

Documents pareils