Modèles basiques de panel

Transcription

Modèles basiques de panel
Claudio Araujo
29/09/2013
Microéconométrie
II. Exploiter des données à plusieurs dimensions
Modèles basiques de panel
Claudio Araujo
CERDI, Université d’Auvergne
Clermont-Ferrand, France
www.cerdi.org
http://www.cerdi.org/claudio-araujo/perso/
1.
Principales caractéristiques des
données longitudinales
• Structure des données
– Données ou séries temporelles (time series)
– Données en coupe transversales (cross sections)
– Données en coupe transversales regroupées (pooled cross
sections)
– Données longitudinales issues d’un panel (panel data)
• Avantages et limites des données de panel
–
–
–
–
Augmentation de la taille de l’échantillon
Double (multi) dimension : caractères individuels et temporels
Interprétation plus fine des résultats
Prise en compte de l’hétérogénéité inobservée
CERDI – Ecole d’Economie UdA
1
Claudio Araujo
29/09/2013
2.
Modélisation des données de panel
• Modèle économétrique linéaire générale
–
–
–
–
•
•
•
•
Comment représenter un modèle de panel ?
Peut-on estimer ce modèle ?
Faut-il imposer des contraintes à ce modèle ?
Quelles options pour contrôler les effets spécifiques ?
Régression groupée (RG)
Modèle à effets fixes (EF)
Modèle à effets aléatoires (EA)
Modèle Between
3. Méthodes d’estimation
• Utilisation des moindres carrés ordinaires (MCO)
• Estimation des modèles à effets fixes
– Approche par les variables muettes (MVM)
– Approche par l’utilisation du théorème de FrischWaugh (within)
• Estimation des modèles à effets aléatoires
– Estimation de la matrice variance-covariance quand
celle-ci est inconnue : le moindres carrés (quasi)
généralisés (MCQG)
– Estimation par le maximum de vraisemblance
CERDI – Ecole d’Economie UdA
2
Claudio Araujo
29/09/2013
4.
Justification et tests d’hypothèses
• Test d’absence d’effets spécifiques fixes
• Test d’absence d’effets spécifiques aléatoires
• Choix entre les effets spécifiques fixes et
aléatoires
– Selon le mode de sélection de l’échantillon
– Selon les caractéristiques des variables ou le type
de modèle économétrique
– Test d’Hausman
• Le problème de l’hétéroscédasticité et de
l’autocorrélation en panel
Microéconométrie
• Principales notions du chapitre
– Données longitudinales (panel, pooling), données en coupe
transversale, séries chronologiques
– Modèles à effets fixes et aléatoires
– Opérateurs within et between
– Estimation par la méthode de moindres carrés quasi
généralisés
– Tests d’absence d’effets spécifiques
• Travaux pratiques
–
–
–
–
–
Calculer des opérateurs à double indice
Estimer des modèles basique de panel
Programmer, tester et interpreter le test d’Hausman
Tester l’autocorrélation en panel
Commentaire d’articles d’économie du développement, utilisant
des techniques de données de panel
CERDI – Ecole d’Economie UdA
3
Claudio Araujo
29/09/2013
Microéconométrie
Textes pour discussions et/ou lecture
• Impact des conflits sur le secteur alimentaire
– Ali H. and E. Lin, 2010, “Wars, foodcost and
countervailing policies: A panel data approach”, Food
Policy, 35, pp. 378-390
• Effet des infrastructure sur la croissance
– Veganzones M-A., 2000, « Infrastructures,
investissement et croissance : un bilan de dix années
de recherches », Etudes et documents du CERDI, ED
2000.07
Complément au cours
Anciennes diapos
CERDI – Ecole d’Economie UdA
4
Claudio Araujo
29/09/2013
Variabilité inter-individuelle
(« between – group »)
Information disponible en
termes de décomposition de
la variabilité totale des
observations
Variabilité totale
Variabilité intertemporelle (« between
time-periods »)
Variabilité intraindividuelle-temporelle
(« double within »)
Exemples : Différents types de variabilité
Inter – individuelle
Différences structurelles
(culture, ethnie, grilles de salaires, …)
Inter – temporelle
Évolutions macro-économiques (reformes nationales,
cadre législatif, effets de la conjoncture, évolution des
salaires, …)
Intra – individuelle – temporelle
Comportement propre à chaque individu – caractéristiques
personnelles (diplôme, expérience, secteur d’activité, taille de
l’entreprise, …)
CERDI – Ecole d’Economie UdA
5
Claudio Araujo
29/09/2013
Impact de l’hétérogénéité inobservée
Cas d’une régression simple. i = 1, 2, 3, 4
Hétérogénéité saisie au niveau de
l’ordonnée à l’origine
y
En rouge : régression
ignorant l’hétérogénéité
inobservée
x
Exemple 1
Exemple 2
y
Exemple 3
4
4
3
1 2
2
Exemple 4
Hétérogénéité saisie au
niveau des pentes
3
1
Exemple 5
x
Observation : Ne pas confondre l’hétérogénéité entre les individus
(hétérogénéité des comportements) et le comportement hétérogène d’un
individu (hétérogénéité des situations)
y
Individu 1
droite de régression
Hétérogénéité de situation
(comportement d’un individu)
CERDI – Ecole d’Economie UdA
x
6
Claudio Araujo
29/09/2013
Modélisation de l’hétérogénéité
•
Modèle économétrique linéaire général
K
Y =
yit = αit + ∑ βkit xkit + ηit
( NT ×1)
k =1
•
β + η
i = 1, …, N ; t = 1, …, T
Terme d’erreurs
Caractéristiques
individuelles
1) E(εεi t ) = 0
2) E(εεi t )2 = σ2ε
3) E(εεi t εj t ) = 0 , ∀ i ≠ j
4) E(εεi t εi s ) = 0 , ∀ t ≠ s
5) E(xi t εi t ) = 0
η it = ν i + θ t + ε it
Caractéristiques
temporelles
•
X
( NT × K +1) ( K +1× NT ) ( NT ×1)
Peut-on estimer ce modèle ?
Le nombre de paramètres a estimer > taille de l’échantillon
Cas particulier de l’hétérogénéité individuelle
Trois contraintes
Tous les
coefficients sont
identiques
Ordonnée à l’origine
différente entre les
individus
αit = α
βk i t = βk
RG
MCO
CERDI – Ecole d’Economie UdA
Ordonnée à l’origine &
coefficients de pente
différents entre les
individus
αi t = α i
βk i t = βk
αi t = α i
βk i t = βk i
Caractère
MCC
Déterministe
Aléatoire
MEF
MEA
MCA
7
Claudio Araujo
29/09/2013
•
Illustrations graphiques
Droite
estimée
y
i=1
i=2
i=3
x
Régression Groupée (RG)
•
i=1
Illustrations graphiques
y
Modèle à Effets
Fixes (MEF)
i=2
i=3
νi
x
Modèle à Coefficients Fixes &
Composés (MCC-F)
y
i=1
i=2
i=3
i=1
i=2
i=3
x
CERDI – Ecole d’Economie UdA
y
x
Modèle à Coefficients
Composés (MCC)
16
8
Claudio Araujo
29/09/2013
•
Droite
estimée
Illustrations graphiques
i=2
y
i=1
« écarts »
aléatoires
Modèle à Effets
Aléatoires (MEA)
i=3
x
y
Droite
estimée
i=2
i=1
i=3
Modèle à Coefficients
Aléatoires (MCA)
x
•
Calcul des opérateurs inter et intra dans le cas particulier
d’effet individuel
Opérateur between
y1•
M
y1•
B
Y
( NT × NT ) ( NT ×1)
J 

=  IN ⊗ T  Y = M = Y
( NT ×1)
T 

yN •
M
yN •
Opérateur within
y11− y1•
M
y1T − y1•


J
T 
W Y = I NT − I N ⊗ Y = M
= Y −Y
(NT ×NT )(NT ×1) 
T  yN1− yN • (NT ×1)

M
yNT − yN •
N, T
Jean, 2002
Jean, 2003
Jean, 2004
Marie, 2002
Marie, 2003
Marie, 2004
Y BY WY
20 22.6 - 2.6
25 22.6 2.4
23 22.6 0.4
18 17
1
15 17 - 2
18 17
1
[ ]
CERDI – Ecole d’Economie UdA
9
Claudio Araujo
29/09/2013
Modèle à effets aléatoires – MEA (RE)
•
L’effet spécifique est pris en compte au niveau de la
perturbation stochastique qui comporte trois termes d’erreurs :
individuel, temporel et idiosyncratique.
Ce modèle est connu sous le nom : modèle à erreurs (ou à
variance) composées – MEC
Structure du MEC
•
•
effets spécifiques individuels
yit = α + ∑ βk xkit + (ν i + εit )
123
k =1
K
ηit
K
double effets
spécifiques
yit = α + ∑ β k xkit + (ν i + θ t + ε it )
14243
k =1
ηit
Matrice des variances–covariances des écarts (cas
d’effets spécifiques individuels)
(
 σ2 + σ2
ε
 ν
2
 σ
ν
Α =
(T ×T )

M

 σ2
ν

)
σ ν2
L
O
O
O
O
L
σ ν2



M
 = σ 2I + σ2 J
ν
T
ε T
2
σν 

σ ν2 + σ ε2 
σ ν2
(
)
En empilant les donnée pour l’ensemble des observations :
Ω =IN ⊗A=σε2 INT+σν2 (IN ⊗JT )
( NT×NT)
CERDI – Ecole d’Economie UdA
10
Claudio Araujo
29/09/2013
Après décomposition spectrale de la matrice Ω, on obtient :


Ω = (σε2+Tσν2 )Ι N ⊗ JT  + σε2 Ι NT − Ι N ⊗ JT 

T 
T 


Ou (dans le cas de double effets) :
Opérateur
moyenne
générale
Opérateur
between
individuel
Opérateur
between
temporel
Opérateur within
individuel temporel
J
I ⊗ JT J NT 
J ⊗ IT J NT 
I ⊗ JT J N ⊗ IT J NT 
Ω = κ1 NT  + κ2 N
−
+κ  N
−
+κ  N
−
+
NT  3 N
NT  4 T
N
NT 
 NT 
 T
σ ε2 + Tσν2
σ ε2 + Tσν2 + Nσθ2
•
σ ε2
σ ε + N σθ
2
2
Comment estimer ce modèle ?
• Par le MV :
′
ln( L ) = − NT ln(2π ) − NT ln(σε ) + N ln(φ ) − 1 ( y − Xβ ) Ω−1( y − Xβ )
2
2
2
2σ ε
•
(
ˆ
β
= X' Ω−1 X
mcg
Par le MCG :
–
)
−1
X' Ω−1Y
En remplaçant la matrice Ω on retrouve :
ˆ = ( X' WX + φX' BX)−1 ( X' WY + φX' BY)
β
mcg
–
φ : rapport entre les variances intra et inter
σε
2
φ=
CERDI – Ecole d’Economie UdA
σ ε + Tσ ν
2
2
11
Claudio Araujo
29/09/2013
•
•
Méthodes d’estimation des composants de la variance – MCQG
• Méthode de « Wallace–Hussain », 1969 : suggèrent calculer σε et σν à
partir des résidus obtenus par les MCO
• Méthode de « Amemiya » (Wansbeek & Kapteyn), 1971 : suggèrent
calculer σε et σν à partir des résidus obtenus par l’estimation du modèle
LSDV
• Méthode de « Nerlorve », 1971 : suggère calculer σν à partir des
coefficients du MVM et σε à partir des résidus du modèle within.
• Méthode de « Swamy–Arora », 1972 : suggèrent procèder en 2 étapes :
i) estimation intra et inter pour obtenir la valeur de φ ; ii) transformation
des données et estimation du modèle
Modèle à estimer
( )
K
{ [ ( ) ]} ( )
yit −1− φ yi =α+∑ βk xkit− 1− φ xki +ηit −1− φ ηi
k=1
(1 - √φ) : facteur de transformation des données
Méthodes d’estimation des composants de la variance
Méthode de « Amemiya »
(Wansbeek & Kapteyn), 1971
Méthode de « Wallace–
Hussain », 1969
Méthode de « Swamy–
Arora », 1972
Remplacer les
perturbations η par les
résidus obenus à partir
de l’estimation MCO
CERDI – Ecole d’Economie UdA
Procéder en 2
étapes :
estimation intra et
inter
Remplacer les
perturbations η par les
résidus obenus à partir
de l’estimation du
modèle LSDV
12
Claudio Araujo
29/09/2013
φ inconnu. Solution : MCQG.
Méthode d’estimation réalisée en deux temps
Méthode de « Swamy–
Arora »
Estimer
1
η̂ itafin d’obtenir la valeur de φ (estimation
2
intra et estimation inter)
Utiliser la valeur de φ pour transformer les données
et estimer le modèle
Remarques :
ˆ ν2=0
σ
Lorsque φ = 1 ⇒ MCO sur échantillon totale
Lorsque φ = 0 ⇒ Modèle Intra
T→∞
ˆ ν2 > σ
ˆ ε2
σ
Estimation de σ²ν par :
Autre Méthode :
« Nerlove » 1971
Coefficients du
modèle MVM :
Estimateur de la variance
(sans correction ddl) :
∑ (γˆ − γˆ )
2
N
i =1
i
N −1
σˆε2 =
εˆw' εˆw
NT
Estimation par le ML
′
ln( L ) = − NT ln(2π ) − NT ln(σε ) + N ln(φ ) − 1 ( y − Xβ ) Ω−1( y − Xβ )
2
2
2
2σ ε
φ = Variance intra / Variance inter
CERDI – Ecole d’Economie UdA
13

Documents pareils