Chapitre 2 Autocorrélation des erreurs

Transcription

Chapitre 2 Autocorrélation des erreurs
Chapitre 2
Autocorrélation des erreurs
Licence Econométrie – Econométrie II
2007-2008
Martin Fournier
[email protected]
L3 Econométrie - Econométrie II
1
1. Présentation du problème
L3 Econométrie - Econométrie II
2
1.1 Présentation du problème (1)
Reprenons le modèle linéaire général
Il y a autocorrélation des erreurs lorsque l’hypothèse
H5 (cf. ch. Introductif) n’est plus vérifiée, soit :
Interprétation :
- La matrice de variance covariance des termes
d’erreurs n’est pas diagonale
- Les termes d’erreur des différentes observations ne
sont pas indépendants
L3 Econométrie - Econométrie II
3
1
1.2 Présentation du problème (2)
En présence d’autocorrélation, les estimateurs
MCO sont sans biais mais ne sont plus à variance
minimale.
En présence d’autocorrélation, les écarts types
usuels des MCO et les tests ne sont plus valides,
même asymptotiquement.
L3 Econométrie - Econométrie II
4
1.3 Les MCO restent sans biais
Sans biais ?
L3 Econométrie - Econométrie II
5
1.4 Mais ne sont plus de variance
minimale
De variance minimale ?
En présence d’autocorrélation des termes
d’erreur, les hypothèses du théorème de GaussMarkov (cf. Econométrie I) ne sont plus
vérifiées
Le résultat de variance minimale des MCO
n’est plus valide
L3 Econométrie - Econométrie II
6
2
1.5 Les tests usuels des MCO
sont invalidés
La variance de l’estimateur des MCO est :
L3 Econométrie - Econométrie II
7
1.6 Les tests usuels des MCO
sont invalidés (2)
Tous les tests d’hypothèse qui reposent sur
l’expression de la matrice de variancecovariance des MCO ( σ 2 ( X ' X ) −1 ) sont
invalidés
Écarts-types et intervalles de confiance des
coefficients estimés
t-Tests et F-tests sur les coefficients
NB : La mesure de la qualité de la régression par
le R2 reste en revanche valide
L3 Econométrie - Econométrie II
8
1.7 Plan du chapitre
Les sources usuelles de l’autocorrélation
Introduction aux séries chronologiques
Tester la présence d’autocorrélation
Méthodes de correction
Conclusion et mises en garde
L3 Econométrie - Econométrie II
9
3
2. Les sources usuelles du
problème
L3 Econométrie - Econométrie II
10
2.1 Les sources usuelles du problème
L’autocorrélation des erreurs peut être observée
pour plusieurs raisons :
- Variables explicatives importantes omises
- Mauvaise spécification du modèle
- Effets dynamiques non modélisés
Sources d’« inertie » dans les erreurs
L’autocorrélation des erreurs se rencontre
essentiellement dans les modèles en séries
temporelles.
L3 Econométrie - Econométrie II
11
2.2 Mauvaise spécification
Un mauvais choix de forme fonctionnelle peut
aussi s’interpréter comme une variable omise :
Modèle théorique :
yt = a + b.xt + c.xt2+ vt
Modèle estimé :
yt = a + b.xt + ut
L3 Econométrie - Econométrie II
12
4
3. Introduction aux modèles en
séries chronologiques
L3 Econométrie - Econométrie II
13
3.1 Introduction aux modèles en
séries chronologiques
Exemples
- Variables macro-économiques françaises (PIB, inflation,
chômage, etc.)
- Suivi mensuel d’un individu (emploi, salaire,
consommation, etc.)
- Cotation d’une action (annuelle, mensuelle, journalière,
à la minute…)
Formalisation
yt = b0 + b1xt1 + . . .+ bkxtk + ut
L3 Econométrie - Econométrie II
14
3.2 Séries chronologiques /
Coupes transversales
Les observations des séries chronologiques
sont ordonnées alors que l’ordre des
observations d’une coupe transversale n’a
pas d’importance
Les observations de séries chronologiques
sont issues d’un processus stochastique
(aléatoire) à partir d’un modèle théorique et
non pas d’un échantillonnage aléatoire
(coupes transversales)
L3 Econométrie - Econométrie II
15
5
3.3 Modèles avec retards
Un modèle statique relie des variables
contemporaines
yt = b0 + b1zt + ut
NB : Identique au modèle de coupe transversale
Un modèle avec retards inclut l’observation
passée de certaines variables
yt = a0 + d0zt + d1zt-1 + d2zt-2 + ut
L3 Econométrie - Econométrie II
16
3.4 Modèles avec retards (2)
yt = a0 + d0zt + d1zt-1 + d2zt-2 + ut
Le paramètre d0 mesure l’impact immédiat (i.e. de
court terme) de la variable z sur la variable y.
L’ensemble des paramètres (d0 , d1,…, dq) décrit
la relation de long terme entre les deux variables
L3 Econométrie - Econométrie II
17
3.5 Le problème des tendances
(trend)
Les différentes variables d’une série chronologique
économique ont souvent une tendance temporelle
Le fait que deux variables suivent la même
tendance ne suffit pas à prouver une relation
causale.
Exemple:
- Le cours du blé fluctue en fonction des précipitations
- La demande d’énergie (chauffage) fluctue également en
fonction des conditions météorologiques
Une corrélation est observable entre les deux variables
sans qu’il y ait pour autant de causalité
L3 Econométrie - Econométrie II
18
6
3.6 Le problème des tendances (2)
Ce sont le plus souvent des facteurs inobservés
par l’économètre qui causent les tendances
Même si ces facteurs ne peuvent être observés, il
est possible de les contrôler en modélisant la
tendance temporelle
La question de la cointégration (cf. cours de séries
temporelles en M1)
L3 Econométrie - Econométrie II
19
3.7 Le problème des tendances (3)
Comme pour le modèle économique, il existe
une infinité de spécifications possibles pour la
tendance
Tendance linéaire
yt = b0 + b1zt + a1t + et , t = 1, 2, …
Tendance exponentielle
log(yt) = b0 + b1zt + a1t + et , t = 1, 2, …
Tendance quadratique
yt = b0 + b1zt + a1t + a2t2 + et , t = 1, 2, …
L3 Econométrie - Econométrie II
20
3.8 Purger la tendance (detrending)
Au lieu d’introduire une tendance linéaire,
il est possible de travailler sur des données
purgées de la tendance (detrended)
1) Régression de chaque variable du modèle sur
une tendance
2) Utilisation des résidus de chaque équation
comme nouvelles variables
L3 Econométrie - Econométrie II
21
7
3.9 Purger la tendance (2)
Application pratique
yt = b0 + b1zt + a1t + et , t = 1, 2, …
1) Créations de variables purgées de la tendance
yt = c0 + c1t + εt ytd = εt
zt = d0 + d1t + ηt ztd = η t
2) Régression du modèle sur les nouvelles
variables
ytd = b1zdt + ωt , t = 1, 2, …
L3 Econométrie - Econométrie II
22
3.10 Purger la tendance (3)
Purger la tendance est une méthode en 2 étapes
qui introduit une erreur de mesure sur la
deuxième étape
Les variables purgées de la tendance sont
construites à partir de paramètres estimés
yt = c0 + c1t + ε t
yˆ td = yt − cˆ0 − cˆ1t
zt = d 0 + d1t + ηt
zˆ td = zt − dˆ0 − dˆ1t
L3 Econométrie - Econométrie II
23
3.11 Purger la tendance (4)
L’introduction d’une tendance et l’utilisation de
variables purgées de la tendance sont deux
approches équivalentes
Calcul du R2
Les régressions en séries temporelles ont souvent un R2
très élevé du seul fait du pouvoir explicatif de la
tendance (qui ne correspond pas au pouvoir explicatif
réel du modèle économique estimé)
Le R2 de la régression avec variables purgées de la
tendance reflète de manière plus juste le pouvoir
explicatif du modèle économique
L3 Econométrie - Econométrie II
24
8
3.12 Le cas d’erreurs
autorégressives de degré 1 [AR(1)]
yt = b0 + b1zt + ut
Prenons le cas particulier suivant
ut = ρ .ut−1 + et
ρ <1
avec 
et i.i.d (non autocorrélé)
(1)
L3 Econométrie - Econométrie II
25
3.13 Le cas d’erreurs AR(1) (2)
L3 Econométrie - Econométrie II
26
3.14 Le cas d’erreurs AR(1) (3)
L3 Econométrie - Econométrie II
27
9
3.15 Le cas d’erreurs AR(1) (4)
L3 Econométrie - Econométrie II
28
3.16 Sur ou sous-évaluation des
écarts-types ?
<
σ u2 ( X ' X ) −1 X ' Φ X ( X ' X ) −1 0 ?
>
Les deux cas sont possibles.
Dans la plupart des modèles économiques en
séries chronologiques, les erreurs sont
positivement corrélées et les variables explicatives
restent de même signe La variance des MCO
tend à sous-évaluer la vraie variance.
L3 Econométrie - Econométrie II
29
4. Détection de l’autocorrélation
L3 Econométrie - Econométrie II
30
10
4.1 Détection de l’autocorrélation
Elle s’effectue à partir de l’analyse des résidus
empiriques. Eux seuls sont connus
Examen visuel des résidus
L’analyse graphique des résidus permet le plus souvent
de détecter une autocorrélation des erreurs lorsque :
- Les résidus sont pendant plusieurs périodes consécutives, soit
positifs, soit négatifs : corrélation positive
- Les résidus sont alternés : corrélation négative.
Cependant, le plus souvent, l’analyse graphique est
délicate à interpréter
L3 Econométrie - Econométrie II
31
4.2 Examen visuel des résidus
L3 Econométrie - Econométrie II
32
4.3 Le test de Durbin Watson
Test d’autocorrélation des termes d’erreur d’ordre
1 selon la forme :
ut = ρ .ut −1 + et
avec : et → N (0, σ e2 )
Il s’agit de tester
contre
L3 Econométrie - Econométrie II
33
11
4.3 Le test de Durbin Watson (2)
Pour tester l’hypothèse nulle, on calcule la
statistique de Durbin Watson
n
DW =
∑ (uˆ
t =2
t
− uˆt −1 ) 2
n
∑ uˆ
t =1
2
t
De par sa construction, cette statistique varie entre
0 et 4 et on a :
L3 Econométrie - Econométrie II
34
4.4 Le test de Durbin Watson (3)
Preuve
L3 Econométrie - Econométrie II
35
4.5 Le test de Durbin Watson (4)
Afin de tester l’hypothèse nulle, Durbin et Watson
(1950) ont tabulé les valeurs critiques de DW au
seuil de 5%, en fonction de la taille de
l’échantillon T et du nombre de variables
explicatives (k).
La lecture de la table permet de déterminer 2
valeurs d1 et d2 comprises entre 0 et 2.
L3 Econométrie - Econométrie II
36
12
4.6 Les valeurs critiques du DW
p : nombre de variables explicatives (constante exclue)
n : nombre d’observations
L3 Econométrie - Econométrie II
37
4.7 Lecture de la table du DW
Le calcul de la statistique de Durbin Watson
permet de tester la présence d’autocorrélation de la
manière suivante
L3 Econométrie - Econométrie II
38
4.8 Les conditions d’utilisation de la
statistique de Durbin Watson
Le modèle doit comporter impérativement un
terme constant
Le nombre d’observations doit être supérieur (ou
égal) à 15
Le modèle estimé ne contient pas la variable
dépendante retardée dans les variables explicatives
Le test de DW ne permet de tester que
l’autocorrélation d’ordre 1
NB : La statistique de DW est une statistique de
2ème étape, i.e. calculée à partir des résidus
empiriques, eux-mêmes soumis à erreur de mesure
L3 Econométrie - Econométrie II
39
13
4.9 Exemple : Estimation d’une
fonction de consommation
(Greene, Econometric Analysis, 5° Edition)
yt : ln (consommation
réelle)
xt : ln (revenu réel)
Table de DW pour
1 var. explicative et
100 observations
d2 = 1,69
d1 = 1,65
L3 Econométrie - Econométrie II
40
4.10 Approches alternatives
Il s’agit de tester l’autocorrélation des termes
d’erreur d’ordre 1
ut = ρ.ut−1 + et
avec : et i.i.d (non autocorrélé)
NB : On lève ici l’hypothèse de normalité sur e
Pour cela il suffit de régresser les résidus
empiriques sur les résidus empiriques retardés
Un t-test sur le paramètre estimé permet de tester
la présence d’autocorrélation
L3 Econométrie - Econométrie II
41
4.11 Approches alternatives (2)
Une approche plus flexible
Test d’une autocorrélation des termes d’erreur d’ordre q
Estimation du modèle
ut = ρ .ut − q + et avec : et i.i.d non autocorrélé
t-test sur le paramètre estimé
Test d’une structure plus générale d’autocorrélation
jusqu’à l’ordre q
Estimation du modèle
q
ut = ∑ ρi .ut −i + et
i =1
avec : et i.i.d non autocorrélé
F-test sur le modèle estimé
L3 Econométrie - Econométrie II
42
14
5. Correction de l’autocorrélation
L3 Econométrie - Econométrie II
43
5.1 Les Moindres Carrés Généralisés
On a vu qu’en présence d’autocorrélation
Les estimateurs par MCO sont sans biais
Les estimateurs par MCO ne sont plus de variance
minimale
On cherche un estimateur qui soit de variance
minimale
L3 Econométrie - Econométrie II
44
5.2 Les Moindres Carrés Généralisés
(2)
Considérons le modèle linéaire général suivant
Y = Xβ + u avec Ω u ≠ σ 2 I
On peut démontrer que l’estimateur, sans biais,
fonction linéaire de Y et à variance minimale est
donné par :
βˆMCG = ( X ' Ω u−1 X ) −1 ( X ' Ω u−1Y )
Ω βˆ
MCG
= ( X ' Ω u−1 X ) −1
L3 Econométrie - Econométrie II
45
15
5.3 Les Moindres Carrés Généralisés (3)
Démonstration
L3 Econométrie - Econométrie II
46
5.4 Les Moindres Carrés Généralisés (4)
Démonstration (suite)
L3 Econométrie - Econométrie II
47
5.5 Les Moindres Carrés Généralisés (5)
Démonstration (suite)
L3 Econométrie - Econométrie II
48
16
5.6 Les Moindres Carrés Généralisés (6)
Si l’on connaît la matrice de variance-covariance
des erreurs, cela permet de résoudre la question de
l’autocorrélation des résidus.
Le théorème de Gauss Markov s’applique au modèle
transformé.
L’estimateur des MCG est BLUE
L’estimateur des MCG suit asymptotiquement une loi
normale centrée en β et de variance :
Var ( βˆ X * ) = σ 2 ( X * ' X * ) −1 = σ 2 ( X ' Ψ −1 X ) −1
NB : Les MCO sont un cas particulier des MCG pour Ψ = I
L3 Econométrie - Econométrie II
49
5.7 Appliquer la méthode des MCG
Dans la pratique, on ne connaît pas la matrice de variance
covariance des termes d’erreurs.
Il faut l’estimer dans une première étape.
Les tests d’hypothèses des MCO peuvent être directement
adaptés au modèle transformé.
En revanche, la statistique de R2 n’est plus comparable à
celle des MCO et il existe plusieurs alternatives (non
développées ici)
L3 Econométrie - Econométrie II
50
5.8 Les moindres carrés quasigénéralisés (MCQG)
Pour appliquer les MCQG, on procède en deux
étapes :
1) Estimation de la matrice permettant de transformer le
modèle estimé en un modèle sans autocorrélation des
erreurs
2) Estimation du modèle transformé par les MCO
NB : La première étape introduit des paramètres
estimés (avec erreur) dans la deuxième étape.
L3 Econométrie - Econométrie II
51
17
5.9 Application des MCQG au cas de
termes d’erreur AR(1)
Reprenons le modèle à termes d’erreurs AR(1) :
ut = ρ .ut −1 + et
 ρ <1
avec 
et i.i.d et non autocorrélé
On a vu que dans ce cas :
 1
ρ ρ2 .

1 .
.
 ρ
Ωu = σ u2  ρ 2
.
.
.

 .
.
. 1
 T −1
. ρ2 ρ
ρ
ρ T −1 

. 
ρ 2  = σ u2 Ψ ( ρ )
ρ 

1 
L3 Econométrie - Econométrie II
52
5.10 Application des MCQG au cas de
termes d’erreur AR(1) (2)
Pour obtenir l’estimateur des MCQG, il faut dans
un premier temps estimer le paramètre ρ.
L3 Econométrie - Econométrie II
53
5.11 Application des MCQG au cas de
termes d’erreur AR(1) (3)
L3 Econométrie - Econométrie II
54
18
5.12 Application des MCQG au cas de
termes d’erreur AR(1) (4)
Un résultat important :
Si l’estimateur de ρ est convergent, l’estimation en deux
étapes par les MCQG est asymptotiquement équivalente
à utiliser le vrai paramètre ρ
Les limites :
- Les propriétés à distance finie des estimateurs par les
MCQG sont inconnues dans le cas général.
* N’est plus « sans biais »
* Les statistiques de tests ne sont que des
approximations des vraies statistiques de test du fait de
l’approximation de ρ par ρ̂
L3 Econométrie - Econométrie II
55
5.13 Estimer ρ dans le cas de termes
d’erreur AR(1)
Différentes études montrent que les MCQG sont le
plus souvent plus efficaces que les MCO mais, si le
problème d’autocorrélation n’est pas trop grave, les
MCO peuvent être plus efficaces que les MCQG sur
petits échantillons.
Les MCQG sont en particulier largement utilisés
lorsque le modèle d’autocorrélation retenu pour les
erreurs est donné par :
ut = ρ .ut −1 + et
avec et → N(0,σ e2 )
L3 Econométrie - Econométrie II
56
5.14 Estimer ρ dans le cas de termes
d’erreur AR(1) (2)
Première approche : estimation directe
1. OLS sur le modèle sans tenir compte de l’autocorrélation
2. OLS sur les résidus du modèle estimés (û ) selon le modèle
∑ uˆ uˆ
∑ uˆ
t t −1
uˆt = ρ .uˆt −1 + et ⇒ ρˆ = ρˆ 0 =
t
2
t −1
t
1
4
24
3
Estimateur des MCO
[(X'X) -1 X'Y avec X = uˆt −1 et Y = uˆt ]
L3 Econométrie - Econométrie II
57
19
5.15 Estimer ρ dans le cas de termes
d’erreur AR(1) (3)
Deuxième approche : Utilisation de la statistique de
Durbin-Watson
T
DW =
∑ (uˆ
t =2
t
− uˆt −1 ) 2
T
∑ uˆ t2
d' où ρˆ = 1 -
DW
2
t =1
NB :
DW ≈ 2(1 − ρˆ )
L3 Econométrie - Econométrie II
58
5.16 La procédure itérative de
Cochrane-Orcutt
Première étape : initialisation de ρ par estimation directe
(cf. première approche)
ρ̂ 0 =
∑ uˆ uˆ
∑ uˆ
t t −1
t
2
t −1
t
Deuxième étape : utilisation de ρ̂ 0 pour appliquer les
MCQG dont on déduit un nouveau résidu empirique ûˆ et
une nouvelle valeur de ρ
uˆˆ uˆˆ
ρ̂1 =
∑
t t −1
t
∑ uˆˆ
2
t −1
t
Le processus est répété jusqu’à stabilité de l’estimation de
ρ
L3 Econométrie - Econométrie II
59
5.17 Exemple : Estimation d’une
fonction de consommation
+---------------------------------------------+
| AR(1) Model:
e(t) = rho * e(t-1) + u(t) |
| Initial value of rho
=
.90693 |
| Maximum iterations
=
100 |
Procédure
| Method = Prais - Winsten
|
| Iter= 1, SS=
.017, Log-L= 666.519353 |
équivalente à
| Iter= 2, SS=
.017, Log-L= 666.573544 |
Cochrane| Final value of Rho
=
.910496 |
Orcutt
| Iter= 2, SS=
.017, Log-L= 666.573544 |
| Durbin-Watson:
e(t) =
.179008 |
| Std. Deviation: e(t) =
.022308 |
| Std. Deviation: u(t) =
.009225 |
| Durbin-Watson:
u(t) =
2.512611 |
| Autocorrelation: u(t) =
-.256306 |
| N[0,1] used for significance levels
|
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Constant
-.08791441
.09678008
-.908
.3637
LOGY
.99749200
.01208806
82.519
.0000
7.99083133
RHO
.91049600
.02902326
31.371
.0000
Rappel :
LOGY(MCO)
1.00306
.00297
t=338.159
L3 Econométrie - Econométrie II
60
20
5.18 La procédure de “balayage” de
Hildreth-Lu
Première étape : A partir de la statistique de DurbinWatson, on détermine une autocorrélation positive ou
négative :
ρˆ 0 > 0 ou ρˆ 0 < 0
Deuxième étape : Régression pour l’intervalle des valeurs
possibles de ρ
Si ρˆ 0 > 0 alors ont utilise des valeurs de ρ sur [0,1]
Si ρˆ 0 < 0 alors ont utilise des valeurs de ρ sur [-1,0]
On retient la valeur de ρ qui minimise la somme des
carrés des résidus en balayant l’intervalle avec un pas
correspondant au degré de précision désiré.
L3 Econométrie - Econométrie II
61
6. Conclusions et mises en garde
L3 Econométrie - Econométrie II
62
6.1 Conclusions et mises en gardes
Le problème d’autocorrélation des erreurs est
particulièrement important en données chronologiques
Les méthodes de test et de correction de l’autocorrélation
vues ici uniquement pour des termes d’erreurs AR(1)
peuvent être développées pour tester et corriger des
autocorrélations plus complexes
Les méthodes des MCG et MCQG permettent de corriger
les biais induits par l’autocorrélation lorsque l’on connaît
la nature de cette autocorrélation
L3 Econométrie - Econométrie II
63
21
6.2 Conclusions et mises en gardes (2)
Si la nature de la structure d’autocorrélation est mal évaluée, le
remède peut se révéler plus nocif que la maladie.
Par ex. si les résidus sont saisonniers et qu’on les suppose AR(1)
Dans ce cas, on risque d’avoir par ces procédures d’estimation des
résultats plus mauvais que si on faisait des MCO simples.
Se tromper sur la modélisation des résidus peut être plus grave que le
problème d’autocorrélation en lui-même.
Souvent, il vaut mieux essayer de revoir sa spécification
économétrique au lieu d’appliquer ces méthodes de correction.
L3 Econométrie - Econométrie II
64
22

Documents pareils