Chapitre 2 Autocorrélation des erreurs

Transcription

Chapitre 2
Autocorrélation des erreurs
Licence Econométrie – Econométrie II
2007-2008
Martin Fournier
[email protected]
L3 Econométrie - Econométrie II
1
1. Présentation du problème
2
1.1 Présentation du problème (1)
Reprenons le modèle linéaire général
Il y a autocorrélation des erreurs lorsque l’hypothèse
H5 (cf. ch. Introductif) n’est plus vérifiée, soit :
Interprétation :
- La matrice de variance covariance des termes
d’erreurs n’est pas diagonale
- Les termes d’erreur des différentes observations ne
sont pas indépendants
3
1
1.2 Présentation du problème (2)
En présence d’autocorrélation, les estimateurs
MCO sont sans biais mais ne sont plus à variance
minimale.
En présence d’autocorrélation, les écarts types
usuels des MCO et les tests ne sont plus valides,
même asymptotiquement.
4
1.3 Les MCO restent sans biais
Sans biais ?
5
1.4 Mais ne sont plus de variance
minimale
De variance minimale ?
En présence d’autocorrélation des termes
d’erreur, les hypothèses du théorème de GaussMarkov (cf. Econométrie I) ne sont plus
vérifiées
Le résultat de variance minimale des MCO
n’est plus valide
6
2
1.5 Les tests usuels des MCO
sont invalidés
La variance de l’estimateur des MCO est :
7
1.6 Les tests usuels des MCO
sont invalidés (2)
Tous les tests d’hypothèse qui reposent sur
l’expression de la matrice de variancecovariance des MCO ( σ 2 ( X ' X ) −1 ) sont
invalidés
Écarts-types et intervalles de confiance des
coefficients estimés
t-Tests et F-tests sur les coefficients
NB : La mesure de la qualité de la régression par
le R2 reste en revanche valide
8
1.7 Plan du chapitre
Les sources usuelles de l’autocorrélation
Introduction aux séries chronologiques
Tester la présence d’autocorrélation
Méthodes de correction
Conclusion et mises en garde
9
3
2. Les sources usuelles du
problème
10
2.1 Les sources usuelles du problème
L’autocorrélation des erreurs peut être observée
pour plusieurs raisons :
- Variables explicatives importantes omises
- Mauvaise spécification du modèle
- Effets dynamiques non modélisés
Sources d’« inertie » dans les erreurs
L’autocorrélation des erreurs se rencontre
essentiellement dans les modèles en séries
temporelles.
11
2.2 Mauvaise spécification
Un mauvais choix de forme fonctionnelle peut
aussi s’interpréter comme une variable omise :
Modèle théorique :
yt = a + b.xt + c.xt2+ vt
Modèle estimé :
yt = a + b.xt + ut
12
4
3. Introduction aux modèles en
séries chronologiques
13
3.1 Introduction aux modèles en
séries chronologiques
Exemples
- Variables macro-économiques françaises (PIB, inflation,
chômage, etc.)
- Suivi mensuel d’un individu (emploi, salaire,
consommation, etc.)
- Cotation d’une action (annuelle, mensuelle, journalière,
à la minute…)
Formalisation
yt = b0 + b1xt1 + . . .+ bkxtk + ut
14
3.2 Séries chronologiques /
Coupes transversales
Les observations des séries chronologiques
sont ordonnées alors que l’ordre des
observations d’une coupe transversale n’a
pas d’importance
Les observations de séries chronologiques
sont issues d’un processus stochastique
(aléatoire) à partir d’un modèle théorique et
non pas d’un échantillonnage aléatoire
(coupes transversales)
15
5
3.3 Modèles avec retards
Un modèle statique relie des variables
contemporaines
yt = b0 + b1zt + ut
NB : Identique au modèle de coupe transversale
Un modèle avec retards inclut l’observation
passée de certaines variables
yt = a0 + d0zt + d1zt-1 + d2zt-2 + ut
16
3.4 Modèles avec retards (2)
yt = a0 + d0zt + d1zt-1 + d2zt-2 + ut
Le paramètre d0 mesure l’impact immédiat (i.e. de
court terme) de la variable z sur la variable y.
L’ensemble des paramètres (d0 , d1,…, dq) décrit
la relation de long terme entre les deux variables
17
3.5 Le problème des tendances
(trend)
Les différentes variables d’une série chronologique
économique ont souvent une tendance temporelle
Le fait que deux variables suivent la même
tendance ne suffit pas à prouver une relation
causale.
Exemple:
- Le cours du blé fluctue en fonction des précipitations
- La demande d’énergie (chauffage) fluctue également en
fonction des conditions météorologiques
Une corrélation est observable entre les deux variables
sans qu’il y ait pour autant de causalité
18
6
3.6 Le problème des tendances (2)
Ce sont le plus souvent des facteurs inobservés
par l’économètre qui causent les tendances
Même si ces facteurs ne peuvent être observés, il
est possible de les contrôler en modélisant la
tendance temporelle
La question de la cointégration (cf. cours de séries
temporelles en M1)
19
3.7 Le problème des tendances (3)
Comme pour le modèle économique, il existe
une infinité de spécifications possibles pour la
tendance
Tendance linéaire
yt = b0 + b1zt + a1t + et , t = 1, 2, …
Tendance exponentielle
log(yt) = b0 + b1zt + a1t + et , t = 1, 2, …
Tendance quadratique
yt = b0 + b1zt + a1t + a2t2 + et , t = 1, 2, …
20
3.8 Purger la tendance (detrending)
Au lieu d’introduire une tendance linéaire,
il est possible de travailler sur des données
purgées de la tendance (detrended)
1) Régression de chaque variable du modèle sur
une tendance
2) Utilisation des résidus de chaque équation
comme nouvelles variables
21
7
3.9 Purger la tendance (2)
Application pratique
yt = b0 + b1zt + a1t + et , t = 1, 2, …
1) Créations de variables purgées de la tendance
yt = c0 + c1t + εt ytd = εt
zt = d0 + d1t + ηt ztd = η t
2) Régression du modèle sur les nouvelles
variables
ytd = b1zdt + ωt , t = 1, 2, …
22
Purger la tendance est une méthode en 2 étapes
qui introduit une erreur de mesure sur la
deuxième étape
Les variables purgées de la tendance sont
construites à partir de paramètres estimés
yt = c0 + c1t + ε t
yˆ td = yt − cˆ0 − cˆ1t
zt = d 0 + d1t + ηt
zˆ td = zt − dˆ0 − dˆ1t
23
L’introduction d’une tendance et l’utilisation de
variables purgées de la tendance sont deux
approches équivalentes
Calcul du R2
Les régressions en séries temporelles ont souvent un R2
très élevé du seul fait du pouvoir explicatif de la
tendance (qui ne correspond pas au pouvoir explicatif
réel du modèle économique estimé)
Le R2 de la régression avec variables purgées de la
tendance reflète de manière plus juste le pouvoir
explicatif du modèle économique
24
8
3.12 Le cas d’erreurs
autorégressives de degré 1 [AR(1)]
yt = b0 + b1zt + ut
Prenons le cas particulier suivant
ut = ρ .ut−1 + et
ρ <1
avec 
et i.i.d (non autocorrélé)
(1)
25
3.13 Le cas d’erreurs AR(1) (2)
26
27
9
28
3.16 Sur ou sous-évaluation des
écarts-types ?
<
σ u2 ( X ' X ) −1 X ' Φ X ( X ' X ) −1 0 ?
>
Les deux cas sont possibles.
Dans la plupart des modèles économiques en
séries chronologiques, les erreurs sont
positivement corrélées et les variables explicatives
restent de même signe La variance des MCO
tend à sous-évaluer la vraie variance.
29
4. Détection de l’autocorrélation
30
10
4.1 Détection de l’autocorrélation
Elle s’effectue à partir de l’analyse des résidus
empiriques. Eux seuls sont connus
Examen visuel des résidus
L’analyse graphique des résidus permet le plus souvent
de détecter une autocorrélation des erreurs lorsque :
- Les résidus sont pendant plusieurs périodes consécutives, soit
positifs, soit négatifs : corrélation positive
- Les résidus sont alternés : corrélation négative.
Cependant, le plus souvent, l’analyse graphique est
délicate à interpréter
31
4.2 Examen visuel des résidus
32
4.3 Le test de Durbin Watson
Test d’autocorrélation des termes d’erreur d’ordre
1 selon la forme :
ut = ρ .ut −1 + et
avec : et → N (0, σ e2 )
Il s’agit de tester
contre
33
11
4.3 Le test de Durbin Watson (2)
Pour tester l’hypothèse nulle, on calcule la
statistique de Durbin Watson
n
DW =
∑ (uˆ
t =2
t
− uˆt −1 ) 2
n
∑ uˆ
t =1
2
t
De par sa construction, cette statistique varie entre
0 et 4 et on a :
34
Preuve
35
Afin de tester l’hypothèse nulle, Durbin et Watson
(1950) ont tabulé les valeurs critiques de DW au
seuil de 5%, en fonction de la taille de
l’échantillon T et du nombre de variables
explicatives (k).
La lecture de la table permet de déterminer 2
valeurs d1 et d2 comprises entre 0 et 2.
36
12
4.6 Les valeurs critiques du DW
p : nombre de variables explicatives (constante exclue)
n : nombre d’observations
37
4.7 Lecture de la table du DW
Le calcul de la statistique de Durbin Watson
permet de tester la présence d’autocorrélation de la
manière suivante
38
4.8 Les conditions d’utilisation de la
statistique de Durbin Watson
Le modèle doit comporter impérativement un
terme constant
Le nombre d’observations doit être supérieur (ou
égal) à 15
Le modèle estimé ne contient pas la variable
dépendante retardée dans les variables explicatives
Le test de DW ne permet de tester que
l’autocorrélation d’ordre 1
NB : La statistique de DW est une statistique de
2ème étape, i.e. calculée à partir des résidus
empiriques, eux-mêmes soumis à erreur de mesure
39
13
4.9 Exemple : Estimation d’une
fonction de consommation
(Greene, Econometric Analysis, 5° Edition)
yt : ln (consommation
réelle)
xt : ln (revenu réel)
Table de DW pour
1 var. explicative et
100 observations
d2 = 1,69
d1 = 1,65
40
4.10 Approches alternatives
Il s’agit de tester l’autocorrélation des termes
d’erreur d’ordre 1
ut = ρ.ut−1 + et
avec : et i.i.d (non autocorrélé)
NB : On lève ici l’hypothèse de normalité sur e
Pour cela il suffit de régresser les résidus
empiriques sur les résidus empiriques retardés
Un t-test sur le paramètre estimé permet de tester
la présence d’autocorrélation
41
4.11 Approches alternatives (2)
Une approche plus flexible
Test d’une autocorrélation des termes d’erreur d’ordre q
Estimation du modèle
ut = ρ .ut − q + et avec : et i.i.d non autocorrélé
t-test sur le paramètre estimé
Test d’une structure plus générale d’autocorrélation
jusqu’à l’ordre q
Estimation du modèle
q
ut = ∑ ρi .ut −i + et
i =1
avec : et i.i.d non autocorrélé
F-test sur le modèle estimé
42
14
5. Correction de l’autocorrélation
43
5.1 Les Moindres Carrés Généralisés
On a vu qu’en présence d’autocorrélation
Les estimateurs par MCO sont sans biais
Les estimateurs par MCO ne sont plus de variance
minimale
On cherche un estimateur qui soit de variance
minimale
44
5.2 Les Moindres Carrés Généralisés
(2)
Considérons le modèle linéaire général suivant
Y = Xβ + u avec Ω u ≠ σ 2 I
On peut démontrer que l’estimateur, sans biais,
fonction linéaire de Y et à variance minimale est
donné par :
βˆMCG = ( X ' Ω u−1 X ) −1 ( X ' Ω u−1Y )
Ω βˆ
MCG
= ( X ' Ω u−1 X ) −1
45
15
5.3 Les Moindres Carrés Généralisés (3)
Démonstration
46
Démonstration (suite)
47
Démonstration (suite)
48
16
Si l’on connaît la matrice de variance-covariance
des erreurs, cela permet de résoudre la question de
l’autocorrélation des résidus.
Le théorème de Gauss Markov s’applique au modèle
transformé.
L’estimateur des MCG est BLUE
L’estimateur des MCG suit asymptotiquement une loi
normale centrée en β et de variance :
Var ( βˆ X * ) = σ 2 ( X * ' X * ) −1 = σ 2 ( X ' Ψ −1 X ) −1
NB : Les MCO sont un cas particulier des MCG pour Ψ = I
49
5.7 Appliquer la méthode des MCG
Dans la pratique, on ne connaît pas la matrice de variance
covariance des termes d’erreurs.
Il faut l’estimer dans une première étape.
Les tests d’hypothèses des MCO peuvent être directement
adaptés au modèle transformé.
En revanche, la statistique de R2 n’est plus comparable à
celle des MCO et il existe plusieurs alternatives (non
développées ici)
50
5.8 Les moindres carrés quasigénéralisés (MCQG)
Pour appliquer les MCQG, on procède en deux
étapes :
1) Estimation de la matrice permettant de transformer le
modèle estimé en un modèle sans autocorrélation des
erreurs
2) Estimation du modèle transformé par les MCO
NB : La première étape introduit des paramètres
estimés (avec erreur) dans la deuxième étape.
51
17
5.9 Application des MCQG au cas de
termes d’erreur AR(1)
Reprenons le modèle à termes d’erreurs AR(1) :
ut = ρ .ut −1 + et
 ρ <1
avec 
et i.i.d et non autocorrélé
On a vu que dans ce cas :
 1
ρ ρ2 .

1 .
.
 ρ
Ωu = σ u2  ρ 2
.
.
.

 .
.
. 1
 T −1
. ρ2 ρ
ρ
ρ T −1 

. 
ρ 2  = σ u2 Ψ ( ρ )
ρ 

1 
52
termes d’erreur AR(1) (2)
Pour obtenir l’estimateur des MCQG, il faut dans
un premier temps estimer le paramètre ρ.
53
54
18
Un résultat important :
Si l’estimateur de ρ est convergent, l’estimation en deux
étapes par les MCQG est asymptotiquement équivalente
à utiliser le vrai paramètre ρ
Les limites :
- Les propriétés à distance finie des estimateurs par les
MCQG sont inconnues dans le cas général.
* N’est plus « sans biais »
* Les statistiques de tests ne sont que des
approximations des vraies statistiques de test du fait de
l’approximation de ρ par ρ̂
55
5.13 Estimer ρ dans le cas de termes
d’erreur AR(1)
Différentes études montrent que les MCQG sont le
plus souvent plus efficaces que les MCO mais, si le
problème d’autocorrélation n’est pas trop grave, les
MCO peuvent être plus efficaces que les MCQG sur
petits échantillons.
Les MCQG sont en particulier largement utilisés
lorsque le modèle d’autocorrélation retenu pour les
erreurs est donné par :
ut = ρ .ut −1 + et
avec et → N(0,σ e2 )
56
d’erreur AR(1) (2)
Première approche : estimation directe
1. OLS sur le modèle sans tenir compte de l’autocorrélation
2. OLS sur les résidus du modèle estimés (û ) selon le modèle
∑ uˆ uˆ
∑ uˆ
t t −1
uˆt = ρ .uˆt −1 + et ⇒ ρˆ = ρˆ 0 =
t
2
t −1
t
1
4
24
3
Estimateur des MCO
[(X'X) -1 X'Y avec X = uˆt −1 et Y = uˆt ]
57
19
d’erreur AR(1) (3)
Deuxième approche : Utilisation de la statistique de
Durbin-Watson
T
DW =
∑ (uˆ
t =2
t
− uˆt −1 ) 2
T
∑ uˆ t2
d' où ρˆ = 1 -
DW
2
t =1
NB :
DW ≈ 2(1 − ρˆ )
58
5.16 La procédure itérative de
Cochrane-Orcutt
Première étape : initialisation de ρ par estimation directe
(cf. première approche)
ρ̂ 0 =
∑ uˆ uˆ
∑ uˆ
t t −1
t
2
t −1
t
Deuxième étape : utilisation de ρ̂ 0 pour appliquer les
MCQG dont on déduit un nouveau résidu empirique ûˆ et
une nouvelle valeur de ρ
uˆˆ uˆˆ
ρ̂1 =
∑
t t −1
t
∑ uˆˆ
2
t −1
t
Le processus est répété jusqu’à stabilité de l’estimation de
ρ
59
5.17 Exemple : Estimation d’une
fonction de consommation
+---------------------------------------------+
| AR(1) Model:
e(t) = rho * e(t-1) + u(t) |
| Initial value of rho
=
.90693 |
| Maximum iterations
=
100 |
Procédure
| Method = Prais - Winsten
|
| Iter= 1, SS=
.017, Log-L= 666.519353 |
équivalente à
| Iter= 2, SS=
.017, Log-L= 666.573544 |
Cochrane| Final value of Rho
=
.910496 |
Orcutt
| Iter= 2, SS=
.017, Log-L= 666.573544 |
| Durbin-Watson:
e(t) =
.179008 |
| Std. Deviation: e(t) =
.022308 |
| Std. Deviation: u(t) =
.009225 |
| Durbin-Watson:
u(t) =
2.512611 |
| Autocorrelation: u(t) =
-.256306 |
| N[0,1] used for significance levels
|
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Constant
-.08791441
.09678008
-.908
.3637
LOGY
.99749200
.01208806
82.519
.0000
7.99083133
RHO
.91049600
.02902326
31.371
.0000
Rappel :
LOGY(MCO)
1.00306
.00297
t=338.159
60
20
5.18 La procédure de “balayage” de
Hildreth-Lu
Première étape : A partir de la statistique de DurbinWatson, on détermine une autocorrélation positive ou
négative :
ρˆ 0 > 0 ou ρˆ 0 < 0
Deuxième étape : Régression pour l’intervalle des valeurs
possibles de ρ
Si ρˆ 0 > 0 alors ont utilise des valeurs de ρ sur [0,1]
Si ρˆ 0 < 0 alors ont utilise des valeurs de ρ sur [-1,0]
On retient la valeur de ρ qui minimise la somme des
carrés des résidus en balayant l’intervalle avec un pas
correspondant au degré de précision désiré.
61
6. Conclusions et mises en garde
62
6.1 Conclusions et mises en gardes
Le problème d’autocorrélation des erreurs est
particulièrement important en données chronologiques
Les méthodes de test et de correction de l’autocorrélation
vues ici uniquement pour des termes d’erreurs AR(1)
peuvent être développées pour tester et corriger des
autocorrélations plus complexes
Les méthodes des MCG et MCQG permettent de corriger
les biais induits par l’autocorrélation lorsque l’on connaît
la nature de cette autocorrélation
63
21
6.2 Conclusions et mises en gardes (2)
Si la nature de la structure d’autocorrélation est mal évaluée, le
remède peut se révéler plus nocif que la maladie.
Par ex. si les résidus sont saisonniers et qu’on les suppose AR(1)
Dans ce cas, on risque d’avoir par ces procédures d’estimation des
résultats plus mauvais que si on faisait des MCO simples.
Se tromper sur la modélisation des résidus peut être plus grave que le
problème d’autocorrélation en lui-même.
Souvent, il vaut mieux essayer de revoir sa spécification
économétrique au lieu d’appliquer ces méthodes de correction.
64
22

Chapitre 2 Autocorrélation des erreurs

Transcription

Documents pareils

M2 MOSEF

Samson Anne-laure - Université Paris

Marketing, Vente

Master 2

SOW Omar

Modibo Sidibé: Curriculum Vitae

Jérôme Gaulier - L`École d`économie de Toulouse

CANDELA Anthony FORMATIONS Master 2 Marchés Financiers

Rachid Bokreta

Modalité RCC CM TD Coef ECTS 12 12 Cours obligatoire Analyse