Chapitre 2 Autocorrélation des erreurs
Transcription
Chapitre 2 Autocorrélation des erreurs
Chapitre 2 Autocorrélation des erreurs Licence Econométrie – Econométrie II 2007-2008 Martin Fournier [email protected] L3 Econométrie - Econométrie II 1 1. Présentation du problème L3 Econométrie - Econométrie II 2 1.1 Présentation du problème (1) Reprenons le modèle linéaire général Il y a autocorrélation des erreurs lorsque l’hypothèse H5 (cf. ch. Introductif) n’est plus vérifiée, soit : Interprétation : - La matrice de variance covariance des termes d’erreurs n’est pas diagonale - Les termes d’erreur des différentes observations ne sont pas indépendants L3 Econométrie - Econométrie II 3 1 1.2 Présentation du problème (2) En présence d’autocorrélation, les estimateurs MCO sont sans biais mais ne sont plus à variance minimale. En présence d’autocorrélation, les écarts types usuels des MCO et les tests ne sont plus valides, même asymptotiquement. L3 Econométrie - Econométrie II 4 1.3 Les MCO restent sans biais Sans biais ? L3 Econométrie - Econométrie II 5 1.4 Mais ne sont plus de variance minimale De variance minimale ? En présence d’autocorrélation des termes d’erreur, les hypothèses du théorème de GaussMarkov (cf. Econométrie I) ne sont plus vérifiées Le résultat de variance minimale des MCO n’est plus valide L3 Econométrie - Econométrie II 6 2 1.5 Les tests usuels des MCO sont invalidés La variance de l’estimateur des MCO est : L3 Econométrie - Econométrie II 7 1.6 Les tests usuels des MCO sont invalidés (2) Tous les tests d’hypothèse qui reposent sur l’expression de la matrice de variancecovariance des MCO ( σ 2 ( X ' X ) −1 ) sont invalidés Écarts-types et intervalles de confiance des coefficients estimés t-Tests et F-tests sur les coefficients NB : La mesure de la qualité de la régression par le R2 reste en revanche valide L3 Econométrie - Econométrie II 8 1.7 Plan du chapitre Les sources usuelles de l’autocorrélation Introduction aux séries chronologiques Tester la présence d’autocorrélation Méthodes de correction Conclusion et mises en garde L3 Econométrie - Econométrie II 9 3 2. Les sources usuelles du problème L3 Econométrie - Econométrie II 10 2.1 Les sources usuelles du problème L’autocorrélation des erreurs peut être observée pour plusieurs raisons : - Variables explicatives importantes omises - Mauvaise spécification du modèle - Effets dynamiques non modélisés Sources d’« inertie » dans les erreurs L’autocorrélation des erreurs se rencontre essentiellement dans les modèles en séries temporelles. L3 Econométrie - Econométrie II 11 2.2 Mauvaise spécification Un mauvais choix de forme fonctionnelle peut aussi s’interpréter comme une variable omise : Modèle théorique : yt = a + b.xt + c.xt2+ vt Modèle estimé : yt = a + b.xt + ut L3 Econométrie - Econométrie II 12 4 3. Introduction aux modèles en séries chronologiques L3 Econométrie - Econométrie II 13 3.1 Introduction aux modèles en séries chronologiques Exemples - Variables macro-économiques françaises (PIB, inflation, chômage, etc.) - Suivi mensuel d’un individu (emploi, salaire, consommation, etc.) - Cotation d’une action (annuelle, mensuelle, journalière, à la minute…) Formalisation yt = b0 + b1xt1 + . . .+ bkxtk + ut L3 Econométrie - Econométrie II 14 3.2 Séries chronologiques / Coupes transversales Les observations des séries chronologiques sont ordonnées alors que l’ordre des observations d’une coupe transversale n’a pas d’importance Les observations de séries chronologiques sont issues d’un processus stochastique (aléatoire) à partir d’un modèle théorique et non pas d’un échantillonnage aléatoire (coupes transversales) L3 Econométrie - Econométrie II 15 5 3.3 Modèles avec retards Un modèle statique relie des variables contemporaines yt = b0 + b1zt + ut NB : Identique au modèle de coupe transversale Un modèle avec retards inclut l’observation passée de certaines variables yt = a0 + d0zt + d1zt-1 + d2zt-2 + ut L3 Econométrie - Econométrie II 16 3.4 Modèles avec retards (2) yt = a0 + d0zt + d1zt-1 + d2zt-2 + ut Le paramètre d0 mesure l’impact immédiat (i.e. de court terme) de la variable z sur la variable y. L’ensemble des paramètres (d0 , d1,…, dq) décrit la relation de long terme entre les deux variables L3 Econométrie - Econométrie II 17 3.5 Le problème des tendances (trend) Les différentes variables d’une série chronologique économique ont souvent une tendance temporelle Le fait que deux variables suivent la même tendance ne suffit pas à prouver une relation causale. Exemple: - Le cours du blé fluctue en fonction des précipitations - La demande d’énergie (chauffage) fluctue également en fonction des conditions météorologiques Une corrélation est observable entre les deux variables sans qu’il y ait pour autant de causalité L3 Econométrie - Econométrie II 18 6 3.6 Le problème des tendances (2) Ce sont le plus souvent des facteurs inobservés par l’économètre qui causent les tendances Même si ces facteurs ne peuvent être observés, il est possible de les contrôler en modélisant la tendance temporelle La question de la cointégration (cf. cours de séries temporelles en M1) L3 Econométrie - Econométrie II 19 3.7 Le problème des tendances (3) Comme pour le modèle économique, il existe une infinité de spécifications possibles pour la tendance Tendance linéaire yt = b0 + b1zt + a1t + et , t = 1, 2, … Tendance exponentielle log(yt) = b0 + b1zt + a1t + et , t = 1, 2, … Tendance quadratique yt = b0 + b1zt + a1t + a2t2 + et , t = 1, 2, … L3 Econométrie - Econométrie II 20 3.8 Purger la tendance (detrending) Au lieu d’introduire une tendance linéaire, il est possible de travailler sur des données purgées de la tendance (detrended) 1) Régression de chaque variable du modèle sur une tendance 2) Utilisation des résidus de chaque équation comme nouvelles variables L3 Econométrie - Econométrie II 21 7 3.9 Purger la tendance (2) Application pratique yt = b0 + b1zt + a1t + et , t = 1, 2, … 1) Créations de variables purgées de la tendance yt = c0 + c1t + εt ytd = εt zt = d0 + d1t + ηt ztd = η t 2) Régression du modèle sur les nouvelles variables ytd = b1zdt + ωt , t = 1, 2, … L3 Econométrie - Econométrie II 22 3.10 Purger la tendance (3) Purger la tendance est une méthode en 2 étapes qui introduit une erreur de mesure sur la deuxième étape Les variables purgées de la tendance sont construites à partir de paramètres estimés yt = c0 + c1t + ε t yˆ td = yt − cˆ0 − cˆ1t zt = d 0 + d1t + ηt zˆ td = zt − dˆ0 − dˆ1t L3 Econométrie - Econométrie II 23 3.11 Purger la tendance (4) L’introduction d’une tendance et l’utilisation de variables purgées de la tendance sont deux approches équivalentes Calcul du R2 Les régressions en séries temporelles ont souvent un R2 très élevé du seul fait du pouvoir explicatif de la tendance (qui ne correspond pas au pouvoir explicatif réel du modèle économique estimé) Le R2 de la régression avec variables purgées de la tendance reflète de manière plus juste le pouvoir explicatif du modèle économique L3 Econométrie - Econométrie II 24 8 3.12 Le cas d’erreurs autorégressives de degré 1 [AR(1)] yt = b0 + b1zt + ut Prenons le cas particulier suivant ut = ρ .ut−1 + et ρ <1 avec et i.i.d (non autocorrélé) (1) L3 Econométrie - Econométrie II 25 3.13 Le cas d’erreurs AR(1) (2) L3 Econométrie - Econométrie II 26 3.14 Le cas d’erreurs AR(1) (3) L3 Econométrie - Econométrie II 27 9 3.15 Le cas d’erreurs AR(1) (4) L3 Econométrie - Econométrie II 28 3.16 Sur ou sous-évaluation des écarts-types ? < σ u2 ( X ' X ) −1 X ' Φ X ( X ' X ) −1 0 ? > Les deux cas sont possibles. Dans la plupart des modèles économiques en séries chronologiques, les erreurs sont positivement corrélées et les variables explicatives restent de même signe La variance des MCO tend à sous-évaluer la vraie variance. L3 Econométrie - Econométrie II 29 4. Détection de l’autocorrélation L3 Econométrie - Econométrie II 30 10 4.1 Détection de l’autocorrélation Elle s’effectue à partir de l’analyse des résidus empiriques. Eux seuls sont connus Examen visuel des résidus L’analyse graphique des résidus permet le plus souvent de détecter une autocorrélation des erreurs lorsque : - Les résidus sont pendant plusieurs périodes consécutives, soit positifs, soit négatifs : corrélation positive - Les résidus sont alternés : corrélation négative. Cependant, le plus souvent, l’analyse graphique est délicate à interpréter L3 Econométrie - Econométrie II 31 4.2 Examen visuel des résidus L3 Econométrie - Econométrie II 32 4.3 Le test de Durbin Watson Test d’autocorrélation des termes d’erreur d’ordre 1 selon la forme : ut = ρ .ut −1 + et avec : et → N (0, σ e2 ) Il s’agit de tester contre L3 Econométrie - Econométrie II 33 11 4.3 Le test de Durbin Watson (2) Pour tester l’hypothèse nulle, on calcule la statistique de Durbin Watson n DW = ∑ (uˆ t =2 t − uˆt −1 ) 2 n ∑ uˆ t =1 2 t De par sa construction, cette statistique varie entre 0 et 4 et on a : L3 Econométrie - Econométrie II 34 4.4 Le test de Durbin Watson (3) Preuve L3 Econométrie - Econométrie II 35 4.5 Le test de Durbin Watson (4) Afin de tester l’hypothèse nulle, Durbin et Watson (1950) ont tabulé les valeurs critiques de DW au seuil de 5%, en fonction de la taille de l’échantillon T et du nombre de variables explicatives (k). La lecture de la table permet de déterminer 2 valeurs d1 et d2 comprises entre 0 et 2. L3 Econométrie - Econométrie II 36 12 4.6 Les valeurs critiques du DW p : nombre de variables explicatives (constante exclue) n : nombre d’observations L3 Econométrie - Econométrie II 37 4.7 Lecture de la table du DW Le calcul de la statistique de Durbin Watson permet de tester la présence d’autocorrélation de la manière suivante L3 Econométrie - Econométrie II 38 4.8 Les conditions d’utilisation de la statistique de Durbin Watson Le modèle doit comporter impérativement un terme constant Le nombre d’observations doit être supérieur (ou égal) à 15 Le modèle estimé ne contient pas la variable dépendante retardée dans les variables explicatives Le test de DW ne permet de tester que l’autocorrélation d’ordre 1 NB : La statistique de DW est une statistique de 2ème étape, i.e. calculée à partir des résidus empiriques, eux-mêmes soumis à erreur de mesure L3 Econométrie - Econométrie II 39 13 4.9 Exemple : Estimation d’une fonction de consommation (Greene, Econometric Analysis, 5° Edition) yt : ln (consommation réelle) xt : ln (revenu réel) Table de DW pour 1 var. explicative et 100 observations d2 = 1,69 d1 = 1,65 L3 Econométrie - Econométrie II 40 4.10 Approches alternatives Il s’agit de tester l’autocorrélation des termes d’erreur d’ordre 1 ut = ρ.ut−1 + et avec : et i.i.d (non autocorrélé) NB : On lève ici l’hypothèse de normalité sur e Pour cela il suffit de régresser les résidus empiriques sur les résidus empiriques retardés Un t-test sur le paramètre estimé permet de tester la présence d’autocorrélation L3 Econométrie - Econométrie II 41 4.11 Approches alternatives (2) Une approche plus flexible Test d’une autocorrélation des termes d’erreur d’ordre q Estimation du modèle ut = ρ .ut − q + et avec : et i.i.d non autocorrélé t-test sur le paramètre estimé Test d’une structure plus générale d’autocorrélation jusqu’à l’ordre q Estimation du modèle q ut = ∑ ρi .ut −i + et i =1 avec : et i.i.d non autocorrélé F-test sur le modèle estimé L3 Econométrie - Econométrie II 42 14 5. Correction de l’autocorrélation L3 Econométrie - Econométrie II 43 5.1 Les Moindres Carrés Généralisés On a vu qu’en présence d’autocorrélation Les estimateurs par MCO sont sans biais Les estimateurs par MCO ne sont plus de variance minimale On cherche un estimateur qui soit de variance minimale L3 Econométrie - Econométrie II 44 5.2 Les Moindres Carrés Généralisés (2) Considérons le modèle linéaire général suivant Y = Xβ + u avec Ω u ≠ σ 2 I On peut démontrer que l’estimateur, sans biais, fonction linéaire de Y et à variance minimale est donné par : βˆMCG = ( X ' Ω u−1 X ) −1 ( X ' Ω u−1Y ) Ω βˆ MCG = ( X ' Ω u−1 X ) −1 L3 Econométrie - Econométrie II 45 15 5.3 Les Moindres Carrés Généralisés (3) Démonstration L3 Econométrie - Econométrie II 46 5.4 Les Moindres Carrés Généralisés (4) Démonstration (suite) L3 Econométrie - Econométrie II 47 5.5 Les Moindres Carrés Généralisés (5) Démonstration (suite) L3 Econométrie - Econométrie II 48 16 5.6 Les Moindres Carrés Généralisés (6) Si l’on connaît la matrice de variance-covariance des erreurs, cela permet de résoudre la question de l’autocorrélation des résidus. Le théorème de Gauss Markov s’applique au modèle transformé. L’estimateur des MCG est BLUE L’estimateur des MCG suit asymptotiquement une loi normale centrée en β et de variance : Var ( βˆ X * ) = σ 2 ( X * ' X * ) −1 = σ 2 ( X ' Ψ −1 X ) −1 NB : Les MCO sont un cas particulier des MCG pour Ψ = I L3 Econométrie - Econométrie II 49 5.7 Appliquer la méthode des MCG Dans la pratique, on ne connaît pas la matrice de variance covariance des termes d’erreurs. Il faut l’estimer dans une première étape. Les tests d’hypothèses des MCO peuvent être directement adaptés au modèle transformé. En revanche, la statistique de R2 n’est plus comparable à celle des MCO et il existe plusieurs alternatives (non développées ici) L3 Econométrie - Econométrie II 50 5.8 Les moindres carrés quasigénéralisés (MCQG) Pour appliquer les MCQG, on procède en deux étapes : 1) Estimation de la matrice permettant de transformer le modèle estimé en un modèle sans autocorrélation des erreurs 2) Estimation du modèle transformé par les MCO NB : La première étape introduit des paramètres estimés (avec erreur) dans la deuxième étape. L3 Econométrie - Econométrie II 51 17 5.9 Application des MCQG au cas de termes d’erreur AR(1) Reprenons le modèle à termes d’erreurs AR(1) : ut = ρ .ut −1 + et ρ <1 avec et i.i.d et non autocorrélé On a vu que dans ce cas : 1 ρ ρ2 . 1 . . ρ Ωu = σ u2 ρ 2 . . . . . . 1 T −1 . ρ2 ρ ρ ρ T −1 . ρ 2 = σ u2 Ψ ( ρ ) ρ 1 L3 Econométrie - Econométrie II 52 5.10 Application des MCQG au cas de termes d’erreur AR(1) (2) Pour obtenir l’estimateur des MCQG, il faut dans un premier temps estimer le paramètre ρ. L3 Econométrie - Econométrie II 53 5.11 Application des MCQG au cas de termes d’erreur AR(1) (3) L3 Econométrie - Econométrie II 54 18 5.12 Application des MCQG au cas de termes d’erreur AR(1) (4) Un résultat important : Si l’estimateur de ρ est convergent, l’estimation en deux étapes par les MCQG est asymptotiquement équivalente à utiliser le vrai paramètre ρ Les limites : - Les propriétés à distance finie des estimateurs par les MCQG sont inconnues dans le cas général. * N’est plus « sans biais » * Les statistiques de tests ne sont que des approximations des vraies statistiques de test du fait de l’approximation de ρ par ρ̂ L3 Econométrie - Econométrie II 55 5.13 Estimer ρ dans le cas de termes d’erreur AR(1) Différentes études montrent que les MCQG sont le plus souvent plus efficaces que les MCO mais, si le problème d’autocorrélation n’est pas trop grave, les MCO peuvent être plus efficaces que les MCQG sur petits échantillons. Les MCQG sont en particulier largement utilisés lorsque le modèle d’autocorrélation retenu pour les erreurs est donné par : ut = ρ .ut −1 + et avec et → N(0,σ e2 ) L3 Econométrie - Econométrie II 56 5.14 Estimer ρ dans le cas de termes d’erreur AR(1) (2) Première approche : estimation directe 1. OLS sur le modèle sans tenir compte de l’autocorrélation 2. OLS sur les résidus du modèle estimés (û ) selon le modèle ∑ uˆ uˆ ∑ uˆ t t −1 uˆt = ρ .uˆt −1 + et ⇒ ρˆ = ρˆ 0 = t 2 t −1 t 1 4 24 3 Estimateur des MCO [(X'X) -1 X'Y avec X = uˆt −1 et Y = uˆt ] L3 Econométrie - Econométrie II 57 19 5.15 Estimer ρ dans le cas de termes d’erreur AR(1) (3) Deuxième approche : Utilisation de la statistique de Durbin-Watson T DW = ∑ (uˆ t =2 t − uˆt −1 ) 2 T ∑ uˆ t2 d' où ρˆ = 1 - DW 2 t =1 NB : DW ≈ 2(1 − ρˆ ) L3 Econométrie - Econométrie II 58 5.16 La procédure itérative de Cochrane-Orcutt Première étape : initialisation de ρ par estimation directe (cf. première approche) ρ̂ 0 = ∑ uˆ uˆ ∑ uˆ t t −1 t 2 t −1 t Deuxième étape : utilisation de ρ̂ 0 pour appliquer les MCQG dont on déduit un nouveau résidu empirique ûˆ et une nouvelle valeur de ρ uˆˆ uˆˆ ρ̂1 = ∑ t t −1 t ∑ uˆˆ 2 t −1 t Le processus est répété jusqu’à stabilité de l’estimation de ρ L3 Econométrie - Econométrie II 59 5.17 Exemple : Estimation d’une fonction de consommation +---------------------------------------------+ | AR(1) Model: e(t) = rho * e(t-1) + u(t) | | Initial value of rho = .90693 | | Maximum iterations = 100 | Procédure | Method = Prais - Winsten | | Iter= 1, SS= .017, Log-L= 666.519353 | équivalente à | Iter= 2, SS= .017, Log-L= 666.573544 | Cochrane| Final value of Rho = .910496 | Orcutt | Iter= 2, SS= .017, Log-L= 666.573544 | | Durbin-Watson: e(t) = .179008 | | Std. Deviation: e(t) = .022308 | | Std. Deviation: u(t) = .009225 | | Durbin-Watson: u(t) = 2.512611 | | Autocorrelation: u(t) = -.256306 | | N[0,1] used for significance levels | +---------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Constant -.08791441 .09678008 -.908 .3637 LOGY .99749200 .01208806 82.519 .0000 7.99083133 RHO .91049600 .02902326 31.371 .0000 Rappel : LOGY(MCO) 1.00306 .00297 t=338.159 L3 Econométrie - Econométrie II 60 20 5.18 La procédure de “balayage” de Hildreth-Lu Première étape : A partir de la statistique de DurbinWatson, on détermine une autocorrélation positive ou négative : ρˆ 0 > 0 ou ρˆ 0 < 0 Deuxième étape : Régression pour l’intervalle des valeurs possibles de ρ Si ρˆ 0 > 0 alors ont utilise des valeurs de ρ sur [0,1] Si ρˆ 0 < 0 alors ont utilise des valeurs de ρ sur [-1,0] On retient la valeur de ρ qui minimise la somme des carrés des résidus en balayant l’intervalle avec un pas correspondant au degré de précision désiré. L3 Econométrie - Econométrie II 61 6. Conclusions et mises en garde L3 Econométrie - Econométrie II 62 6.1 Conclusions et mises en gardes Le problème d’autocorrélation des erreurs est particulièrement important en données chronologiques Les méthodes de test et de correction de l’autocorrélation vues ici uniquement pour des termes d’erreurs AR(1) peuvent être développées pour tester et corriger des autocorrélations plus complexes Les méthodes des MCG et MCQG permettent de corriger les biais induits par l’autocorrélation lorsque l’on connaît la nature de cette autocorrélation L3 Econométrie - Econométrie II 63 21 6.2 Conclusions et mises en gardes (2) Si la nature de la structure d’autocorrélation est mal évaluée, le remède peut se révéler plus nocif que la maladie. Par ex. si les résidus sont saisonniers et qu’on les suppose AR(1) Dans ce cas, on risque d’avoir par ces procédures d’estimation des résultats plus mauvais que si on faisait des MCO simples. Se tromper sur la modélisation des résidus peut être plus grave que le problème d’autocorrélation en lui-même. Souvent, il vaut mieux essayer de revoir sa spécification économétrique au lieu d’appliquer ces méthodes de correction. L3 Econométrie - Econométrie II 64 22