Théorème de Frisch
Transcription
Théorème de Frisch
Théorème de Frisch Laboratoire d’Analyse – Recherche en Economie Quantitative One Pager Octobre 2013 Vol. 8 – Num. 004 Copyright © Laréq 2013 http://www.lareq.com Théorème de Frisch – Waugh – Lovell Cédrick Tombola Muke & Jean–Paul K. Tsasa Vangu « Je rêve d'un jour où l'égoïsme ne régnera plus dans les sciences, où on s'associera pour étudier, au lieu d'envoyer aux académiciens des plis cachetés, on s'empressera de publier ses moindres observations pour peu qu'elles soient nouvelles, et on ajoutera "je ne sais pas le reste". » Évariste Galois (1811 – 1832) Résumé Ce papier présente le théorème de FWL en se servant du langage d’algèbre linéaire, et illustre par ailleurs ses nombreuses applications dans le cas de modèles linéaires à régresseurs stochastiques. Mots – clé : Moindres carrés ordinaires, projection orthogonale. Abstract This paper focuses on the FWL theorem by using the language of linear algebra, and also illustrates its many applications in the case of linear models with random regressors. Introduction Dans l’éditorial du premier numéro de la revue Econometrica parue en 1930, R.A.K. Frisch1 note que le principal objectif de l’économétrie devrait être celui de promouvoir les études qui visent à l'unification des approches quantitatives, théoriques et empiriques des problèmes économiques et qui sont mues par une pensée constructive et rigoureuse similaire à celle qui domine dans les sciences naturelles. C’est dans cette logique que nous élaborons ce papier, en vue de fournir aux publications ultérieures des fondements théoriques robustes. Dans une publication précédente, Lokota et Tsasa (2013) ont dérivé l’estimateur des moindres carrés, en considérant un modèle à régresseurs stochastiques. Plus n’est besoin de nous mettre à expliquer l’approche moderne de l’économétrie, où ce type de modèles constituent la pierre de l’angle (Cf. Stock – Watson, 2011). Y faisant suite, dans ce papier, nous proposons, à l’aide notamment du théorème de Frisch – Waugh – Lovell, une interprétation concise des paramètres estimés dans un modèle à régresseurs stochastiques (section 1). Les conclusions tirées sont transposables et valables dans le cas de modèles à régresseurs fixes. Ensuite, nous illustrons quelques fonctions des résultats établis avec le théorème FWL, notamment l’analyse de la déviation par rapport à la moyenne (section 2), la dérivation du coefficient de détermination et du coefficient de détermination ajusté de Theil (section 3) et l’appréhension de l’effet d’une omission des variables dans un modèle de régression (section 4). 1 Ragnar A.K. Frisch, avec Irving Fisher et François Divisia sont les principaux fondateurs de la Société d'Économétrie (Econometric Society), le 29 décembre 1930 et de la Revue Econometrica, lancée en 1933. D’après les investigations de Kalaitzidakis, Mamuneas et Stengos (2013), la revue Econometrica serait la deuxième revue économique la plus influente du monde, non loin derrière l’American Economic Review. 42 Cédrick Tombola & Jean–Paul K. Tsasa Laboratoire d’Analyse – Recherche en Economie Quantitative Théorème de Frisch – Waugh – Lovell Dans l’analyse du modèle linéaire classique, à régresseurs stochastiques, plusieurs résultats suivants ont été établis (Lokota – Tsasa, 2013), notamment : 1°) avec 2°) ; ; 3°) ainsi, on a : où est le vecteur des résidus tel que : En posant : et on détermine une matrice de projection orthogonale dans l’espace engendré par les la matrice de projection de sur l’espace orthogonal aux tel que et ; 4°) Par les conditions du premier ordre : ainsi, les résidus sont orthogonaux aux vecteurs des explicatives. De ce fait, il est possible d’exprimer le modèle linéaire classique comme une décomposition orthogonale de l’espace : Analytiquement, l’expression par les explicatives, et représente la composante de désigne la composante de qui est expliquée dans l’espace engendré qui n’est pas expliquée par l’espace engendré par les Considérons à présent, une partition de la matrice telle que Dès lors, la relation devient : où : 43 Cédrick Tombola & Jean–Paul K. Tsasa Laboratoire d’Analyse – Recherche en Economie Quantitative Théorème. Soit le vecteur paramétrique et Alors, l’estimateur du sous – vecteur ordinaires du vecteur ses sous – vecteurs tels que obtenu à l’aide de la régression par moindres carrés sur les ensembles de variables explicatives régression des résidus de la régression de ‘ vecteurs colonnes de sur et correspond à la ’ sur les résidus de la régression des sur Il vient qu’à l’optimum, puisque : alors : D’où, le système matriciel suivant : En résolvant ce système, par la méthode de substitution, on a : et En substituant dans on obtient : où Puisque est la projection de tel que sur l’espace orthogonal aux donc : Ainsi : La matrice où étant idempotente : et est l’estimateur de MCO de la régression de régression des vecteurs colonnes de En effet, soit une colonne où sur de la matrice et sur Et la matrice correspond aux résidus de la aux résidus de la régression de sur telle que : alors : 44 Cédrick Tombola & Jean–Paul K. Tsasa Laboratoire d’Analyse – Recherche en Economie Quantitative En réalité, le résultat établi dans sur les traduit une régression de la fraction de Autrement, il s’agit de l’impact spécifique de sur conséquence, le vecteur paramétrique capte l’information de exclusivement de purgée de toute information de orthogonale à En (information provenant ). De même, pour l’estimateur de où non expliquée par les on a : et En regardant de plus près le théorème de Frisch – Waugh – Lovell, et après exécution des moindres carrés dans l’équation on établit la figure suivante1. Figure 1 Il vient que d’après les résultats du théorème de FWL, l’estimateur de peut être obtenu par MCO sur le modèle : où est la matrice de projection orthogonale sur l’espace orthogonal à De même, l’estimateur de où peut être obtenu par MCO sur le modèle suivant : est la matrice de projection orthogonale sur l’espace orthogonal à Pour capter l’intuition sous – tendant l’appréhension du théorème FWL, considérons l’équation matricielle telle que par construction, la matrice 1 est orthogonale aux Voir notamment Tsasa (2013a, b, c). 45 Cédrick Tombola & Jean–Paul K. Tsasa Laboratoire d’Analyse – Recherche en Economie Quantitative L’espace orthogonal aux est tel qu’on a la structure suivante. Figure 2 Une construction supplémentaire permet d’exprimer la projection de sur l’espace orthogonal aux (en jaune). Figure 3 Par la suite, la projection de sur peut commodément être établie (projection en verte). 46 Cédrick Tombola & Jean–Paul K. Tsasa Laboratoire d’Analyse – Recherche en Economie Quantitative Figure 4 Par l’application du théorème d’intersection ou théorème de Thalès1, on établit ainsi l’égalité des coefficients Figure 5 Attelons – nous, à présent, à quelques applications du théorème de Frisch – Waugh – Lovell. 1 Du nom du savant grec antique Thalès de Milet [vers 625 av. J.–C – vers 547 av. J.–C]. 47 Cédrick Tombola & Jean–Paul K. Tsasa Laboratoire d’Analyse – Recherche en Economie Quantitative Analyse de la déviation par rapport à la moyenne Le théorème de FWL permet de mieux comprendre l’implication d’estimer un modèle avec ou sans constante, ou encore celle de régresser un modèle comprenant une composante temporelle (trend). Soit la relation où tel qu’on a : est un vecteur de format tel que : Pour un vecteur aléatoire quelconque moyenne — Soit : avec — il vient qu’une manipulation appropriée permet d’exprimer la comme suit : est la matrice de projection de constante ; par le théorème de FWL, on sait que : avec — ; puisque alors par et : et où et sont exprimées comme des variables en déviation par rapport à la moyenne. Ainsi, lorsqu’on est en présence d’une régression avec une constante, les variables du modèle correspondent à des variables en déviation par rapport à leurs moyennes respectives. Donc, la constante purge les moyennes respectives des variables expliquée et explicatives. En considérant un modèle alternatif : où avec et tel que : le trend (mesure du temps). En vertu des résultats établis à l’aide du théorème de FWL, il suit que l’estimateur de mesurera l’impact de sur après avoir purgé de sa moyenne et de la tendance. 48 Cédrick Tombola & Jean–Paul K. Tsasa Laboratoire d’Analyse – Recherche en Economie Quantitative Coefficient de détermination et coefficient de détermination de Theil Considérons le modèle et le résultat établi dans il vient que : tel que : et où est la partie expliquée et la partie non expliquée. Soit : Avec : la relation établie dans ne change pas en la réécrivant comme suit : Connaissant les résultats établis dans et après réaménagement de la relation il suit qu’en vertu du théorème FWL : tel que : une expression proche de la variance empirique de : D’où : - : correspond à la variance près de ; : la variance non expliquée près de la partie expliquée de Dès lors, en notant ; : la variance expliquée près de la partie expliquée de un indicateur mesurant la variance expliquée de ; dans une régression (nommé coefficient de détermination), il vient que : Puisque : donc : Ainsi définit – on le domaine de définition de Pour sa preuve, cf. Makambo – Tsasa (2012) ; pour ses propriétés, voir Tombola (2012a, pp. 36 – 37) ; et enfin pour ses limites, lire Tombola (2012b). 49 Cédrick Tombola & Jean–Paul K. Tsasa Laboratoire d’Analyse – Recherche en Economie Quantitative Comme le note Tombola (2012a, p.55), le est certes un indicateur de qualité, mais il présente l’inconvénient d’être mécanique, c’est – à –dire sa valeur augmente avec l’augmentation des variables explicatives, mêmes non pertinentes à l’explication du phénomène étudié. Cette note vaut une remarque tant pour les modèles à régresseurs aléatoires que pour les modèles à régresseurs fixes. D’où, une mesure alternative, notée moins sensible à l’ajout des variables, proposée par H. Theil dans son livre publié en 1961 (page 213), puis dans celui publié en 1971 (chapitre 4). Cette mesure est appelée ou car elle consiste à corriger la principale faiblesse du liée aux degrés de liberté. D’où : où correspond au nombre de paramètres dans le modèle de régression (hormis bien sûr la constante). Connaissant il découle que : Par ailleurs : In fine, notons que la relation est valable uniquement si un de régresseurs est une constante. La preuve est assez intuitive en considérant Par les résultats établis dans et il vient qu’en absence d’une constante dans le modèle, les variables ne sont plus centrées autour de leurs moyennes respectives. Ainsi, le coefficient de détermination obtenu est dit coefficient de détermination non centré et est noté par ou Problème d’omission des variables Intéressons – nous à présent au problème d’omission de variables explicatives. Considérons pour ce faire la relation et supposons que le vecteur aléatoire Dans ce cas, nous montrons que l’estimateur de — biaisé, si les matrices des explicatives — et, non biaisé dans le cas contraire. soit omis du modèle. sera : et sont corrélées ; 50 Cédrick Tombola & Jean–Paul K. Tsasa Laboratoire d’Analyse – Recherche en Economie Quantitative En effet, partant de la relation De on a : il est établi, en vertu du théorème de FWL : Dès lors, si est sans biais, il vient que : tel que les matrices aléatoires et sont orthogonales : et donc : En parallèle, si donc alors : est biaisé. Ainsi, il ressort au regard du théorème du FWL que l’amplitude du biais dans l’estimation des paramètres d’un modèle, en cas d’omission de variables, dépend de la nature de la corrélation entre et Somme toute, ce papier avait l’ambition de mettre en évidence la pertinence du théorème de Frisch – Waugh – Lovell dans l’analyse économétrique, en considérant particulièrement trois de ses applications. Les résultats obtenus ont ainsi permis de poser un fondement solide dans la compréhension du sens technique des coefficients estimés par la méthode des moindres carrés. L’étude a été réalisée en considérant les principaux résultats obtenus d’une estimation par les moindres carrés, à distance finie, d’un modèle classique à régresseurs aléatoires. A ce titre, les conclusions tirées serviront de support pour les publications ultérieures, notamment pour les papiers qui s’attèleront au traitement de la même problématique, mais dans le cas asymptotique. 51 Cédrick Tombola & Jean–Paul K. Tsasa Laboratoire d’Analyse – Recherche en Economie Quantitative Bibliographie AITKEN Alexander C., 1935, "On Least Squares and Linear Combinations of Observations", Proceedings of the Royal Society of Edinburgh, A (55): 42 – 48. CHAVENT Guy, 2009, Nonlinear Least Squares for Inverse Problems. Theorical Foundations and Step–by–Step Guide for Applications (With 25 Figures), Springer, New York, 360p. CHOW Gregory C et An – Loh LIN, 1971, “Best linear unbiased interpolation, distribution and extrapolation of time series by related series”, The Review of Economics and Statistics, 53 (4): 372 – 375. DAVIDSON Russell et MACKINNON James G., 2003, Econometric Theory and Methods, Oxford University Press Inc, 768p. DUFOUR Jean – Marie, 2011, Coefficients of determination, McGill University, July version (First version: March 1983), Centre interuniversitaire de recherche en analyse des organisations (CIRANO), and Centre interuniversitaire de recherché en économie quantitative (CIREQ), 1 – 12. FERNANDEZ Roque B., 1981, “A methodological Note on the Estimation of Time Series”, The Review of Economics and Statistics, 63 (3): 471 – 476. FEVE Patrick, 1997, « Les Méthodes d’étalonnage au regard de l’économétrie », Revue économique, 48 (3): 629 – 638. FRISCH Ragnar A.K. et Frederick V. WAUGH, 1933, "Partial Time Regressions as Compared with Individual Trends", Econometrica, 1 (4): 387 – 401. FRISCH Ragnar A.K., 1933, "Editor's Note", Econometrica (janvier), 1 (1): 1 – 4. GRANGER Clive W. J. et Paul NEWBOLD, 1977, Forecasting Economic Time Series, Academic Press, New York, 333p. GRANGER Clive W.J., 1966, "The typical spectral shape of an economic variable", Econometrica (January), 34 (1): 150–161. GREENE William, 2001, Econométrie, 7è éd. Pearson Education, édition francophone dirigée par Didier Schlacther, Traduction par Theophile Azomahou, Phu Nguyen Van & Wladimir Raymond, Paris, 988p. HAMILTON James D., 1994, Time Series Analysis, Princeton Uniersity Press, 820p. HAYASHI Fumio, 2000, Econometrics, Princeton University Press, 712p. HENDRY David F. et Robert C. MARSHALL, 1983, “On High and Low contributions”, Oxford Billetin of Economics and Statistics (august), 45 (3): 313 – 316. HOGG Robert V., Joseph W. McKEAN and Allen T. CRAIG, 2013, Introduction to Mathematical Statistics, 7th edition, Pearson, Montreal, 694p. IPSEN Ilse C.F., 2009, Numerical Matrix Analysis. Linear Systems and Least Squares, Society for Industrial and Applied Mathematics (Siam), Philadelphia, 128p. JACOD Jean et Philip PROTTER, 2003, L’Essentiel en Théorie des Probabilités, éd. Cassini, Paris, 261p. JOHANSEN Søren, 1988, “Statistical Analysis of Cointegration Vectors”, Journal of Economic Dynamics and Control, 12 (2–3): 231 – 254. JOHANSEN Søren, 1994, "The Role of the Constant and Linear Terms in Cointegration Analysis of Nonstationary Variables", Econometric Reviews, 13 (2): 205 – 229. JOHNSTON Jack et John DINARDO, 1997, Econometric Methods, 4e edition, McGraw Hill Higher Education, New York, 531p. 52 Cédrick Tombola & Jean–Paul K. Tsasa Laboratoire d’Analyse – Recherche en Economie Quantitative KALAITZIDAKIS Pantelis, Theofanis P. MAMUNEAS et Thanasis STENGOS, 2003, "Rankings of Academic Journals and Institutions in Economics", Journal of the European Economic Association (december), MIT Press, 1 (6): 1346 – 1366. KARIYA Takeai and KURATA Hiroshi, 2004, Generalized Least Squares, John Wiley & Sons, Ltd, West Sussex, 289p. KENDALL, Maurice G. and Alan STUART, 1979 (1958), The Advanced Theory of Statistics, Vol. 2 (vol. 1), New – York, Macmillan, 748p (433p). KULLBACK Solomon et Richard A. LEIBLER, 1951, “On information and sufficiency”, The Annals of Mathematical Statistics, 22 (1): 79 – 86. LAWSON Charles L. and Richard J. HANSON, 1995, Solving Least Squares Problems, Society for Industrial and Applied Mathematics (Siam), Philadelphia, 337p. LOKOTA Michel – Ange et Jean – Paul TSASA, 2013, « Modèle à Régresseurs Stochastiques : Etude des propriétés des estimateurs MCO et MCG à distance finie », One Pager Laréq (octobre), 8 (2): 19 – 30. LOVELL Michael C., 1963, "Seasonal Adjustment of Economic Time Series and Multiple Regression Analysis", Journal of the American Statistical Association, 58 (304): 993 – 1010. LOVELL Michael C., 2008, "A Simple Proof of the FWL Theorem", Journal of Economic Education, 39 (1): 88 – 91. MAKAMBO Israël et Jean – Paul TSASA, 2012, "Dérivation du Domaine de Définition du Coefficient de Corrélation de Bravais – Galton – Pearson: Application de l’Inégalité de Cauchy (1921), Bunyakovski (1859) et Schwarz (1885)", One Pager Laréq (août), 3 (8): 97 – 101. MITCHELL Douglas W., 1991, "Invariance of Results under a Common Orthogonalization", Journal of Economics and Business, 43 (2): 193 – 196. NICOLA Acocella et Giovannu Di BARTOLOMEO, Giovanni, 2006, "Tinbergen and Theil meet Nash: controllability in policy games", in Economics Letter’, 90 (2): 213 – 218. OK Efe A., 2007, Real Analysis with Economic Applications, Princeton University Press, Princeton, 802p. RAO C. Radhakrishna and Helge TOUTENBURG, 1999, Linear Models. Least Squares and Alternatives (With 33 Illlustrations), 2nd Edition (With Contribution by Adreas FIEGER), Springer – Verlag, New York, 427p. RAO C. Radhakrishna, Helge TOUTENBURG, SHALABH, Christian HEUMANN, 2008, Linear Models and Generalizations. Linear Squares and Alternative, 3rd Extended Edition (With Contribution by Michael SCHOMAKER), Springer – Verlag, Berlin, 570p. SAVAGE Leonard J., 2000, The Foundations of Statistics, Dover Publications Inc., 310p. STOCK James H. et Mark M. WATSON, 2011, Introduction to Econometrics, 3e édition, Pearson Education, 832p. STOCK James H. et Mark W. WATSON, 1988, "Testing for Common Trends", Journal of The American Statistical Association, 83 (404): 1097 – 1107. TEUN Kloek, 2001, “Obituary: Henri Theil, 1924–2000”, Statistica Neerlandica, 55 (3): 263 – 269. THEIL Henry, 1961, Economic Forecasts and Policy, 2nd edition, North – Holland, Amsterdam, 599p. THEIL Henry, 1971, Principles of Econometrics, Revised Edition, John Wiley & Sons Inc., New York, 768p. 53 Cédrick Tombola & Jean–Paul K. Tsasa Laboratoire d’Analyse – Recherche en Economie Quantitative TOMBOLA Cédrick, 2012a, Econométrie 1: Théories et Recueils d’exercices résolus, Guide Laréq pour étudiant, (juin), 109p. TOMBOLA Cédrick, 2012b, « Réflexions sur le Coefficient de Détermination: Comment Eviter les Pièges d’une Interprétation à Problèmes », One Pager Lareq (août), 3 (7), 83 – 89. TSASA Jean – Paul, 2013a, « Produit Scalaire, Métrique et Orthogonalité: Préalables à la Résolution du Problème des Moindres Carrés », One Pager Laréq (mars), 5 (17): 112 – 117. TSASA Jean – Paul, 2013b, « Projection Orthogonale : Décomposition Orthogonale et Meilleure Approximation », One Pager Laréq (mars), 5 (18): 118 – 125. TSASA Jean – Paul, 2013c, « Dérivation du Problème général des Moindres Carrés », One Pager Laréq (mars), 5 (19): 126 – 132. VINZI V. Esposito, CHIN Wynne W., HENSElER Jörg and WANG Huiwen (editors), 2010, Handbook of Pratical Least Squares. Concepts, Methods and Applications, Springer Handbooks of Computational Statistics, New York, 798p. WOLBERG John R., 2006, Data Analysis Using the Method of Least Squares. Extracting the Most Information from Experiments (With 58 Figures and 68 Tables), Springer – Verlag, Berlin, 250p. WOOLDRIDGE Jeffrey M., 2008, Introductory Econometrics: A Modern Approach, International edition of 4th revised edition, South – Western, 808p. ZELLNER Arnold, 1971, An Introduction to Bayesian Inference in Econometrics, JohnWiley & Sons, New York, 431. 54 Cédrick Tombola & Jean–Paul K. Tsasa Laboratoire d’Analyse – Recherche en Economie Quantitative