Théorème de Frisch

Transcription

Théorème de Frisch

Théorème de Frisch
Laboratoire d’Analyse – Recherche en Economie Quantitative
One Pager
Octobre 2013
Vol. 8 – Num. 004
Copyright © Laréq 2013
http://www.lareq.com
Théorème de Frisch – Waugh – Lovell
Cédrick Tombola Muke & Jean–Paul K. Tsasa Vangu
« Je rêve d'un jour où l'égoïsme ne régnera plus dans les sciences, où on s'associera pour étudier, au
lieu d'envoyer aux académiciens des plis cachetés, on s'empressera de publier ses moindres observations
pour peu qu'elles soient nouvelles, et on ajoutera "je ne sais pas le reste". »
Évariste Galois (1811 – 1832)
Résumé
Ce papier présente le théorème de FWL en se servant du langage d’algèbre linéaire, et illustre
par ailleurs ses nombreuses applications dans
le cas de modèles
linéaires
à régresseurs
stochastiques.
Mots – clé : Moindres carrés ordinaires, projection orthogonale.
Abstract
This paper focuses on the FWL theorem by using the language of linear algebra, and also
illustrates its many applications in the case of linear models with random regressors.
Introduction
Dans l’éditorial du premier numéro de la revue Econometrica parue en 1930, R.A.K. Frisch1 note que le
principal objectif de l’économétrie devrait être celui de promouvoir les études qui visent à l'unification
des approches quantitatives, théoriques et empiriques des problèmes économiques et qui sont mues par
une pensée constructive et rigoureuse similaire à celle qui domine dans les sciences naturelles. C’est
dans cette logique que nous élaborons ce papier, en vue de fournir aux publications ultérieures des
fondements théoriques robustes.
Dans une publication précédente, Lokota et Tsasa (2013) ont dérivé l’estimateur des moindres carrés, en
considérant un modèle à régresseurs stochastiques. Plus n’est besoin de nous mettre à expliquer
l’approche moderne de l’économétrie, où ce type de modèles constituent la pierre de l’angle (Cf. Stock –
Watson, 2011).
Y faisant suite, dans ce papier, nous proposons, à l’aide notamment du théorème de Frisch – Waugh –
Lovell, une interprétation concise des paramètres estimés dans un modèle à régresseurs stochastiques
(section 1). Les conclusions tirées sont transposables et valables dans le cas de modèles à régresseurs
fixes. Ensuite, nous illustrons quelques fonctions des résultats établis avec le théorème FWL, notamment
l’analyse de la déviation par rapport à la moyenne (section 2), la dérivation du coefficient de
détermination et du coefficient de détermination ajusté de Theil (section 3) et l’appréhension de l’effet
d’une omission des variables dans un modèle de régression (section 4).
1
Ragnar A.K. Frisch, avec Irving Fisher et François Divisia sont les principaux fondateurs de la Société d'Économétrie
(Econometric Society), le 29 décembre 1930 et de la Revue Econometrica, lancée en 1933. D’après les investigations
de Kalaitzidakis, Mamuneas et Stengos (2013), la revue Econometrica serait la deuxième revue économique la plus
influente du monde, non loin derrière l’American Economic Review.
42
Cédrick Tombola & Jean–Paul K. Tsasa
Théorème de Frisch – Waugh – Lovell
Dans l’analyse du modèle linéaire classique,
à régresseurs stochastiques, plusieurs résultats
suivants ont été établis (Lokota – Tsasa, 2013), notamment :
1°)
avec
2°)
;
;
3°)
ainsi, on a :
où
est le vecteur des résidus tel que :
En posant :
et
on détermine
une matrice de projection orthogonale dans l’espace engendré par les
la matrice de projection de
sur l’espace orthogonal aux
tel que
et
;
4°) Par les conditions du premier ordre :
ainsi, les résidus sont orthogonaux aux vecteurs des explicatives.
De ce fait, il est possible d’exprimer le modèle linéaire classique comme une décomposition orthogonale
de l’espace :
Analytiquement, l’expression
par les explicatives, et
représente la composante de
désigne la composante de
qui est expliquée dans l’espace engendré
qui n’est pas expliquée par l’espace engendré par
les
Considérons à présent, une partition de la matrice
telle que
Dès lors, la relation
devient :
où :
43
Théorème. Soit
le vecteur paramétrique et
Alors, l’estimateur du sous – vecteur
ordinaires du vecteur
ses sous – vecteurs tels que
obtenu à l’aide de la régression par moindres carrés
sur les ensembles de variables explicatives
régression des résidus de la régression de ‘
vecteurs colonnes de
sur
et
correspond à la
’ sur les résidus de la régression des
sur
Il vient qu’à l’optimum, puisque :
alors :
D’où, le système matriciel suivant :
En résolvant ce système, par la méthode de substitution, on a :
et
En substituant
dans
on obtient :
où
Puisque
est la projection de
tel que
donc :
Ainsi :
La matrice
où
étant idempotente :
et
est l’estimateur de MCO de la régression de
régression des vecteurs colonnes de
En effet, soit une colonne
où
sur
de la matrice
et
sur
Et la matrice
correspond aux résidus de la
aux résidus de la régression de
sur
telle que :
alors :
44
En réalité, le résultat établi dans
sur les
traduit une régression de la fraction de
Autrement, il s’agit de l’impact spécifique de
sur
conséquence, le vecteur paramétrique capte l’information de
exclusivement de
purgée de toute information de
orthogonale à
En
(information provenant
).
De même, pour l’estimateur de
où
non expliquée par les
on a :
et
En regardant de plus près le théorème de Frisch – Waugh – Lovell, et après exécution des moindres
carrés dans l’équation
on établit la figure suivante1.
Figure 1
Il vient que d’après les résultats du théorème de FWL, l’estimateur de
peut être obtenu par MCO sur le
modèle :
où
est la matrice de projection orthogonale sur l’espace orthogonal à
De même, l’estimateur de
où
peut être obtenu par MCO sur le modèle suivant :
est la matrice de projection orthogonale sur l’espace orthogonal à
Pour capter l’intuition sous – tendant l’appréhension du théorème FWL, considérons l’équation matricielle
telle que par construction, la matrice
1
est orthogonale aux
Voir notamment Tsasa (2013a, b, c).
45
L’espace orthogonal aux
est tel qu’on a la structure suivante.
Figure 2
Une construction supplémentaire permet d’exprimer la projection de
(en
jaune).
Figure 3
Par la suite, la projection de
sur
peut commodément être établie (projection en verte).
46
Figure 4
Par l’application du théorème d’intersection ou théorème de Thalès1, on établit ainsi l’égalité des
coefficients
Figure 5
Attelons – nous, à présent, à quelques applications du théorème de Frisch – Waugh – Lovell.
1
Du nom du savant grec antique Thalès de Milet [vers 625 av. J.–C – vers 547 av. J.–C].
47
Analyse de la déviation par rapport à la moyenne
Le théorème de FWL permet de mieux comprendre l’implication d’estimer un modèle avec ou sans
constante, ou encore celle de régresser un modèle comprenant une composante temporelle (trend). Soit
la relation
où
tel qu’on a :
est un vecteur de format
tel que :
Pour un vecteur aléatoire quelconque
moyenne
—
Soit :
avec
—
il vient qu’une manipulation appropriée permet d’exprimer la
comme suit :
est la matrice de projection de constante ;
par le théorème de FWL, on sait que :
avec
—
;
puisque
alors par
et
:
et
où
et
sont exprimées comme des variables en déviation par rapport à la moyenne.
Ainsi, lorsqu’on est en présence d’une régression avec une constante, les variables du modèle
correspondent à des variables en déviation par rapport à leurs moyennes respectives. Donc, la constante
purge les moyennes respectives des variables expliquée et explicatives.
En considérant un modèle alternatif :
où
avec
et
tel que :
le trend (mesure du temps). En vertu des résultats établis à l’aide du théorème de FWL, il suit que
l’estimateur de
mesurera l’impact de
sur
après avoir purgé
de sa moyenne et de la tendance.
48
Coefficient de détermination et coefficient de détermination de Theil
Considérons le modèle
et le résultat établi dans
il vient que :
tel que :
et où
est la partie expliquée et
la partie non expliquée.
Soit :
Avec :
la relation établie dans
ne change pas en la réécrivant comme suit :
Connaissant les résultats établis dans
et
après réaménagement de la relation
il suit qu’en
vertu du théorème FWL :
tel que :
une expression proche de la variance empirique de
:
D’où :
-
: correspond à la variance près de
;
: la variance non expliquée près de la partie expliquée de
Dès lors, en notant
;
: la variance expliquée près de la partie expliquée de
un indicateur mesurant la variance expliquée de
;
dans une régression (nommé
coefficient de détermination), il vient que :
Puisque :
donc :
Ainsi définit – on le domaine de définition de
Pour sa preuve, cf. Makambo – Tsasa (2012) ; pour ses
propriétés, voir Tombola (2012a, pp. 36 – 37) ; et enfin pour ses limites, lire Tombola (2012b).
49
Comme le note Tombola (2012a, p.55), le
est certes un indicateur de qualité, mais il présente
l’inconvénient d’être mécanique, c’est – à –dire sa valeur augmente avec l’augmentation des variables
explicatives, mêmes non pertinentes à l’explication du phénomène étudié. Cette note vaut une remarque
tant pour les modèles à régresseurs aléatoires que pour les modèles à régresseurs fixes.
D’où, une mesure alternative, notée
moins sensible à l’ajout des variables, proposée par H. Theil dans
son livre publié en 1961 (page 213), puis dans celui publié en 1971 (chapitre 4). Cette mesure est
appelée
ou
car elle consiste à corriger la principale faiblesse du
liée aux degrés de
liberté.
D’où :
où
correspond au nombre de paramètres dans le modèle de régression (hormis bien sûr la constante).
Connaissant
il découle que :
Par ailleurs :
In fine, notons que la relation
est valable uniquement si un de régresseurs est une constante. La
preuve est assez intuitive en considérant
Par les résultats établis dans
et
il vient qu’en absence d’une constante dans le modèle, les
variables ne sont plus centrées autour de leurs moyennes respectives. Ainsi, le coefficient de
détermination obtenu est dit coefficient de détermination non centré et est noté par
ou
Problème d’omission des variables
Intéressons – nous à présent au problème d’omission de variables explicatives. Considérons pour ce faire
la relation
et supposons que le vecteur aléatoire
Dans ce cas, nous montrons que l’estimateur de
—
biaisé, si les matrices des explicatives
—
et, non biaisé dans le cas contraire.
soit omis du modèle.
sera :
et
sont corrélées ;
50
En effet, partant de la relation
De
on a :
il est établi, en vertu du théorème de FWL :
Dès lors, si
est sans biais, il vient que :
tel que les matrices aléatoires
et
sont orthogonales :
et donc :
En parallèle, si
donc
alors :
est biaisé.
Ainsi, il ressort au regard du théorème du FWL que l’amplitude du biais dans l’estimation des paramètres
d’un modèle, en cas d’omission de variables, dépend de la nature de la corrélation entre
et
Somme toute, ce papier avait l’ambition de mettre en évidence la pertinence du théorème de Frisch –
Waugh – Lovell dans l’analyse économétrique, en considérant particulièrement trois de ses applications.
Les résultats obtenus ont ainsi permis de poser un fondement solide dans la compréhension du sens
technique des coefficients estimés par la méthode des moindres carrés. L’étude a été réalisée en
considérant les principaux résultats obtenus d’une estimation par les moindres carrés, à distance finie,
d’un modèle classique à régresseurs aléatoires. A ce titre, les conclusions tirées serviront de support
pour les publications ultérieures, notamment pour les papiers qui s’attèleront au traitement de la même
problématique, mais dans le cas asymptotique.
51
Bibliographie

AITKEN Alexander C., 1935, "On Least Squares and Linear Combinations of Observations",
Proceedings of the Royal Society of Edinburgh, A (55): 42 – 48.

CHAVENT Guy, 2009, Nonlinear Least Squares for Inverse Problems. Theorical Foundations and
Step–by–Step Guide for Applications (With 25 Figures), Springer, New York, 360p.

CHOW Gregory C et An – Loh LIN, 1971, “Best linear unbiased interpolation, distribution and
extrapolation of time series by related series”, The Review of Economics and Statistics, 53 (4):
372 – 375.

DAVIDSON Russell et MACKINNON James G., 2003, Econometric Theory and Methods, Oxford
University Press Inc, 768p.

DUFOUR Jean – Marie, 2011, Coefficients of determination, McGill University, July version (First
version: March 1983), Centre interuniversitaire de recherche en analyse des organisations
(CIRANO), and Centre interuniversitaire de recherché en économie quantitative (CIREQ), 1 – 12.

FERNANDEZ Roque B., 1981, “A methodological Note on the Estimation of Time Series”, The
Review of Economics and Statistics, 63 (3): 471 – 476.

FEVE Patrick, 1997, « Les Méthodes d’étalonnage au regard de l’économétrie », Revue
économique, 48 (3): 629 – 638.

FRISCH Ragnar A.K. et Frederick V. WAUGH, 1933, "Partial Time Regressions as Compared with
Individual Trends", Econometrica, 1 (4): 387 – 401.

FRISCH Ragnar A.K., 1933, "Editor's Note", Econometrica (janvier), 1 (1): 1 – 4.

GRANGER Clive W. J. et Paul NEWBOLD, 1977, Forecasting Economic Time Series, Academic
Press, New York, 333p.

GRANGER Clive W.J., 1966, "The typical spectral shape of an economic variable", Econometrica
(January), 34 (1): 150–161.

GREENE William, 2001, Econométrie, 7è éd. Pearson Education, édition francophone dirigée par
Didier Schlacther, Traduction par Theophile Azomahou, Phu Nguyen Van & Wladimir Raymond,
Paris, 988p.

HAMILTON James D., 1994, Time Series Analysis, Princeton Uniersity Press, 820p.

HAYASHI Fumio, 2000, Econometrics, Princeton University Press, 712p.

HENDRY David F. et Robert C. MARSHALL, 1983, “On High and Low
contributions”, Oxford
Billetin of Economics and Statistics (august), 45 (3): 313 – 316.

HOGG Robert V., Joseph W. McKEAN and Allen T. CRAIG, 2013, Introduction to Mathematical
Statistics, 7th edition, Pearson, Montreal, 694p.

IPSEN Ilse C.F., 2009, Numerical Matrix Analysis. Linear Systems and Least Squares, Society for
Industrial and Applied Mathematics (Siam), Philadelphia, 128p.

JACOD Jean et Philip PROTTER, 2003, L’Essentiel en Théorie des Probabilités, éd. Cassini, Paris,
261p.

JOHANSEN Søren, 1988, “Statistical Analysis of Cointegration Vectors”, Journal of Economic
Dynamics and Control, 12 (2–3): 231 – 254.

JOHANSEN Søren, 1994, "The Role of the Constant and Linear Terms in Cointegration Analysis of
Nonstationary Variables", Econometric Reviews, 13 (2): 205 – 229.

JOHNSTON Jack et John DINARDO, 1997, Econometric Methods, 4e edition, McGraw Hill Higher
Education, New York, 531p.
52

KALAITZIDAKIS Pantelis, Theofanis P. MAMUNEAS et Thanasis STENGOS, 2003, "Rankings of
Academic Journals and Institutions in Economics", Journal of the European Economic Association
(december), MIT Press, 1 (6): 1346 – 1366.

KARIYA Takeai and KURATA Hiroshi, 2004, Generalized Least Squares, John Wiley & Sons, Ltd,
West Sussex, 289p.

KENDALL, Maurice G. and Alan STUART, 1979 (1958), The Advanced Theory of Statistics, Vol. 2
(vol. 1), New – York, Macmillan, 748p (433p).

KULLBACK Solomon et Richard A. LEIBLER, 1951, “On information and sufficiency”, The Annals
of Mathematical Statistics, 22 (1): 79 – 86.

LAWSON Charles L. and Richard J. HANSON, 1995, Solving Least Squares Problems, Society for
Industrial and Applied Mathematics (Siam), Philadelphia, 337p.

LOKOTA Michel – Ange et Jean – Paul TSASA, 2013, « Modèle à Régresseurs Stochastiques :
Etude des propriétés des estimateurs MCO et MCG à distance finie », One Pager Laréq (octobre),
8 (2): 19 – 30.

LOVELL Michael C., 1963, "Seasonal Adjustment of Economic Time Series and Multiple
Regression Analysis", Journal of the American Statistical Association, 58 (304): 993 – 1010.

LOVELL Michael C., 2008, "A Simple Proof of the FWL Theorem", Journal of Economic Education,
39 (1): 88 – 91.

MAKAMBO Israël et Jean – Paul TSASA, 2012, "Dérivation du Domaine de Définition du
Coefficient de Corrélation de Bravais – Galton – Pearson: Application de l’Inégalité de Cauchy
(1921), Bunyakovski (1859) et Schwarz (1885)", One Pager Laréq (août), 3 (8): 97 – 101.

MITCHELL Douglas W., 1991, "Invariance of Results under a Common Orthogonalization",
Journal of Economics and Business, 43 (2): 193 – 196.

NICOLA Acocella et Giovannu Di BARTOLOMEO, Giovanni, 2006, "Tinbergen and Theil meet
Nash: controllability in policy games", in Economics Letter’, 90 (2): 213 – 218.

OK Efe A., 2007, Real Analysis with Economic Applications, Princeton University Press, Princeton,
802p.

RAO C. Radhakrishna and Helge TOUTENBURG, 1999, Linear Models. Least Squares and
Alternatives (With 33 Illlustrations), 2nd Edition (With Contribution by Adreas FIEGER), Springer
– Verlag, New York, 427p.

RAO C. Radhakrishna, Helge TOUTENBURG, SHALABH, Christian HEUMANN, 2008, Linear Models
and Generalizations. Linear Squares and Alternative, 3rd Extended Edition (With Contribution by
Michael SCHOMAKER), Springer – Verlag, Berlin, 570p.

SAVAGE Leonard J., 2000, The Foundations of Statistics, Dover Publications Inc., 310p.

STOCK James H. et Mark M. WATSON, 2011, Introduction to Econometrics, 3e édition, Pearson
Education, 832p.

STOCK James H. et Mark W. WATSON, 1988, "Testing for Common Trends", Journal of The
American Statistical Association, 83 (404): 1097 – 1107.

TEUN Kloek, 2001, “Obituary: Henri Theil, 1924–2000”, Statistica Neerlandica, 55 (3): 263 –
269.

THEIL Henry, 1961, Economic Forecasts and Policy, 2nd edition, North – Holland, Amsterdam,
599p.

THEIL Henry, 1971, Principles of Econometrics, Revised Edition, John Wiley & Sons Inc., New
York, 768p.
53

TOMBOLA Cédrick, 2012a, Econométrie 1: Théories et Recueils d’exercices résolus, Guide Laréq
pour étudiant, (juin), 109p.

TOMBOLA Cédrick, 2012b, « Réflexions sur le Coefficient de Détermination: Comment Eviter les
Pièges d’une Interprétation à Problèmes », One Pager Lareq (août), 3 (7), 83 – 89.

TSASA Jean – Paul, 2013a, « Produit Scalaire, Métrique et Orthogonalité: Préalables à la
Résolution du Problème des Moindres Carrés », One Pager Laréq (mars), 5 (17): 112 – 117.

TSASA Jean – Paul, 2013b, « Projection Orthogonale : Décomposition Orthogonale et Meilleure
Approximation », One Pager Laréq (mars), 5 (18): 118 – 125.

TSASA Jean – Paul, 2013c, « Dérivation du Problème général des Moindres Carrés », One Pager
Laréq (mars), 5 (19): 126 – 132.

VINZI V. Esposito, CHIN Wynne W., HENSElER Jörg and WANG Huiwen (editors), 2010,
Handbook of Pratical Least Squares. Concepts, Methods and Applications, Springer Handbooks of
Computational Statistics, New York, 798p.

WOLBERG John R., 2006, Data Analysis Using the Method of Least Squares. Extracting the Most
Information from Experiments (With 58 Figures and 68 Tables), Springer – Verlag, Berlin, 250p.

WOOLDRIDGE Jeffrey M., 2008, Introductory Econometrics: A Modern Approach, International
edition of 4th revised edition, South – Western, 808p.

ZELLNER Arnold, 1971, An Introduction to Bayesian Inference in Econometrics, JohnWiley &
Sons, New York, 431.
54

Théorème de Frisch

Transcription

Documents pareils

à l`EDEN BAR Colmar

2016 AFFICHE cidre et chataigne

telethon-2016

« Pour bien grandir…» - Ecole Ste Marie St Hilaire de Loulay

un week end en mobil home au bord de la mer (côtes d`Armor), un

3ème Activité – Théorème de Thalès 2011/2012

3ème Révisions brevet blanc de mathématiques

Honorable Correspondant, A l`occasion de l`expansion de ses

week-end ludique - Roquefort les Pins