L`usage du coefficient de Pearson comme mesure du R2 dans les
Transcription
L`usage du coefficient de Pearson comme mesure du R2 dans les
L’usage du coefficient de Pearson comme mesure du R2 dans les modèles non linéaires par Richard Laferrière Université de Montréal Agora Jules Dupuit, Publication AJD-57 Centre de recherche sur les transports, Publication CRT 99-25 Juillet 1999, révisé en août 2002 Summary This note proposes to apply the simple Pearson coefficient as a measure of goodness of fit for non-linear econometric models. Empirically, the existing measures are very often deceiving in terms of their intuitive interpretation. Pseudo-R2’s may yield either negative numbers or surprisingly high correlation (near 1). The Pearson coefficient is always included between 0 and 1 and has a clear interpretation. Furthermore, it is well known that, for linear models, the Pearson coefficient is identical to the usual R2 formula. Résumé Cet note propose d’appliquer le coefficient de Pearson comme mesure de coefficient de corrélation multiple, ou d’ajustement, pour les modèles économétriques non linéaires. Les résultats empiriques des mesures existantes sont très souvent décevants d’un point de vue intuitif. En effet, les pseudo-R2 peuvent être négatifs ou étonnamment élevés (près de 1). Par contre, le coefficient de corrélation de Pearson est toujours compris entre 0 et 1. De plus, son interprétation est sans ambiguïté. Enfin, il est bien connu que, dans le cas d’un modèle linéaire, le coefficient de Pearson est identique au R2. usuel. __________________________________________________________________________ Note Considérons le calcul du R2 avec modèle économétrique non-linéaire quelconque. Soit Yt la variable dépendante observée. Soit Zt la variable dépendante calculée avec le modèle économétrique. Alors, le R2p (r carré Pearson) est défini comme suit: R p2 _ _ ∑ (Yt − Y )( Z t − Z ) t = _ _ 2 2 ( ( Y Y ) ) ( ( Z Z ) ) − − ∑ ∑ t t t t 2 Cette définition possède divers avantages: 1) elle s’adapte à n’importe quel modèle non-linéaire. Zt peut être l’espérance mathématique de Yt, ou bien la variable calculée directement par le modèle économétrique, ou bien toute autre définition; 2) dans le cas linéaire, elle correspond au R2 usuel; 3) R2p est nécessairement contraint entre 0 et 1; 4) R2p s’interprète intuitivement d’une façon évidente. J’utilise personnellement cette définition du R2 dans tous les modèles nonlinéaires depuis de nombreuses années. Il me semble que cette définition est simple et, j’oserais dire, évidente.