L`usage du coefficient de Pearson comme mesure du R2 dans les

Transcription

L`usage du coefficient de Pearson comme mesure du R2 dans les
L’usage du coefficient de Pearson comme mesure du R2 dans les modèles
non linéaires
par
Richard Laferrière
Université de Montréal
Agora Jules Dupuit, Publication AJD-57
Centre de recherche sur les transports, Publication CRT 99-25
Juillet 1999, révisé en août 2002
Summary
This note proposes to apply the simple Pearson coefficient as a measure of goodness of fit
for non-linear econometric models. Empirically, the existing measures are very often
deceiving in terms of their intuitive interpretation. Pseudo-R2’s may yield either
negative numbers or surprisingly high correlation (near 1). The Pearson coefficient is
always included between 0 and 1 and has a clear interpretation. Furthermore, it is well
known that, for linear models, the Pearson coefficient is identical to the usual R2
formula.
Résumé
Cet note propose d’appliquer le coefficient de Pearson comme mesure de coefficient de
corrélation multiple, ou d’ajustement, pour les modèles économétriques non linéaires.
Les résultats empiriques des mesures existantes sont très souvent décevants d’un point
de vue intuitif. En effet, les pseudo-R2 peuvent être négatifs ou étonnamment élevés
(près de 1). Par contre, le coefficient de corrélation de Pearson est toujours compris entre
0 et 1. De plus, son interprétation est sans ambiguïté. Enfin, il est bien connu que, dans
le cas d’un modèle linéaire, le coefficient de Pearson est identique au R2. usuel.
__________________________________________________________________________
Note
Considérons le calcul du R2 avec modèle économétrique non-linéaire quelconque.
Soit Yt la variable dépendante observée.
Soit Zt la variable dépendante calculée avec le modèle économétrique.
Alors, le R2p (r carré Pearson) est défini comme suit:
R p2
_
_




∑ (Yt − Y )( Z t − Z )
t

= 
_
_

2
2 
(
(
Y
Y
)
)
(
(
Z
Z
)
)
−
−
∑
∑

t
t
t

 t
2
Cette définition possède divers avantages:
1) elle s’adapte à n’importe quel modèle non-linéaire. Zt peut être l’espérance
mathématique de Yt, ou bien la variable calculée directement par le modèle
économétrique, ou bien toute autre définition;
2) dans le cas linéaire, elle correspond au R2 usuel;
3) R2p est nécessairement contraint entre 0 et 1;
4) R2p s’interprète intuitivement d’une façon évidente.
J’utilise personnellement cette définition du R2 dans tous les modèles nonlinéaires depuis de nombreuses années. Il me semble que cette définition est
simple et, j’oserais dire, évidente.