Laboratoire d`Analyse – Recherche en Economie Quantitative

Commentaires

Transcription

Laboratoire d`Analyse – Recherche en Economie Quantitative
Corrélation by Jean-Paul Tsasa & Israël Makambo
Laboratoire d’Analyse – Recherche en Economie Quantitative
One pager
Août 2012
Vol. 3 – Num. 009
http://www.lareq.com
Dérivation du Domaine de Définition du Coefficient de corrélation
De Bravais – Galton - Pearson
Application de l’inégalité de Cauchy (1821), Bunyakovski (1859) et Schwartz (1885)
Israël Makambo Monga* & Jean – Paul Tsasa V. Kimbambu†
Introduction
Le coefficient de corrélation fait partie des ABC de la plupart d’ouvrages ou leçons d’économétrie. Et
pourtant ses limites et/ou le caractère restrictif et ambigu de son interprétation (Frechet, 1934) devrait
pousser les techniciens à de questionnement et inquiétude allant non pas dans le sens de la prolifération
des mesures d’interdépendance mais plutôt à un réexamen de la méthodologie économétrique. Avant de
se lancer, dans de prochains papiers, sur cette problématique, nous nous proposons de revenir sur un de
non dits dans le calcul du coefficient de corrélation, à savoir la dérivation du domaine de définition du
coefficient de corrélation paramétrique. La démonstration s’appuie sur l’inégalité de Cauchy –
Bunyakovski – Schwartz‡. Le développement du papier se fera en deux temps. Primo, nous expliquons
brièvement l’inégalité CBS et deuxio, nous considérons un modèle de régression bivariée, dont
l’estimation se fera par les moindres carrés, avant de dériver le domaine de définition du coefficient de
corrélation BGP.
Inégalité de Cauchy – Bunyakovski – Schwartz
Si au point suivant, nous montrons que le coefficient de corrélation BGP de deux variables aléatoires Y1
et Y2 est toujours compris dans l’intervalle entre [–1, +1], nous présentons une inégalité mathématique
très célèbre, d’où est dérivé ce résultat.
En pré – considérant l’équation polynomiale du second degré suivante pour tout réel
:
dont l’expression, est par définition non négative § et le discriminant négatif, l’inégalité en cause s’obtient
comme suit :
Notons
élément
*
†
‡
§
le produit scalaire sur un espace vectoriel réel
de
, le théorème de Cauchy montre que pour tout
:
Chercheur co – accompli au Laboratoire d’Analyse – Recherche en Economie Quantitative [LAREQ] ;
[email protected]
Master en cours Economie – NPTCI 2010 – 2012 ; Assistant CCAM – UPC et Chercheur co – accompli au Laboratoire
d’Analyse – Recherche en Economie Quantitative [LAREQ] ; [email protected]– BP 16 626 Kinshasa I.
De noms de Augustin Louis Cournot (mathématicien français), Viktor Yakovlevich Bunyakovski (mathématicien russe)
et Hermann Amandus Schwarz (mathématicien allemand).
et le produit scalaire défini,
sont non nul.
97
Laréq
Israël Makambo et Jean – Paul Tsasa/ Chercheurs co – accomplis
Autrement :

dans R3, avec

et si
et
et
deux
de réels, l’inégalité CBS devient :
sont des fonctions réelles continues sur [a, b], on a :
Transposée en statistique, on obtient, eu égard à la formulation précédente :
Nous allons nous servir, par la suite, de la logique intrinsèque de cette inégalité afin de conduire nos
analyses.
In
fine,
il
convient
de
noter
précieusement
que
l’expression
de
l’inégalité
établie
précédemment, rend non seulement souple la démonstration et la définition du domaine de variation du
coefficient de corrélation BGP, mais également plus aisé la dérivation de l’inégalité de Cramér – Rao (voir
Matata – Tsasa, 2012).
Modèle d’analyse et estimation par les moindres carrés et domaine de définition du coefficient
de corrélation BGP
Considérons deux variables aléatoires centrées – réduites dont les interactions peuvent être ajustées à
l’aide des méthodes de moindres carrés ordinaires, largement évoqués dans les papiers de Tombola
(2012) et Tsasa (2012a, 2012b). Le modèle de régression correspondant à cet environnement s’écrit :
où pour chaque instant du temps t,
est l’endogène expliquée par le modèle ;
est l’explicative de
le terme de l’erreur, et dont les réalisations après régression sont qualifiées de « résidus » et
;
un
paramètre standardisé mesurant la pente optimale de la droite d’ajustement (dans le cas d’espèce,
droite de régression bivariée) qui passe par le point moyen
L’estimation du modèle (1) par les moindres carrés ordinaires, sous respect de la règle d’or établie dans
Tsasa (2012b), nous autorise d’écrire :
où
est l’opérateur d’espérance conditionnelle.
La valeur de
de la relation (2) minimise la variance des perturbations
et l’espérance des
perturbations est nulle.
98
Laréq
Israël Makambo et Jean – Paul Tsasa/ Chercheurs co – accomplis
En rappelant la relation (1), on note que le carré des perturbations ne peut qu’être non négatif pour
toute valeur de la pente appartenant à l’ensemble de réels *.
En considérant la forme quadratique associée à la covariance des perturbations, on obtient :
Une transformation élémentaire de l’expression (4) donne :
En valorisant la linéarité de l’opérateur espérance †, on aboutit aux résultats suivants :
L’équation peut également s’écrire (rappelez – vous que les variables en cause sont centrées –
réduites) :
où
représente le coefficient de corrélation théorique de Bravais – Galton – Pearson.
Après réaménagement des termes de l’expression (7a), on a :
où
est le coefficient de détermination. Pour un modèle de régression linéaire simple, le coefficient de
détermination est mesuré par le carré du coefficient de corrélation BGP, cela cesse d’être vrai pour la
régression multiple (voir, Tombola, 2012).
En appliquant la condition d’optimalité à la relation (7b), Il ressort donc que la variance des
perturbations est minimisée si et seulement si :
Et ce résultat implique que :
*
†
L’omission de l’indice t ne doit pas vous choquer. On adopte, sans ambigüité, cette écriture pour le reste du papier.
Tous les détails se trouvent auprès des auteurs.
99
Laréq
Israël Makambo et Jean – Paul Tsasa/ Chercheurs co – accomplis
Par conséquent, il advient que :
Attelons – nous à présent aux valeurs frontières prises par le coefficient BGP.
lorsque le coefficient de corrélation BGP est égal à l’unité, cela suppose que, au regard de
développements ci – dessus, la variance des perturbation est nulle :
Puisque cette expression exprime une relation certaine, autrement, cela se traduit comme suit :

pour la frontière basse :
c’est – à – dire, tous les points sont sur la première bissectrice dans le plan

.
pour la frontière basse :
De même,
Pour clore, évoquons la relation qu’entretiennent les paramètres standardisé
et le coefficient de corrélation BGP
et non standardisé
.
D’une part, nous avons montré que :
Et d’autre part, on sait que :
Il ressort donc que :
Ainsi, nous notons avec Chatelain (2008) que :
-
le coefficient standardisé de la régression simple est différent du paramètre de pente non
standardisé, sauf si les variances
et
s’égalisent ;
100
Laréq
Israël Makambo et Jean – Paul Tsasa/ Chercheurs co – accomplis
-
pour un écart – type de la variable expliqué supérieur à l’écart – type de la variable explicative
; les valeurs faibles du coefficient BGP n’impliquent pas nécessairement des valeurs
faibles du coefficient non standardisé ;
-
pour un écart – type de la variable expliqué inférieur à l’écart – type de la variable explicative
; les valeurs élevées du coefficient BGP n’impliquent pas nécessairement des valeurs
élevées du coefficient non standardisé ;
-
d’après l’inégalité CBS, le paramètrede la pente non standardisé est compris entre les valeurs
algébriques du rapport entre l’écart – type de la variable expliquée sur l’écart – type de la
variable explicative
.
Bibliographie

ARMATTE Michel, 2001, « Le statut changeant de la corrélation en économétrie (1910 – 1944) », in
Revue économique, vol. 52, num. 3, 617 – 631, disponible sur www.cairn.info/revue-economique2001-3-page-617.htm.

BOUVIER Alain, Michel GEORGE et François LE LIONNAIS, 2009, Dictionnaire des Mathématiques, PUF,
3ième édition mise à jour « Quagrige » (2009, avril), Paris.

BUNYAKOVSKI Viktor Y., 1859, Inequalities Between Integrals, Monograph.

CAUCHY Augustin L., 1821, Cours d’analyse, Oeuvres 2 III.

CHATELAIN Jean – Bernard, 2008, Econométrie de Panel, (October 27, 2008), Polycopié.

FRECHET Maurice, 1934, « Sur l’usage du soi – disant coefficient de corrélation », Rapport pour la
22e session de l’IIS à Londres, Bulletin de l’IIS.

MATATA Dandy et Jean – Paul TSASA, 2012, “Troïka statistique de R.A. Fisher : Critère absolu,
Information de Fisher et Analyse de la Variance”, One Pager Laréq, vol. 2, num. 003, (mai 2012), 16 – 21.

SCHWARZ Hermann A., 1885, Über ein die Flächen kleinsten Flächeninhalts betreffendes Problem der
Variationsrechnung Acta Societatis scientiarum Fennicae Vol XV.

TOMBOLA Cédrick, 2012, “Econométrie 1 : Rappels et Recueils d’exercices”, Guide Laréq pour
étudiant, (Juin 2012), 109p.

TSASA Jean – Paul, 2012a, "Faisceau des moindres carrés", One Pager Laréq, vol. 2, num. 001,
(Mai 2012), 01 – 11.

TSASA Jean – Paul, 2012b, "Dérivation De La Règle d’or d’Estimation : Un regard plus attentif sur
les points focaux de la méthode des moindres carrés linéaires", One Pager Laréq, vol. 2, num. 001,
(Mai 2012), 22 – 28.
101
Laréq
Israël Makambo et Jean – Paul Tsasa/ Chercheurs co – accomplis

Documents pareils