Laboratoire d`Analyse – Recherche en Economie Quantitative
Transcription
Laboratoire d`Analyse – Recherche en Economie Quantitative
Corrélation by Jean-Paul Tsasa & Israël Makambo Laboratoire d’Analyse – Recherche en Economie Quantitative One pager Août 2012 Vol. 3 – Num. 009 http://www.lareq.com Dérivation du Domaine de Définition du Coefficient de corrélation De Bravais – Galton - Pearson Application de l’inégalité de Cauchy (1821), Bunyakovski (1859) et Schwartz (1885) Israël Makambo Monga* & Jean – Paul Tsasa V. Kimbambu† Introduction Le coefficient de corrélation fait partie des ABC de la plupart d’ouvrages ou leçons d’économétrie. Et pourtant ses limites et/ou le caractère restrictif et ambigu de son interprétation (Frechet, 1934) devrait pousser les techniciens à de questionnement et inquiétude allant non pas dans le sens de la prolifération des mesures d’interdépendance mais plutôt à un réexamen de la méthodologie économétrique. Avant de se lancer, dans de prochains papiers, sur cette problématique, nous nous proposons de revenir sur un de non dits dans le calcul du coefficient de corrélation, à savoir la dérivation du domaine de définition du coefficient de corrélation paramétrique. La démonstration s’appuie sur l’inégalité de Cauchy – Bunyakovski – Schwartz‡. Le développement du papier se fera en deux temps. Primo, nous expliquons brièvement l’inégalité CBS et deuxio, nous considérons un modèle de régression bivariée, dont l’estimation se fera par les moindres carrés, avant de dériver le domaine de définition du coefficient de corrélation BGP. Inégalité de Cauchy – Bunyakovski – Schwartz Si au point suivant, nous montrons que le coefficient de corrélation BGP de deux variables aléatoires Y1 et Y2 est toujours compris dans l’intervalle entre [–1, +1], nous présentons une inégalité mathématique très célèbre, d’où est dérivé ce résultat. En pré – considérant l’équation polynomiale du second degré suivante pour tout réel : dont l’expression, est par définition non négative § et le discriminant négatif, l’inégalité en cause s’obtient comme suit : Notons élément * † ‡ § le produit scalaire sur un espace vectoriel réel de , le théorème de Cauchy montre que pour tout : Chercheur co – accompli au Laboratoire d’Analyse – Recherche en Economie Quantitative [LAREQ] ; [email protected]. Master en cours Economie – NPTCI 2010 – 2012 ; Assistant CCAM – UPC et Chercheur co – accompli au Laboratoire d’Analyse – Recherche en Economie Quantitative [LAREQ] ; [email protected]– BP 16 626 Kinshasa I. De noms de Augustin Louis Cournot (mathématicien français), Viktor Yakovlevich Bunyakovski (mathématicien russe) et Hermann Amandus Schwarz (mathématicien allemand). et le produit scalaire défini, sont non nul. 97 Laréq Israël Makambo et Jean – Paul Tsasa/ Chercheurs co – accomplis Autrement : dans R3, avec et si et et deux de réels, l’inégalité CBS devient : sont des fonctions réelles continues sur [a, b], on a : Transposée en statistique, on obtient, eu égard à la formulation précédente : Nous allons nous servir, par la suite, de la logique intrinsèque de cette inégalité afin de conduire nos analyses. In fine, il convient de noter précieusement que l’expression de l’inégalité établie précédemment, rend non seulement souple la démonstration et la définition du domaine de variation du coefficient de corrélation BGP, mais également plus aisé la dérivation de l’inégalité de Cramér – Rao (voir Matata – Tsasa, 2012). Modèle d’analyse et estimation par les moindres carrés et domaine de définition du coefficient de corrélation BGP Considérons deux variables aléatoires centrées – réduites dont les interactions peuvent être ajustées à l’aide des méthodes de moindres carrés ordinaires, largement évoqués dans les papiers de Tombola (2012) et Tsasa (2012a, 2012b). Le modèle de régression correspondant à cet environnement s’écrit : où pour chaque instant du temps t, est l’endogène expliquée par le modèle ; est l’explicative de le terme de l’erreur, et dont les réalisations après régression sont qualifiées de « résidus » et ; un paramètre standardisé mesurant la pente optimale de la droite d’ajustement (dans le cas d’espèce, droite de régression bivariée) qui passe par le point moyen L’estimation du modèle (1) par les moindres carrés ordinaires, sous respect de la règle d’or établie dans Tsasa (2012b), nous autorise d’écrire : où est l’opérateur d’espérance conditionnelle. La valeur de de la relation (2) minimise la variance des perturbations et l’espérance des perturbations est nulle. 98 Laréq Israël Makambo et Jean – Paul Tsasa/ Chercheurs co – accomplis En rappelant la relation (1), on note que le carré des perturbations ne peut qu’être non négatif pour toute valeur de la pente appartenant à l’ensemble de réels *. En considérant la forme quadratique associée à la covariance des perturbations, on obtient : Une transformation élémentaire de l’expression (4) donne : En valorisant la linéarité de l’opérateur espérance †, on aboutit aux résultats suivants : L’équation peut également s’écrire (rappelez – vous que les variables en cause sont centrées – réduites) : où représente le coefficient de corrélation théorique de Bravais – Galton – Pearson. Après réaménagement des termes de l’expression (7a), on a : où est le coefficient de détermination. Pour un modèle de régression linéaire simple, le coefficient de détermination est mesuré par le carré du coefficient de corrélation BGP, cela cesse d’être vrai pour la régression multiple (voir, Tombola, 2012). En appliquant la condition d’optimalité à la relation (7b), Il ressort donc que la variance des perturbations est minimisée si et seulement si : Et ce résultat implique que : * † L’omission de l’indice t ne doit pas vous choquer. On adopte, sans ambigüité, cette écriture pour le reste du papier. Tous les détails se trouvent auprès des auteurs. 99 Laréq Israël Makambo et Jean – Paul Tsasa/ Chercheurs co – accomplis Par conséquent, il advient que : Attelons – nous à présent aux valeurs frontières prises par le coefficient BGP. lorsque le coefficient de corrélation BGP est égal à l’unité, cela suppose que, au regard de développements ci – dessus, la variance des perturbation est nulle : Puisque cette expression exprime une relation certaine, autrement, cela se traduit comme suit : pour la frontière basse : c’est – à – dire, tous les points sont sur la première bissectrice dans le plan . pour la frontière basse : De même, Pour clore, évoquons la relation qu’entretiennent les paramètres standardisé et le coefficient de corrélation BGP et non standardisé . D’une part, nous avons montré que : Et d’autre part, on sait que : Il ressort donc que : Ainsi, nous notons avec Chatelain (2008) que : - le coefficient standardisé de la régression simple est différent du paramètre de pente non standardisé, sauf si les variances et s’égalisent ; 100 Laréq Israël Makambo et Jean – Paul Tsasa/ Chercheurs co – accomplis - pour un écart – type de la variable expliqué supérieur à l’écart – type de la variable explicative ; les valeurs faibles du coefficient BGP n’impliquent pas nécessairement des valeurs faibles du coefficient non standardisé ; - pour un écart – type de la variable expliqué inférieur à l’écart – type de la variable explicative ; les valeurs élevées du coefficient BGP n’impliquent pas nécessairement des valeurs élevées du coefficient non standardisé ; - d’après l’inégalité CBS, le paramètrede la pente non standardisé est compris entre les valeurs algébriques du rapport entre l’écart – type de la variable expliquée sur l’écart – type de la variable explicative . Bibliographie ARMATTE Michel, 2001, « Le statut changeant de la corrélation en économétrie (1910 – 1944) », in Revue économique, vol. 52, num. 3, 617 – 631, disponible sur www.cairn.info/revue-economique2001-3-page-617.htm. BOUVIER Alain, Michel GEORGE et François LE LIONNAIS, 2009, Dictionnaire des Mathématiques, PUF, 3ième édition mise à jour « Quagrige » (2009, avril), Paris. BUNYAKOVSKI Viktor Y., 1859, Inequalities Between Integrals, Monograph. CAUCHY Augustin L., 1821, Cours d’analyse, Oeuvres 2 III. CHATELAIN Jean – Bernard, 2008, Econométrie de Panel, (October 27, 2008), Polycopié. FRECHET Maurice, 1934, « Sur l’usage du soi – disant coefficient de corrélation », Rapport pour la 22e session de l’IIS à Londres, Bulletin de l’IIS. MATATA Dandy et Jean – Paul TSASA, 2012, “Troïka statistique de R.A. Fisher : Critère absolu, Information de Fisher et Analyse de la Variance”, One Pager Laréq, vol. 2, num. 003, (mai 2012), 16 – 21. SCHWARZ Hermann A., 1885, Über ein die Flächen kleinsten Flächeninhalts betreffendes Problem der Variationsrechnung Acta Societatis scientiarum Fennicae Vol XV. TOMBOLA Cédrick, 2012, “Econométrie 1 : Rappels et Recueils d’exercices”, Guide Laréq pour étudiant, (Juin 2012), 109p. TSASA Jean – Paul, 2012a, "Faisceau des moindres carrés", One Pager Laréq, vol. 2, num. 001, (Mai 2012), 01 – 11. TSASA Jean – Paul, 2012b, "Dérivation De La Règle d’or d’Estimation : Un regard plus attentif sur les points focaux de la méthode des moindres carrés linéaires", One Pager Laréq, vol. 2, num. 001, (Mai 2012), 22 – 28. 101 Laréq Israël Makambo et Jean – Paul Tsasa/ Chercheurs co – accomplis