Statistiques I
Transcription
Statistiques I
Exercices Covariance Indicateurs de concentration Statistiques I Alexandre Caboussat [email protected] Classe : Mercredi 8h15-10h00 Salle: C114 http://campus.hesge.ch/caboussata A. Caboussat, HEG STAT I, 2010 1 / 27 Exercices Covariance Indicateurs de concentration Exercice 8.2 1 Nuage de points 2 Relation? Covariance: 3 cov (x, y ) = −60. 4 Corrélation rxy = −0.9688. A. Caboussat, HEG STAT I, 2010 2 / 27 Exercices Covariance Indicateurs de concentration Exercice 8.2 1 Nuage de points 2 Relation? Covariance: 3 cov (x, y ) = −60. 4 Corrélation rxy = −0.9688. A. Caboussat, HEG STAT I, 2010 2 / 27 Exercices Covariance Indicateurs de concentration Exercice 8.2 1 Nuage de points 2 Relation? Covariance: 3 cov (x, y ) = −60. 4 Corrélation rxy = −0.9688. A. Caboussat, HEG STAT I, 2010 2 / 27 Exercices Covariance Indicateurs de concentration Exercice 8.2 1 Nuage de points 2 Relation? Covariance: 3 cov (x, y ) = −60. 4 Corrélation rxy = −0.9688. A. Caboussat, HEG STAT I, 2010 2 / 27 Exercices Covariance Indicateurs de concentration Exercice 8.3 Nombre de glaces 210 190 Nbre glaces 170 150 130 110 90 70 50 15 17 19 21 23 25 27 29 31 33 35 Température 1 R 2 = 0.996 2 Si xi = 24, ŷi = ... 3 Si xi = 5, ŷi = ... A. Caboussat, HEG STAT I, 2010 3 / 27 Exercices Covariance Indicateurs de concentration Exercice 8.3 Nombre de glaces 210 190 Nbre glaces 170 150 130 110 90 70 50 15 17 19 21 23 25 27 29 31 33 35 Température 1 R 2 = 0.996 2 Si xi = 24, ŷi = ... 3 Si xi = 5, ŷi = ... A. Caboussat, HEG STAT I, 2010 3 / 27 Exercices Covariance Indicateurs de concentration Exercice 8.3 Nombre de glaces 210 190 Nbre glaces 170 150 130 110 90 70 50 15 17 19 21 23 25 27 29 31 33 35 Température 1 R 2 = 0.996 2 Si xi = 24, ŷi = ... 3 Si xi = 5, ŷi = ... A. Caboussat, HEG STAT I, 2010 3 / 27 Exercices Covariance Indicateurs de concentration Données groupées Définition La covariance de données groupées d’une population est ` cov(x, y ) = c 1 XX nij (xi − µx ) (yj − µy ) n i=1 j=1 ` = c 1 XX nij xi yj − µx µy n i=1 j=1 où xi et yj sont les centres des classes et où µx et µy sont les moyennes des données groupées. A. Caboussat, HEG STAT I, 2010 4 / 27 Exercices Covariance Indicateurs de concentration Données groupées Corrélation linéaire de Pearson : formule identique à celle des données non-groupées. Population σxy ρxy = σx σy A. Caboussat, HEG Echantillon sxy rxy = sx sy STAT I, 2010 5 / 27 Exercices Covariance Indicateurs de concentration Exemple Relation entre les quantités d’aluminium et d’or achetées. Données groupées en deux catégories pour l’aluminium et 3 catégories pour l’or. Or A. Caboussat, HEG [0;2000[ [2000;4000[ [4000;6000] Total Aluminium [0;10[ [10;20] 20 2 5 2 0 3 25 7 Total 22 7 3 32 STAT I, 2010 6 / 27 Exercices Covariance Indicateurs de concentration Exemple (suite) Notons X pour l’or et Y pour l’aluminium. 3·5000+7·3000+22·1000 32 = 1812.5 = 7.1875 µx µy = = 25·5+7·15 32 var(x) var(y ) = = 3·50002 +7·30002 +22·10002 32 25·52 +7·152 − 7.18752 32 cov(x, y ) = 0·5000·5+...+2·1000·15 32 corr(x, y ) = 3222.66 √ 10 7140 843.75·17.09 A. Caboussat, HEG − 1812.52 = 10 7140 843.75 = 17.09 − 1812.5 · 7.1875 = 3222.66 = 0.5953 STAT I, 2010 7 / 27 Exercices Covariance Indicateurs de concentration Indicateurs de Concentration A. Caboussat, HEG STAT I, 2010 8 / 27 Exercices Covariance Indicateurs de concentration Objectifs Comprendre un indicateur de concentration Savoir construire la courbe de Lorenz Savoir calculer et interpréter l’indice de Gini A. Caboussat, HEG STAT I, 2010 9 / 27 Exercices Covariance Indicateurs de concentration Indicateurs de concentration Comment mesurer la répartition de richesse? Y a-t-il des inégalités ou équité? Exemples Patrimoine culturel. Salaire des employés. Imposition des citoyens. Peuplement d’un pays. Offres d’emploi. ... A. Caboussat, HEG STAT I, 2010 10 / 27 Exercices Covariance Indicateurs de concentration Exemple Bonus distribués dans l’entreprise. Bonus en milliers de Frs 0.8 3 4 6 10 Effectifs 10 6 4 3 2 Cette répartition est-elle égalitaire? A. Caboussat, HEG STAT I, 2010 11 / 27 Exercices Covariance Indicateurs de concentration Rappel: Positionnement 1 observation vs les autres observations valeur la plus fréquente: mode ou classe modale valeur qui divise en deux parties égales l’ensemble d’une série statistique classée par ordre croissant (statistique d’ordre): médiane situation par rapport à une tendance centrale: variables centrées réduites A. Caboussat, HEG STAT I, 2010 12 / 27 Exercices Covariance Indicateurs de concentration Répartition égalitaire ou inégalitaire? Fréquence relative cumulée Représentation graphique en ogive A. Caboussat, HEG STAT I, 2010 13 / 27 Exercices Covariance Indicateurs de concentration Exemple xi = Bonus en milliers de Frs ni = Effectifs 0.8 10 3 6 4 4 6 3 10 2 Effectifs cumulés Effectif relatif cumulé 10 0.4 16 0.64 20 0.8 23 25 0.92 1 Richesse par classe Richesse cumulée Richesse relative cumulée 8 8 0.1 18 26 0.325 16 42 0.525 18 20 60 80 0.75 1 Total 25 80 Attention: Bonus classés par ordre croissant. A. Caboussat, HEG STAT I, 2010 14 / 27 Exercices Covariance Indicateurs de concentration Exemple A. Caboussat, HEG STAT I, 2010 15 / 27 Exercices Covariance Indicateurs de concentration Courbe de Lorenz Considérons les parts de richesse par ordre croissant, avec leurs effectifs associés. La représentation graphique en une ogive comprenant: en abscisse les effectifs relatifs cumulés en ordonnée les parts de richesse relatives cumulées une courbe de concentration en joignant par des segments de droites les points (effectif relatif cumulé, part relative cumulée) est la représentation graphique de la courbe de Lorenz A. Caboussat, HEG STAT I, 2010 16 / 27 Exercices Covariance Indicateurs de concentration Courbe de Lorenz A. Caboussat, HEG STAT I, 2010 17 / 27 Exercices Covariance Indicateurs de concentration Aire de concentration A. Caboussat, HEG STAT I, 2010 18 / 27 Exercices Covariance Indicateurs de concentration Indice de Gini Définition L’indice de concentration de Gini, ou plus communément l’indice de Gini, est défini par le rapport entre l’aire de concentration par l’aire du triangle sous la ligne d’équipartition. Il est noté IG . IG = Aire de concentration Aire du triangle sous la ligne d’équipartition = 2 × Aire de concentration A. Caboussat, HEG STAT I, 2010 19 / 27 Exercices Covariance Indicateurs de concentration Indice de Gini Définition L’indice de concentration de Gini, ou plus communément l’indice de Gini, est défini par le rapport entre l’aire de concentration par l’aire du triangle sous la ligne d’équipartition. Il est noté IG . IG = Aire de concentration Aire du triangle sous la ligne d’équipartition = 2 × Aire de concentration Équipartition → 0 ≤ IG ≤ 1 ← Inégalité maximale A. Caboussat, HEG STAT I, 2010 19 / 27 Exercices Covariance Indicateurs de concentration Indice de Gini Définition L’indice de concentration de Gini, ou plus communément l’indice de Gini, est défini par le rapport entre l’aire de concentration par l’aire du triangle sous la ligne d’équipartition. Il est noté IG . IG = Aire de concentration Aire du triangle sous la ligne d’équipartition = 2 × Aire de concentration Équipartition → 0 ≤ IG ≤ 1 ← Inégalité maximale Équité ↓ A. Caboussat, HEG ⇔ IG ↑ STAT I, 2010 19 / 27 Exercices Covariance Indicateurs de concentration Concentration faible - forte Concentration faible Concentration forte 50% détient 40% de la richesse 50% détient 60% de la richesse 95% détient 15% de la richesse 5% détient 85% de la richesse A. Caboussat, HEG STAT I, 2010 20 / 27 Exercices Covariance Indicateurs de concentration Exemples 10% détient 90% de la richesse 30% détient 90% de la richesse 10% détient 70% de la richesse 30% détient 70% de la richesse 10% détient 50% de la richesse 30% détient 50% de la richesse A. Caboussat, HEG STAT I, 2010 21 / 27 Exercices Covariance Indicateurs de concentration Calcul de l’indice de Gini: Méthode 1 1 2 3 Calculer l’aire A sous la courbe de Lorenz en additionnant les aires des trapèzes (trapèze dégénéré en un triangle pour le premier calcul). Soustraire de 0.5 l’aire trouvée: Aire de concentration = 0.5-A Multiplier par 2 l’aire de concentration: IG = 2(0.5 − A) A. Caboussat, HEG STAT I, 2010 22 / 27 Exercices Covariance Indicateurs de concentration Exemple de calcul: méthode 1 A. Caboussat, HEG STAT I, 2010 23 / 27 Exercices Covariance Indicateurs de concentration Exemple de calcul: méthode 1 1 2 3 Aire du triangle = 0.5 · 0.4 · 0.1 = 0.02 Aire du trapèze = 0.5(0.1+0.325)(0.64-0.4)=0.051 Aire du trapèze = 0.5(0.325+0.525)(0.8-0.64)=0.068 Aire du trapèze = 0.5(0.535+0.75)(0.92-0.8)=0.0765 Aire du trapèze = 0.5(0.75+1)(1-0.92)=0.07 Aire sous la courbe = 0.2855 Aire de concentration = 0.5 − A = 0.2145 IG = 2(0.5 − A) = 0.429 A. Caboussat, HEG STAT I, 2010 23 / 27 Exercices Covariance Indicateurs de concentration Calcul de l’indice de Gini: Méthode 2 F = fréquence relative cumulée des individus G = part relative cumulée de la richesse. i P i 1X Fi = nj ; n Gi = j=1 IG = c−1 X i=1 Fi Gi+1 − j=1 c P nj x j nj x j j=1 c−1 X Fi+1 Gi i=1 Courbe de Lorenz = lieu des points (Fi , Gi ) reliés par des segments de droite A. Caboussat, HEG STAT I, 2010 24 / 27 Exercices Covariance Indicateurs de concentration Exemple de calcul: méthode 2 Bonus en milliers de Frs 0.8 3 4 6 10 10 6 4 3 2 Effectifs Fi = Effectif relatif cumulé 0.4 0.64 0.8 0.92 1 Gi = Richesse relative cumulée 0.1 0.325 0.525 0.75 1 IG = (0.4 · 0.325 + 0.64 · 0.525 + 0.8 · 0.75 + 0.92 · 1) −(0.64 · 0.1 + 0.8 · 0.325 + 0.92 · 525 + 1 · 0.75) = 1.986 − 1.557 = 0.429 A. Caboussat, HEG STAT I, 2010 25 / 27 Exercices Covariance Indicateurs de concentration Pour le 15 décembre: test en blanc. Pour le 23 décembre: exercices 9.1 et 9.2 A. Caboussat, HEG STAT I, 2010 27 / 27