Statistiques I

Transcription

Statistiques I
Exercices Covariance Indicateurs de concentration
Statistiques I
Alexandre Caboussat
[email protected]
Classe : Mercredi 8h15-10h00
Salle: C114
http://campus.hesge.ch/caboussata
A. Caboussat, HEG
STAT I, 2010
1 / 27
Exercices Covariance Indicateurs de concentration
Exercice 8.2
1
Nuage de points
2
Relation?
Covariance:
3
cov (x, y ) = −60.
4
Corrélation
rxy = −0.9688.
A. Caboussat, HEG
STAT I, 2010
2 / 27
Exercices Covariance Indicateurs de concentration
Exercice 8.2
1
Nuage de points
2
Relation?
Covariance:
3
cov (x, y ) = −60.
4
Corrélation
rxy = −0.9688.
A. Caboussat, HEG
STAT I, 2010
2 / 27
Exercices Covariance Indicateurs de concentration
Exercice 8.2
1
Nuage de points
2
Relation?
Covariance:
3
cov (x, y ) = −60.
4
Corrélation
rxy = −0.9688.
A. Caboussat, HEG
STAT I, 2010
2 / 27
Exercices Covariance Indicateurs de concentration
Exercice 8.2
1
Nuage de points
2
Relation?
Covariance:
3
cov (x, y ) = −60.
4
Corrélation
rxy = −0.9688.
A. Caboussat, HEG
STAT I, 2010
2 / 27
Exercices Covariance Indicateurs de concentration
Exercice 8.3
Nombre de glaces
210
190
Nbre glaces
170
150
130
110
90
70
50
15
17
19
21
23
25
27
29
31
33
35
Température
1
R 2 = 0.996
2
Si xi = 24, ŷi = ...
3
Si xi = 5, ŷi = ...
A. Caboussat, HEG
STAT I, 2010
3 / 27
Exercices Covariance Indicateurs de concentration
Exercice 8.3
Nombre de glaces
210
190
Nbre glaces
170
150
130
110
90
70
50
15
17
19
21
23
25
27
29
31
33
35
Température
1
R 2 = 0.996
2
Si xi = 24, ŷi = ...
3
Si xi = 5, ŷi = ...
A. Caboussat, HEG
STAT I, 2010
3 / 27
Exercices Covariance Indicateurs de concentration
Exercice 8.3
Nombre de glaces
210
190
Nbre glaces
170
150
130
110
90
70
50
15
17
19
21
23
25
27
29
31
33
35
Température
1
R 2 = 0.996
2
Si xi = 24, ŷi = ...
3
Si xi = 5, ŷi = ...
A. Caboussat, HEG
STAT I, 2010
3 / 27
Exercices Covariance Indicateurs de concentration
Données groupées
Définition
La covariance de données groupées d’une population est
`
cov(x, y ) =
c
1 XX
nij (xi − µx ) (yj − µy )
n
i=1 j=1
`
=
c
1 XX
nij xi yj − µx µy
n
i=1 j=1
où xi et yj sont les centres des classes et où µx et µy sont les
moyennes des données groupées.
A. Caboussat, HEG
STAT I, 2010
4 / 27
Exercices Covariance Indicateurs de concentration
Données groupées
Corrélation linéaire de Pearson : formule identique à celle des
données non-groupées.
Population
σxy
ρxy =
σx σy
A. Caboussat, HEG
Echantillon
sxy
rxy =
sx sy
STAT I, 2010
5 / 27
Exercices Covariance Indicateurs de concentration
Exemple
Relation entre les quantités d’aluminium et d’or achetées. Données
groupées en deux catégories pour l’aluminium et 3 catégories pour
l’or.
Or
A. Caboussat, HEG
[0;2000[
[2000;4000[
[4000;6000]
Total
Aluminium
[0;10[ [10;20]
20
2
5
2
0
3
25
7
Total
22
7
3
32
STAT I, 2010
6 / 27
Exercices Covariance Indicateurs de concentration
Exemple (suite)
Notons X pour l’or et Y pour l’aluminium.
3·5000+7·3000+22·1000
32
= 1812.5
= 7.1875
µx
µy
=
=
25·5+7·15
32
var(x)
var(y )
=
=
3·50002 +7·30002 +22·10002
32
25·52 +7·152
− 7.18752
32
cov(x, y ) =
0·5000·5+...+2·1000·15
32
corr(x, y ) =
3222.66
√
10 7140 843.75·17.09
A. Caboussat, HEG
− 1812.52
= 10 7140 843.75
= 17.09
− 1812.5 · 7.1875 = 3222.66
= 0.5953
STAT I, 2010
7 / 27
Exercices Covariance Indicateurs de concentration
Indicateurs de Concentration
A. Caboussat, HEG
STAT I, 2010
8 / 27
Exercices Covariance Indicateurs de concentration
Objectifs
Comprendre un indicateur de concentration
Savoir construire la courbe de Lorenz
Savoir calculer et interpréter l’indice de Gini
A. Caboussat, HEG
STAT I, 2010
9 / 27
Exercices Covariance Indicateurs de concentration
Indicateurs de concentration
Comment mesurer la répartition de richesse?
Y a-t-il des inégalités ou équité?
Exemples
Patrimoine culturel.
Salaire des employés.
Imposition des citoyens.
Peuplement d’un pays.
Offres d’emploi.
...
A. Caboussat, HEG
STAT I, 2010
10 / 27
Exercices Covariance Indicateurs de concentration
Exemple
Bonus distribués dans l’entreprise.
Bonus en milliers de Frs 0.8 3 4 6 10
Effectifs
10 6 4 3 2
Cette répartition est-elle égalitaire?
A. Caboussat, HEG
STAT I, 2010
11 / 27
Exercices Covariance Indicateurs de concentration
Rappel: Positionnement
1 observation vs les autres observations
valeur la plus fréquente: mode ou classe modale
valeur qui divise en deux parties égales l’ensemble d’une série
statistique classée par ordre croissant (statistique d’ordre):
médiane
situation par rapport à une tendance centrale: variables
centrées réduites
A. Caboussat, HEG
STAT I, 2010
12 / 27
Exercices Covariance Indicateurs de concentration
Répartition égalitaire ou inégalitaire?
Fréquence relative cumulée
Représentation graphique en ogive
A. Caboussat, HEG
STAT I, 2010
13 / 27
Exercices Covariance Indicateurs de concentration
Exemple
xi = Bonus en milliers de Frs
ni = Effectifs
0.8
10
3
6
4
4
6
3
10
2
Effectifs cumulés
Effectif relatif cumulé
10
0.4
16
0.64
20
0.8
23 25
0.92 1
Richesse par classe
Richesse cumulée
Richesse relative cumulée
8
8
0.1
18
26
0.325
16
42
0.525
18 20
60 80
0.75 1
Total
25
80
Attention: Bonus classés par ordre croissant.
A. Caboussat, HEG
STAT I, 2010
14 / 27
Exercices Covariance Indicateurs de concentration
Exemple
A. Caboussat, HEG
STAT I, 2010
15 / 27
Exercices Covariance Indicateurs de concentration
Courbe de Lorenz
Considérons les parts de richesse par ordre croissant, avec leurs
effectifs associés.
La représentation graphique en une ogive comprenant:
en abscisse les effectifs relatifs cumulés
en ordonnée les parts de richesse relatives cumulées
une courbe de concentration en joignant par des segments de
droites les points (effectif relatif cumulé, part relative
cumulée)
est la représentation graphique de la courbe de Lorenz
A. Caboussat, HEG
STAT I, 2010
16 / 27
Exercices Covariance Indicateurs de concentration
Courbe de Lorenz
A. Caboussat, HEG
STAT I, 2010
17 / 27
Exercices Covariance Indicateurs de concentration
Aire de concentration
A. Caboussat, HEG
STAT I, 2010
18 / 27
Exercices Covariance Indicateurs de concentration
Indice de Gini
Définition
L’indice de concentration de Gini, ou plus communément l’indice
de Gini, est défini par le rapport entre l’aire de concentration par
l’aire du triangle sous la ligne d’équipartition. Il est noté IG .
IG
=
Aire de concentration
Aire du triangle sous la ligne d’équipartition
=
2 × Aire de concentration
A. Caboussat, HEG
STAT I, 2010
19 / 27
Exercices Covariance Indicateurs de concentration
Indice de Gini
Définition
L’indice de concentration de Gini, ou plus communément l’indice
de Gini, est défini par le rapport entre l’aire de concentration par
l’aire du triangle sous la ligne d’équipartition. Il est noté IG .
IG
=
Aire de concentration
Aire du triangle sous la ligne d’équipartition
=
2 × Aire de concentration
Équipartition → 0 ≤ IG ≤ 1 ← Inégalité maximale
A. Caboussat, HEG
STAT I, 2010
19 / 27
Exercices Covariance Indicateurs de concentration
Indice de Gini
Définition
L’indice de concentration de Gini, ou plus communément l’indice
de Gini, est défini par le rapport entre l’aire de concentration par
l’aire du triangle sous la ligne d’équipartition. Il est noté IG .
IG
=
Aire de concentration
Aire du triangle sous la ligne d’équipartition
=
2 × Aire de concentration
Équipartition → 0 ≤ IG ≤ 1 ← Inégalité maximale
Équité ↓
A. Caboussat, HEG
⇔
IG ↑
STAT I, 2010
19 / 27
Exercices Covariance Indicateurs de concentration
Concentration faible - forte
Concentration faible
Concentration forte
50% détient 40% de la richesse
50% détient 60% de la richesse
95% détient 15% de la richesse
5% détient 85% de la richesse
A. Caboussat, HEG
STAT I, 2010
20 / 27
Exercices Covariance Indicateurs de concentration
Exemples
10% détient 90% de la richesse
30% détient 90% de la richesse
10% détient 70% de la richesse
30% détient 70% de la richesse
10% détient 50% de la richesse
30% détient 50% de la richesse
A. Caboussat, HEG
STAT I, 2010
21 / 27
Exercices Covariance Indicateurs de concentration
Calcul de l’indice de Gini: Méthode 1
1
2
3
Calculer l’aire A sous la courbe de Lorenz en additionnant les
aires des trapèzes (trapèze dégénéré en un triangle pour le
premier calcul).
Soustraire de 0.5 l’aire trouvée: Aire de concentration = 0.5-A
Multiplier par 2 l’aire de concentration: IG = 2(0.5 − A)
A. Caboussat, HEG
STAT I, 2010
22 / 27
Exercices Covariance Indicateurs de concentration
Exemple de calcul: méthode 1
A. Caboussat, HEG
STAT I, 2010
23 / 27
Exercices Covariance Indicateurs de concentration
Exemple de calcul: méthode 1
1
2
3
Aire du triangle = 0.5 · 0.4 · 0.1 = 0.02
Aire du trapèze = 0.5(0.1+0.325)(0.64-0.4)=0.051
Aire du trapèze = 0.5(0.325+0.525)(0.8-0.64)=0.068
Aire du trapèze = 0.5(0.535+0.75)(0.92-0.8)=0.0765
Aire du trapèze = 0.5(0.75+1)(1-0.92)=0.07
Aire sous la courbe = 0.2855
Aire de concentration = 0.5 − A = 0.2145
IG = 2(0.5 − A) = 0.429
A. Caboussat, HEG
STAT I, 2010
23 / 27
Exercices Covariance Indicateurs de concentration
Calcul de l’indice de Gini: Méthode 2
F = fréquence relative cumulée des individus
G = part relative cumulée de la richesse.
i
P
i
1X
Fi =
nj ;
n
Gi =
j=1
IG =
c−1
X
i=1
Fi Gi+1 −
j=1
c
P
nj x j
nj x j
j=1
c−1
X
Fi+1 Gi
i=1
Courbe de Lorenz = lieu des points (Fi , Gi ) reliés par des segments
de droite
A. Caboussat, HEG
STAT I, 2010
24 / 27
Exercices Covariance Indicateurs de concentration
Exemple de calcul: méthode 2
Bonus en milliers de Frs
0.8
3
4
6
10
10
6
4
3
2
Effectifs
Fi = Effectif relatif cumulé
0.4 0.64
0.8 0.92 1
Gi = Richesse relative cumulée 0.1 0.325 0.525 0.75 1
IG
= (0.4 · 0.325 + 0.64 · 0.525 + 0.8 · 0.75 + 0.92 · 1)
−(0.64 · 0.1 + 0.8 · 0.325 + 0.92 · 525 + 1 · 0.75)
= 1.986 − 1.557
= 0.429
A. Caboussat, HEG
STAT I, 2010
25 / 27
Exercices Covariance Indicateurs de concentration
Pour le 15 décembre: test en blanc.
Pour le 23 décembre: exercices 9.1 et 9.2
A. Caboussat, HEG
STAT I, 2010
27 / 27

Documents pareils