statistiques - Maths learning

Transcription

statistiques - Maths learning
C L A S S E
D E
1
S T G
S T A T I S T I Q U E S .
S TAT I S T I Q U E S
1. Les indicateurs de tendance centrale.
1.1
La moyenne.
1.1.1
Détermination de la moyenne.
Plusieurs cas peuvent se présenter :
1° La moyenne de n nombres x1 , x2 , ............., xn se calcule par la relation
x=
x1 + x2 + ....... + xn
n
2° Si la valeur n°i est prise n fois, on dira que ni est l’effectif de xi et on calculera alors :
p
∑n x
1 i
x=
i =1
p
∑n
i
i =1
3° S’il y a trop de valeurs, on les regroupe en classes, c'est-à-dire en intervalles [ ai ; bi [ , et pour les
calculs on prendra comme valeurs de la variable les centres des classes.
Pour chaque classe le centre se calcule selon la relation : ci =
ai + bi
2
On calculera alors :
p
∑n c
1 i
x=
i =1
p
∑n
i
i =1
En résumé, les méthodes de calcul sont :
x
Si peu de valeurs
x + x2 + ....... + xn
x= 1
n
Si nombreuses valeurs et
n1 x1 + n2 x2 + .... + n p x p
plusieurs fois la même valeur x =
N
N étant l’effectif total
Si les valeurs sont
n c + n2 c2 + ..... + n p c p
x= 1 1
regroupées par classes
N
Notation avec
x=
1
∑ xi
n i =1
x=
1
N
∑n x
1
N
∑n c
x=
∑
p
p
i i
i =1
p
i i
i =1
Inconvénient de la 3ème méthode : il faut que les effectifs soient également répartis à l’intérieur des classes, ce qui
est rarement le cas.
A rédiger.
EXERCICE 1
1 – Calculer la moyenne d’un élève qui a obtenu les 5 notes suivantes : 9 , 11, 7, 12, 10
JMD - Classe de 1 STG
www.maths-learning.fr
1
C L A S S E D E
1 E R E
S T G
C O U R S
D E
S T A T I S T I Q U E S
2 – Les 31 élèves d’une classe de première ont obtenu les notes suivantes :
Notes : xi
7
8
9
10
11
12
13
14
Effectifs : ni
1
5
4
12
5
3
0
1
Total
ni × xi
Compléter ce tableau et calculer la moyenne.
3 – On effectue une enquête auprès de 120 magasins afin de déterminer la prix de vente moyen d’un pantalon.
On relève ces résultats dans le tableau suivant :
Prix de vente en euros
xi
Nombres de magasins
ni
[ 20 , 25[
24
[ 25 , 30[
32
[30 , 35[
48
[35 , 40[
12
[ 40 , 45[
4
Centre des classes
ci
Produit ni × ci
Total
Compléter ce tableau et calculer le prix de vente moyen.
Donner en pourcentage de l’effectif global, le nombre de magasins ayant un prix supérieur ou égal au prix
moyen (arrondir à l’unité).
1.1.2
Les propriétés de la moyenne.
a)
Linéarité.
•
Si on multiplie toutes les valeurs de la série par un même nombre a, alors la moyenne est
multipliée par a.
Ainsi : si la série x1 , x2 ,............ xn a pour moyenne x , alors la série ax1 , ax2 ,............axn a pour moyenne ax
•
Si on ajoute le même nombre b à chacune des valeurs de la série, alors la moyenne est
augmentée de b.
www.maths-learning.fr
2
C L A S S E
D E
1
S T G
S T A T I S T I Q U E S .
Ainsi : si la série x1 , x2 ............xn a pour moyenne x , alors la série x1 + b, x2 + b,............xn + b a pour moyenne
x+b
Exemples :
1.
Dans une classe la moyenne du contrôle de SVT a été de 8 sur 20.
Le professeur a décidé d’augmenter toutes les notes de 10%
Calculer la nouvelle moyenne.
2.
Dans cette classe la moyenne du contrôle d’hist-géo a été de 7,8.
Le professeur décide d’ajouter un point à chaque élève.
Calculer la nouvelle moyenne.
b) La moyenne des sous-groupes.
Soit une série statistique séparée en deux sous-groupes distincts d’effectifs respectifs n et p
Le premier sous-groupe a pour moyenne z , et le second sous-groupe a pour moyenne y
Dans ce cas la moyenne de la série statistique est :
x=
nz + p y
n+ p
EXERCICE 8
A chercher
Dans une classe de seconde, la moyenne générale des 12 élèves ayant choisi l’option MPI est 12,74 et la moyenne
générale des 18 élèves ayant choisi l’option SES est 11,86
Calculer la moyenne générale de la classe.
c)
Moyenne élaguée.
Lorsque les valeurs extrêmes, maximum ou minimum semblent douteuses, ou ne rentrent pas dans le cadre de
l’étude, on peut faire un calcul de moyenne élaguée en retirant ces valeurs de la série.
EXERCICE 9
A chercher
Observer la série suivante de la répartition des salaires dans une entreprise.
Salaires (en €)
Effectifs
JMD - Classe de 1 STG
www.maths-learning.fr
1000
1200
1500
2000
19 000
7
8
3
2
1
3
C L A S S E D E
1 E R E
S T G
C O U R S
D E
S T A T I S T I Q U E S
La situation est-elle adaptée au calcul d’une moyenne élaguée ? Pourquoi ?
Calculer cette moyenne.
Autre exemple :
La série 7, 9, 10, 11, 15, 17, 51 a pour moyenne :
Refaisons ce calcul en éliminant la valeur 51.
1.2
Le mode.
C’est la valeur du caractère correspondant au plus grand effectif.
On parlera de classe modale, pour la classe correspondant au plus grand effectif.
Remarque :
On peut trouver dans une population statistique plusieurs modes, ou plusieurs classes modales.
1.3
La médiane.
1.3.1
Définition :
C’est la valeur du caractère qui partage la série ordonnée en deux parties de même effectif.
1.3.2
Détermination :
1.3.2.1
MÉDIANE D’UNE SÉRIE DISCRÈTE
1.3.2.1.1 Méthode de la
liste.
On range les valeurs du caractère par ordre croissant.
4° Si l’effectif total est impair, N = 2n + 1 alors la médiane (Me) est la valeur de rang n + 1
www.maths-learning.fr
4
C L A S S E
D E
1
S T G
S T A T I S T I Q U E S .
5° Si l’effectif total est pair, N = 2n alors la médiane est la demi somme des valeurs du
caractère de rang n et n + 1
EXERCICE 6
A chercher.
Donner, en justifiant, la médiane des séries suivantes :
6° Série 1
7 ; 9 ; 10 ; 11 ; 15 ; 17 ; 51
7° Série 2
8 ; 10 ; 12 ; 15
1.3.2.1.2 Méthode en
utilisant les effectifs
cumulés croissants
On utilisera cette méthode lorsque les valeurs à recopier sont trop nombreuses.
Calculons la note médiane de la série ci-dessous.
On commence par calculer les effectifs cumulés croissants (ou les fréquences cumulées croissantes), que l’on
regroupe dans un tableau.
On obtient : (complète ce tableau)
Note ( xi )
2
5
8
9
10
11
12
14
16
19
Total
Nombres d’élèves ( ni )
1
3
4
6
6
4
3
2
3
2
34
1
4
Effectifs cumulés
croissants
Rappel :
1 signifie que 1 élève a une note inférieure ou égale à 2
4 signifie que élèves ont une note inférieure ou égale à 5
etc……
JMD - Classe de 1 STG
www.maths-learning.fr
5
C L A S S E D E
1 E R E
S T G
C O U R S
D E
S T A T I S T I Q U E S
Il y a 34 élèves au total, donc la note médiane est située …………………………………………………………
Conclusion : en observant le tableau ci-dessus, on en conclut que la note médiane est :
1.3.2.2
MÉDIANE D’UNE SÉRIE À CARACTÈRE CONTINU.
On se propose de déterminer la taille médiane de la série ci-dessous.
Comme précédemment, on va utiliser le polygone des fréquences cumulées croissantes :
•
Soit par simple lecture : c’est l’abscisse de l’intersection des polygones des fréquences
cumulées croissantes et décroissantes.
•
Soit en faisant un calcul en supposant que la répartition est homogène dans les intervalles.
1.3.2.2.1 Méthode par
lecture graphique
On construit d’abord le tableau des fréquences cumulées croissantes :
Taille (en cm)
[115 ; 135[ [135 ; 145[ [145 ; 155[ [155 ; 165[ [165 ; 185[ [185 ; 195[
Nombre d’élèves ( ni )
3
11
Fréquences ( fi ) en %
9
33
Fréquences cumulées
croissantes en % 1
9
42
8
7
Fréquences cumulées
décroissantes en %2
3
1
Total
33
3
1° Compléter le tableau ci-dessus.
2° Dans quel intervalle à ton avis se trouve la valeur médiane ?
3° On suppose que la répartition est homogène à l’intérieur de cet intervalle. En déduire la valeur
médiane par un calcul de proportionnalité.
1
Ici, 9 signifie que 9 % des élèves ont une taille strictement inférieure à 135 cm
33 signifie que 33 % des élèves ont une taille strictement inférieure à 145 cm
2
3 signifie que 3% des élèves ont une taille supérieure ou égale à 185
www.maths-learning.fr
6
C L A S S E
D E
1
S T G
S T A T I S T I Q U E S .
4° Construire les polygones des fréquences cumulées croissantes et décroissantes. L’abscisse de leur
point d’intersection est la médiane.
Déterminer cette médiane par lecture graphique.
y
110
100
90
80
70
60
50
40
30
20
10
0
115
-10
120
125
130
135
140
145
150
155
160
165
170
175
180
185
190
Tailles
Par lecture graphique, on en déduit que la médiane est égale à environ :
2. Les indicateurs de dispersion.
2.1
La variance.
2.1.1
Définition :
La variance V est la moyenne des carrés des écarts à la moyenne.
Ainsi :
(x − x )
V=
+ ....... + ( xn − x )
2
2
1
n
De la même manière qu’avec le calcul de la moyenne, on pourra distinguer les trois cas suivants :
V
Si peu de valeurs
Notation avec
(x − x )
2
1
+ ....... + ( xn − x )
2
V=
2
1
xi − x )
(
∑
n i =1
V=
1
N
n
Si nombreuses valeurs et
plusieurs fois la même valeur
n1 ( x1 − x ) + ....... + n p ( x p − x )
2
2
N
N étant l’effectif total
Si les valeurs sont
regroupées par classes
n1 (c1 − x ) + n2 (c2 − x ) + ..... + n p (c p − x )
2
2
N
JMD - Classe de 1 STG
www.maths-learning.fr
∑
p
2
V=
1
N
p
∑ n ( x − x)
2
i
i
i =1
p
∑ n (c − x )
2
i
i
i =1
7
C L A S S E D E
1 E R E
S T G
C O U R S
2.1.2
D E
S T A T I S T I Q U E S
Formule à utiliser dans les calculs.
On calculera V selon la formule suivante, qui est plus commode à utiliser :
p
V=
∑n x
2
i i
i =1
N
−x
2
Dans le cas d’une série continue, on remplacera xi par le centre des classes ci . Ainsi :
p
∑n c
2
i i
V=
i =1
N
−x
2
Il est bien sûr attendu que vous soyez capables d’obtenir ces résultats à l’aide de la calculatrice.
2.1.3
L’écart-type
Il représente la moyenne des écarts à la moyenne.
On le note σ , et on calcule : σ = V
A chercher
EXERCICE 5
Au tennis, l’entraîneur d’un joueur de haut niveau a relevé la vitesse de son premier
service au cours d’un match.
Vitesse
en
km/h
[132 ; 140[
[140 ; 148[
[148 ; 156[
[156 ; 164[
[164 ; 172[
[172 ; 180[
[180 ; 188[
[188 ; 196[
Nombre
de
services.
4
7
13
24
53
30
9
5
1° Calculer la vitesse moyenne du premier service.
Vitesse
en km/h
xi
[132 ; 140[ [140 ; 148[ [148 ; 156[
Nombre
de
services.
ni
4
7
13
[156 ; 164[
[164 ; 172[
[172 ; 180[
[180 ; 188[
24
53
30
9
[188 ; 196[
5
ci
ni × ci
ni × ci 2
On calcule :
p
∑n c
i i
x=
i =1
N
=
www.maths-learning.fr
8
Total
C L A S S E
D E
1
S T G
S T A T I S T I Q U E S .
2° Déterminer l’écart-type de la série, d’abord à l’aide du tableau complété, puis à l’aide de la
calculatrice.
On calcule :
p
V=
∑n c
2
i i
i =1
N
2
−x =
Puis : l’écart-type , σ =
3° On refait les calculs à l’aide de la calculatrice en entrant les centres des classes en tant que valeurs
xi du caractère, et les effectifs correspondants.
Les valeurs lues sont :
x=
σ=
2.2
Les quartiles.
2.2.1
Situation.
On partage une série statistique dont les termes sont rangés par ordre croissant, en 4 parties de même
effectifs.
Q1
Q2
Q3
14444
4244444
3 14444
4244444
3 14444
4244444
3 14444
4244444
3
25%
25%
25%
25%
Les nombres Q1 , Q2 , Q3 sont les quartiles.
2.2.2
Définitions.
ƒ
Q1 est le plus petit terme de la série tel qu’au moins 25 % des données soient
inférieures ou égales à Q1
ƒ
Q2 est le plus petit terme de la série tel qu’au moins 50 % des données soient
inférieures ou égales à Q2
Remarque :
On peut assimiler Q2 à Me, bien que ces deux nombres puissent être parfois très légèrement différents (voir cidessous)
ƒ
Q3 est le plus petit terme de la série tel qu’au moins 75 % des données soient
inférieures ou égales à Q3
JMD - Classe de 1 STG
www.maths-learning.fr
ƒ
L’intervalle interquartile est [Q1 , Q3 ]
ƒ
L’écart interquartile est Q3 − Q1
9
C L A S S E D E
1 E R E
S T G
C O U R S
D E
S T A T I S T I Q U E S
A chercher.
EXERCICE 6
On considère une série de 16 notes, classées par ordre croissant :
4 − 6 − 8 − 8 − 914
−10
10 −3
11−11
−12244
−13 −3
15 −15
−16244
−18 −3
19
4−
244
144
144
14243
En utilisant les définitions ci-dessus, donner :
ƒ
Q1 =
ƒ
Q2 =
ƒ
Q3 =
ƒ
L’intervalle interquartile est :
ƒ
L’écart interquartile est :
Remarque :
Il y a un nombre pair de valeurs, donc selon la définition, Me est la moyenne des valeurs situées au 8ème et 9ème
rang.
...... + ......
2
Ainsi : Me =
On note qu’ici, Me = Q2
A chercher.
EXERCICE 7
On considère la série de 14 notes suivantes classées par ordre croissant :
414243
− 6 − 8 − 8 − 914
−10
10 −3
11−11
−12244
−13 −3
16 −18 −19
4−
244
144
Ici, 14 n’étant pas un multiple de 4, il n’est pas possible de répartir ces notes en 4 parties de même effectif.
D’après la définition :
ƒ
Q1 =
ƒ
Q2 =
ƒ
Q3 =
ƒ
L’intervalle interquartile est :
L’écart interquartile est :
Remarque :
Selon la définition de la médiane, puisqu’il y a un nombre pair de valeurs (14), la Médiane (Me) est la moyenne
des valeurs situées au 7ème et 8ème rang.
Ainsi : Me =
10 + 11
= 10,5
2
www.maths-learning.fr
10
C L A S S E
D E
1
S T G
S T A T I S T I Q U E S .
On remarque qu’ici, Me ≠ Q2
La règle générale, est de considérer que Me = Q2 .
Cela ne change rien pour des séries constituées d’un grand nombre de valeurs, car il n’y a pas de saut important
entre deux valeurs consécutives.
2.3
Les déciles.
On considère une série statistique dont les termes sont classés par ordre croissant.
ƒ
Le premier décile D1 est le plus petit terme tel qu’au moins 10% des données soient inférieures ou
égales à D1
ƒ
Le deuxième décile D2 , le troisième décile D3 ,……..est le plus petit terme tel qu’au moins 20%,
30%,……des données soient inférieures ou égales à D2 , D3 ……..
ƒ
L’intervalle inter décile est [ D1 , D9 ]
ƒ
L’écart inter décile est D9 − D1
On résume tous ces résultats dans un diagramme en boîte (ou à moustaches)
Voici le diagramme en boîte correspondant à l’exercice 7.
Les valeurs Min et Max sont représentées par les petits ronds à gauche et à droite du graphique.
D1
Q1
Med
Q3
D9
A chercher.
EXERCICE 8
Les résultats d’une enquête sur le prix de la baguette de pain dans les 30 boulangeries
d’une ville sont regroupés dans le tableau suivant :
Prix en centimes d’euros
68
70
72
74
75
76
78
80
85
90
92
Nombre de boulangeries
1
1
2
4
7
3
3
4
2
2
1
Effectifs cumulés croissants
1° Compléter la ligne des effectifs cumulés croissants.
2° En déduire la médiane, les 1er et 3ème quartiles, et les 1er et 9ème déciles de la série.
ƒ
30
= 15
2
La médiane est donc la moyenne des valeurs observées au 15ème et au 16ème rang.
Médiane : on calcule
Me =
JMD - Classe de 1 STG
www.maths-learning.fr
11
C L A S S E D E
1 E R E
S T G
C O U R S
ƒ
Quartiles : on calcule
D E
S T A T I S T I Q U E S
30
= 7,5
4
Le 1er quartile est la valeur observée au rang 8.
Ainsi Q1 =
Pour le 3ème quartile, on calcule : 3×
30
= 22,5
4
Le 3ème quartile est donc la valeur observée au rang 23.
Ainsi : Q3 =
ƒ
Déciles : on calcule
30
=3
10
Le 1er décile est la valeur observée au rang 3.
Ainsi D1 =
Pour le 9ème décile, on calcule : 9 ×
30
= 27
10
Le 9ème décile est donc la valeur observée au rang 27
Ainsi : D9 =
3° Résumer la série par un diagramme en boîte. Préciser l’écart interquartile.
En résumé, les indicateurs à marquer sur le diagramme en boîte sont :
ƒ
Valeur minimum =
ƒ
1er décile =
ƒ
1er quartile =
ƒ
Médiane =
ƒ
3ème quartile =
ƒ
9éme décile =
ƒ
Valeur maximum =
www.maths-learning.fr
12
C L A S S E
D E
1
S T G
S T A T I S T I Q U E S .
EXERCICE 9
Détermination des quartiles d’une série à caractère continu.
Voici le récapitulatif des distances parcourues chaque jour pendant un mois par un livreur.
Distance en Km
Nombre de jours
[0 ; 10[
1
[10 ; 20[
1
[ 20 ; 30[
3
[30 ; 40[
2
[ 40 ; 50[
4
[50 ; 60[
5
[60 ; 70[
8
[70 ; 80[
3
[80 ; 90[
1
[90 ; 100[
2
1.
Effectifs cumulés croissants
a) Compléter la ligne des effectifs cumulés croissants.
b) Compléter le polygone des effectifs cumulés croissants (placer les lignes de rappel)
y
30
25
20
15
10
5
0
10
JMD - Classe de 1 STG
www.maths-learning.fr
20
30
40
50
60
70
80
90
100
110x
13
C L A S S E D E
1 E R E
S T G
C O U R S
2.
D E
S T A T I S T I Q U E S
a) Déterminer graphiquement la médiane, les premiers et troisièmes quartiles et les premiers et
neuvièmes déciles.
On indiquera leur position sur l’axe des abscisses et les pourcentages correspondant sur l’axe des
ordonnées.
b) Résumer ces résultats à l’aide d’un diagramme en boîte en utilisant l’axe des abscisses du graphique
précédent.
y
0
3.
10
20
30
40
50
60
70
80
90
100
110x
Vérifier tous vos résultats à l’aide de la calculatrice, et retrouvez l’aspect du diagramme en boîte.
3. Tableaux croisés d’effectifs.
3.1
Rappels.
On considère le tableau relatif au montant des achats en euros de 2000 personnes dans un magasin un certain
jour.
Classe montant des achats
[0 ; 200[
[ 200 ; 400[
[ 400 ; 600[
[600 ; 800[
ni
fi
Se souvenir que :
ni
N
ƒ
fi =
ƒ
f A∪ B = f A + f B − f A∩ B
ƒ
Si A et B disjoints, alors : f A∩ B = 0 , donc : f A∪ B = f A + f B
www.maths-learning.fr
14
C L A S S E
D E
1
S T G
S T A T I S T I Q U E S .
3.2
Fréquence conditionnelle.
On complète les données du tableau précédent par des infos concernent l’heure des achats.
Montants des
achats
en €
[0 ; 200[
[ 200 ; 400[
[ 400 ; 600[
[600 ; 800[
Total
[9 ; 12[
230
400
140
30
800
[14 ; 16[
100
290
70
20
480
[16 ; 19[
190
410
90
30
720
Total
520
1100
300
80
2000
Heure des
achats
ƒ
On note A l’ensemble des achats dans la tranche [ 200 ; 400[ , donc : f A =
ƒ
On note B l’ensemble des achats effectués entre 9h et 12h, donc : f B =
1100
= 0,55
2000
800
= 0, 4
2000
A ∩ B est l’ensemble des achats dans la tranche [ 200 ; 400[ , effectués entre 9h et 12h : il y en a 400
Donc : f A∩ B =
400
= 0, 2 .
2000
C’est la fréquence conjointe de A et B.
On s’intéresse maintenant à la fréquence des achats dont le montant est dans la tranche [ 200 ; 400[ sachant
qu’ils ont été effectués entre 9h et 12h.
Selon le tableau :
ƒ
400 achats ont été effectués dans la tranche [ 200 ; 400[
ƒ
800 achats ont été effectués entre 9h et 12h.
On écrira que :
f B ( A) =
400
= 0,5
800
Il s’agit d’une fréquence conditionnelle.
C’est la fréquence de A (achats dans la tranche [ 200 ; 400[ ) sachant B (achats effectués entre 9h et 12h).
On remarque que :
f B ( A) =
ƒ
f B ( A) est une fréquence conditionnelle.
ƒ
f ( A∩ B ) est une fréquence conjointe
ƒ
f ( B ) est la fréquence marginale de B.
f A∩ B
fB
EXERCICE 10
JMD - Classe de 1 STG
www.maths-learning.fr
15
C L A S S E D E
1 E R E
S T G
C O U R S
D E
S T A T I S T I Q U E S
En reprenant les données du tableau précédent, calculer :
1.
La fréquence des achats effectués entre 16h et 19h sachant que leur montant est compris entre 600€
inclus et 800€ exclus.
On note A l’ensemble des achats dont le montant est dans la tranche [ 600 ; 800[ , et B l’ensemble des achats
effectués entre 16h et 19h.
ƒ
f A∩ B =
ƒ
f ( A) =
ƒ
2.
On calcule : f A ( B ) =
f( A∩ B)
f ( A)
=
La fréquence des achats dont le montant est compris entre 600€ inclus et 800€ exclus, sachant qu’ils ont
été effectués entre 16h et 19h.
ƒ
f A∩ B =
ƒ
f ( B) =
ƒ
On calcule : f B ( A) =
f( A∩ B)
f ( B)
=
www.maths-learning.fr
16