aperçu avec Acrobat Reader au format PDF

Transcription

aperçu avec Acrobat Reader au format PDF
STATISTIQUE
I) Vocabulaire
1) Différents types de séries statistiques
Tout commence par une question statistique. Cette question définit la population et les caractères à observer. On mène
ensuite une enquête statistique sur cette population. On obtient une série statistique brute c’est-à-dire le relevé, pour
chaque individu de la population, de la valeur du caractère observé.
Les caractères observés sont de deux types :
• Les caractères numériques ou quantitatifs peuvent être représentés par des nombres qui représentent des quantités ;
par exemple, la taille d’une personne est un caractère quantitatif.
On distingue deux catégories de caractères numériques :
- Les caractères discrets qui prennent des valeurs numériques isolées. Exemple: le nombre de frères et sœurs dans une
famille.
- Les caractères continus qui prennent leurs valeurs dans un intervalle. Exemple la taille ou le poids d'une personne.
‚ Les caractères non numériques ou qualitatifs : la couleur des yeux, l'artiste préféré en sont des exemples. Pour ces
caractères, on remplace le mot valeur par le mot modalité. Nous ne traiterons pas ces cas -là.
2) Un exemple : Les résultats au dernier devoir de Mathématiques d’une classe de 20 élèves.
• La population est la classe concernée ; le caractère étudié est le résultat de chaque individu au dernier devoir de
Mathématiques.
Voici la série statistique brute c’est-à-dire le relevé, pour chaque individu de la population (élève), de la valeur (note
sur 20) du caractère observé.
Valeurs ou notes
6 6 7 8 8 9 10 10 11 12 12 12 12 14 15 15 15 16 16 18
• On obtient une série dépouillée en regroupant les individus ayant une même valeur pour le caractère observé. Une
série dépouillée donne les effectifs partiels de chaque valeur. La somme des effectifs partiels est l’effectif total de la
série.
Valeur
6
7
8
9
10
11
12
14
15
16
18
Effectif
2
1
2
1
2
1
4
1
3
2
1
• En divisant les effectifs partiels par l’effectif total, on obtient la fréquence de chaque valeur. L’ensemble des
fréquences est appelé distribution des fréquences. On remarque que la somme de toutes les fréquences est égale à 1.
Valeur
Fréquence
6
0,1
7
0,05
Dans l'étude des caractères numériques,
quand le nombre d'individus est grand, on
regroupe souvent des individus ayant des
caractères proches. On parle alors de série
statistique classée.
8
9
0,1 0,05
10
0,1
11
12
0,05 0,2
14
15
16
0,05 0,15 0,1
18
0,05
[6 ; 8[
[8 ; 10[
[10 ; 12[
[12 ; 14[
[14 ; 16[
[16 ; 18]
3
3
3
4
4
3
Dans la suite de ce cours, nous noterons xi les valeurs du caractère, n i les effectifs et fi les fréquences.
II) Caractéristiques de position
1) Valeur moyenne d’une série statistique
Définition : Soit une série de valeurs xi et x la moyenne.
x1 + x2 + L ∑ xi
=
.
N
N
n × x + n × x + L ∑ ni xi
• Avec les effectifs n i , on a : x = 1 1 2 2
=
.
n 1 + n2 + L
∑ ni
• Sans les effectifs avec un effectif total N, on a : x =
• Avec les fréquences, on a : x = f1 ×x1 +f 2 ×x2 +L = ∑ fi xi .
Statistique 1/3
Exemple : Soit la série précédente des 20 notes.
6 + 6 + L + 18
• Sans les effectifs : x =
= 11,7 .
20
• Avec les effectifs : x =
6 × 2 + 7 × 1 + 8 × 2 + L + 18 × 1
= 11,7 .
20
• Avec les fréquences : x = 6 × 0,1 + 7 × 0,05 + 8 × 0,1+ L + 18 × 0,05 = 11,7
Remarques :
• La moyenne d'une série de nombres dont la somme est S est la valeur unique qu’auraient ces nombres si on les
rendait tous égaux en gardant S comme somme.
‚ Pour le calcul de la moyenne d’une série regroupée en classes, on choisit comme valeurs du caractère les centres des
classes et comme effectifs les effectifs des classes.
2) Propriétés de la moyenne
a) Linéarité de la moyenne
Propriété :
• Lorsqu’on ajoute un même nombre r (réel positif ou négatif) à chacune des valeurs du caractère sans
changer les effectifs, la moyenne augmente de r.
• Lorsqu’on multiplie par un même nombre q (réel positif ou négatif) chacune des valeurs du caractère
sans changer les effectifs, la moyenne est multipliée par q.
Exemple : • Le professeur décide d’ajouter un point à toutes les copies, alors la moyenne sera augmentée de 1 point.
‚ Le professeur a noté sur 10 et trouve une moyenne de 6 sur 10. Pour ramener les notes sur 20, il multiplie
toutes les notes par 2 et la moyenne sera aussi multipliée par 2, on trouve 12 sur 20 de moyenne.
b) Moyenne à partir de sous groupes
Exemple : On a fait un devoir commun de mathématiques dans 3 classes :
• Seconde D : 29 élèves, moyenne 10,5 / 20 ;
• Seconde E : 34 élèves, moyenne 9,5 / 20 ;
• Seconde F : 37 élèves, moyenne 13 / 20.
29 × 10,5 + 34 × 9,5+ 37× 13
La moyenne sur l’ensemble des 3 classes est égale à
c’est-à-dire 11,085.
29 + 34 + 37
Propriété : Supposons qu’une population soit séparée en deux parties d’effectifs n 1 et n 2 ; la moyenne de la première
sous-population est x1 et x2 est celle de la deuxième population.
La moyenne x sur la population entière est x =
n1 × x1 + n2 × x2
(ou avec les fréquences x = f1 × x1 + f 2 × x2 ).
n1 + n2
c) Moyenne élaguée
Exemple : Dans la seconde F, deux élèves fraudeurs ont eu 0 /20 , ces deux notes ne représentent pas l’ensemble de la
classe. On recalcule une nouvelle moyenne qui ne tient pas compte de ces deux notes aberrantes.
13× 37 − 0 × 2 481
Nouvelle moyenne =
=
= 13,7 .
37 − 2
35
3) Mode
Définition : Un mode d’une série statistique est une valeur du caractère dont l’effectif est le plus élevé.
Remarques :
• Pour une série regroupée en classes, une classe qui correspond à l’effectif maximum est une classe modale.
‚ Si cet effectif maximal est obtenu pour plusieurs valeurs (ou classes), on dit que la série a plusieurs modes (ou
classes modales).
Exemple : So it la série des 20 notes. L’effectif maximum est égal à 4 : le mode est la valeur « 12 » , c’est la valeur la
plus fréquente.
Statistique 2/3
4) Médiane
On observe un caractère numérique dans une population. On veut trouver une valeur du caractère qui partage la
population en 2 groupes de même effectif. On trie la série selon l’ordre croissant des valeurs.
Définition :
• Si l’effectif total est un nombre impair, la valeur centrale de la série triée ( la 3ème de 5 ; la 7ème de 13, …) est appelée
médiane de la série. On la note Me.
‚ Si l’effectif total est un nombre pair, la médiane est la moyenne des 2 valeurs centrales (la 6ème et la
7ème d’une série de 12 , la 10ème et la 11ème d’une série de 20 , …).
Exemple : Soit la série des 20 notes. La 10ème valeur vaut « 12 » et la 11ème vaut « 12 » , la médiane Me est égale à
12 + 12
soit 12.
2
III) Caractéristique de dispersion
Un autre concept important en statistique est la dispersion : on étudie si le caractère varie beaucoup d’un individu à
l’autre.
Il existe de nombreux indices pour mesurer la dispersion, mais en classe de Seconde, nous nous limiterons à l’étendue.
Définition : L’étendue d’une série statistique est la différence entre la plus grande valeur prise par le caractère et la plus
petite.
Exemple :
Note au premier
contrôle
Effectif
Note au deuxiè me
contrôle
Effectif
6
7
8
9
10
11
12
13
14
3
3
5
4
2
5
4
1
1
7
8
9
10
11
12
13
2
5
8
7
4
2
1
Pour le premier contrôle, l’étendue vaut 14 . 6, soit 8. Pour le second, elle vaut 13 . 7, c’est-à-dire 6. La première série
est plus dispersée que la deuxième.
Remarques : • De même que l’on calcule des moyennes élaguées, on peut corriger l’étendue en supprimant de la série
certaines valeurs aberrantes.
‚ La série du premier contrôle est bimodale pour des valeurs relativement éloignées. Cela confirme
qu’elle est plus dis persée que la série du deuxième contrôle.
Statistique 3/3