Statistiques – Cours du TD1 : « Résumé d`une série de mesures à

Transcription

Statistiques – Cours du TD1 : « Résumé d`une série de mesures à
Unité d’enseignement : L6S2TC
Statistiques
Statistiques – Cours du TD1 :
« Résumé d’une série de mesures à un
caractère »
I.
Généralités :
Le but de la statistique est de dégager les significations de données, numériques ou non, obtenues au cours
de l’étude d’un phénomène.
Il faut distinguer les données statistiques qui sont les résultats d’observations recueillies lors de l’étude d’un
phénomène, et la méthode statistique qui a pour objet l’étude rationnelle des données. La méthode
statistique comporte plusieurs étapes.
La statistique descriptive ou déductive
C’est l’ensemble des méthodes à partir desquelles on recueille, ordonne, réduit, et condense les données.
A cette fin, la statistique descriptive utilise des paramètres, des graphiques et des méthodes dites d’analyse
des données (l’ordinateur a facilité le développement de ces méthodes).
La statistique mathématique ou inductive
C’est l’ensemble des méthodes qui permettent de faire des prévisions, des interpolations sur une population
à partir des résultats recueillis sur un échantillon.
Nous utilisons des raisonnements inductifs c’est-à-dire des raisonnements de passage du particulier au
général.
Cette statistique utilise des repères de référence qui sont les modèles théoriques (lois de probabilités).
Cette statistique nécessite la recherche d'
échantillons qui représentent le mieux possible la diversité
de la population entière ; il est nécessaire qu'
ils soient constitués au hasard ; on dit qu'
ils résultent
d'
un tirage non exhaustif.
Statistique et activités physiques et sportives
Pour mettre au point les barèmes, on fait des statistiques avec l’évolution d’environ 5000 sujets et on fait des
barèmes sur chaque tranche d’âge. Cela permet l’élaboration de norme de cotation des tests.
II.
Vocabulaire statistique :
I. 2. 1. Population
C'
est l'
ensemble des unités ou individus sur lequel on effectue une analyse statistique.
X = {X1, ... , XN} avec card(X) = N fini
Ce vocabulaire est hérité du 1er champ d'
application de la statistique : la démographie (Vauban
(1633-1707) effectua des recensements pour des études économiques et militaires).
Exemples de populations.
Les véhicules automobiles immatriculés en France
La population des P.M.E. d'
un pays
Les salariés d'
une entreprise
Les habitants d'
un quartier
I. 2. 2. Echantillon
C'
est un ensemble d'
individus prélevés dans une population déterminée
Exemple d'échantillon.
L'
échantillon des véhicules automobiles immatriculés dans un département.
I. 2. 3. Caractère
C'
est un trait déterminé C présent chez tous les individus d'
une population sur laquelle on effectue
une étude statistique.
- Un caractère est dit quantitatif s'
il est mesurable.
Exemples de caractères quantitatifs.
1
Unité d’enseignement : L6S2TC
Statistiques
La puissance fiscale d'
un véhicule automobile.
Le chiffre d'
affaire d'
une P.M.E.
L'
âge, le salaire des salariés d'
une entreprise.
- Un caractère est dit qualitatif s'
il est repérable sans être mesurable.
Exemples de caractères qualitatifs.
La couleur de la carrosserie d'
un véhicule automobile
Le lieu de travail des habitants d'
un quartier
Le sexe et la situation matrimoniale des salariés d'
une entreprise
I. 2. 4. Modalités
Ce sont les différentes situations Mi possibles du caractère.
Les modalités d'
un caractère doivent être incompatibles et exhaustives ; tout individu doit présenter une
et une seule modalité.
Les modalités d'
un caractère qualitatif sont les différentes rubriques d'
une nomenclature ; celles d'
un
caractère quantitatif sont les mesures de ce caractère.
L'
ensemble des modalités est noté E.
Pour un caractère quantitatif, la mesure du caractère peut être un nombre entier pris parmi un ensemble
limité ; nous dirons qu'
il est discret.
Exemple de caractère quantitatif discret.
Le nombre d'
enfants d'
une famille (fratrie)
Dans certains cas la mesure du caractère peut être un nombre décimal pris parmi un ensemble de valeurs
possibles très important (plusieurs dizaines ou plusieurs centaines).
Pour permettre une étude et notamment une représentation graphique plus simple, nous sommes conduits à
effectuer un regroupement en classes (5 à 20 classes) ; nous dirons alors que le caractère est continu.
Dans ces deux situations, nous dirons que le caractère quantitatif est défini par ses modalités (valeurs
discrètes ou classes).
Les modalités d'
un caractère quantitatif peuvent être prises dans
ou
Exemples d'ensembles de modalités.
Nombre d'
enfants dans une fratrie : {Mi} = {xi}= {0, 1, 2, 3, ...}, Mi ?
n
.
3
L'
âge, la taille et le poids d'
un groupe d'
individus représentent globalement une modalité définie dans
(à
condition que chacune de ces variables soit discrète)
L'
ensemble des modalités d'
un caractère peut être établi à priori avant l'
enquête (une liste, une
nomenclature, un code) ou après enquête.
On constitue l'
ensemble des valeurs prises par le caractère.
Les caractères étudiés sur une population peuvent être mixtes.
Exemple de caractère mixte.
L'
ensemble des salariés d'
une entreprise peut être représenté par un caractère mixte que nous pourrons
exploiter globalement ou plus efficacement en extrayant une partie des données.
Le sexe, de modalités : H ou F (codé par 1 ou 2)
L'
âge, de modalités : 18, 19, 20, ... ou [16, 20], [21, 25], ...
Le salaire mensuel, de modalités : 6000, 6500, 7000, ... ou [6000, 6500[, [6500, 7500[,...
La situation matrimoniale, de modalités : marié, célibataire, veuf, divorcé, vivant maritalement.
II.
Définitions de la moyenne, de la variance et de l’écart-type :
On considère une série statistique donnée par le tableau suivant :
Valeur : xi
Effectif : ni
x1
n1
x2
n2
x3
n3
…
…
…
…
…
…
xp
np
n1 x x1 + n2 x x2 + n3 x x3 + … + np x xp
n1 + n2 + n3 + … + np
La moyenne permet d'
avoir une idée du "centre" de la série, c'
est une mesure de tendance centrale
 2
 2
 2
 2
n1 x (x1 - x ) + n2 x (x2 - x ) + n3 x (x3 - x ) + … + np x (xp - x )
La variance de cette série est : V
n1 + n2 + n3 + … + np

La moyenne de cette série est : x
L'
écart-type de cette série est : σ
V
L'
écart-type permet d'
avoir une idée de la façon dont les valeurs de la série s'
écartent par rapport à la
moyenne. C'
est une mesure de dispersion.
Un écart-type faible correspond à une série concentrée autour de la moyenne.
Les calculs de moyenne, de variance et d'
écart-type sont, pour des séries prenant un grand nombre de
valeurs, des calculs compliqués. Les calculatrices utilisées en mode statistique et les ordinateurs rendent
alors de grands services pour ces calculs.
2
Unité d’enseignement : L6S2TC
Statistiques
Exercice 4
A un test de mathématique, noté sur 10 points, les élèves de 2 classes ont obtenu les notes suivantes :
Classe A : 4 5 3 4 5 4 3 4 6 7 7 6 3 6 4 5 8 7 6 5 4 9 3 5 6 4 1 5 4 7 5
Classe B : 2 4 3 2 5 6 5 1 3 8 3 6 8 7 2 3 7 10 5 7 7 2 10 0 1 0 4 7 8 9 10
1°) Compléter les tableaux suivants :
Pour la classe A :
Note : xi
0
1
Effectif : ni
Pour la classe B :
Note : xi
Effectif : ni
0
1
2
3
4
5
6
7
8
9
10
2
3
4
5
6
7
8
9
10
9
10
9
10
2°) Représenter pour chaque classe la série de notes par un diagramme en bâtons.
3°) Calculer la moyenne de chacune des classes.
4°) Compléter pour chacune des classes le tableau suivant :
Pour la classe A :
Note : xi
0
1
2
3
4
5
6
7
8
Effectif : ni

(xi - x )²

ni x (xi - x )²
Pour la classe B :
Note : xi
Effectif : ni

(xi - x )²

ni x (xi - x )²
0
1
2
3
4
5
6
7
Calculer la variance et l'
écart-type de chacune des séries.
5°) A partir des résultats précédents, faire une comparaison des deux classes.
ème
6°) Pour chacune des classes, donner la note du 16
élève
3
8
Unité d’enseignement : L6S2TC
Statistiques
Remarque
Le recueil d'
un grand nombre de données dans certains domaines (données industrielles, données
biologiques … ) conduit souvent à des diagrammes (diagrammes à barres, histogrammes) ayant
sensiblement la même forme dite "en cloche".
Exemples : sur chacun des diagrammes a été superposé la courbe dite "courbe en cloche"
Fréquence des battements cardiaques
Circonférence du biceps
Dans un tel cas, les données recueillies sont qualifiées de «données gaussiennes».
Si l'
on calcule pour de telles données la moyenne µ et l'
écart-type σ, on peut noter que :
La série est à peu près symétrique autour de la moyenne µ.
Environ 95% des données se trouvent dans l'
intervalle µ 2σ ; µ + 2σ .
Cet intervalle est appelé plage de normalité.
Environ 99% des données se trouvent dans l'
intervalle µ 3σ ; µ + 3σ .
Exemple
Les études statistiques portant sur un grand nombre d'
enfants ont conduit à des données gaussiennes.
Ces études ont permis d'
établir des courbes de croissance (taille, poids, périmètre cranien …) que l'
on trouve
sur le "Carnet de santé" remis aux parents à la naissance d'
un enfant.
Ces courbes sont construites à partir de la plage de normalité µ 2σ ; µ + 2σ .
Elles permettent aux parents et aux médecins de surveiller la croissance d'
un enfant.
Extraits d'un Carnet de santé
III.
Définition de la médiane
On considère une série, dont les valeurs sont ordonnées (rangées dans l'
ordre croissant).
4
Unité d’enseignement : L6S2TC
Statistiques
Si la série comporte un nombre pair 2 de termes, la médiane de cette série est la demi-somme de la valeur
du terme de rang
et de la valeur du terme de rang n+1
Si la série comporte un nombre impair 2n + 1 de termes, la médiane de cette série est la valeur du terme de
rang
(c'
est-à-dire le terme partageant la série en deux groupes de même effectif).
Exemple
La série : 101 101 105 105 107 108 108 110
a un nombre pair (8) de termes.
terme, c'
est-à-dire 105 + 107
2
La série : 87 88 89 89 90 92 92 93 97 99 99 a un nombre impair (11) de termes.
ème
La médiane de cette série est la valeur du 6
terme, c'
est-à-dire 92.
ème
La médiane de cette série est la demi-somme du 4
IV.
ème
et du 5
106.
Définition de quartiles
On appelle premier quartile d'
une série la plus petite valeur q des termes de la série pour laquelle au moins
un quart (25%) des données sont inférieures ou égales à q.
On appelle troisième quartile d'
une série la plus petite valeur q'des termes de la série pour laquelle au
moins trois quarts (75%) des données sont inférieures ou égales à q'
.
On appelle intervalle interquartile l'
intervalle [q ; q'
].
On appelle écart interquartile l'
amplitude de l'
intervalle [q ; q'
], c'
est-à-dire le nombre q'- q.
Exemple
La recherche des quartiles sera plus facile si les termes de la suite sont ordonnés.
La série 11 , 12 , 12 , 13 , 15 , 16 , 16 , 17 , 17 , 18 , 19 , 20 , 22 , 23 a 14 termes.
Un quart (25%) des données correspond à : 14 x 0,25
3,5.
Le premier quartile est alors, par définition, la plus petite valeur
pour laquelle les valeurs de 4 termes de la
série sont inférieures ou égales à q.
ème
terme de la série c'
est-à-dire 13.
Le premier quartile est donc la valeur du 4
Trois quarts (75%) des données correspondent à : 14 x 0,75
10,5.
Le troisième quartile est alors, par définition, la plus petite valeur q'pour laquelle les valeurs de 11 termes de
la série sont inférieurs ou égales à q'
.
ème
Le troisième quartile est donc la valeur du 11
terme de la série c'
est-à-dire 19.
L'
intervalle interquartile est [13 ; 19]. L'
écart interquartile est 19
V.
13
6.
Définition de déciles
On appelle premier décile d'
une série la plus petite valeur
des termes de la série pour laquelle au moins
un dixième (10%) des données sont inférieures ou égales à d.
On appelle neuvième décile d'
une série la plus petite valeur d'des termes de la série pour laquelle au moins
neuf dixièmes (90%) des données sont inférieures ou égales à d'
.
On appelle intervalle interdécile l'
intervalle [d ; d’]
On appelle écart interdécile l'
amplitude de l'
intervalle [d ; d’], c'
est-à-dire le nombre d’ – d.
Exemple
La recherche des quartiles sera plus facile si les termes de la suite sont ordonnés.
La série 4, 5, 5, 5, 6, 6, 7, 8, 8, 9, 9, 9, 9, 10, 10, 11, 11, 11, 12, 13, 13, 13, 14, 14, 15, 15, 17 a 27 termes.
Un dixième (10%) des données correspond à : 27 x 0,10
2,7.
Le premier décile est alors, par définition, la plus petite valeur
pour laquelle les valeurs de 3 termes de la
série sont inférieures ou égales à d.
ème
Le premier décile est donc la valeur du 3
terme de la série c'
est-à-dire 5.
Neuf dixièmes (90%) des données correspondent à : 27 x 0,9
24,3.
Le neuvième décile est alors, par définition, la plus petite valeur d'pour laquelle les valeurs de 25 termes de
la série sont inférieurs ou égales à d’.
ème
Le neuvième décile est donc la valeur du 25
terme c'
est-à-dire 15.
L'
intervalle interdécile est [5 ; 15].
L'
écart interdécile est 15- 5
5
10.
Unité d’enseignement : L6S2TC
Statistiques
Exercice 5
Le graphique ci-dessous représente la série des tailles en cm pour des enfants de 68 mois.
(Source : Pr. M. Tauber, CHU Toulouse)
1°) En utilisant ce graphique, compléter le tableau suivant
Taille
96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111
Effectif
Effectif
cumulé
Taille
112 113 114 115 116 117 118 119 120 121 122 123 124 125 126
Effectif
Effectif
cumulé
2°) Vérifier que l'
effectif total de la série est 259.
er
ème
4°) Déterminer le 1 quartile et le 3
quartile.
3°) Déterminer la médiane de cette série.
er
ème
5°) Déterminer le 1 décile et le 9
décile.
6
Unité d’enseignement : L6S2TC
VI.
Statistiques
Construction d'un diagramme en boîte
Ce type de diagramme est aussi appelé diagramme de Tuckey, boîte à moustaches ou boîte à pattes.
er
ème
er
ème
Il utilise le 1 et le 3
quartile, les valeurs extrêmes, le 1 et le 9
décile et éventuellement la médiane
d'
une série.
La construction ci-contre est faite pour la série de l'
exercice 5 (tailles en cm pour des enfants de 68 mois).
Cette série était caractérisée par :
médiane : 113
er
ème
1 quartile : 110
3
quartile : 117
er
ème
1 décile : 108
9
décile : 119
On choisit une graduation verticale permettant de
représenter les différentes valeurs de la série.
3ème quartile
On pourra par exemple graduer entre 90 et 130.
(Si certaines valeurs sont manifestement hors normes,
on n'
en tiendra pas compte.)
Le "corps" du diagramme, c'
est-à-dire la "boîte" est
formée d'
un rectangle ayant pour extrémité inférieure le
er
ème
quartile. A
1 quartile et pour extrémité supérieure le 3
médiane
l'
intérieur de ce rectangle on pourra tracer un segment
er
1 quartile
représentant la médiane.
La largeur du rectangle n'
est pas fixée, elle sera choisie
de façon à obtenir un graphique "harmonieux".
Ce rectangle représente les données contenues dans
l'
intervalle interquartile.
9ème décile
er
On repère ensuite les hauteurs correspondant au 1 et
ème
au 9
décile, et on trace deux pattes représentant les
données contenues dans l'
intervalle interdécile.
(la largeur des pattes n'
a pas d'
importance).
1er décile
On peut ensuite terminer le graphique, en faisant figurer
par des points les données qui sont en dehors de
l'
intervalle interdécile.
Si certaines données, sont manifestement très éloignées,
on ne les représentera pas, mais on écrira leurs valeurs
au dessous du diagramme.
Remarques
Une boîte avec des "pattes" courtes indique que la série
est assez concentrée autour de sa médiane.
Au contraire des "pattes" longues indique que la série est
assez dispersée.
Un des avantages de cette représentation, est qu'
elle nécessite très peu de calculs.
La représentation peut aussi se faire horizontalement, la graduation se trouvant alors sur l'
axe horizontal,
d'
où l'
appellation de "boîte à moustaches".
er
ème
Le graphique est parfois fait en dessinant des pattes correspondant au 1 et au 99
valeurs extrêmes.
7
centile, ou même aux
Unité d’enseignement : L6S2TC
Statistiques
Exercice 6
On a relevé les taux de cholestérol de 200 employés des hôpitaux de Los Angeles victimes de
maladie cardiaque.
270
250
300
200
260
240
270
270
290
240
320
230
150
230
240
300
250
270
300
300
310
270
350
230
290
280
230
250
320
330
250
230
230
220
230
220
290
250
340
240
250
240
210
360
270
240
220
240
350
300
300
200
250
290
250
230
220
250
170
330
250
210
230
270
360
300
310
280
290
200
270
240
250
240
190
280
260
210
200
190
270
210
220
170
180
220
260
350
140
300
190
270
310
190
260
240
230
200
310
240
200
210
180
280
350
190
250
230
260
210
260
130
280
250
180
170
300
210
260
240
260
220
300
270
250
320
200
240
240
200
330
290
290
280
280
150
160
200
220
260
280
220
190
300
270
320
230
210
180
170
280
200
220
240
240
200
270
330
320
270
250
220
250
210
220
210
280
200
220
250
240
330
230
260
230
270
180
260
300
250
330
270
220
190
220
230
300
310
310
270
250
260
220
250
220
270
270
160
250
190
1°) Organiser ces données dans un tableau faisant apparaître les effectifs.
er
ème
2°) Déterminer la médiane, le 1 quartile, le 3
er
ème
quartile, le 1 décile et le 9
décile de la série.
3°) Construire un diagramme en boîte pour représenter la série.
VII.
En conclusion
Pour rendre compte d’une série statistique, il faut décrire :
- la forme de la série : symétrie, cloche, Gauss…
- la valeur centrale : mode, moyenne, médiane
- l’Indice de dispersion : variance, écart type, étendu.
LES VALEURS CENTRALES OU DE POSITIONS.
1 La moyenne
2 La médiane
3 Le mode
Le mode correspond à la valeur de la variable qui correspond à l’effectif le plus élevé. Le mode peut être
aussi un mode bimodal quand il y a plusieurs valeurs les plus élevées.
LES INDICES DE DISPERSION.
1 L’étendue.
L’étendue est la différence entre l’observation la plus grande et l’observation la plus petite de notre étendue.
Ainsi si l’observation la plus grande de la série stat est : 1.69 et la plus petite est : 1.47 ; l’entendue est : 1.69
– 1.47 = 0.22
2 La variance.
La variance est la dispersion des observations autour de la moyenne, cette dispersion est plus ou moins
grande.
3 L’écart type.
L’écart type est à exprimer dans la même unité que la variance. Il exprime une distance type par
rapport à la moyenne.
Statistiques
8
Unité d’enseignement : L6S2TC
Statistiques
Exercices sur le TD1
Exercice 1
4 candidats se présentent à une élection. Les résultats sont donnés dans le tableau :
Candidat
A
B
C
D
Nombre de voix
51 210 43 821 23 212 8 597
obtenues
Fréquence
(en pourcentage)
Compléter le tableau en donnant la fréquence en pourcentage pour chacun des candidats.
Représenter ces données par un diagramme circulaire.
Exercice 2
Le tableau ci-dessous donne le nombre moyen de longs métrages réalisés par les dix plus gros
producteurs mondiaux, entre 1990 et 1995 (source Unesco).
Brésil
Chine
Etats- France
Inde
Italie
Japon Philippi Royau Thaïlan
me-Uni
Unis
nes
de
86
154
420
141
838
96
251
456
Représenter ces données par un diagramme à barres (ou diagramme en bâtons).
78
194
Exercice 3
On a relevé le prix de vente d'
un CD et le nombre de CD vendus chez différents fournisseurs.
Les résultats sont donnés dans le tableau suivant :
Prix de vente en
15
16
17
18
19
euros
Nombre de CD
97
vendus
Donner le prix de vente moyen de ce CD.
34
43
20
6
Exercices 4 à 6 : Exercices du cours
Exercice 7 :
On fait passer à un groupe d’adolescents une épreuve de saut en hauteur. La série statistique obtenue
est donnée par le tableau suivant :
[50 ; 60[
[60 ; 70[ [70 ; 80[
[80 ; 90[
[90 ; 100[
[100 ; 110[
[110 ; 120[
[120 ; 130[
xi (cm)
Effectifs
15
18
15
23
34
21
15
9
1) Construire l’histogramme de cette série.
2) Calculer la moyenne et l’écart-type.
3) Calculer la médiane et les quartiles. Interpréter ces résultats.
4) Déterminer le pourcentage de cette population qui fait partie de la plage de normalité.
Exercice 8 :
On a recueilli les performances en cm au saut à la perche d’un groupe de sportifs :
[170 ; 180[
[180 ; 190[
[190 ; 200[
[200 ; 210[
[210 ; 220[
[220 ; 230[
[230 ; 240[
[240 ; 250[
xi (cm)
Effectifs
5
15
22
23
20
14
12
9
1) Construire l’histogramme de cette série.
2) Calculer la moyenne et l’écart-type.
3) Calculer la médiane et les quartiles. Interpréter ces résultats.
4) Déterminer le pourcentage de cette population qui fait partie de la plage de normalité.
Exercice 9 :
9
Unité d’enseignement : L6S2TC
Statistiques
On considère la répartition en pourcentages des agents civils de l'
état selon le
montant de leur salaire net mensuel en 1980, en négligeant les salaires au-delà de
15 000 F.
X (milliers de F) %
[0 ; 3 [
7
[3 ; 4 [
35
24
[4 ; 5 [
[5 ; 6 [
15
[6 ; 7 [
9
[7 ; 10 [
8
[10 ; 15 [
2
Nous admettrons une répartition uniforme à l'
intérieur de chaque classe.
1°/ Tracer l'
histogramme des densités de fréquence de cette distribution.
2°/ Déterminer le mode.
3°/ Tracer la fonction de répartition empirique.
4°/ Déterminer la médiane.
5°/ Déterminer l'
intervalle interquartile.
6°/ On appelle rapport des déciles le quotient du salaire au-dessus duquel se trouvent 10 % des
agents, par celui en dessous duquel se trouvent 10 % des agents.
Calculer ce rapport pour l'
année 1980.
Sachant que ce rapport valait 2,4 en 1976, que peut-on conclure sur l'
évolution des rémunérations
entre ces deux années ?
Exercice 10 :
Propriété : Soit une série statistique de variable x dont la moyenne est x et l’écart type
Soit x’, une nouvelle variable telle que x’ = ax + b avec a et b, deux réels donnés. Alors :
x’ = a x + b
σ = a σ’
Le tableau ci-dessous donne les salaires d’une entreprise et le nombre d’employés correspondant :
800
900
1050
1150
1300
1350
1500
1800
2000
Salaire en euros
3
5
7
8
11
9
4
2
1
Effectifs
1) Calculer le salaire moyen et l’écart type de cette série.
2) Les salaires sont tous augmentés de 3% puis encore augmentés d’une somme fixe de 15 €.
Calculer la nouvelle moyenne et le nouvel écart-type.
3) Que doit-on faire pour obtenir une série centrée réduite à partir des données initiales
Exercice 11 :
Les notes centrées réduites sont très utilisées en statistiques car elles sont normalisées. L’idée est
de transformer et de comparer n’importe qu’elle variable. La moyenne est toujours égale à zéro et
l’écart type de la transformation est aussi toujours égale à 1. On transforme x1 en z1 avec toujours
la même formule :
Z1 = (x1 – M) /σ (M : moyenne et σ : écart-type)
Il y a pas d’unité, on peut donc comparer des choses qui, en pratique n’ont aucun rapport.
Poids hauteur 60m
Moyenne 6.20 m 1.15 m 9.2 s
Ecart type 0.40 m 0.05 m 0.3 s
Deux élèves A et B ont obtenu les performances suivantes :
Poids Hauteur 60 m
A 6.50 m 1.10 m
9.4 s
B 5.20 m 1.25 m
8.7 s
1) Dans quelle épreuve l’élève A est-il le meilleur (en comparaison avec les performance des autres
élèves) ?
2) Quelle performance au poids faudrait-il que l’élève A réalise pour égaler la meilleure
performance de l’élève B ?
10
Unité d’enseignement : L6S2TC
Statistiques
Statistiques
Utilisation du tableur
Exercice 1
Faire le tableau de valeurs, écrire les formules donnant les fréquences. Les résultats seront affichés en
pourcentage avec 1 chiffre après la virgule.
Faire le diagramme circulaire. Vous enregistrerez votre travail sous le nom st01.xls
Exercice 2
Faire le tableau et le diagramme à barres correspondant.
Vous enregistrerez votre travail sous le nom st02.xls
Exercice 3
Faire le tableau et écrire la formule permettant d'
obtenir le prix moyen d'
un CD.
Vous enregistrerez votre travail sous le nom st03.xls
Exercice 4
Ouvrir le classeur st04.xls
Sur la feuille "Classe A", Compléter la plage B2:L2 , puis la plage B3:L3 .
Le diagramme en bâtons a déjà été prévu et doit apparaître alors automatiquement.
Écrire dans la cellule B7 la formule pour le calcul de la moyenne.
Compléter ensuite les deux dernières lignes du tableau, puis écrire dans les cellules B8 et B9 les formules
donnant la variance et l'
écart-type. Les résultats seront affichés avec à 0,01 près.
La fonction racine carrée est obtenue en écrivant = racine( )
Faire de même sur la feuille "Classe B", et faire le diagramme en bâtons qui n'
a pas été fait.
Sur la feuille "Données", vous trouverez les données brutes concernant la classe A et la classe B.
Calculer pour chaque classe la moyenne, la variance et l'
écart-type en utilisant les fonctions : moyenne( : )
var.p( : ) ecartypep( : ). Faire afficher les résultats à 10-2 près et constater qu'
ils sont corrects.
Exercice 5
Ouvrir le classeur st05.xls
Sur la feuille Diagrammes, vous trouverez le diagramme à barres représentant la taille en cm pour des
enfants de 68 mois. Ce diagramme comporte trois erreurs dans les effectifs des catégories 99 ; 110 et 122.
Les différents paramètres, Effectif Total, Médiane etc… sont donc faux, ainsi que le diagramme en boîte se
trouvant plus bas. Corrigez les erreurs en agissant directement sur les barres du diagramme à barres.
Vérifiez alors que les divers paramètres de la série sont corrects ainsi que le diagramme en boîte.
Exercice 6
Ouvrir le classeur st06.xls
Compléter la ligne "Effectif" par les valeurs trouvées, puis la ligne "Effectif cumulé" par les formules
appropriées.
Vérifier que les différents paramètres de la série sont corrects ainsi que le diagramme en boîte.
11

Documents pareils