T E S Exercices de statistique. Séries simples Une série simple X

Transcription

T E S Exercices de statistique. Séries simples Une série simple X
Auteurs et sources : E. Leclercq & A. Sébaoun & Oraux de concours & Exercice officiel
TES
Exercices de statistique.
Séries simples
Une série simple X = (xi , ni ) (xi =terme d’indice i de la série et ni effectif associé à xi ) est donnée par
le tableau suivant.
xi 0 2 3 4 5 10 12 15 20 25
ni
1
2
4
5
6
4
4
3
2
1
1.a. Calculer l’effectif total de cette série. Former le tableau des fréquences puis le tableau des fréquences
cumulées croissantes. Estimer la valeur médiane de la série X.
1.b. Calculer X la moyenne de X, puis X 2 , la moyenne de X 2 . Donner la variance de X : V ar(X) puis
l’écart-type de X : σ(X).
1.c. On pose Y = 2X − 1. Quelle est la moyenne de Y et son écart-type ?
1.d. Pour a et b réels, on pose Z = aX + b. Quelles sont les valeurs possibles pour a et b sachant que
Z = 0 et σ(Z) = 1 ?
Deux classes de Terminale ES ont fait le même contrôle de mathématique. Chaque professeur a corrigé
les contrôles de sa propre classe ce qui a donné les tableaux de notes suivants.
CLASSE TERMINALE ES 1
notes
4
5
6
7
8
9
10
11
12
13
14
15
effectifs
2
2
3
4
5
3
3
2
2
2
1
1
1
5
6
7
8
9
10
11
12
13
14
18
1
1
2
4
5
4
4
3
2
2
1
1
CLASSE TERMINALE ES 2
note
effectifs
On appelle X la série des notes de la première classe et Y celle des notes de la deuxième classe.
2.a. Représenter graphiquement ces deux séries. Calculer les moyennes mX et mY , les écarts types σX
et σY . Laquelle de ces deux classes a la plus grande dispersion de ses notes ?
2.b. Calculer la moyenne générale mG des notes obtenues par l’ensemble des élèves des deux classes.
Quelles relations y a-t-il entre mX , mY et mG ?
2.c. Calculer l’écart-type σG des notes obtenues par l’ensemble des élèves des deux classes. Quelles
relations y a-t-il entre σX , σY et σG ?
On considère les variables statistiques X et Y distribuées suivant les tableaux suivants :
X
41
51
62
71
Y
24
21
17
14
3.a. Calculer les moyennes mX et mY , ainsi que les écarts types σX et σY .
3.b. Établir le tableau de distribution de la variable statistique X + Y .
3.c. Calculer la moyenne mX+Y , ainsi que l’écart type σX+Y de la variable X + Y .
3.d. Quelles relations y a-t-il entre les moyennes et les écarts types précédents ?
1
Dans une population on a relevé les tailles des individus et noté les résultats par classe ce qui a donné
le tableau de pourcentages suivant.
Taille en mètres
]1, 5; 1, 65]
]1, 65; 1.7]
]1.7; 1.8]
]1, 8; 1.9]
]1, 9; 2, 0]
%
8
22
30
25
15
4.a. Représenter graphiquement ce relevé de taille. En considérant les centres des classes, calculer la
moyenne et l’écart-type de la taille de cette population.
4.b. Établir le tableau des effectifs cumulés croissants de cette série. Déterminer une estimation de la
valeur médiane de cette série par interpolation linéaire.
4.c. Quel est le nombre de personnes que l’on peut estimer avoir une taille comprise entre 1,68 mètres
et 1,83 mètres ? On acceptera une réponse non entière.
4.d. Quelle est la taille maximale des dix personnes les plus petites ?
Séries doubles & Corrélation
On considère un couple de deux variables statistiques (X, Y ), dont les effectifs sont donnés ci-dessous.
Y
\
[14; 16[
[16; 18[
[18; 26]
total
[101; 110[
0, 1
0, 14
0, 06
0, 3
[110; 123[
0, 12
0, 21
0, 07
0, 4
[123; 123, 4[
0, 03
0, 05
0, 02
0, 1
[123, 4; 143[
0, 01
0, 14
0, 05
0, 2
total
0, 26
0, 54
0, 2
1
X
5.a. Déterminer la distribution théorique que l’on aurait obtenue dans le cas où les variables auraient
été indépendantes. Préciser quelles sont les modalités sous et sur représentées.
5.b. Calculer les valeurs moyennes de X et de Y .
5.c. Établir le tableau de fréquences de X sachant que Y = 17.
5.d. Calculer la moyenne et l’écart type de la variable X sachant que Y = 17.
On définit la série double suivante :
i
1
2
3
4
5
6
7
8
9
10
xi
0
1
2
3
4
5
6
7
8
9
yi
0
1
4
9
16
25
36
49
64
81
6.a. Représenter graphiquement cette série double (X, Y ) dans un repère (O,~ı, ~). Calculer les coordonnées du point point moyen G et placer ce point sur la représentation graphique.
On appelle N le nuage de points obtenus, c.a.d, les points M i de coordonnées (xyii ). On partage ce nuage
en deux sous-nuages N1 et N2 . Le nuage N1 se compose des points Mi pour i ∈ {1; 2; 3; 4; 5}, et le
nuage N2 des points Mi pour i ∈ {6; 7; 8; 9; 10}
6.b. Déterminer les coordonnées de G1 , point moyen de N1 , puis les coordonnées de G2 , point moyen
de N2 . Placer ces deux points G1 et G2 puis tracer la droite (G1 G2 )1 . Déterminer une équation de
(G1 G2 ) de la forme y = ax + b.
1 Cette
droite qui est un ersatz très approximatif de droite de régression est appelée (( droite de Mayer. ))
2
6.c. Calculer la covariance de (x, y) puis le coefficient de corrélation linéaire de (x, y). Comment peut-on
interpréter la valeur numérique de ce coefficient de corrélation linéaire ?
6.d. Montrer que la droite de régression par les moindres carrés de y par rapport à x admet pour
équation : Dy/x : y = 9x − 12.
6.e. Donner aussi une équation de la droite Dx/y de régression de x par rapport à y.
6.f. Tracer les droites D( y/x) et D( x/y) sur la figure. Que peut-on dire de l’intersection des droites
(G1 G2 ), Dy/x et Dx/y ?
Étude d’un cas (( limte )).
On sait que par deux points distincts passent une droite et une seule. Qu’est-ce qu’une droite de
régression dans le cas où le nuage de points ne comporte que deux points ? Considérons le couple (X, Y )
suivant de variables statistiques.
X
Y
7
4
3
-2
7.a. Calculer l’équation de la droite (AB) où A est le point de coordonnées (7, 4) et B celui de coordonnées (3, −2.
7.b. Déterminer l’équation de la droite de régression de Y en X associée à (X, Y ).
7.c. Déterminer l’équation de la droite de régression de X en Y associée à (X, Y ). Conclure.
On étudie le couple (X, Y ) de variables statistiques.
X
Y
430
14
432
37
436
94
440
158
444
201
448
199
452
209
456
220
460
311
464
337
468
371
472
398
8.a. Calculer la covariance du couple (X, Y ) ainsi que la variance X.
8.b. Calculer le coefficient de corrélation entre X et Y .
8.c. Représenter graphiquement le nuage de points correspondant.
8.d. Calculer la droite de régression de Y en X.
8.e. Porter cette droite sur la représentation graphique.
3
8.f. On cherche à prévoir quelles seront les valeurs de X associées à Y = 61, Y = 105, Y = 600, etc.
Quelle droite de régression doit-on utiliser pour cela : la droite de régression de Y en X ou la droite de
régression de X en Y ? Compléter le tableau suivant :
X
Y
61
105
600
8.g. On cherche à prévoir quelles seront les valeurs de Y associées à X = 424, X = 450, X = 484, etc.
Quelle droite de régression doit-on utiliser pour cela : la droite de régression de Y en X ou la droite de
régression de X en Y ? Compléter le tableau suivant :
X
Y
424
450
484
On considère X et Y deux variables statistiques dont les distributions sont données dans le tableau
suivant :
X
a
a
0
Y
1
2a2
a
9.a. Calculer les moyennes X, Y , XY , X 2 et Y 2 .
9.b. Calculer la covariance du couple (X, Y ).
9.c. Calculer le coefficient de corrélation linéaire du couple (X, Y ).
9.d. Déterminer l’équation cartésienne de la droite de régression (suivant la méthode des moindres
carrés) de Y en X.
Le tableau ci-dessous donne une série double (x, y).
i
1
2
3
4
5
6
7
8
9
10
xi
0
1
2
3
4
5
6
7
8
9
yi
0, 2
0, 8
1
1, 5
2
3
5, 5
8
13
25
4
Cette série double est représentée graphiquement ci-dessous.
10.a. D’après cette représentation graphique, un ajustement affine semble-t-il raisonnable ?
10.b. Calculer le coefficient de corrélation linéaire de la série (x, y). Cela confirme-t-il ce qu’on pouvait
voir sur le graphique ?
10.c. On pose alors (x, z) comme étant la série double telle que pour tout i ∈ {1; 2; ...; 10}, on ait
zi = ln(yi ). Calculer les termes zi (donner les résultats à 10−3 près par défaut).
10.d. La série double (x, z) est représentée graphiquement ci-dessous.
D’après ce graphique un ajustement linéaire pour cette série semble-t-il justifié ?
10.e. Calculer le coefficient de corrélation linéaire de (x, z). Un ajustement linéaire pour cette série
semble-t-il toujours justifié ?
10.f. Déterminez un équation de la droite de régression par les moindres carrés de z par rapport à x
sous la forme : Dz/x : z = ax + b.
10.g. On décide de prendre comme ajustement pour la série (x, y) la fonction : f (x) = (0, 3).(1, 6 x).
Cela est-il cohérent avec les les résultats de la question précédente ?
10.h. Quelle valeur de Y peut-on prévoir pour X = 11 ?
5
Exercice officiel
L’évolution de la population d’une région entre 1950 et 1990 a permis de construire le tableau suivant :
Année Xi
1950
1960
1970
1980
1990
2, 5
3
3, 6
4, 4
5, 2
xi
Population yi en millions
11.a. Lorsque Xi désigne le numéro de l’année, on pose xi =
à une unité. Compléter la seconde ligne du tableau.
Xi −1900
·
10
Une décennie correspond alors
11.b. Construire, à l’aide de ces données, le nuage des points de coordonnées (xi , yi ). Les unités graphiques seront de 1cm pour 1 unité sur l’axe des abscisses et de 2cm pour 1 million sur l’axe des
ordonnées.
11.c. En première approximation, on peut envisager de représenter la population y comme une fonction
affine de l’année x.
1. Expliquer pourquoi les accroissements absolus devraient être constants tous les 10 ans.
2. Déterminer l’équation de la droite d’ajustement obtenue par la méthode des moindres carrés.
3. Quelle prévision ferait-on avec cette approximation pour la population de la région en l’an 2000 ?
En 2000, la population a été en réalité de 6,2 millions. Les démographes intéressés par l’évolution de
cette population ont alors modifié l’ajustement du nuage en tenant compte du fait que l’accroissement
relatif de cette population est presque constant d’une décennie à l’autre.
11.d. Vérifier que, pour les valeurs données, cet accroissement est voisin de 20 %.
11.e. Expliquer pourquoi la fonction f : x 7→ 1, 2x peut être utilisée pour modéliser plus précisément
l’évolution de la population étudiée.
11.f. En utilisant cette modélisation, quelle prévision peut-on faire pour 2005 ? Quelle aurait été la
prévision faite à l’aide de la première approximation ?
12. Une entreprise étudie la corrélation entre X son chiffre d’affaires, donné en millions de francs et Y
son budget de publicité exprimé en centaines de milliers de francs.
Classes de X
Classes de Y
[0, 50]
[0; 0, 2]
30
]0, 2; 0, 8]
13
]0, 8; 1]
]50, 100]
]100, 200]
]200, 500]
]500, 1000]
2
1
10
4
4
]1; 3]
2
Calculer la covariance de (X, Y ) puis le coefficient de corrélation linéaire entre X et Y . Calculer les
coordonnées du point moyen.
On étudie sur un échantillon de véhicules la consommation de carburant pour 100 kilomètres. On relève
6
pour chacun la distance parcourue, en kilomètres, avec 50 litres de carburant.
Distance parcourue
Nombre de véhicules
]430; 432]
12
]432; 436]
35
]436; 440]
89
]440; 444]
150
]444; 448]
201
]448; 452]
198
]452; 456]
209
]456; 460]
220
]460; 464]
307
]464; 468]
337
]468; 472]
370
]472; 480]
400
13.a. Calculer le coefficient de corrélation entre les variables statistiques D et N représentant respectivement la distance parcourue et le nombre de véhicules.
13.b. Représenter graphiquement le nuage de points correspondant.
13.c. Calculer l’équation de la droite de régression de D en N ainsi que celle de la droite de régression
de N en D. Porter ces deux droites sur la représentation graphique.
13.d. On cherche à estimer combien de véhicules pourrait parcourir entre 484 et 488 kilomètres. Quelle
est la droite de régression que l’on doit utiliser ? Quelle est vraisemblablement ce nombre de véhicules ?
Le tableau suivant donne en milliers de tonneaux de jauge brute, la capacité totale des navires marchands
mis en service dans le monde (à l’exclusion de l’URSS, la Roumanie et la Chine) au cours des années
1969 à 1975.
Année i
Capacité. yi
1
2
3
4
5
6
7
18 738
20 979
24 387
26 748
30 408
33 541
34 202
La série (i, yi ) est représentée ci-dessous.
7
14.a. Calculer le coefficient de corrélation linéaire entre i et yi . Un ajustement linéaire est-il possible ?
14.b. On appelle v la variable définie par vi = ln yi pour tout i ∈ {1, 2, 3, 4, 5, 6, 7}. Construire le
tableau donnant vi . La série (i, vi ) est représentée ci-dessous.
14.c. Calculer les coordonnées du point moyen G et porter ce point sur le graphique.
14.d. Calculer le coefficient de corrélation linéaire entre i et vi . Un ajustement linéaire est-il justifié ?
14.e. Déterminer les coefficients de la droite de régression de v en i, tracer cette droite. Déduire de ce
qui précède une relation entre yi et i.
14.f. Quelle était la capacité prévisible pour 1976 ?
Le nombre N d’individus d’une population expérimentale varie avec le temps t exprimé en heures suivant
un loi de la forme N = ae−kt , où a et k sont des réels positifs. Le tableau suivant résume l’observation
de cette population durant 8 mois.
t
1
2
3
4
5
6
7
8
N
180
154
140
120
112
97
84
76
15.a. Étudier la variable ln N par la méthode des moindres carrés.
15.b. En déduire des valeurs approchées de a et de k.
15.c. Donner une prévision du nombre N à la douzième heure.
8