T E S Exercices de statistique. Séries simples Une série simple X
Transcription
T E S Exercices de statistique. Séries simples Une série simple X
Auteurs et sources : E. Leclercq & A. Sébaoun & Oraux de concours & Exercice officiel TES Exercices de statistique. Séries simples Une série simple X = (xi , ni ) (xi =terme d’indice i de la série et ni effectif associé à xi ) est donnée par le tableau suivant. xi 0 2 3 4 5 10 12 15 20 25 ni 1 2 4 5 6 4 4 3 2 1 1.a. Calculer l’effectif total de cette série. Former le tableau des fréquences puis le tableau des fréquences cumulées croissantes. Estimer la valeur médiane de la série X. 1.b. Calculer X la moyenne de X, puis X 2 , la moyenne de X 2 . Donner la variance de X : V ar(X) puis l’écart-type de X : σ(X). 1.c. On pose Y = 2X − 1. Quelle est la moyenne de Y et son écart-type ? 1.d. Pour a et b réels, on pose Z = aX + b. Quelles sont les valeurs possibles pour a et b sachant que Z = 0 et σ(Z) = 1 ? Deux classes de Terminale ES ont fait le même contrôle de mathématique. Chaque professeur a corrigé les contrôles de sa propre classe ce qui a donné les tableaux de notes suivants. CLASSE TERMINALE ES 1 notes 4 5 6 7 8 9 10 11 12 13 14 15 effectifs 2 2 3 4 5 3 3 2 2 2 1 1 1 5 6 7 8 9 10 11 12 13 14 18 1 1 2 4 5 4 4 3 2 2 1 1 CLASSE TERMINALE ES 2 note effectifs On appelle X la série des notes de la première classe et Y celle des notes de la deuxième classe. 2.a. Représenter graphiquement ces deux séries. Calculer les moyennes mX et mY , les écarts types σX et σY . Laquelle de ces deux classes a la plus grande dispersion de ses notes ? 2.b. Calculer la moyenne générale mG des notes obtenues par l’ensemble des élèves des deux classes. Quelles relations y a-t-il entre mX , mY et mG ? 2.c. Calculer l’écart-type σG des notes obtenues par l’ensemble des élèves des deux classes. Quelles relations y a-t-il entre σX , σY et σG ? On considère les variables statistiques X et Y distribuées suivant les tableaux suivants : X 41 51 62 71 Y 24 21 17 14 3.a. Calculer les moyennes mX et mY , ainsi que les écarts types σX et σY . 3.b. Établir le tableau de distribution de la variable statistique X + Y . 3.c. Calculer la moyenne mX+Y , ainsi que l’écart type σX+Y de la variable X + Y . 3.d. Quelles relations y a-t-il entre les moyennes et les écarts types précédents ? 1 Dans une population on a relevé les tailles des individus et noté les résultats par classe ce qui a donné le tableau de pourcentages suivant. Taille en mètres ]1, 5; 1, 65] ]1, 65; 1.7] ]1.7; 1.8] ]1, 8; 1.9] ]1, 9; 2, 0] % 8 22 30 25 15 4.a. Représenter graphiquement ce relevé de taille. En considérant les centres des classes, calculer la moyenne et l’écart-type de la taille de cette population. 4.b. Établir le tableau des effectifs cumulés croissants de cette série. Déterminer une estimation de la valeur médiane de cette série par interpolation linéaire. 4.c. Quel est le nombre de personnes que l’on peut estimer avoir une taille comprise entre 1,68 mètres et 1,83 mètres ? On acceptera une réponse non entière. 4.d. Quelle est la taille maximale des dix personnes les plus petites ? Séries doubles & Corrélation On considère un couple de deux variables statistiques (X, Y ), dont les effectifs sont donnés ci-dessous. Y \ [14; 16[ [16; 18[ [18; 26] total [101; 110[ 0, 1 0, 14 0, 06 0, 3 [110; 123[ 0, 12 0, 21 0, 07 0, 4 [123; 123, 4[ 0, 03 0, 05 0, 02 0, 1 [123, 4; 143[ 0, 01 0, 14 0, 05 0, 2 total 0, 26 0, 54 0, 2 1 X 5.a. Déterminer la distribution théorique que l’on aurait obtenue dans le cas où les variables auraient été indépendantes. Préciser quelles sont les modalités sous et sur représentées. 5.b. Calculer les valeurs moyennes de X et de Y . 5.c. Établir le tableau de fréquences de X sachant que Y = 17. 5.d. Calculer la moyenne et l’écart type de la variable X sachant que Y = 17. On définit la série double suivante : i 1 2 3 4 5 6 7 8 9 10 xi 0 1 2 3 4 5 6 7 8 9 yi 0 1 4 9 16 25 36 49 64 81 6.a. Représenter graphiquement cette série double (X, Y ) dans un repère (O,~ı, ~). Calculer les coordonnées du point point moyen G et placer ce point sur la représentation graphique. On appelle N le nuage de points obtenus, c.a.d, les points M i de coordonnées (xyii ). On partage ce nuage en deux sous-nuages N1 et N2 . Le nuage N1 se compose des points Mi pour i ∈ {1; 2; 3; 4; 5}, et le nuage N2 des points Mi pour i ∈ {6; 7; 8; 9; 10} 6.b. Déterminer les coordonnées de G1 , point moyen de N1 , puis les coordonnées de G2 , point moyen de N2 . Placer ces deux points G1 et G2 puis tracer la droite (G1 G2 )1 . Déterminer une équation de (G1 G2 ) de la forme y = ax + b. 1 Cette droite qui est un ersatz très approximatif de droite de régression est appelée (( droite de Mayer. )) 2 6.c. Calculer la covariance de (x, y) puis le coefficient de corrélation linéaire de (x, y). Comment peut-on interpréter la valeur numérique de ce coefficient de corrélation linéaire ? 6.d. Montrer que la droite de régression par les moindres carrés de y par rapport à x admet pour équation : Dy/x : y = 9x − 12. 6.e. Donner aussi une équation de la droite Dx/y de régression de x par rapport à y. 6.f. Tracer les droites D( y/x) et D( x/y) sur la figure. Que peut-on dire de l’intersection des droites (G1 G2 ), Dy/x et Dx/y ? Étude d’un cas (( limte )). On sait que par deux points distincts passent une droite et une seule. Qu’est-ce qu’une droite de régression dans le cas où le nuage de points ne comporte que deux points ? Considérons le couple (X, Y ) suivant de variables statistiques. X Y 7 4 3 -2 7.a. Calculer l’équation de la droite (AB) où A est le point de coordonnées (7, 4) et B celui de coordonnées (3, −2. 7.b. Déterminer l’équation de la droite de régression de Y en X associée à (X, Y ). 7.c. Déterminer l’équation de la droite de régression de X en Y associée à (X, Y ). Conclure. On étudie le couple (X, Y ) de variables statistiques. X Y 430 14 432 37 436 94 440 158 444 201 448 199 452 209 456 220 460 311 464 337 468 371 472 398 8.a. Calculer la covariance du couple (X, Y ) ainsi que la variance X. 8.b. Calculer le coefficient de corrélation entre X et Y . 8.c. Représenter graphiquement le nuage de points correspondant. 8.d. Calculer la droite de régression de Y en X. 8.e. Porter cette droite sur la représentation graphique. 3 8.f. On cherche à prévoir quelles seront les valeurs de X associées à Y = 61, Y = 105, Y = 600, etc. Quelle droite de régression doit-on utiliser pour cela : la droite de régression de Y en X ou la droite de régression de X en Y ? Compléter le tableau suivant : X Y 61 105 600 8.g. On cherche à prévoir quelles seront les valeurs de Y associées à X = 424, X = 450, X = 484, etc. Quelle droite de régression doit-on utiliser pour cela : la droite de régression de Y en X ou la droite de régression de X en Y ? Compléter le tableau suivant : X Y 424 450 484 On considère X et Y deux variables statistiques dont les distributions sont données dans le tableau suivant : X a a 0 Y 1 2a2 a 9.a. Calculer les moyennes X, Y , XY , X 2 et Y 2 . 9.b. Calculer la covariance du couple (X, Y ). 9.c. Calculer le coefficient de corrélation linéaire du couple (X, Y ). 9.d. Déterminer l’équation cartésienne de la droite de régression (suivant la méthode des moindres carrés) de Y en X. Le tableau ci-dessous donne une série double (x, y). i 1 2 3 4 5 6 7 8 9 10 xi 0 1 2 3 4 5 6 7 8 9 yi 0, 2 0, 8 1 1, 5 2 3 5, 5 8 13 25 4 Cette série double est représentée graphiquement ci-dessous. 10.a. D’après cette représentation graphique, un ajustement affine semble-t-il raisonnable ? 10.b. Calculer le coefficient de corrélation linéaire de la série (x, y). Cela confirme-t-il ce qu’on pouvait voir sur le graphique ? 10.c. On pose alors (x, z) comme étant la série double telle que pour tout i ∈ {1; 2; ...; 10}, on ait zi = ln(yi ). Calculer les termes zi (donner les résultats à 10−3 près par défaut). 10.d. La série double (x, z) est représentée graphiquement ci-dessous. D’après ce graphique un ajustement linéaire pour cette série semble-t-il justifié ? 10.e. Calculer le coefficient de corrélation linéaire de (x, z). Un ajustement linéaire pour cette série semble-t-il toujours justifié ? 10.f. Déterminez un équation de la droite de régression par les moindres carrés de z par rapport à x sous la forme : Dz/x : z = ax + b. 10.g. On décide de prendre comme ajustement pour la série (x, y) la fonction : f (x) = (0, 3).(1, 6 x). Cela est-il cohérent avec les les résultats de la question précédente ? 10.h. Quelle valeur de Y peut-on prévoir pour X = 11 ? 5 Exercice officiel L’évolution de la population d’une région entre 1950 et 1990 a permis de construire le tableau suivant : Année Xi 1950 1960 1970 1980 1990 2, 5 3 3, 6 4, 4 5, 2 xi Population yi en millions 11.a. Lorsque Xi désigne le numéro de l’année, on pose xi = à une unité. Compléter la seconde ligne du tableau. Xi −1900 · 10 Une décennie correspond alors 11.b. Construire, à l’aide de ces données, le nuage des points de coordonnées (xi , yi ). Les unités graphiques seront de 1cm pour 1 unité sur l’axe des abscisses et de 2cm pour 1 million sur l’axe des ordonnées. 11.c. En première approximation, on peut envisager de représenter la population y comme une fonction affine de l’année x. 1. Expliquer pourquoi les accroissements absolus devraient être constants tous les 10 ans. 2. Déterminer l’équation de la droite d’ajustement obtenue par la méthode des moindres carrés. 3. Quelle prévision ferait-on avec cette approximation pour la population de la région en l’an 2000 ? En 2000, la population a été en réalité de 6,2 millions. Les démographes intéressés par l’évolution de cette population ont alors modifié l’ajustement du nuage en tenant compte du fait que l’accroissement relatif de cette population est presque constant d’une décennie à l’autre. 11.d. Vérifier que, pour les valeurs données, cet accroissement est voisin de 20 %. 11.e. Expliquer pourquoi la fonction f : x 7→ 1, 2x peut être utilisée pour modéliser plus précisément l’évolution de la population étudiée. 11.f. En utilisant cette modélisation, quelle prévision peut-on faire pour 2005 ? Quelle aurait été la prévision faite à l’aide de la première approximation ? 12. Une entreprise étudie la corrélation entre X son chiffre d’affaires, donné en millions de francs et Y son budget de publicité exprimé en centaines de milliers de francs. Classes de X Classes de Y [0, 50] [0; 0, 2] 30 ]0, 2; 0, 8] 13 ]0, 8; 1] ]50, 100] ]100, 200] ]200, 500] ]500, 1000] 2 1 10 4 4 ]1; 3] 2 Calculer la covariance de (X, Y ) puis le coefficient de corrélation linéaire entre X et Y . Calculer les coordonnées du point moyen. On étudie sur un échantillon de véhicules la consommation de carburant pour 100 kilomètres. On relève 6 pour chacun la distance parcourue, en kilomètres, avec 50 litres de carburant. Distance parcourue Nombre de véhicules ]430; 432] 12 ]432; 436] 35 ]436; 440] 89 ]440; 444] 150 ]444; 448] 201 ]448; 452] 198 ]452; 456] 209 ]456; 460] 220 ]460; 464] 307 ]464; 468] 337 ]468; 472] 370 ]472; 480] 400 13.a. Calculer le coefficient de corrélation entre les variables statistiques D et N représentant respectivement la distance parcourue et le nombre de véhicules. 13.b. Représenter graphiquement le nuage de points correspondant. 13.c. Calculer l’équation de la droite de régression de D en N ainsi que celle de la droite de régression de N en D. Porter ces deux droites sur la représentation graphique. 13.d. On cherche à estimer combien de véhicules pourrait parcourir entre 484 et 488 kilomètres. Quelle est la droite de régression que l’on doit utiliser ? Quelle est vraisemblablement ce nombre de véhicules ? Le tableau suivant donne en milliers de tonneaux de jauge brute, la capacité totale des navires marchands mis en service dans le monde (à l’exclusion de l’URSS, la Roumanie et la Chine) au cours des années 1969 à 1975. Année i Capacité. yi 1 2 3 4 5 6 7 18 738 20 979 24 387 26 748 30 408 33 541 34 202 La série (i, yi ) est représentée ci-dessous. 7 14.a. Calculer le coefficient de corrélation linéaire entre i et yi . Un ajustement linéaire est-il possible ? 14.b. On appelle v la variable définie par vi = ln yi pour tout i ∈ {1, 2, 3, 4, 5, 6, 7}. Construire le tableau donnant vi . La série (i, vi ) est représentée ci-dessous. 14.c. Calculer les coordonnées du point moyen G et porter ce point sur le graphique. 14.d. Calculer le coefficient de corrélation linéaire entre i et vi . Un ajustement linéaire est-il justifié ? 14.e. Déterminer les coefficients de la droite de régression de v en i, tracer cette droite. Déduire de ce qui précède une relation entre yi et i. 14.f. Quelle était la capacité prévisible pour 1976 ? Le nombre N d’individus d’une population expérimentale varie avec le temps t exprimé en heures suivant un loi de la forme N = ae−kt , où a et k sont des réels positifs. Le tableau suivant résume l’observation de cette population durant 8 mois. t 1 2 3 4 5 6 7 8 N 180 154 140 120 112 97 84 76 15.a. Étudier la variable ln N par la méthode des moindres carrés. 15.b. En déduire des valeurs approchées de a et de k. 15.c. Donner une prévision du nombre N à la douzième heure. 8