Première L 2010-2011 DS4 quartiles et diagrammes en boîtes
Transcription
Première L 2010-2011 DS4 quartiles et diagrammes en boîtes
Première L 2010-2011 DS4 quartiles et diagrammes en boîtes – plages de normalité NOM : Prénom : Exercice 1 : Elections régionales 1999 Le tableau ci-dessous donne les pourcentages des voix obtenues par le parti socialiste aux élections régionales de 1999 dans les 22 régions de France (hors DOM-TOM) rangés par ordre croissant. 1) a) Déterminer les différents quartiles de cette série. b) Définir les intervalles [Min ;Q1[, [Q1 ;Med[, [Med ;Q3[ et [Q3 ;Max]. 2) a) Construire à l’aide des résultats de la question 1, un diagramme en boîte pour cette série. b) Situer dans ce diagramme la position de la région Ile-de-France. Commenter. Région Alsace Provence-Alpes-Côte d'Azur Picardie Basse-Normandie Champagne-Ardenne Ile-de-France Rhône-Alpes Centre Haute-Normandie Lorraine Languedoc-Roussillon Nord-Pas-de-Calais Pays de la Loire Franche-Comté Bourgogne Poitou-Charentes Aquitaine Auvergne Bretagne Corse Midi-Pyrénées Limousin %PS 17,36 18,24 19,07 19,64 19,97 20,6 21,18 21,19 21,82 21,84 22,03 22,15 22,58 22,98 23,31 23,56 24,05 24,14 24,3 25,25 27,06 28,59 1 Première L 2010-2011 DS4 quartiles et diagrammes en boîtes – plages de normalité Exercice 2 : Etude de la clientèle d’un site Internet Un site de vente aux enchères sur Internet désire réaliser une étude statistique de sa clientèle. Les responsables de l’étude utilisent un échantillon de 3 000 clients, parmi les plus réguliers du site. Partie A La première question concerne l’âge des clients considérés. Les résultats sont donnés par l’histogramme cidessous. Classe [13 ;18[ [18 ;20[ [20 ;25[ [25 ;30[ [30 ;35[ [35 ;45[ [45 ;55[ [55 ;70[ total Centre de la classe effectif fréquence (en %) 3000 32 18,6 7,4 1,9 1 100 22,5 27,5 32,5 40 1) Compléter, sans justifier, le tableau ci-dessus. 2) A l’aide de la calculatrice, déterminer sans justifier (on arrondira les résultats au dixième) : a) L’âge moyen m des 3 000 clients du site de vente aux enchères. b) L’écart-type σ de la série des âges des clients. 3) Peut-on estimer que le pourcentage des individus qui ont un âge appartenant à la plage [m- σ ;m+ σ ] est supérieur ou égal à 75 % ? Partie B La seconde question posée aux 3 000 clients porte sur la durée moyenne de connexion en minute durant une période d’une semaine. 1) L’étude a montré que la série des durées moyennes de connexion suit une loi de Gauss de moyenne µ ≈ 83,5 et d’écart-type s ≈ 26,6. a) Déterminer la plage de normalité à 95% de cette série. b) A combien peut-on estimer le nombre de clients dont la durée moyenne de connexion par semaine est située en dehors de cette plage ? 2) Pour cette série, le premier quartile Q1 est 65, la médiane Me est 85 et le troisième quartile est 100. a) Quel est le nombre minimum de clients dont la durée moyenne de connexion par semaine sur le site est inférieure ou égale à 65 minutes ? b) Les responsables du site espéraient qu’au moins 1 000 personnes se connecteraient en moyenne 1 heure 40 minutes ou plus par semaine. Cet objectif est-il atteint ? Barème : Ex 1 : 6 points (1,5+1+2+1,5) Ex 2 : 14 points (2+2+2+2+1+2+1+2) 2 Première L 2010-2011 DS4 quartiles et diagrammes en boîtes – plages de normalité CORRECTION Exercice 1 : Elections régionales 1999 Le tableau ci-dessous donne les pourcentages des voix obtenues par le parti socialiste aux élections régionales de 1999 dans les 22 régions de France (hors DOM-TOM) rangés par ordre croissant. 1) a) Déterminer les différents quartiles de cette série. b) Définir les intervalles [Min ;Q1[, [Q1 ;Med[, [Med ;Q3[ et [Q3 ;Max]. 2) a) Construire à l’aide des résultats de la question 1, un diagramme en boîte pour cette série. b) Situer dans ce diagramme la position de la région Ile-de-France. Commenter. 1) a) Région Alsace PROVENCE-ALPES-CÔTE D'AZUR Picardie Basse-Normandie CHAMPAGNE-ARDENNE Ile-de-France RHÔNES-ALPES Centre Haute-Normandie Lorraine Languedoc-Roussillon Nord-Pas-de-Calais Pays de la Loire Franche-Comté Bourgogne Poitou-Charentes Aquitaine Auvergne Bretagne Corse Midi-Pyrénées Limousin %PS Position 17,36 4,5% 18,24 9,1% 19,07 13,6% 19,64 18,2% 19,97 22,7% 20,6 27,3% 21,18 31,8% 21,19 36,4% 21,82 40,9% 21,84 45,5% 22,03 50,0% 22,15 54,5% 22,58 59,1% 22,98 63,6% 23,31 68,2% 23,56 72,7% 24,05 77,3% 24,14 81,8% 24,3 86,4% 25,25 90,9% 27,06 95,5% 28,59 100,0% Q1 = 20,6 Med = [22,03[ b) [Min;Q1[ = [17,36 ;20,6[ [Q1;Med[ = [20,6 ;22,03[ [Med;Q3[ = [22,03;24,05[ [Q3;Max] = [24,05;28,59] Q3 = 24,05 3 Première L Contrôle plages de normalité CORRECTION 2009-2010 2) a) b) L’ile de France correspond au premier quartile. C’est à dire que 25% des régions ont un score inférieur à celui de l’Ile de France Cependant, la valeur pour l’Ile de France est relativement proche de celle de la médiane. Exercice 2 : Etude de la clientèle d’un site Internet Un site de vente aux enchères sur Internet désire réaliser une étude statistique de sa clientèle. Les responsables de l’étude utilisent un échantillon de 3 000 clients, parmi les plus réguliers du site. Partie A La première question concerne l’âge des clients considérés. Les résultats sont donnés par l’histogramme ci-dessous. 4 Première L Classe [13 ;18[ [18 ;20[ [20 ;25[ [25 ;30[ [30 ;35[ [35 ;45[ [45 ;55[ [55 ;70[ total Contrôle plages de normalité CORRECTION Centre de la classe 2009-2010 effectif fréquence (en %) 3000 32 18,6 7,4 1,9 1 100 22,5 27,5 32,5 40 1) Compléter, sans justifier, le tableau ci-dessus. 2) A l’aide de la calculatrice, déterminer sans justifier (on arrondira les résultats au dixième) : a) L’âge moyen m des 3 000 clients du site de vente aux enchères. b) L’écart-type σ de la série des âges des clients. 3) Peut-on estimer que le pourcentage des individus qui ont un âge appartenant à la plage [m- σ ;m+ σ ] est supérieur ou égal à 75 % ? Partie B La seconde question posée aux 3 000 clients porte sur la durée moyenne de connexion en minute durant une période d’une semaine. 1) L’étude a montré que la série des durées moyennes de connexion suit une loi de Gauss de moyenne µ ≈ 83,5 et d’écart-type s ≈ 26,6. a) Déterminer la plage de normalité à 95% de cette série. b) A combien peut-on estimer le nombre de clients dont la durée moyenne de connexion par semaine est située en dehors de cette plage ? 2) Pour cette série, le premier quartile Q1 est 65, la médiane Me est 85 et le troisième quartile est 100. a) Quel est le nombre minimum de clients dont la durée moyenne de connexion par semaine sur le site est inférieure ou égale à 65 minutes ? b) Les responsables du site espéraient qu’au moins 1 000 personnes se connecteraient en moyenne 1 heure 40 minutes ou plus par semaine. Cet objectif est-il atteint ? 5 Première L Contrôle plages de normalité CORRECTION 2009-2010 Partie A 1) Classe [13 ;18[ [18 ;20[ [20 ;25[ [25 ;30[ [30 ;35[ [35 ;45[ [45 ;55[ [55 ;70[ total Centre de la classe 15,5 19 22,5 27,5 32,5 40 50 62,5 effectif fréquence (en %) 148 210 815 959 559 221 57 31 3000 4,9 7 27,2 32 18,6 7,4 1,9 1 100 15,5x148 + 19x210 + ... + 62,5x31 82789 = ≈ 27,6 3000 3000 b) On calcule la variance V = 148x(15,5-m)² + 210x(19-m)² + ... + 31x(62,5-m)² 172169,7 = V ≈ 57,4 3000 3000 a) On calcule m = σ = V ≈ 7,6 3) plage [m- σ ;m+ σ ] = [20 ;35,2] L’effectif de cette plage est : 815 + 959 + 559 = 2333 2333 Soit un pourcentage de : ≈ 77,8 % > 75 % 3000 Donc on peut estimer que le pourcentage des individus qui ont un âge appartenant à la plage [m- σ ;m+ σ ] est bien supérieur à 75 %. Partie B 1) a) La plage de normalité correspond à l’intervalle [ µ -2s ; µ +2s] Soit : [30,3 ;136 ;7] b) Le pourcentage de clients dont la durée moyenne de connexion par semaine est située en dehors de cette plage est de 5% ce qui représente 150 clients. 2) a) Le premier quartile correspond à un pourcentage de 25% de la série ordonnée. Le nombre minimum de clients dont la durée moyenne de connexion par semaine sur le site est inférieure ou égale à 65 minutes est donc de 750. 6 Première L Contrôle plages de normalité CORRECTION 2009-2010 b) 1 heure 40 minutes = 100 minutes Le troisième quartile correspond à un pourcentage de 75% de la série ordonnée. On a donc 100 – 75 = 25% de clients qui se connectent pour une durée supérieure à Q3. Soit 750 clients. L’objectif des 1000 clients n’est pas atteint. 7