Première L 2010-2011 DS4 quartiles et diagrammes en boîtes

Transcription

Première L 2010-2011 DS4 quartiles et diagrammes en boîtes
Première L
2010-2011
DS4 quartiles et diagrammes en boîtes – plages de normalité
NOM :
Prénom :
Exercice 1 : Elections régionales 1999
Le tableau ci-dessous donne les pourcentages des voix obtenues par le parti socialiste aux
élections régionales de 1999 dans les 22 régions de France (hors DOM-TOM) rangés par
ordre croissant.
1) a) Déterminer les différents quartiles de cette série.
b) Définir les intervalles [Min ;Q1[, [Q1 ;Med[, [Med ;Q3[ et [Q3 ;Max].
2) a) Construire à l’aide des résultats de la question 1, un diagramme en boîte pour cette
série.
b) Situer dans ce diagramme la position de la région Ile-de-France. Commenter.
Région
Alsace
Provence-Alpes-Côte d'Azur
Picardie
Basse-Normandie
Champagne-Ardenne
Ile-de-France
Rhône-Alpes
Centre
Haute-Normandie
Lorraine
Languedoc-Roussillon
Nord-Pas-de-Calais
Pays de la Loire
Franche-Comté
Bourgogne
Poitou-Charentes
Aquitaine
Auvergne
Bretagne
Corse
Midi-Pyrénées
Limousin
%PS
17,36
18,24
19,07
19,64
19,97
20,6
21,18
21,19
21,82
21,84
22,03
22,15
22,58
22,98
23,31
23,56
24,05
24,14
24,3
25,25
27,06
28,59
1
Première L
2010-2011
DS4 quartiles et diagrammes en boîtes – plages de normalité
Exercice 2 : Etude de la clientèle d’un site Internet
Un site de vente aux enchères sur Internet désire réaliser une étude statistique de sa clientèle.
Les responsables de l’étude utilisent un échantillon de 3 000 clients, parmi les plus réguliers du site.
Partie A
La première question concerne l’âge des clients considérés. Les résultats sont donnés par l’histogramme cidessous.
Classe
[13 ;18[
[18 ;20[
[20 ;25[
[25 ;30[
[30 ;35[
[35 ;45[
[45 ;55[
[55 ;70[
total
Centre de la classe
effectif
fréquence (en %)
3000
32
18,6
7,4
1,9
1
100
22,5
27,5
32,5
40
1) Compléter, sans justifier, le tableau ci-dessus.
2) A l’aide de la calculatrice, déterminer sans justifier (on arrondira les résultats au dixième) :
a) L’âge moyen m des 3 000 clients du site de vente aux enchères.
b) L’écart-type σ de la série des âges des clients.
3) Peut-on estimer que le pourcentage des individus qui ont un âge appartenant à la plage [m- σ ;m+ σ ] est
supérieur ou égal à 75 % ?
Partie B
La seconde question posée aux 3 000 clients porte sur la durée moyenne de connexion en minute durant une
période d’une semaine.
1) L’étude a montré que la série des durées moyennes de connexion suit une loi de Gauss de moyenne µ ≈ 83,5
et d’écart-type s ≈ 26,6.
a) Déterminer la plage de normalité à 95% de cette série.
b) A combien peut-on estimer le nombre de clients dont la durée moyenne de connexion par semaine est
située en dehors de cette plage ?
2) Pour cette série, le premier quartile Q1 est 65, la médiane Me est 85 et le troisième quartile est 100.
a) Quel est le nombre minimum de clients dont la durée moyenne de connexion par semaine sur le site est
inférieure ou égale à 65 minutes ?
b) Les responsables du site espéraient qu’au moins 1 000 personnes se connecteraient en moyenne 1 heure
40 minutes ou plus par semaine. Cet objectif est-il atteint ?
Barème :
Ex 1 : 6 points (1,5+1+2+1,5)
Ex 2 : 14 points (2+2+2+2+1+2+1+2)
2
Première L
2010-2011
DS4 quartiles et diagrammes en boîtes – plages de normalité
CORRECTION
Exercice 1 : Elections régionales 1999
Le tableau ci-dessous donne les pourcentages des voix obtenues par le parti
socialiste aux élections régionales de 1999 dans les 22 régions de France (hors
DOM-TOM) rangés par ordre croissant.
1) a) Déterminer les différents quartiles de cette série.
b) Définir les intervalles [Min ;Q1[, [Q1 ;Med[, [Med ;Q3[ et [Q3 ;Max].
2) a) Construire à l’aide des résultats de la question 1, un diagramme en boîte
pour cette série.
b) Situer dans ce diagramme la position de la région Ile-de-France. Commenter.
1) a)
Région
Alsace
PROVENCE-ALPES-CÔTE D'AZUR
Picardie
Basse-Normandie
CHAMPAGNE-ARDENNE
Ile-de-France
RHÔNES-ALPES
Centre
Haute-Normandie
Lorraine
Languedoc-Roussillon
Nord-Pas-de-Calais
Pays de la Loire
Franche-Comté
Bourgogne
Poitou-Charentes
Aquitaine
Auvergne
Bretagne
Corse
Midi-Pyrénées
Limousin
%PS
Position
17,36
4,5%
18,24
9,1%
19,07
13,6%
19,64
18,2%
19,97
22,7%
20,6
27,3%
21,18
31,8%
21,19
36,4%
21,82
40,9%
21,84
45,5%
22,03
50,0%
22,15
54,5%
22,58
59,1%
22,98
63,6%
23,31
68,2%
23,56
72,7%
24,05
77,3%
24,14
81,8%
24,3
86,4%
25,25
90,9%
27,06
95,5%
28,59
100,0%
Q1 = 20,6
Med = [22,03[
b) [Min;Q1[ = [17,36 ;20,6[
[Q1;Med[ = [20,6 ;22,03[
[Med;Q3[ = [22,03;24,05[
[Q3;Max] = [24,05;28,59]
Q3 = 24,05
3
Première L
Contrôle plages de normalité
CORRECTION
2009-2010
2) a)
b) L’ile de France correspond au premier quartile.
C’est à dire que 25% des régions ont un score inférieur à celui de l’Ile de France
Cependant, la valeur pour l’Ile de France est relativement proche de celle de la
médiane.
Exercice 2 : Etude de la clientèle d’un site Internet
Un site de vente aux enchères sur Internet désire réaliser une étude statistique
de sa clientèle.
Les responsables de l’étude utilisent un échantillon de 3 000 clients, parmi les
plus réguliers du site.
Partie A
La première question concerne l’âge des clients considérés. Les résultats sont
donnés par l’histogramme ci-dessous.
4
Première L
Classe
[13 ;18[
[18 ;20[
[20 ;25[
[25 ;30[
[30 ;35[
[35 ;45[
[45 ;55[
[55 ;70[
total
Contrôle plages de normalité
CORRECTION
Centre de la
classe
2009-2010
effectif
fréquence (en %)
3000
32
18,6
7,4
1,9
1
100
22,5
27,5
32,5
40
1) Compléter, sans justifier, le tableau ci-dessus.
2) A l’aide de la calculatrice, déterminer sans justifier (on arrondira les
résultats au dixième) :
a) L’âge moyen m des 3 000 clients du site de vente aux enchères.
b) L’écart-type σ de la série des âges des clients.
3) Peut-on estimer que le pourcentage des individus qui ont un âge appartenant à
la plage [m- σ ;m+ σ ] est supérieur ou égal à 75 % ?
Partie B
La seconde question posée aux 3 000 clients porte sur la durée moyenne de
connexion en minute durant une période d’une semaine.
1) L’étude a montré que la série des durées moyennes de connexion suit une loi de
Gauss de moyenne µ ≈ 83,5 et d’écart-type s ≈ 26,6.
a) Déterminer la plage de normalité à 95% de cette série.
b) A combien peut-on estimer le nombre de clients dont la durée moyenne de
connexion par semaine est située en dehors de cette plage ?
2) Pour cette série, le premier quartile Q1 est 65, la médiane Me est 85 et le
troisième quartile est 100.
a) Quel est le nombre minimum de clients dont la durée moyenne de
connexion par semaine sur le site est inférieure ou égale à 65 minutes ?
b) Les responsables du site espéraient qu’au moins 1 000 personnes se
connecteraient en moyenne 1 heure 40 minutes ou plus par semaine. Cet
objectif est-il atteint ?
5
Première L
Contrôle plages de normalité
CORRECTION
2009-2010
Partie A
1)
Classe
[13 ;18[
[18 ;20[
[20 ;25[
[25 ;30[
[30 ;35[
[35 ;45[
[45 ;55[
[55 ;70[
total
Centre de la
classe
15,5
19
22,5
27,5
32,5
40
50
62,5
effectif
fréquence (en %)
148
210
815
959
559
221
57
31
3000
4,9
7
27,2
32
18,6
7,4
1,9
1
100
15,5x148 + 19x210 + ... + 62,5x31 82789
=
≈ 27,6
3000
3000
b) On calcule la variance V =
148x(15,5-m)² + 210x(19-m)² + ... + 31x(62,5-m)² 172169,7
=
V ≈ 57,4
3000
3000
a) On calcule m =
σ =
V ≈ 7,6
3) plage [m- σ ;m+ σ ] = [20 ;35,2]
L’effectif de cette plage est : 815 + 959 + 559 = 2333
2333
Soit un pourcentage de :
≈ 77,8 % > 75 %
3000
Donc on peut estimer que le pourcentage des individus qui ont un âge appartenant
à la plage [m- σ ;m+ σ ] est bien supérieur à 75 %.
Partie B
1) a) La plage de normalité correspond à l’intervalle [ µ -2s ; µ +2s]
Soit : [30,3 ;136 ;7]
b) Le pourcentage de clients dont la durée moyenne de connexion par semaine
est située en dehors de cette plage est de 5% ce qui représente 150
clients.
2) a) Le premier quartile correspond à un pourcentage de 25% de la série
ordonnée.
Le nombre minimum de clients dont la durée moyenne de connexion par semaine
sur le site est inférieure ou égale à 65 minutes est donc de 750.
6
Première L
Contrôle plages de normalité
CORRECTION
2009-2010
b) 1 heure 40 minutes = 100 minutes
Le troisième quartile correspond à un pourcentage de 75% de la série ordonnée.
On a donc 100 – 75 = 25% de clients qui se connectent pour une durée supérieure
à Q3.
Soit 750 clients.
L’objectif des 1000 clients n’est pas atteint.
7