énoncés d`exercices - Société Française de Statistique

Transcription

énoncés d`exercices - Société Française de Statistique
1
ACCÈS ET USAGE DE FICHIERS DE
DONNÉES STATISTIQUES RÉELLES
Des exemples d’exploitation possible en classe
Atelier APMEP P1-17 – Marseille 20 octobre 2013
SANTÉ
1 – Consommation d’antibiotiques
Niveau : 1ère technologique - troisième (autre rédaction)
Représenter
Calculer
La surconsommation d’antibiotiques favorise la résistance des
bactéries. C’est la raison pour laquelle on cherche à en maîtriser
la consommation.
Le fichier « antibiotiques.xls » fournit les données pour la consommation d’antibiotiques
en France de 1999 à 2012 (source Ansm - Agence nationale de sécurité des médicaments et
des produits de santé : http://ansm.sante.fr/Dossiers-thematiques/Antibiotiques/Bienutiliser-les-antibiotiques/(offset)/0 ).
2
La consommation annuelle est exprimée en doses définies journalières pour 1000
habitants. Les cellules des colonnes C, D, F et G sont au Format Pourcentage avec 2
décimales.
1. À l’aide du tableur, représenter graphiquement l’évolution de la consommation
d’antibiotique en ville et à l’hôpital sur la période 1999-2012.
Appelez le professeur pour analyser le graphique produit.
2. Compléter la feuille de calcul en déterminant, pour la consommation en ville et la
consommation à l’hôpital, le pourcentage d’évolution par rapport à l’année précédente et la
part relative, en pourcentage, de chacun des deux types de consommation.
3. Où la consommation d’antibiotique a-t-elle le plus baissé entre 1999 et 2012 ?
Appelez le professeur pour présenter vos résultats.
2 – Mortalité en France et ailleurs
Niveau : 2nde - 1ère technologique
Le fichier mortalite.xls fournit le nombre annuel de décès en
France métropolitaine de 1900 à 2011 (source INSEE et état
civil, données disponibles sur http://www.insee.fr/).
Représenter
Communiquer
(critiquer)
A. Nombre de décès en France métropolitaine
1. a) Représenter graphiquement, à l’aide du tableur, l’évolution du nombre de décès de
1900 à 2011.
b) Interpréter les deux « pics » de mortalité observés.
c) Quelle est la « tendance » globale de l’évolution sur la période de 1900 à 2011 ?
2. a) Représenter graphiquement, à l’aide du tableur, l’évolution du nombre de décès de
1990 à 2011.
b) L’été 2003 est celui de la « canicule ». Qu’observe-t-on sur le graphique ?
c) Quelle est la « tendance » globale de l’évolution sur la période de 1990 à 2011 ?
3. Calculer en colonne C l’évolution, exprimée en pourcentage, du nombre de décès par
rapport à l’année précédente. Afficher les pourcentages avec une décimale.
4. a) Quelle est l’évolution du nombre de décès en 2003 par rapport à 2002 ?
b) Quelle est l’évolution du nombre de décès en 2004 par rapport à 2003 ? Donner une
explication.
c) L’augmentation de la mortalité en 2005 est-elle due à un nombre important de décès
cette année là (comparer aux années 1999-2002) ? Comment peut-on l’expliquer ?
B. Mortalité en France et en Inde
D’après les estimations de l’INED (institut national des études démographiques), la
mortalité en France (environ 8,6 décès pour mille habitants) est supérieure à la mortalité en
Inde (environ 8 pour mille) alors qu’à tout âge le taux de mortalité en France est bien
inférieur à celui qui existe en Inde !
3
Pour comprendre ce phénomène, saisir sur une feuille de calcul le tableau ci-dessous (les
cellules de B2 à E3 sont au format pourcentage avec 0 décimale).
1. Quelle formule peut-on entrer en E2 puis recopier vers le bas en E3 (l’affichage doit-être
100%) ?
Comparer la répartition des populations, selon les tranches d’âge, en France et en Inde.
2. Pour calculer le taux de mortalité global, entrer en E4 la formule :
=B4*B2+C4*C2+D4*D2 puis la recopier vers le bas en E5.
Pourquoi serait-il faux d’entrer en E4 la formule =SOMME(B4:D4)/3 ?
Que constate-t-on pour le taux de mortalité global en France et en Inde ? Donner une
explication.
3 – Tailles père/fils
Modéliser
Niveau : terminale
Le statisticien britannique Karl Pearson (1857-1936), dans le cadre de recherches sur
l’hérédité, a établi un fichier de 1 078 couples de mesures de la taille du père et du fils
(adulte). La feuille 1 fournit ces données, exprimées en mètres.
1. Regrouper les tailles des pères en classes d’amplitude 0,01 mètre. Peut-on ajuster à
l’histogramme normalisé des fréquences, correspondant à ces classes, une loi à densité
figurant au programme de terminale ?
2. Même question pour les tailles des fils.
3. La taille moyenne d’un homme d’âge compris entre 20 et 29 ans est actuellement, en
France, de 1,77 m. En utilisant le modèle de la question précédente estimer la probabilité
qu’un jeune homme anglais de ces âges ait une taille supérieure ou égale à 1,77 m à la fin
du XIXe siècle.
ÉCONOMIE ET SOCIAL
4 – Indicateurs de pauvreté
Niveau : terminale
La feuille de calcul suivante permet d’étudier certains indicateurs
de la pauvreté en France (source INSEE).
Calculer
Communiquer
4
1. Le seuil de pauvreté correspond ici à 60% du niveau de vie médian mensuel de la
population. Quelle formule peut-on entrer en B4 puis recopier vers la droite pour obtenir la
ligne 4 ?
2. Interpréter l’information selon laquelle le niveau de vie médian en France en 2010 est de
1 606 € par mois et le seuil de pauvreté de 964 € par mois.
3. Une personne pauvre a un niveau de vie inférieur au seuil de pauvreté. Que signifie
l’information selon laquelle en 2010 le niveau de vie médian des personnes pauvres en
France est de 781 € par mois ?
4. Les cellules de la ligne 6 sont au format pourcentage.
On a entré en B6 la formule =(B4-B5)/B4 qui a été recopiée vers la droite.
À quoi correspond 18,8% relativement à 744 € et à 916 € ?
Comment peut-on définir « l’intensité de la pauvreté », exprimée en pourcentage ?
5. Les cellules de la ligne 8 sont au format pourcentage.
Quelle formule peut-on entrer en C8, puis recopier vers la droite, pour compléter la ligne
8?
6. Quelle formule permet-elle l’affichage du résultat présent en B9 ?
7. Justifier la formule =(1+B9)^(1/5)-1 entrée en B10.
Comparer le résultat affiché en B10 avec la moyenne des 5 pourcentages de la ligne 8.
5 – Évolution du chômage
Niveau : troisième - seconde
Représenter
Calculer
Communiquer
5
Le fichier correspondant fournit le nombre trimestriel de chômeurs (au sens du bureau
international du travail) en France de 1975 à 2012 (on peut trouver ces données,
actualisées, à l’adresse suivante :
http://www.insee.fr/fr/themes/indicateur.asp?id=14&type=1 ).
1. a. Choisir un type de graphique permettant d’illustrer l’évolution du chômage, puis le
réaliser.
b. Commenter le graphique obtenu.
2. Calculer des résumés numériques adaptés.
3. Le nombre de chômeurs au 4e trimestre 2012 est environ 2 944 000. En utilisant les
indicateurs précédents, situer cette valeur par rapport à celles de la période 1975 à 2012.
CLIMAT – DÉVELOPPEMENT DURABLE
6 – Normales de saison
Niveau : troisième - seconde - première
Représenter
Calculer
Communiquer
(D’après une activité de l’IREM de Grenoble.)
Une question fréquemment posée est de savoir si des données météorologiques récentes
sont conformes aux « normales saisonnières ». On s’intéresse ici à la moyenne mensuelle
des températures minimales observées dans une ville de France. On peut télécharger sur le
site dédié plusieurs fichiers de données. D’autres villes, ou des données actualisées, sont
disponibles sur le site http://eca.knmi.nl/indicesextremes (série « TN »).
Pour une station météorologique donnée, les « normales saisonnières » d’une grandeur sont
les moyennes calculées sur une période de 30 ans. Depuis 2012, Météo France considère la
période 1981-2010.
1. Caractériser la période de référence 1981-2010 en déterminant des indicateurs de
tendance centrale et de dispersion. Présenter les résultats sous une forme graphique
adaptée.
2. Comparer l’année 2012 (ou la dernière année dont on possède les données) aux
« normales saisonnières ». Argumenter votre présentation.
6
7 – Production éolienne
Niveau : troisième - seconde
Représenter
Calculer
Communiquer
Ouvrir le fichier fournissant la capacité de production éolienne
de 76 pays de 2001 à 2013 (Source : http://www.thewindpower.net/).
Évolution de la production en Europe et en Asie
1. À l’aide d’un filtre, représenter sur un même graphique l’évolution de la production
éolienne totale de l’Europe et celle de la production totale de l’Asie (choisir un type de
graphique adapté).
2. Comparer l’évolution de la production éolienne en Europe et en Asie.
er
B. Capacités de production au 1 janvier 2013
1. Représenter graphiquement les capacités de production de tous les pays au 1er janvier
2013, dans l’ordre décroissant des productions. Qu’observe-t-on ?
2. Déterminer la moyenne et la médiane des capacités de production de tous les pays au 1er
janvier 2013. Comment expliquer que la moyenne et la médiane sont très différents ?
Lequel de ces indicateurs vous semble-t-il le plus adapté pour résumer cette série ?
3. Situer la capacité de production française au 1er janvier 2013 par rapport aux autres pays
en vous fondant sur des indicateurs statistiques.
7
8 – Old Faithful
Modéliser
Niveau : terminale
Le geyser Old Faithful est situé dans le parc Yellowstone aux États-Unis. Son nom signifie
« vieux fidèle » en raison de la régularité de ses éruptions. Les données statistiques
permettent d’étudier cette « fidélité ». La feuille 3 fournit la durée entre le début de chaque
éruption, exprimée en minutes, pour les 5 699 éruptions de l’année 2010, ainsi que la durée
moyenne journalière entre éruptions pour chacun des 365 jours de l’année.
1. Regrouper les 5 699 durées entre éruptions en classes d’amplitude 4 minutes. Peut-on
ajuster à l’histogramme normalisé des fréquences, correspondant à ces classes, une loi à
densité figurant au programme de terminale ?
2. Regrouper les 365 durées moyennes journalières entre éruptions en classes d’amplitude
une minute. Peut-on ajuster à l’histogramme normalisé des fréquences, correspondant à ces
classes, une loi à densité figurant au programme de terminale ?
SOCIÉTÉ
9 – Coupes du monde de football
Niveau : seconde
Représenter
Calculer
Communiquer
Source : http://www.footforever.com/CM/Statistiques_CM/statistiques_sta_cm.php
8
Ouvrir le fichier contenant tous les scores des coupes du monde de football de 1930 à 2010.
A. L’ensemble des coupes du monde
1. Calculer en colonne I le nombre de buts marqués par match (hors tirs au but).
2. Quel est le nombre minimal de buts marqués par match ? Le nombre maximal ? Le
nombre moyen ?
3. a. Combien de matchs ont été joués ?
b. Quel est la fréquence des matchs où ont été marqués au moins cinq buts ?
4. Pour chaque nombre de buts par match possible, calculer l’effectif correspondant puis
représenter la série obtenue.
B. Comparaison de deux périodes
On souhaite comparer la période 1950-1966 à la période 1994-2010.
1. Représenter les données comme sur l’image d’écran ci-dessous.
Que nous montre ce graphique ?
2. Déterminer à l’aide du tableur, pour chaque période, la moyenne du nombre de buts
marqués par match, la médiane, le premier et le troisième quartile. Comparer les résultats.
10 – Sondages politiques
Niveau : seconde.
A. Étude des sondages Gallup
Ouvrir le fichier correspondant.
Modéliser (simuler)
Calculer
Communiquer
(critiquer)
9
La feuille 1 indique, pour chaque président élu aux États-Unis depuis 1936 jusqu’en 2012,
la proportion p en sa faveur le jour du vote et la proportion f prévue par le sondage Gallup
avant l’élection (source http://www.gallup.com/).
1. Donner les deux années où l’écart entre le sondage et le résultat du vote a été le plus
grand.
2. Pour les quatre premiers sondages (1936 à 1948), Gallup n’utilisait pas de tirage
aléatoire, mais la méthode des « quotas », abandonnée depuis 1952 au profit d’échantillons
aléatoires.
Montrer que la moyenne des écarts de 1952 à 2012 est plus de deux fois inférieure à celle
des années de 1936 à 1948. Que peut-on en conclure pour la méthode des échantillons
aléatoires ?
B. Intervalles de confiance de p
1. On sait que si p est la proportion d’opinions favorables à Barack Obama dans la
population, alors un sondage aléatoire de taille 1000 fournit une fréquence f d’opinions
favorables qui appartient, dans au moins 95% des cas, à l’intervalle de fluctuation
I=[p– 1
; p + 1 ].
1 000
1 000
Montrer que f ∈ I revient à dire que p appartient à J = [ f –
1
1 000
; f+
1
].
1 000
J est appelé intervalle de confiance au niveau 0,95 de p.
2. La feuille 2 du fichier simule des sondages de taille 1 000 le jour de l’élection de Barak
Obama, avec p = 0,502.
Le diagramme ci-contre donne, pour chacune des fréquences d’opinions favorables f issues
des 100 sondages simulés, l’intervalle de confiance associé :
J=[f–
1
1 000
; f+
1
].
1 000
a. A l’aide du diagramme et de la touche F9, indiquer si la fréquence obtenue par Barack
Obama le jour de l’élection est toujours comprise dans l’intervalle de confiance J.
b. Si ce n’est pas le cas, estimer le pourcentage d’intervalles J contenant le résultat de
l’élection.
3. Les intervalles de confiance associés à deux fréquences f et f ’ peuvent-ils être
disjoints ?
En observez-vous ?