énoncés d`exercices - Société Française de Statistique
Transcription
énoncés d`exercices - Société Française de Statistique
1 ACCÈS ET USAGE DE FICHIERS DE DONNÉES STATISTIQUES RÉELLES Des exemples d’exploitation possible en classe Atelier APMEP P1-17 – Marseille 20 octobre 2013 SANTÉ 1 – Consommation d’antibiotiques Niveau : 1ère technologique - troisième (autre rédaction) Représenter Calculer La surconsommation d’antibiotiques favorise la résistance des bactéries. C’est la raison pour laquelle on cherche à en maîtriser la consommation. Le fichier « antibiotiques.xls » fournit les données pour la consommation d’antibiotiques en France de 1999 à 2012 (source Ansm - Agence nationale de sécurité des médicaments et des produits de santé : http://ansm.sante.fr/Dossiers-thematiques/Antibiotiques/Bienutiliser-les-antibiotiques/(offset)/0 ). 2 La consommation annuelle est exprimée en doses définies journalières pour 1000 habitants. Les cellules des colonnes C, D, F et G sont au Format Pourcentage avec 2 décimales. 1. À l’aide du tableur, représenter graphiquement l’évolution de la consommation d’antibiotique en ville et à l’hôpital sur la période 1999-2012. Appelez le professeur pour analyser le graphique produit. 2. Compléter la feuille de calcul en déterminant, pour la consommation en ville et la consommation à l’hôpital, le pourcentage d’évolution par rapport à l’année précédente et la part relative, en pourcentage, de chacun des deux types de consommation. 3. Où la consommation d’antibiotique a-t-elle le plus baissé entre 1999 et 2012 ? Appelez le professeur pour présenter vos résultats. 2 – Mortalité en France et ailleurs Niveau : 2nde - 1ère technologique Le fichier mortalite.xls fournit le nombre annuel de décès en France métropolitaine de 1900 à 2011 (source INSEE et état civil, données disponibles sur http://www.insee.fr/). Représenter Communiquer (critiquer) A. Nombre de décès en France métropolitaine 1. a) Représenter graphiquement, à l’aide du tableur, l’évolution du nombre de décès de 1900 à 2011. b) Interpréter les deux « pics » de mortalité observés. c) Quelle est la « tendance » globale de l’évolution sur la période de 1900 à 2011 ? 2. a) Représenter graphiquement, à l’aide du tableur, l’évolution du nombre de décès de 1990 à 2011. b) L’été 2003 est celui de la « canicule ». Qu’observe-t-on sur le graphique ? c) Quelle est la « tendance » globale de l’évolution sur la période de 1990 à 2011 ? 3. Calculer en colonne C l’évolution, exprimée en pourcentage, du nombre de décès par rapport à l’année précédente. Afficher les pourcentages avec une décimale. 4. a) Quelle est l’évolution du nombre de décès en 2003 par rapport à 2002 ? b) Quelle est l’évolution du nombre de décès en 2004 par rapport à 2003 ? Donner une explication. c) L’augmentation de la mortalité en 2005 est-elle due à un nombre important de décès cette année là (comparer aux années 1999-2002) ? Comment peut-on l’expliquer ? B. Mortalité en France et en Inde D’après les estimations de l’INED (institut national des études démographiques), la mortalité en France (environ 8,6 décès pour mille habitants) est supérieure à la mortalité en Inde (environ 8 pour mille) alors qu’à tout âge le taux de mortalité en France est bien inférieur à celui qui existe en Inde ! 3 Pour comprendre ce phénomène, saisir sur une feuille de calcul le tableau ci-dessous (les cellules de B2 à E3 sont au format pourcentage avec 0 décimale). 1. Quelle formule peut-on entrer en E2 puis recopier vers le bas en E3 (l’affichage doit-être 100%) ? Comparer la répartition des populations, selon les tranches d’âge, en France et en Inde. 2. Pour calculer le taux de mortalité global, entrer en E4 la formule : =B4*B2+C4*C2+D4*D2 puis la recopier vers le bas en E5. Pourquoi serait-il faux d’entrer en E4 la formule =SOMME(B4:D4)/3 ? Que constate-t-on pour le taux de mortalité global en France et en Inde ? Donner une explication. 3 – Tailles père/fils Modéliser Niveau : terminale Le statisticien britannique Karl Pearson (1857-1936), dans le cadre de recherches sur l’hérédité, a établi un fichier de 1 078 couples de mesures de la taille du père et du fils (adulte). La feuille 1 fournit ces données, exprimées en mètres. 1. Regrouper les tailles des pères en classes d’amplitude 0,01 mètre. Peut-on ajuster à l’histogramme normalisé des fréquences, correspondant à ces classes, une loi à densité figurant au programme de terminale ? 2. Même question pour les tailles des fils. 3. La taille moyenne d’un homme d’âge compris entre 20 et 29 ans est actuellement, en France, de 1,77 m. En utilisant le modèle de la question précédente estimer la probabilité qu’un jeune homme anglais de ces âges ait une taille supérieure ou égale à 1,77 m à la fin du XIXe siècle. ÉCONOMIE ET SOCIAL 4 – Indicateurs de pauvreté Niveau : terminale La feuille de calcul suivante permet d’étudier certains indicateurs de la pauvreté en France (source INSEE). Calculer Communiquer 4 1. Le seuil de pauvreté correspond ici à 60% du niveau de vie médian mensuel de la population. Quelle formule peut-on entrer en B4 puis recopier vers la droite pour obtenir la ligne 4 ? 2. Interpréter l’information selon laquelle le niveau de vie médian en France en 2010 est de 1 606 € par mois et le seuil de pauvreté de 964 € par mois. 3. Une personne pauvre a un niveau de vie inférieur au seuil de pauvreté. Que signifie l’information selon laquelle en 2010 le niveau de vie médian des personnes pauvres en France est de 781 € par mois ? 4. Les cellules de la ligne 6 sont au format pourcentage. On a entré en B6 la formule =(B4-B5)/B4 qui a été recopiée vers la droite. À quoi correspond 18,8% relativement à 744 € et à 916 € ? Comment peut-on définir « l’intensité de la pauvreté », exprimée en pourcentage ? 5. Les cellules de la ligne 8 sont au format pourcentage. Quelle formule peut-on entrer en C8, puis recopier vers la droite, pour compléter la ligne 8? 6. Quelle formule permet-elle l’affichage du résultat présent en B9 ? 7. Justifier la formule =(1+B9)^(1/5)-1 entrée en B10. Comparer le résultat affiché en B10 avec la moyenne des 5 pourcentages de la ligne 8. 5 – Évolution du chômage Niveau : troisième - seconde Représenter Calculer Communiquer 5 Le fichier correspondant fournit le nombre trimestriel de chômeurs (au sens du bureau international du travail) en France de 1975 à 2012 (on peut trouver ces données, actualisées, à l’adresse suivante : http://www.insee.fr/fr/themes/indicateur.asp?id=14&type=1 ). 1. a. Choisir un type de graphique permettant d’illustrer l’évolution du chômage, puis le réaliser. b. Commenter le graphique obtenu. 2. Calculer des résumés numériques adaptés. 3. Le nombre de chômeurs au 4e trimestre 2012 est environ 2 944 000. En utilisant les indicateurs précédents, situer cette valeur par rapport à celles de la période 1975 à 2012. CLIMAT – DÉVELOPPEMENT DURABLE 6 – Normales de saison Niveau : troisième - seconde - première Représenter Calculer Communiquer (D’après une activité de l’IREM de Grenoble.) Une question fréquemment posée est de savoir si des données météorologiques récentes sont conformes aux « normales saisonnières ». On s’intéresse ici à la moyenne mensuelle des températures minimales observées dans une ville de France. On peut télécharger sur le site dédié plusieurs fichiers de données. D’autres villes, ou des données actualisées, sont disponibles sur le site http://eca.knmi.nl/indicesextremes (série « TN »). Pour une station météorologique donnée, les « normales saisonnières » d’une grandeur sont les moyennes calculées sur une période de 30 ans. Depuis 2012, Météo France considère la période 1981-2010. 1. Caractériser la période de référence 1981-2010 en déterminant des indicateurs de tendance centrale et de dispersion. Présenter les résultats sous une forme graphique adaptée. 2. Comparer l’année 2012 (ou la dernière année dont on possède les données) aux « normales saisonnières ». Argumenter votre présentation. 6 7 – Production éolienne Niveau : troisième - seconde Représenter Calculer Communiquer Ouvrir le fichier fournissant la capacité de production éolienne de 76 pays de 2001 à 2013 (Source : http://www.thewindpower.net/). Évolution de la production en Europe et en Asie 1. À l’aide d’un filtre, représenter sur un même graphique l’évolution de la production éolienne totale de l’Europe et celle de la production totale de l’Asie (choisir un type de graphique adapté). 2. Comparer l’évolution de la production éolienne en Europe et en Asie. er B. Capacités de production au 1 janvier 2013 1. Représenter graphiquement les capacités de production de tous les pays au 1er janvier 2013, dans l’ordre décroissant des productions. Qu’observe-t-on ? 2. Déterminer la moyenne et la médiane des capacités de production de tous les pays au 1er janvier 2013. Comment expliquer que la moyenne et la médiane sont très différents ? Lequel de ces indicateurs vous semble-t-il le plus adapté pour résumer cette série ? 3. Situer la capacité de production française au 1er janvier 2013 par rapport aux autres pays en vous fondant sur des indicateurs statistiques. 7 8 – Old Faithful Modéliser Niveau : terminale Le geyser Old Faithful est situé dans le parc Yellowstone aux États-Unis. Son nom signifie « vieux fidèle » en raison de la régularité de ses éruptions. Les données statistiques permettent d’étudier cette « fidélité ». La feuille 3 fournit la durée entre le début de chaque éruption, exprimée en minutes, pour les 5 699 éruptions de l’année 2010, ainsi que la durée moyenne journalière entre éruptions pour chacun des 365 jours de l’année. 1. Regrouper les 5 699 durées entre éruptions en classes d’amplitude 4 minutes. Peut-on ajuster à l’histogramme normalisé des fréquences, correspondant à ces classes, une loi à densité figurant au programme de terminale ? 2. Regrouper les 365 durées moyennes journalières entre éruptions en classes d’amplitude une minute. Peut-on ajuster à l’histogramme normalisé des fréquences, correspondant à ces classes, une loi à densité figurant au programme de terminale ? SOCIÉTÉ 9 – Coupes du monde de football Niveau : seconde Représenter Calculer Communiquer Source : http://www.footforever.com/CM/Statistiques_CM/statistiques_sta_cm.php 8 Ouvrir le fichier contenant tous les scores des coupes du monde de football de 1930 à 2010. A. L’ensemble des coupes du monde 1. Calculer en colonne I le nombre de buts marqués par match (hors tirs au but). 2. Quel est le nombre minimal de buts marqués par match ? Le nombre maximal ? Le nombre moyen ? 3. a. Combien de matchs ont été joués ? b. Quel est la fréquence des matchs où ont été marqués au moins cinq buts ? 4. Pour chaque nombre de buts par match possible, calculer l’effectif correspondant puis représenter la série obtenue. B. Comparaison de deux périodes On souhaite comparer la période 1950-1966 à la période 1994-2010. 1. Représenter les données comme sur l’image d’écran ci-dessous. Que nous montre ce graphique ? 2. Déterminer à l’aide du tableur, pour chaque période, la moyenne du nombre de buts marqués par match, la médiane, le premier et le troisième quartile. Comparer les résultats. 10 – Sondages politiques Niveau : seconde. A. Étude des sondages Gallup Ouvrir le fichier correspondant. Modéliser (simuler) Calculer Communiquer (critiquer) 9 La feuille 1 indique, pour chaque président élu aux États-Unis depuis 1936 jusqu’en 2012, la proportion p en sa faveur le jour du vote et la proportion f prévue par le sondage Gallup avant l’élection (source http://www.gallup.com/). 1. Donner les deux années où l’écart entre le sondage et le résultat du vote a été le plus grand. 2. Pour les quatre premiers sondages (1936 à 1948), Gallup n’utilisait pas de tirage aléatoire, mais la méthode des « quotas », abandonnée depuis 1952 au profit d’échantillons aléatoires. Montrer que la moyenne des écarts de 1952 à 2012 est plus de deux fois inférieure à celle des années de 1936 à 1948. Que peut-on en conclure pour la méthode des échantillons aléatoires ? B. Intervalles de confiance de p 1. On sait que si p est la proportion d’opinions favorables à Barack Obama dans la population, alors un sondage aléatoire de taille 1000 fournit une fréquence f d’opinions favorables qui appartient, dans au moins 95% des cas, à l’intervalle de fluctuation I=[p– 1 ; p + 1 ]. 1 000 1 000 Montrer que f ∈ I revient à dire que p appartient à J = [ f – 1 1 000 ; f+ 1 ]. 1 000 J est appelé intervalle de confiance au niveau 0,95 de p. 2. La feuille 2 du fichier simule des sondages de taille 1 000 le jour de l’élection de Barak Obama, avec p = 0,502. Le diagramme ci-contre donne, pour chacune des fréquences d’opinions favorables f issues des 100 sondages simulés, l’intervalle de confiance associé : J=[f– 1 1 000 ; f+ 1 ]. 1 000 a. A l’aide du diagramme et de la touche F9, indiquer si la fréquence obtenue par Barack Obama le jour de l’élection est toujours comprise dans l’intervalle de confiance J. b. Si ce n’est pas le cas, estimer le pourcentage d’intervalles J contenant le résultat de l’élection. 3. Les intervalles de confiance associés à deux fréquences f et f ’ peuvent-ils être disjoints ? En observez-vous ?