Jour de naissance
Transcription
Jour de naissance
Jour de naissance Document présenté par: Pascale Balland 108 avenue du Général de Gaulle 94 700 Maisons Alfort Professeur de mathématiques au Collège Pierre Brossolette 154 bis avenue Pierre Brossolette 94 170 Le Perreux Sur Marne tel: 01 48 71 13 63 fax 01 48 71 00 63 RNE 0940788W avec tous mes remerciements à Mme Trinquet pour son aide précieuse. 1/12 Jour de naissance Présentation et objectifs : Ce travail est un complément sur la notion de hasard et de traitement de données statistiques. Il s'inscrit dans le programme de 4ème de mathématiques paragraphe 1.3 « traitements de données » et 1.1 « utilisation de la proportionnalité », ainsi que du B.2.I . Problématique : Le jour de naissance (lundi, mardi, mercredi, jeudi, vendredi, samedi ou dimanche) dans la semaine est-il dû au hasard? Compétences travaillées : Cette étude a permis de travailler sur les savoir-faire suivants : 1. notions de statistiques ◦ Etudier le caractère d'une population réelle : effectuer un sondage, récolter, ordonner des données en vue de leur traitement ; s'interroger sur la taille de l'échantillon ; ◦ Utiliser des outils statistiques : fréquence, construire un tableau de données, un graphique, intérêt des différents types de graphiques. 2. notion de probabilités : le hasard et l'ordre qui en découle ; évolution de la fréquence d'une série de données aléatoires en fonction du nombre. 3. B2I : ◦ Utilisation et intérêt du tableur (openoffice. Org Calc) pour compiler des données ; créer, modifier et insérer une formule dans une feuille de calcul ; créer un graphique à partir des données d'une feuille de calcul. ◦ Envoyer et recevoir un fichier joint sur messagerie. Modalité de mise en œuvre : Cette activité s’est déroulée durant des séances d'atelier, c’est à dire avec des groupes d’une quinzaine d’élèves, ce qui a permis de favoriser la prise en main d'un tableur en salle informatique ainsi que l'échange entre élèves. Déroulement : J'ai demandé aux élèves d'interroger leur entourage sur leur date de naissance. Suite à une remarque de certains, il m'a fallu insister sur le fait que nous voulions faire une véritable étude, et que des données inventées fausseraient sûrement le résultat et ne nous permettraient pas de tirer des conclusions intéressantes. Nous avons discuté de « l'échantillon » à sonder, et nous avons convenu qu'il devait comporter des personnes de tous les âges. Ils ont donc interrogé chacun 10 personnes (parents, oncles et tantes, grands-parents, frères et sœurs, cousins et cousines). 2/12 1ère partie : traitement des données (annexe 1, première et deuxième parties) Le premier travail a été de déterminer le jour de naissance dans la semaine à partir de la date de naissance. Après l'inévitable « c'est facile madame » et des ébauches de calculs compliqués, j'ai présenté aux élèves une formule fournie par openoffice.org calc : « =JOURSEM() »; cette dernière renvoie un chiffre en fonction de la date de naissance insérée (1 pour dimanche, 2 pour lundi ...). Ils ont alors élaboré un tableau à partir de leur série de donnée (voir annexe 1). Remarque : lorsque nous avons voulu trier par ordre décroissant la colonne B, nous nous sommes aperçus que rien ne se passait. Cela m'a permis de leur expliquer que le tri se faisait sur la formule insérée et non sur le chiffre (le logiciel « voit » les formules). Lors de la mise en commun de leurs observations, ils se sont rendu compte que chacune de leur série était d'effectif trop faible pour en tirer des conclusions. Ils ont alors mis leurs données en commun, en vérifiant que celles-ci ne se recoupaient pas (j'avais pris soin pour cela de ne pas leur demander les dates de naissance parmi les amis du collège). Lors de la lecture du diagramme circulaire, les élèves se sont aperçus que la répartition dans la semaine n'était pas régulière. Deux avis sont alors apparus: 1. Puisque la répartition n'est pas régulière, c'est que les jours de naissance ne sont pas le fait du hasard. En effet, ils attendaient une répartition à peu près identique tous les jours de la semaine. 2. C'est justement parce qu'on ne choisit pas le jour de sa naissance que cette répartition n'est pas régulière dans la semaine. La suite du travail a donc consisté en deux points: 1. D'une part, interpréter les résultats obtenus (émettre des hypothèses pouvant les expliquer, élaborer une stratégie pour vérifier ces hypothèses). 2. D'autre part, étudier le comportement d'une série de données aléatoires modélisant le problème. 3/12 2ème partie: interprétation des résultats à l'aide d'un questionnaire (annexe 2 et 3) Pour expliquer le déséquilibre dans la répartition des données, les élèves ont été amenés à émettre l'hypothèse que les naissances devaient être parfois « programmées ». Je leur ai alors donné à lire un extrait d’un compte rendu d’une conférence du Collège national des gynécologues et obstétriciens français du 30 novembre 1995 publié sur internet (voir annexe 2). Suite à cette lecture, nous nous sommes rendu compte que notre échantillon n'était pas bien choisi: en effet, on ne peut visualiser l'incidence du déclenchement des accouchements sur le jour de naissance qu'à partir de 1970, puisque avant cette date il ne se pratiquait pas ou très peu. D'après l'article, le déclenchement des naissances se faisant de façon plus régulière à partir de 1995, nous avons décidé de trier nos données en considérant d'une part toutes les dates de naissance avant 1970 et d'autre part toutes celles après 1995. A cette occasion, je leur ai montré l'avantage de comparer les données des différents tableaux sous la forme de fréquence, l'effectif total n'étant pas le même ; on peut ainsi répondre plus facilement aux questions u type « dans quel tableau la « part » d'un jour précis est-elle la plus importante ». L'étude du document en annexe 3, résultat du tri effectué à partir de toutes les données récoltées dans trois classes, nous a montré que la répartition des naissances dans la semaine est plus régulière avant 1970 avec une nette diminution de la fréquence des naissances le dimanche après 1995. Cela semble confirmer l'hypothèse émise. 3ème partie: modélisation du problème ( annexe 4 ) En utilisant la fonction « ALEA.ENTRE.BORNES » du tableur, nous avons construit une série de données aléatoires modélisant le problème : une suite de nombres entiers compris entre 1 et 7, le 1 désignant le dimanche, 2 le lundi etc... Dans un premier temps, notre série était de même effectif que la série de données récoltées par sondage. Mais à la lecture des différents résultats (tableau des effectifs et des fréquences ainsi que les diagrammes) nous nous sommes aperçus que la répartition n'était pas plus régulière que celle observée sur les données sondées. Je leur ai alors fourni un fichier légèrement modifié pour qu'ils puissent générer rapidement une nouvelle série aléatoire (touche F9) et observer les différents diagrammes se modifier en conséquence. Nous nous sommes aperçus que la série aléatoire finissait par « bien » se comporter au bout d'un très grand nombre de données, et qu'elle semblait se stabiliser autour d'une fréquence de 0,14 ou 1/7. Ce travail nous a permis de dégager les deux conclusions suivantes: 1. le « paradoxe » du hasard : on observe une certaine régularité dans les données choisies au hasard. 2. celle-ci apparaît lorsqu'on traite un grand nombre de données. 4/12 Conclusions : (extraits de travaux d'élèves en annexe 5) Suite à ce travail, j'ai fait remarqué aux élèves qu'il faut être prudent dans l'interprétation des résultats d'une étude statistique. En effet, nous nous sommes rendu compte que la taille de l'échantillon étudié joue un rôle très important : avec un échantillon trop faible, rien ne nous permet d'affirmer, quelque soit la répartition des valeurs observées, que celle-ci n'est pas le fait du hasard. Etant donné que l'étude s'est faite sur moins de 200 valeurs pour chaque période, on ne peut exclure l'effet du hasard sur la régularité observée avant 1970 tout comme sur l'irrégularité après 1995. On ne peut donc pas affirmer que notre échantillon comporte des naissances programmées malgré l'apparente cohérence des résultats de l'étude avec l'hypothèse émise. Critiques : Le travail de compilation des données a été très fastidieux ; cette phase nous a pris beaucoup de temps et a fait perdre de vue le fil directeur de l'étude à certains enfants. Il faudra réfléchir à une méthode plus efficace pour regrouper toutes les données. J'ai mené ce travail de façon linéaire, comme présenté dans ce document, mais il pourrait être intéressant suite aux conclusions de la 1ère partie de le scinder en deux: – un premier groupe d'élève travaillant sur l'interprétation des résultats. – un deuxième sur la série aléatoire. Chaque groupe pourrait alors présenter les résultats de ses recherches sous la forme souhaitée à l'autre groupe. Objectifs : favoriser les échanges et mettre en place une démarche scientifique de recherche et de remise en question. 5/12 Annexe 1 ETUDE STATISTIQUE Nous avons récolté les dates de naissance de deux populations différentes : des collégiens et des personnes faisant partie de la génération de leur parents ou grands-parents. L'étude portera sur le jour de la semaine de leur naissance (est-ce un mardi, un dimanche...). PREMIERRE PARTIE Exercice préliminaire : trouver le jour de la semaine Ouvre une feuille de calcul open.office.org calc. correspondant à une date précise. Enregistre-la dans le dossier de la classe sous le nom jour de naissance. Dans la case S1 tape 4/01/2010. Dans S2 =JOURSEM(S1). A quel jour de la semaine correspond chaque chiffre? Construire une série statistique à partir des données récoltées en trouvant le jour de la semaine correspondant à chaque date de naissance. Recopie le tableau suivant dans ta feuille de calcul. Etends la formule B2 jusqu'en B14. Complète le tableau avec tes propres données récoltées. Ranger les jours de la semaine par ordre décroissant Sélectionne la colonne B et clique dans la barre d'outils sur l'icône Que constates-tu? Compare avec les données d'un camarade. Le nombre de données récoltées est-il suffisant pour en tirer une conclusion générale? DEUXIEME PARTIE Regroupe dans un même tableau les données de tous tes camarades. Que constates-tu? Le nombre de données récoltées est-il suffisant maintenant pour en tirer une conclusion générale? 6/12 Annexe 2 Questionnaire : I-Etude des données traitées. 1. Observe le tableau et le diagramme de ta classe. Quelles constatations peux-tu faire sur la répartition des jours dans la semaine ? ___________________________________________________________________________ Ceci correspond-il à ce que tu attendais ? Pourquoi ? ___________________________________________________________________________ Qu’est-ce qui pourrait expliquer cela ? ______________________________________________________________________________ 2. Voici l’extrait d’un compte rendu d’une conférence du Collège national des gynécologues et obstétriciens français du 30 novembre 1995 QUELLE EST LA PLACE DU DÉCLENCHEMENT [DES ACCOUCHEMENTS] EN FRANCE ET DANS LE MONDE? En France, de 1972 à 1995, la fréquence des déclenchements a varié de 8,5 à 20%, mais il existe une disparité importante suivant les régions et suivant les établissements. La fréquence des déclenchements pour indications médicales est stable de 1988 à 1994: 11,2%; mais ceux sans indication médicale ont augmenté progressivement de 4,2 à 7,3 %. A l'étranger, dans les années 80, la fréquence était pour: le Danemark, de 12%, la Pologne, de 15 %, la Norvège, de 17,5 %, le Pays de Galles, de 36%,la Finlande, de 17 à 29%, alors qu'elle était de 10,4% en France Sources : http://www.gyneweb.fr/sources/obstetrique/consens.htm Quelle information supplémentaire cet article nous fournit-il ? ___________________________________________________________________________ A partir de quelle date les déclenchements d’accouchement sont-ils devenus plus fréquents ? ________________________________________________________________ Comment modifier en conséquence la façon dont nous avons traité les données ? ___________________________________________________________________________ 3. Dans la cellule B4 du tableau, modifie la formule pour ne prendre en compte que les dates supérieures à 1995 : $N$2 devient $N$63 (seul le n° de la ligne à partir de laquelle on compte les valeurs est modifié). Qu’observes-tu ? ___________________________________________________________ 4. Observe les tableaux qui regroupent les données de trois classes. Quelles remarques peux-tu faire ? 7/12 Annexe 3 8/12 Annexe 4 Etude de données aléatoires. I- Construire une série aléatoire modélisant l'étude Choisir au hasard 100 nombres compris entre 1 et 7. Dans le même fichier, ouvre une nouvelle feuille. Dans la cellule A1 tape =ALEA.ENTRE.BORNES(1;7) Etends cette formule verticalement jusqu'en A100 Compter le nombre de fois où apparaissent les différentes valeurs de1 à 7, et regrouper ces données dans un tableau. Copie le tableau ci-dessous. Dans la cellule D3 tape la formule =NB.SI($A$1:$A$100;D2) Etends cette formule horizontalement. Dans la cellule K3 calcule la somme de D3 à J3. II – Etude des résultats obtenus: Dans le fichier tableur que ton professeur t'a donné, observe les tableaux situés dans la feuille « données aléatoires ». Si tu appuies sur la touche « F9 » de ton clavier (à utiliser avec modération !), tu pourras modifier les données. 1) Comment se comportent les données dans les tableaux 1 et 2 ? __________________________________________________________________________ Appuie sur la touche « F9 » ; les données sont alors recalculées. Qu’observes-tu ? __________________________________________________________________________ Comment devraient-elles se comporter, sachant que le choix des dates se fait entièrement au hasard ? __________________________________________________________________ __________________________________________________________________________ 2) Observe maintenant le tableau 3 et les diagrammes associés ; appuie sur « F9 ».Quelles remarques peux-tu faire ? ______________________________________________ _________________________________________________________________________ 3) Le nombre de données récoltées lors du sondage est-il suffisant pour tirer des conclusions de cette étude? ___________________________________________________________________________ 9/12 10/12 Annexe 5 Extrait 1 Etudes statistique sur les naissances Nous avons effectué l'étude suivante : Dans les tableaux 1 et 2, les données sont peu nombreuses et donc les fréquences sont inégales alors que si l'on choisi environ 4 000 données (aléatoirement) les fréquences sont quasiment les mêmes. Si l'on recalcule toutes les données, moins il y en a et plus les fréquences sont désordonnées, plus il y en a et plus les fréquences sont proches. Donc il faut au moins 4 000 données pour pouvoir conclure une étude statistique sur les jours de naissance. _________________________________________________________________ Extrait 2 I- A partir des tableaux et des diagrammes de 4C, on constate que la répartition des jours de naissances est très irrégulière. Nous nous attendions a des résultats plus réguliers. Il faudrait récolté plus de date de naissances. 11/12 Extrait 3 Résumé des maths atelier D'abord, on a cherché des dates à inscrire puis on les a toutes rangées dans un tableau et on a cherché dans quelle jour il ya avait le plus de naissances, on a fait un graphique et on l'a visualisé. On a regroupé toutes les données des 4eB, des 4eC et des 4eE puis on a fait 3 tableaux pour chercher d'abord la fréquence des naissances avant 1970 puis ensuite après 1995 et pour finir avec toutes les valeurs Répartition après 1995 Répartition avant 1970 dimanche dimanche lundi lundi mardi mardi mercredi mercredi jeudi jeudi vendredi vendredi samedi samedi répartition des naissances dans la semaine dimanche lundi mardi mercredi jeudi vendredi samedi .On remarque que la part du dimanche est plus faible dans le tableau après 1995 que avant 1970 donc cela confirme l'hypothèse que le déclenchement a une inffluence sur le jour de naissance. 12/12