Statistiques L5.1. APA et ES TD 4 et 5 (V. Bougault)
Transcription
Statistiques L5.1. APA et ES TD 4 et 5 (V. Bougault)
Statistiques L5.1. APA et ES TD 4 et 5 (V. Bougault) Exercice 1: Distribution de l'indice de masse corporelle (IMC) dans la population française en 2003 IMC = poids/(taille)² Le poids est en kilos et la taille en mètres Champ : individus de 18 à 65 ans, résidant en France métropolitaine. Source : enquête Santé 2002-2003, Insee. 1)- Que pouvez-vous dire de la moyenne et de l'écart-type de l'IMC des femmes par rapport à ceux des hommes? La moyenne est différente, plus basse chez les femmes mais l'écart-type est l emême. 2)- Est-ce une distribution dite « normale »? pourquoi? Oui. La courbe est en cloche. LA DISTRIBUTION NORMALE (révisions) Aires sous la courbe et probabilités Les probabilités qu'une variable prenne une valeur entre a et b est égale à l'aire sous la courbe entre les droites verticales élevées aux points a et b. Supposons que la distribution des scores de Quotient intellectuel (QI) soit normale avec une moyenne µ égale à 100 et un écart-type ET égal à 15. La probabilité qu'une personne choisie au hasard ait un QI situé entre 115 et 130 est donnée par l'aire grise de la figure. Pour déterminer l'aire sous la courbe normale pour un intervalle donné, on utilise une table d'aires (il serait trop long de calculer l'intégrale). Évidemment, on ne peut construire de table pour chaque courbe normale (selon µ et ET), mais on peut en construire une pour la courbe normale centrée réduite i.e. Avec µ =0 et ET=1 et rendre comparable, par changement d'échelle, toute distribution normale à cette distribution de référence. Normalisation = Calcul du Z score = (x- µ)/ΕΤ Dans l'exemple donné, QI=115 QI=130 → → Z = (115-100)/15 = 1 Z = (130-100)/15 = 2 Les valeurs 115 et 130 se situent respectivement à 1 et 2 ET de la moyenne. Utilisation de la table La table de l'annexe 1 donne l'aire de la courbe normale centrée réduite pour la zone indiquée en gris dans la figure. La première colonne donne les valeurs de z à une décimale et la première ligne indique la seconde décimale. Exemple: si z= 1,24; P (Z ∠ 1,24 = 0,8925) Calcul des probabilités de la distribution normale 1- Calcul de la valeur de Z pour chaque borne de l'intervalle 2- Recherche dans la table de l'aire qui correspond à chaque valeur de Z Dans notre exemple, Quelle est la probabilité qu'une personne ait un QI entre 100 et 115? QI = 100 (µ) → Z=0 P(X ∠100) = 0,5000 QI = 115 → Z=1 P(X ∠115) = 0,8413 P(100∠X∠115) = P(0∠X∠1) = O,8413-0,5 = 0,3413 La probabilité qu'une personne ait un QI compris entre 100 et 115 est de 34,13%. Quelle est la probabilité qu'une personne ait un QI entre 110 et 120? QI = 110 → Z=0,67 P(X∠110) = 0,7486 QI = 120 → Z=1,33 P(X∠120) = 0,9082 P(110∠X∠120) = P(0,67∠X∠1,33) = O,9082-0,7486 = 0,1596 La probabilité qu'une personne ait un QI compris entre 110 et 120 est de 15,96%. Quelle est la probabilité qu'une personne ait un QI entre 85 et 130? QI = 85 → Z=-1 P(X∠85) = 0,8413 QI = 130 → Z=2 P(X∠130) = 0,9772 P(85∠X∠130) = P(-1∠X∠2) = O,9772-(1-0,8413)= 0,8185 La probabilité qu'une personne ait un QI compris entre 85 et 130 est de 81,85%. Quelle est la probabilité qu'une personne ait un QI de plus de 115? QI = 115 → Z=1 P(X∠115) = 0,8413 P(X>115) = P(X>115) = 1-0,8413 = 0,1587 La probabilité qu'une personne ait un QI compris entre 85 et 130 est de 15,87%. Trouver une valeur pour une probabilité donnée Quelle valeur de QI délimite le 5% des scores les plus élevés de la population? 1- Identification du Z score correspondant au pourcentage recherché 2- calcul de la valeur de x correspondante par la formule x = Z*ET + µ Exemple: Dans la table le Z identifiant les 5% supérieurs donc les 95% inférieurs est Z = 1,645 x = 1,645 * 15 + 100 = 124,675 La valeur délimitant les 5% des scores les plus élevés de la population est 125. Exercice 2 La taille moyenne de joueurs de volley-ball a été mesurée lors de leur participation aux World League 1999 et 2000. Elle était de 197 cm, avec un écart-type de 7 cm. On admet que la distribution suit une loi normale. A- Au dessus de quelle valeur de taille se situent les 2,5% de joueurs les plus grands ? 97,5% des joueurs se trouvent en-dessous de ce point. La table de la loi normale centrée réduite nous donne un Z=1,96. Donc x = 1,96*7+197 = 210,72 cm. Les 2,5% des joueurs lee plus grands se situent au-dessus de 210,7cm. B- Dans une équipe X, le joueur le plus petit mesure 191 cm. L’entraîneur décide de ne pas recruter de joueurs plus petits. Quelle proportion de la population exclue-t-il par ce critère ? Le Z score de 191 cm est: Z=(191-197)/7 = -0,8571 Dans la table de la loi normale centrée réduite, un Z score de 0,86 nous donne une proportion de 0,8023 Selon la table la proportion qu'un jouer soit plus petit que 191cm est de 1-0,8023 = 0,1977 Il exclue 19,8% de la population en utilisant ce critère.