Statistiques L5.1. APA et ES TD 4 et 5 (V. Bougault)

Transcription

Statistiques L5.1. APA et ES TD 4 et 5 (V. Bougault)
Statistiques L5.1. APA et ES
TD 4 et 5
(V. Bougault)
Exercice 1: Distribution de l'indice de masse corporelle (IMC) dans la population
française en 2003
IMC = poids/(taille)²
Le poids est en kilos et la taille en mètres
Champ : individus de 18 à 65 ans, résidant en France métropolitaine.
Source : enquête Santé 2002-2003, Insee.
1)- Que pouvez-vous dire de la moyenne et de l'écart-type de l'IMC des femmes par rapport à
ceux des hommes?
La moyenne est différente, plus basse chez les femmes mais l'écart-type est l emême.
2)- Est-ce une distribution dite « normale »? pourquoi?
Oui. La courbe est en cloche.
LA DISTRIBUTION NORMALE (révisions)
Aires sous la courbe et probabilités
Les probabilités qu'une variable prenne une valeur entre a et b est égale à l'aire sous la
courbe entre les droites verticales élevées aux points a et b.
Supposons que la distribution des scores de Quotient intellectuel (QI) soit normale avec une
moyenne µ égale à 100 et un écart-type ET égal à 15.
La probabilité qu'une personne choisie au hasard ait un QI situé entre 115 et 130 est donnée par
l'aire grise de la figure.
Pour déterminer l'aire sous la courbe normale pour un intervalle donné, on utilise une table d'aires
(il serait trop long de calculer l'intégrale). Évidemment, on ne peut construire de table pour chaque
courbe normale (selon µ et ET), mais on peut en construire une pour la courbe normale centrée
réduite i.e. Avec µ =0 et ET=1 et rendre comparable, par changement d'échelle, toute distribution
normale à cette distribution de référence.
Normalisation
= Calcul du Z score = (x- µ)/ΕΤ
Dans l'exemple donné,
QI=115
QI=130
→
→
Z = (115-100)/15 = 1
Z = (130-100)/15 = 2
Les valeurs 115 et 130 se situent respectivement à 1 et 2 ET de la moyenne.
Utilisation de la table
La table de l'annexe 1 donne l'aire de la courbe normale centrée réduite pour la zone indiquée en
gris dans la figure.
La première colonne donne les valeurs de z à une décimale et la première ligne indique la seconde
décimale.
Exemple: si z= 1,24; P (Z ∠ 1,24 = 0,8925)
Calcul des probabilités de la distribution normale
1- Calcul de la valeur de Z pour chaque borne de l'intervalle
2- Recherche dans la table de l'aire qui correspond à chaque valeur de Z
Dans notre exemple,
Quelle est la probabilité qu'une personne ait un QI entre 100 et 115?
QI = 100 (µ)
→
Z=0 P(X ∠100) = 0,5000
QI = 115
→
Z=1 P(X ∠115) = 0,8413
P(100∠X∠115) = P(0∠X∠1) = O,8413-0,5 = 0,3413
La probabilité qu'une personne ait un QI compris entre 100 et 115 est de 34,13%.
Quelle est la probabilité qu'une personne ait un QI entre 110 et 120?
QI = 110
→
Z=0,67
P(X∠110) = 0,7486
QI = 120
→
Z=1,33
P(X∠120) = 0,9082
P(110∠X∠120) = P(0,67∠X∠1,33) = O,9082-0,7486 = 0,1596
La probabilité qu'une personne ait un QI compris entre 110 et 120 est de 15,96%.
Quelle est la probabilité qu'une personne ait un QI entre 85 et 130?
QI = 85
→
Z=-1 P(X∠85) = 0,8413
QI = 130
→
Z=2 P(X∠130) = 0,9772
P(85∠X∠130) = P(-1∠X∠2) = O,9772-(1-0,8413)= 0,8185
La probabilité qu'une personne ait un QI compris entre 85 et 130 est de 81,85%.
Quelle est la probabilité qu'une personne ait un QI de plus de 115?
QI = 115
→
Z=1 P(X∠115) = 0,8413
P(X>115) = P(X>115) = 1-0,8413 = 0,1587
La probabilité qu'une personne ait un QI compris entre 85 et 130 est de 15,87%.
Trouver une valeur pour une probabilité donnée
Quelle valeur de QI délimite le 5% des scores les plus élevés de la population?
1- Identification du Z score correspondant au pourcentage recherché
2- calcul de la valeur de x correspondante par la formule x = Z*ET + µ
Exemple: Dans la table le Z identifiant les 5% supérieurs donc les 95% inférieurs est Z = 1,645
x = 1,645 * 15 + 100 = 124,675
La valeur délimitant les 5% des scores les plus élevés de la population est 125.
Exercice 2
La taille moyenne de joueurs de volley-ball a été mesurée lors de leur participation aux World
League 1999 et 2000. Elle était de 197 cm, avec un écart-type de 7 cm. On admet que la distribution
suit une loi normale.
A- Au dessus de quelle valeur de taille se situent les 2,5% de joueurs les plus grands ?
97,5% des joueurs se trouvent en-dessous de ce point. La table de la loi normale centrée réduite
nous donne un Z=1,96. Donc x = 1,96*7+197 = 210,72 cm.
Les 2,5% des joueurs lee plus grands se situent au-dessus de 210,7cm.
B- Dans une équipe X, le joueur le plus petit mesure 191 cm. L’entraîneur décide de ne pas
recruter de joueurs plus petits. Quelle proportion de la population exclue-t-il par ce critère ?
Le Z score de 191 cm est: Z=(191-197)/7 = -0,8571
Dans la table de la loi normale centrée réduite, un Z score de 0,86 nous donne une proportion de
0,8023
Selon la table la proportion qu'un jouer soit plus petit que 191cm est de 1-0,8023 = 0,1977
Il exclue 19,8% de la population en utilisant ce critère.