II. Moyenne et écart-type : un outil statistique II. Moyenne et écart
Transcription
II. Moyenne et écart-type : un outil statistique II. Moyenne et écart
II. Moyenne et écart-type : un outil statistique II. Moyenne et écart-type : un outil statistique 2. Un outil pour comparer une valeur à une référence 3. Un outil pour comparer deux valeurs numériques Situation Situation Le score des réussites de Maud à l’évaluation en mathématiques passée en début de sixième est 72 sur 94 items. Maud est-elle bonne en mathématiques ? Le score des réussites de Lucie en mathématiques est 75 sur 94 items. Son score en français est 74 sur 87 items. Lucie est-elle meilleure en mathématiques ou en français ? Traitement Traitement On compare le score de Maud au score national : 68. Le score de Maud est supérieur à la moyenne. On utilise les informations concernant les scores nationaux : -Mathématiques : moyenne = 68 et écart-type = 4 ; -Français : moyenne = 70 et écart-type = 3. Mais la dispersion des scores est un élément à prendre en compte car : On remarque que les scores de Lucie sont bons en mathématiques comme en français, mais quel est le meilleur ? -si 70% des élèves ont des scores compris entre 58 et 78, le score de Maud ne semblera pas exceptionnel ; On calcule les valeurs « centrées et réduites » (les québécois disent les « cotes standards ») : (valeur – moyenne) / écart-type -Mathématiques : (75 – 68) / 4 = +1,75 -Français: (74 – 70) / 3 ~ +1,3 -si 70% des élèves ont des scores compris entre 64 et 72 le score de Maud pourra être considéré comme un bon score. Sachant que l’écart-type est 4, on pourra considérer que Maud est bonne en mathématiques. Les résultats de Lucie sont meilleurs en mathématique. 33 34 IIII. La distribution de référence : la loi normale III. La distribution de référence : la loi normale 1. Exemple d’une distribution liée au hasard 1. Exemple d’une distribution liée au hasard Une évaluation composée de plusieurs questions est proposée à des élèves. On suppose que pour chaque question, un élève quelconque a une chance sur deux de répondre correctement ! Cette évaluation est notée par le pourcentage de réussite. Avec deux questions, il y aurait 3 notes : 0%, 50% et 100%. Si l’évaluation comportait une seule question, le plus probable serait que 50% des élèves aient la note 100% et que 50% obtiennent 0%. Avec trois questions, il y aurait 4 notes : 35 36 III. La distribution de référence : la loi normale 1. Exemple d’une distribution liée au hasard Lorsque le nombre de questions augmente, ressemble de plus en plus à une courbe. le diagramme Cette « courbe » est symétrique autour du mode 50%. On s’aperçoit aussi que plus le nombre de questions est important, plus la « courbe » se resserre autour de la valeur modale. Autrement dit l’écart-type diminue. Pour une évaluation comportant 10 questions, l’écart-type est de 16% environ. Pour une évaluation comportant 100 questions, l’écart-type descend à 5%. Dès que le nombre de questions dépasse 10, la fonction sous jacente à chaque histogramme est une densité de fréquence définie par une loi mathématique appelée loi normale. Il y a en fait une infinité de lois normales, elles se distinguent par la valeur de la moyenne et celle de l’écart type. La plus utilisée des lois normales dans la théorie des probabilités et des statistiques est la loi normale centrée réduite dont la moyenne est zéro et dont l’écart type est 1. 38 37 III. La distribution de référence : la loi normale III. La distribution de référence : la loi normale 2. Propriétés de la loi normale 3. Pourquoi la loi normale est-elle importante ? La loi normale est très connue car elle est utilisée pour modéliser de nombreuses situations dans beaucoup de disciplines. L’aire sous la courbe entre deux valeurs traduit la fréquence de la population dont la modalité est comprise entre ces deux valeurs. Dans une distribution normale, plus des 2/3 des individus sont situés à moins d’un écart-type de la moyenne. Plus de 95% sont situés à moins de deux écartstypes de la moyenne et la quasi-totalité des individu sont situés à moins de trois écarts-types de la moyenne. Elle l’est d’ailleurs si souvent qu’on peut s’interroger parfois sur le bien fondé de la référence à cette loi pour décrire une situation attendue : la répartition des notes des étudiants à un examen. Son utilisation est fondamentale en statistique inférentielle car elle constitue un des outils qu’on met en œuvre pour comparer des groupes d’individus. En statistique descriptive, elle est souvent utilisée comme référence pour constituer des groupes d’individus au sein de la population étudiée : - les individus typiques sont constitués de 68% des individus répartis autour de la moyenne ; - les atypiques forts (faibles) sont constitués des 16% des individus ayant les valeurs les plus élevées (basses) ; - les atypiques très forts (faibles) sont constitués des 2,5% des individus ayant les valeurs les plus élevées (basses) ; - etc. 39 40