II. Moyenne et écart-type : un outil statistique II. Moyenne et écart

Transcription

II. Moyenne et écart-type : un outil statistique II. Moyenne et écart
II. Moyenne et écart-type : un outil statistique
II. Moyenne et écart-type : un outil statistique
2. Un outil pour comparer une valeur à une référence
3. Un outil pour comparer deux valeurs numériques
Situation
Situation
Le score des réussites de Maud à l’évaluation en mathématiques
passée en début de sixième est 72 sur 94 items. Maud est-elle
bonne en mathématiques ?
Le score des réussites de Lucie en mathématiques est 75 sur 94
items. Son score en français est 74 sur 87 items. Lucie est-elle
meilleure en mathématiques ou en français ?
Traitement
Traitement
On compare le score de Maud au score national : 68. Le score de
Maud est supérieur à la moyenne.
On utilise les informations concernant les scores nationaux :
-Mathématiques : moyenne = 68 et écart-type = 4 ;
-Français : moyenne = 70 et écart-type = 3.
Mais la dispersion des scores est un élément à prendre en compte
car :
On remarque que les scores de Lucie sont bons en mathématiques
comme en français, mais quel est le meilleur ?
-si 70% des élèves ont des scores compris entre 58 et 78, le score
de Maud ne semblera pas exceptionnel ;
On calcule les valeurs « centrées et réduites » (les québécois
disent les « cotes standards ») : (valeur – moyenne) / écart-type
-Mathématiques : (75 – 68) / 4 = +1,75
-Français: (74 – 70) / 3 ~ +1,3
-si 70% des élèves ont des scores compris entre 64 et 72 le score
de Maud pourra être considéré comme un bon score.
Sachant que l’écart-type est 4, on pourra considérer que Maud est
bonne en mathématiques.
Les résultats de Lucie sont meilleurs en mathématique.
33
34
IIII. La distribution de référence : la loi normale
III. La distribution de référence : la loi normale
1. Exemple d’une distribution liée au hasard
1. Exemple d’une distribution liée au hasard
Une évaluation composée de plusieurs questions est proposée à des
élèves. On suppose que pour chaque question, un élève quelconque a
une chance sur deux de répondre correctement !
Cette évaluation est notée par le pourcentage de réussite.
Avec deux questions, il y aurait 3 notes : 0%, 50% et 100%.
Si l’évaluation comportait une seule question, le plus probable serait
que 50% des élèves aient la note 100% et que 50% obtiennent 0%.
Avec trois questions, il y aurait 4 notes :
35
36
III. La distribution de référence : la loi normale
1. Exemple d’une distribution liée au hasard
Lorsque le nombre de questions augmente,
ressemble de plus en plus à une courbe.
le
diagramme
Cette « courbe » est symétrique autour du mode 50%.
On s’aperçoit aussi que plus le nombre de questions est important,
plus la « courbe » se resserre autour de la valeur modale.
Autrement dit l’écart-type diminue.
Pour une évaluation comportant 10 questions, l’écart-type est de
16% environ. Pour une évaluation comportant 100 questions,
l’écart-type descend à 5%.
Dès que le nombre de questions dépasse 10, la fonction sous
jacente à chaque histogramme est une densité de fréquence
définie par une loi mathématique appelée loi normale.
Il y a en fait une infinité de lois normales, elles se distinguent par
la valeur de la moyenne et celle de l’écart type.
La plus utilisée des lois normales dans la théorie des probabilités et
des statistiques est la loi normale centrée réduite dont la moyenne
est zéro et dont l’écart type est 1.
38
37
III. La distribution de référence : la loi normale
III. La distribution de référence : la loi normale
2. Propriétés de la loi normale
3. Pourquoi la loi normale est-elle importante ?
La loi normale est très connue car elle est utilisée pour modéliser
de nombreuses situations dans beaucoup de disciplines.
L’aire sous la courbe entre deux valeurs
traduit la fréquence de la population dont
la modalité est comprise entre ces deux
valeurs.
Dans une distribution normale, plus des
2/3 des individus sont situés à moins
d’un écart-type de la moyenne. Plus de
95% sont situés à moins de deux écartstypes de la moyenne et la quasi-totalité
des individu sont situés à moins de trois
écarts-types de la moyenne.
Elle l’est d’ailleurs si souvent qu’on peut s’interroger parfois sur le
bien fondé de la référence à cette loi pour décrire une situation
attendue : la répartition des notes des étudiants à un examen.
Son utilisation est fondamentale en statistique inférentielle car elle
constitue un des outils qu’on met en œuvre pour comparer des
groupes d’individus.
En statistique descriptive, elle est souvent utilisée comme
référence pour constituer des groupes d’individus au sein de la
population étudiée :
- les individus typiques sont constitués de 68% des individus
répartis autour de la moyenne ;
- les atypiques forts (faibles) sont constitués des 16% des
individus ayant les valeurs les plus élevées (basses) ;
- les atypiques très forts (faibles) sont constitués des 2,5% des
individus ayant les valeurs les plus élevées (basses) ;
- etc.
39
40