III. Distribution d`une variable statistique III. Distribution d`une

Transcription

III. Distribution d`une variable statistique III. Distribution d`une
III. Distribution d’une variable statistique
Ayant pour chaque individu la modalité du caractère qui lui
correspond, le premier travail statistique est de regrouper les
individus qui correspondent à la même modalité et de les compter.
A. Distribution statistique
1. Effectif d’une modalité
L’effectif d’une modalité est le nombre d’individus correspondant à cette
modalité. La somme des effectifs est égale à la taille de la population
étudiée, on l’appelle aussi l’effectif total. La détermination des effectifs
s’appelle le tri à plat
Les 3 000 élèves ayant passé la même dictée ont commis 37 500
fautes d’orthographe et 1 725 d’entre elles sont des fautes de type
2 : l’effectif des fautes de type 2 est 1 725. La somme des effectifs
des fautes de type 1, de type 2, … de type 9 est égal au nombre de
fautes : 37 500.
III. Distribution d’une variable statistique
2. Distribution
Les couples constitués par les modalités du caractère d’une part et par
leurs effectifs respectifs d’autre part forment ce qu’on appelle la
distribution de la variable statistique.
Cette définition évoque le fait que les individus sont, au sens propre,
distribués (classés) selon les modalités du caractère.
Remarquons que les 37 500 fautes d’orthographes peuvent être
distribuées autrement : le chercheur pourra s’intéresser par
exemple à leur distribution suivant les niveaux (CM2, 6e, 5e, 4e, 3e)
Test : Dans la situation précédente, quels seraient les individus ? la
population ? le caractère ?
Test : Dans la situations précédente, quels sont les individus ?
quelle est la population ? quel est le caractère ?
III. Distribution d’une variable statistique
IV. Tableau de distribution et tableau de contingence
B. Fréquence d’une modalité
A. Tableau de distribution (issu du tri à plat)
Après la réalisation de la distribution, se posent les premières
questions de comparaison. On rapporte alors les effectifs à l’effectif
total (effectifs relatifs).
Exemple tiré de la recherche sur l’orthographe : les fautes de type 2
sont-elles nombreuses ?
Ainsi, les fautes de type 2 représentent 1 725 fautes sur 37 500, le
quotient 1 725 / 37 500 est égal à 0,046, on en déduit que les
fautes de type 2 représentent 4,6% des fautes.
Est-ce que 4,6% est un pourcentage fort ou faible ?
Comme il y a neuf types de fautes, une répartition uniforme
correspondrait approximativement à 11,1% des fautes par type. On
en déduit donc les fautes de type 2 ne sont pas très nombreuses.
La fréquence d’une modalité est le quotient de l’effectif de cette
modalité par l’effectif total. On l’exprime souvent en pourcentage. La
somme des fréquences est égale à 1 c’est-à-dire à 100%.
Le tableau de la série statistique est le tableau des données brutes
ou tableau descriptif. Il indique pour chaque individu la valeur du
caractère qui lui correspond.
Le tableau de distribution
ou
tableau
statistique
résulte du tri à plat. Il
indique
pour
chaque
modalité
son
effectif
et/ou sa fréquence.
Type 5 : fautes grammaticales
où la catégorie grammaticale
n’est pas représentée.
Problème
pratique
:
réaliser
le
tableau
statistique à partir du
tableau
des
données
brutes.
IV. Tableau de distribution et tableau de contingence
IV. Tableau de distribution et tableau de contingence
B. Compléments : effectifs et fréquences cumulées
B. Compléments : effectifs et fréquences cumulées
Exemple du saut en longueur de 240 élèves de CM1.
1. Effectifs cumulés croissants, fréquences cumulées croissantes
Étant donné une variable semi-quantitative ou quantitative, on appelle
effectif cumulé croissant (ECC) jusqu’à une valeur observée, la somme
des effectifs associés aux modalités inférieures ou égales (c’est-à-dire
au plus égales) à cette valeur. On définit de même les FCC.
IV. Tableau de distribution et tableau de contingence
IV. Tableau de distribution et tableau de contingence
B. Compléments : effectifs et fréquences cumulées
B. Compléments : effectifs et fréquences cumulées
1. Effectifs cumulés croissants, fréquences cumulées croissantes
140 élèves ont
sauté moins de
3m
1. Effectifs cumulés croissants, fréquences cumulées croissantes
40% ont sauté
moins de 2,70 m
IV. Tableau de distribution et tableau de contingence
IV. Tableau de distribution et tableau de contingence
B. Compléments : effectifs et fréquences cumulées
B. Compléments : effectifs et fréquences cumulées
2. Effectifs et fréquences cumulés décroissants
2. Effectifs et fréquences cumulés décroissants
L’effectif cumulé décroissant (ECD) jusqu’à une valeur observée est
la somme des effectifs strictement supérieures à cette valeur. Cela
revient à soustraire l’ECC à l’effectif total. De même pour les FCD.
L’effectif cumulé décroissant (ECD) jusqu’à une valeur observée est
la somme des effectifs strictement supérieures à cette valeur. Cela
revient à soustraire l’ECC à l’effectif total. De même pour les FCD.
60% ont sauté
au moins
2,70 m
100 élèves
ont sauté
3 m ou plus
IV. Tableau de distribution et tableau de contingence
IV. Tableau de distribution et tableau de contingence
C. Tableaux issus d’un tri croisé
C. Tableaux issus d’un tri croisé
Certaines recherches nécessitent d’étudier plusieurs caractères
d’une même population, cela conduit à l’élaboration de tableaux qui
« croisent » les variables.
Par exemple, en étudiant la réussite au baccalauréat (NI 05.09 de
mars 2005), on pourra se demander dans quelle mesure les
réussites sont différentes entre les filles et les garçons.
Le premier caractère est la réussite avec deux modalités « admis »
ou « recalé », le second est le genre, M ou F.
On peut répartir la population en croisant les deux caractères, ce qui
fait quatre modalités (quatre couplages possibles).
1. Tableau de contingence
Dans une étude statistique portant sur deux caractères, le tri croisé est
le travail qui permet d’obtenir les effectifs de tous les couplages
possibles des modalités de chaque caractère. Un tableau à double entrée
(une entrée par caractère) permet de présenter les résultats d’un tri
croisé, on l’appelle tableau de contingence.
IV. Tableau de distribution et tableau de contingence
C. Tableaux issus d’un tri croisé
2. Tableaux de fréquences à partir d’un tableau de contingence
IV. Tableau de distribution et tableau de contingence
C. Tableaux issus d’un tri croisé
Fréquences croisées selon les deux caractères
Fréquences selon le caractère « réussite » : pourcentage en ligne
Fréquences selon le caractère « genre » : pourcentage en colonne
Fréquences théoriques (ou attendues)

Documents pareils