III. Distribution d`une variable statistique III. Distribution d`une
Transcription
III. Distribution d`une variable statistique III. Distribution d`une
III. Distribution d’une variable statistique Ayant pour chaque individu la modalité du caractère qui lui correspond, le premier travail statistique est de regrouper les individus qui correspondent à la même modalité et de les compter. A. Distribution statistique 1. Effectif d’une modalité L’effectif d’une modalité est le nombre d’individus correspondant à cette modalité. La somme des effectifs est égale à la taille de la population étudiée, on l’appelle aussi l’effectif total. La détermination des effectifs s’appelle le tri à plat Les 3 000 élèves ayant passé la même dictée ont commis 37 500 fautes d’orthographe et 1 725 d’entre elles sont des fautes de type 2 : l’effectif des fautes de type 2 est 1 725. La somme des effectifs des fautes de type 1, de type 2, … de type 9 est égal au nombre de fautes : 37 500. III. Distribution d’une variable statistique 2. Distribution Les couples constitués par les modalités du caractère d’une part et par leurs effectifs respectifs d’autre part forment ce qu’on appelle la distribution de la variable statistique. Cette définition évoque le fait que les individus sont, au sens propre, distribués (classés) selon les modalités du caractère. Remarquons que les 37 500 fautes d’orthographes peuvent être distribuées autrement : le chercheur pourra s’intéresser par exemple à leur distribution suivant les niveaux (CM2, 6e, 5e, 4e, 3e) Test : Dans la situation précédente, quels seraient les individus ? la population ? le caractère ? Test : Dans la situations précédente, quels sont les individus ? quelle est la population ? quel est le caractère ? III. Distribution d’une variable statistique IV. Tableau de distribution et tableau de contingence B. Fréquence d’une modalité A. Tableau de distribution (issu du tri à plat) Après la réalisation de la distribution, se posent les premières questions de comparaison. On rapporte alors les effectifs à l’effectif total (effectifs relatifs). Exemple tiré de la recherche sur l’orthographe : les fautes de type 2 sont-elles nombreuses ? Ainsi, les fautes de type 2 représentent 1 725 fautes sur 37 500, le quotient 1 725 / 37 500 est égal à 0,046, on en déduit que les fautes de type 2 représentent 4,6% des fautes. Est-ce que 4,6% est un pourcentage fort ou faible ? Comme il y a neuf types de fautes, une répartition uniforme correspondrait approximativement à 11,1% des fautes par type. On en déduit donc les fautes de type 2 ne sont pas très nombreuses. La fréquence d’une modalité est le quotient de l’effectif de cette modalité par l’effectif total. On l’exprime souvent en pourcentage. La somme des fréquences est égale à 1 c’est-à-dire à 100%. Le tableau de la série statistique est le tableau des données brutes ou tableau descriptif. Il indique pour chaque individu la valeur du caractère qui lui correspond. Le tableau de distribution ou tableau statistique résulte du tri à plat. Il indique pour chaque modalité son effectif et/ou sa fréquence. Type 5 : fautes grammaticales où la catégorie grammaticale n’est pas représentée. Problème pratique : réaliser le tableau statistique à partir du tableau des données brutes. IV. Tableau de distribution et tableau de contingence IV. Tableau de distribution et tableau de contingence B. Compléments : effectifs et fréquences cumulées B. Compléments : effectifs et fréquences cumulées Exemple du saut en longueur de 240 élèves de CM1. 1. Effectifs cumulés croissants, fréquences cumulées croissantes Étant donné une variable semi-quantitative ou quantitative, on appelle effectif cumulé croissant (ECC) jusqu’à une valeur observée, la somme des effectifs associés aux modalités inférieures ou égales (c’est-à-dire au plus égales) à cette valeur. On définit de même les FCC. IV. Tableau de distribution et tableau de contingence IV. Tableau de distribution et tableau de contingence B. Compléments : effectifs et fréquences cumulées B. Compléments : effectifs et fréquences cumulées 1. Effectifs cumulés croissants, fréquences cumulées croissantes 140 élèves ont sauté moins de 3m 1. Effectifs cumulés croissants, fréquences cumulées croissantes 40% ont sauté moins de 2,70 m IV. Tableau de distribution et tableau de contingence IV. Tableau de distribution et tableau de contingence B. Compléments : effectifs et fréquences cumulées B. Compléments : effectifs et fréquences cumulées 2. Effectifs et fréquences cumulés décroissants 2. Effectifs et fréquences cumulés décroissants L’effectif cumulé décroissant (ECD) jusqu’à une valeur observée est la somme des effectifs strictement supérieures à cette valeur. Cela revient à soustraire l’ECC à l’effectif total. De même pour les FCD. L’effectif cumulé décroissant (ECD) jusqu’à une valeur observée est la somme des effectifs strictement supérieures à cette valeur. Cela revient à soustraire l’ECC à l’effectif total. De même pour les FCD. 60% ont sauté au moins 2,70 m 100 élèves ont sauté 3 m ou plus IV. Tableau de distribution et tableau de contingence IV. Tableau de distribution et tableau de contingence C. Tableaux issus d’un tri croisé C. Tableaux issus d’un tri croisé Certaines recherches nécessitent d’étudier plusieurs caractères d’une même population, cela conduit à l’élaboration de tableaux qui « croisent » les variables. Par exemple, en étudiant la réussite au baccalauréat (NI 05.09 de mars 2005), on pourra se demander dans quelle mesure les réussites sont différentes entre les filles et les garçons. Le premier caractère est la réussite avec deux modalités « admis » ou « recalé », le second est le genre, M ou F. On peut répartir la population en croisant les deux caractères, ce qui fait quatre modalités (quatre couplages possibles). 1. Tableau de contingence Dans une étude statistique portant sur deux caractères, le tri croisé est le travail qui permet d’obtenir les effectifs de tous les couplages possibles des modalités de chaque caractère. Un tableau à double entrée (une entrée par caractère) permet de présenter les résultats d’un tri croisé, on l’appelle tableau de contingence. IV. Tableau de distribution et tableau de contingence C. Tableaux issus d’un tri croisé 2. Tableaux de fréquences à partir d’un tableau de contingence IV. Tableau de distribution et tableau de contingence C. Tableaux issus d’un tri croisé Fréquences croisées selon les deux caractères Fréquences selon le caractère « réussite » : pourcentage en ligne Fréquences selon le caractère « genre » : pourcentage en colonne Fréquences théoriques (ou attendues)