1) Le Chi-2 appliqué à ce tableau va nous permettre de déterminer s
Transcription
1) Le Chi-2 appliqué à ce tableau va nous permettre de déterminer s
1) Le Chi-2 appliqué à ce tableau va nous permettre de déterminer s’il existe une dépendance entre la variable X, les différents types de filières et la variable Y, le sexe des individus qui se répartissent dans ces différentes filières. 2) Population = {Etudiants répartis dans les différentes filières} A chaque individu, on associe un couple de variables aléatoires (X, Y). X : Les différentes filières d’étude. Il y a 11 modalités à cette variable. Y : Le sexe des différents individus enquêtés. Il y a 2 modalités à cette variable : Y1=femme et Y2=homme. Problème posé : Existe-t-il une dépendance entre le sexe et la filière d’étude choisi par un étudiant ? Posons l’hypothèse : H0 : Les variables X et Y sont indépendantes. On fait l’hypothèse qu’il n’y a aucun lien entre le fait d’être un homme ou une femme et l’appartenance à une filière d’études. Résolution de l’hypothèse : On interroge un échantillon de 702 personnes (n = 702) A priori : Nij = variable aléatoire du nombre d’étudiants tel que X = xi et Y = yj dans des échantillons de taille 702. Il y a 11 * 2 = 22 variables aléatoires. Cij = variable aléatoire du nombre d’étudiant tel que X = xi et Y = yj dans un échantillon de 702 personnes si H0 est vraie. Il y a 11 * 2 = 22 variables aléatoires. Avec Cij = (Ni. * N.j)/N Si on considère que notre hypothèse de départ est vrai et si 80% des Cij sont supérieurs à 5 alors la variable aléatoire : i=11 j = 2 Χ² = ∑ ∑ (Nij – Cij) ²/ Cij suit une loi du chi-2 à (11-1)*(2-1) = 10 * 1 = 10 degrés de liberté i=1 j=1 A postériori : nij = nombre d’étudiants qui font partis d’une filière d’étude selon la modalité xi de X et qui ont un sexe spécifique selon la modalité yi de Y dans un échantillon de taille 702, celui qu’on a tiré. Cij = nombre d’étudiants qui font partis d’une filière d’étude selon la modalité xi de X et qui ont un sexe spécifique selon la modalité yi de Y si H0 est vraie avec cij = (ni. * n.j)/n (nij – cij) ²/ cij : une mesure de la distance entre les effectifs théoriques et les effectifs observés. Il y a 22 termes à calculer qu’on appelle « contribution au chi-2 calculé » (noté x²). X \ Y AES Biologie BTS action commerciale BTS informatique de gestion Droit IEP IUT carrière juridique Lettres Math/physique Sociologie STAPS Total femme 39.7* 22.2 15 18.6 51.1 55.3 17.4 28.9 24.6 76.9 72.1 422 homme 26.3 14.8 10 12.14 33.9 36.7 11.6 19.1 16.4 51.1 47.9 280 femme 0.043 * 0.029 1.067 7.234 0.932 0.399 5.297 5.938 14.063 4.260 10.952 homme 0.064 0.043 1.6 10.852 1.404 0.602 7.945 8.985 21.095 6.411 16.485 total 66 37 25 31 85 92 29 48 41 128 120 702 C11 = 422 * 66 / 702 = 39.7 X \ Y AES Biologie BTS action commerciale BTS informatique de gestion Droit IEP IUT carrière juridique Lettres Math/physique Sociologie STAPS Total 125.7 * (nij – cij) ²/ cij avec i = 1 et j = 1 soit (41-39.7)²/39.7 = 0.043 x² = chi-2 Test On peut appliquer le test car toutes les valeurs des cij sont supérieures à 5. α = 5% et on sait que ddl = 10. Suite à la lecture de la table du chi-2, on peut dire que t = 18.31 or x² = 125.7 donc x² > t Alors on peut dire que l’hypothèse H0 est rejetée au risque de 5%. J’ai 5% de chance de me tromper. Je déclare donc qu’il y a dépendance entre le choix de la filière d’étude et le fait d’être un homme ou une femme. Si α = 1% ou α = 0.01, ddl vaut toujours 10 et après lecture de la table du chi-2, t = 23.21. X² est toujours supérieur à t donc H0 est rejetée au seuil de 1%. En observant les pourcentages ligne et colonne on constate que la répartition des étudiants varient massivement en fonction du sexe. On trouve ainsi une majorité de femme en sociologie, dans les IEP, en droit et en lettres (IEP : Institut d’études politiques, AES : administration économique et sociale). On constate aussi qu’il y a ****% de femmes en lettre contre seulement 12.5% d’hommes. Au contraire, on trouve 85.4% d’hommes en math/physique contre seulement 14.6% de femmes. Ce constat se vérifie aussi dans les IUT juridiques (plus de femmes : 93.1%) et en STAPS (27.1% des hommes étudiants contre 10.4% des femmes étudiantes en pourcentage colonne. On vérifie par cette lecture que les variables X et Y sont liés et que H0 est rejetée.