1) Le Chi-2 appliqué à ce tableau va nous permettre de déterminer s

Transcription

1) Le Chi-2 appliqué à ce tableau va nous permettre de déterminer s
1) Le Chi-2 appliqué à ce tableau va nous permettre de déterminer s’il existe une dépendance entre
la variable X, les différents types de filières et la variable Y, le sexe des individus qui se
répartissent dans ces différentes filières.
2) Population = {Etudiants répartis dans les différentes filières}
A chaque individu, on associe un couple de variables aléatoires (X, Y).
X : Les différentes filières d’étude. Il y a 11 modalités à cette variable.
Y : Le sexe des différents individus enquêtés. Il y a 2 modalités à cette variable : Y1=femme et
Y2=homme.
Problème posé : Existe-t-il une dépendance entre le sexe et la filière d’étude choisi par un étudiant ?
Posons l’hypothèse : H0 : Les variables X et Y sont indépendantes. On fait l’hypothèse qu’il n’y a aucun
lien entre le fait d’être un homme ou une femme et l’appartenance à une filière d’études.
Résolution de l’hypothèse : On interroge un échantillon de 702 personnes (n = 702)
A priori :
Nij = variable aléatoire du nombre d’étudiants tel que X = xi et Y = yj dans des échantillons de taille
702. Il y a 11 * 2 = 22 variables aléatoires.
Cij = variable aléatoire du nombre d’étudiant tel que X = xi et Y = yj dans un échantillon de 702
personnes si H0 est vraie. Il y a 11 * 2 = 22 variables aléatoires.
Avec Cij = (Ni. * N.j)/N
Si on considère que notre hypothèse de départ est vrai et si 80% des Cij sont supérieurs à 5 alors la
variable aléatoire :
i=11 j = 2
Χ² = ∑ ∑ (Nij – Cij) ²/ Cij suit une loi du chi-2 à (11-1)*(2-1) = 10 * 1 = 10 degrés de liberté
i=1
j=1
A postériori :
nij = nombre d’étudiants qui font partis d’une filière d’étude selon la modalité xi de X et qui ont un
sexe spécifique selon la modalité yi de Y dans un échantillon de taille 702, celui qu’on a tiré.
Cij = nombre d’étudiants qui font partis d’une filière d’étude selon la modalité xi de X et qui ont un
sexe spécifique selon la modalité yi de Y si H0 est vraie avec cij = (ni. * n.j)/n
(nij – cij) ²/ cij : une mesure de la distance entre les effectifs théoriques et les effectifs observés. Il y a
22 termes à calculer qu’on appelle « contribution au chi-2 calculé » (noté x²).
X
\
Y
AES
Biologie
BTS action commerciale
BTS informatique de gestion
Droit
IEP
IUT carrière juridique
Lettres
Math/physique
Sociologie
STAPS
Total
femme
39.7*
22.2
15
18.6
51.1
55.3
17.4
28.9
24.6
76.9
72.1
422
homme
26.3
14.8
10
12.14
33.9
36.7
11.6
19.1
16.4
51.1
47.9
280
femme
0.043 *
0.029
1.067
7.234
0.932
0.399
5.297
5.938
14.063
4.260
10.952
homme
0.064
0.043
1.6
10.852
1.404
0.602
7.945
8.985
21.095
6.411
16.485
total
66
37
25
31
85
92
29
48
41
128
120
702
C11 = 422 * 66 / 702 = 39.7
X
\
Y
AES
Biologie
BTS action commerciale
BTS informatique de gestion
Droit
IEP
IUT carrière juridique
Lettres
Math/physique
Sociologie
STAPS
Total
125.7
* (nij – cij) ²/ cij avec i = 1 et j = 1 soit (41-39.7)²/39.7 = 0.043
x² = chi-2
Test
On peut appliquer le test car toutes les valeurs des cij sont supérieures à 5.
α = 5% et on sait que ddl = 10.
Suite à la lecture de la table du chi-2, on peut dire que t = 18.31 or x² = 125.7 donc x² > t
Alors on peut dire que l’hypothèse H0 est rejetée au risque de 5%. J’ai 5% de chance de me tromper.
Je déclare donc qu’il y a dépendance entre le choix de la filière d’étude et le fait d’être un homme ou
une femme.
Si α = 1% ou α = 0.01, ddl vaut toujours 10 et après lecture de la table du chi-2, t = 23.21. X² est
toujours supérieur à t donc H0 est rejetée au seuil de 1%.
En observant les pourcentages ligne et colonne on constate que la répartition des étudiants varient
massivement en fonction du sexe. On trouve ainsi une majorité de femme en sociologie, dans les IEP,
en droit et en lettres (IEP : Institut d’études politiques, AES : administration économique et sociale).
On constate aussi qu’il y a ****% de femmes en lettre contre seulement 12.5% d’hommes. Au
contraire, on trouve 85.4% d’hommes en math/physique contre seulement 14.6% de femmes. Ce
constat se vérifie aussi dans les IUT juridiques (plus de femmes : 93.1%) et en STAPS (27.1% des
hommes étudiants contre 10.4% des femmes étudiantes en pourcentage colonne. On vérifie par
cette lecture que les variables X et Y sont liés et que H0 est rejetée.