NOM, PRENOM : N° carte d`étudiant : Signature :

Transcription

NOM, PRENOM : N° carte d`étudiant : Signature :
M1 MRHDS
Traitement statistique des données
Examen du 20 décembre 2012
NOM, PRENOM :
N° carte d’étudiant :
Signature :
Durée : 2h. Calculatrice autorisée. Téléphone portable interdit.
___________________________________________________________________________
EXERCICE 1 : Une étude a été réalisée sur les pratiques culturelles des personnes âgées en milieu rural.
200 personnes ont été interrogées. Cette étude fournit notamment le tableau ci-après où X est le nombre
de livres lus par mois et Y le nombre d’habitants de la commune de résidence :
X \ Y
0
1
2
3 et plus
] 0 , 500 [
10
10
15
4
[ 500 , 1 500 [
12
24
22
6
[ 1 500 , 2 500 ]
23
31
33
10
Remarque : pour les calculs, on remplacera la modalité « 3 et plus » par la valeur 3.
1. Combien ce tableau contient-il de modalités conjointes ?
2. Donner la distribution marginale en pourcentages du nombre de livres lus.
3. Construire la représentation graphique associée aux fréquences cumulées de la distribution marginale
du nombre de livres lus.
4. Calculer la moyenne globale et l’écart-type global de X.
5. Calculer l’écart interquartile de la distribution marginale du nombre de livres lus.
6. Calculer le nombre moyen de livres lus dans chaque catégorie de communes, puis vérifier la propriété
de décomposition de la moyenne.
7. Calculer les fréquences marginales et les fréquences cumulées marginales de Y, puis construire
l’histogramme.
8. Calculer la classe modale, la médiane et l’étendue de la distribution marginale de Y.
9. Quelles propriétés doit vérifier la médiane ?
10. Est-il exact de dire que 10% des communes ont moins de 405 habitants ? Et que la moitié des
communes ont au moins 1 325 habitants ? Justifier les réponses.
11. Calculer la moyenne et l’écart-type de la distribution marginale de Y.
12. Sachant que la covariance entre X et Y est négative et égale à -163,844, est-il exact de dire que les
variables X et Y sont linéairement dépendantes ?
EXERCICE 2 : La même enquête (réalisée auprès d’un échantillon de 200 personnes âgées habitant en
milieu rural) permet d’établir le tableau de contingence suivant pour les variables « Connexion à
Internet » (Z) et « Nombre d’habitants de la commune de résidence » (Y) :
Z \ Y
Connexion à Internet
Pas de connexion à Internet
]0,500[
15
24
[500,1 500[
26
38
[1 500,2 500]
45
52
1. Quelle est la nature de la variable Z ?
2. Combien ce tableau contient-il de distributions conditionnelles ?
3. Enoncer 2 propriétés que devraient vérifier les variables Y et Z si elles étaient indépendantes.
4. Compléter le tableau des effectifs théoriques (détailler au moins un calcul) :
Z \ Y
Connexion à Internet
Pas de connexion à Internet
]0,500[
[500,1 500[
36,48
[1 500,2 500]
41,71
55,29
Exemple de calcul :
5. Compléter le tableau des taux de liaison (détailler au moins un calcul) :
Z \ Y
Connexion à Internet
Pas de connexion à Internet
]0,500[
[500,1 500[
0,375
0,252
[1 500,2 500]
0,509
- 0,442
Exemple de calcul :
6. Calculer la distance du khi-2.
7. Avec un risque de première espèce α=1%, peut-on dire que Y et Z sont statistiquement indépendantes ?
Pour les quantiles associés à une distribution théorique du khi-2, on donne : l(1) (95%) = 3,8415,
l(2) (95%) = 5,9915, l(3) (95%) = 7,8147, l(1) (99%) = 6,6349, l(2) (99%) = 9,2103, l(3) (99%) = 11,3449.
8. Quelle autre méthode que le test d’indépendance du khi-2 aurait pu être utilisée aussi pour vérifier
l’existence d’une liaison de dépendance entre Y et Z ? Pourquoi ?