Enoncé - HEC Paris

Transcription

Enoncé - HEC Paris
ELEMENTS DE STATISTIQUE
TP : ENONCE
Gilles Stoltz
2010 -- 2011
Ce document ne peut être utilisé, reproduit ou cédé sans l’autorisation de HEC Paris
Enoncé du TP
A lire avant de commencer...
Instructions : Vous compléterez au fur et à mesure le document de compte-rendu distribué
à part ; vous pouvez effectuer le travail seul ou en groupe de deux, mais pas à plus de deux.
Critères de notation : A priori, je compte simplement mettre une appréciation, dont je
tiendrai compte pour arrondir la note finale du module vers le haut ou vers le bas. Il ne
s’agit pas d’un examen noté stressant, j’aimerais qu’on passe ensemble une heure et demie
agréable et détendue. En fait, je vous demande surtout de remplir le compte-rendu pour
être sûr que vous faites bien le TP et n’allez pas sur FaceBook à la place...
Fichiers de données : Tous les fichiers de données sont disponibles sur le site web du cours :
http://www.hec.fr/stoltz
Pour les charger, il faut faire un clic droit, commande Enregistrer sous, et bien vérifier
que le fichier ainsi enregistré a l’extension .sav (si votre navigateur propose de lui donner
l’extension .htm, refusez et forcez l’extension .sav). Pour ouvrir le fichier, il suffit ensuite
de double-cliquer dessus.
Note sur la version de SPSS : J’ai rédigé ce document à partir de la version 18 française
de SPSS (également appelé PASW Statistics désormais). J’espère que les ordinateurs des
salles de TPs auront été mis à jour : les années précédentes, ils utilisaient encore la version
14 en anglais...
Objectifs de ce TP
– Traiter des données de manière automatique sans avoir à faire les calculs soi-même :
cela permet de se concentrer sur la méthode et sur les interprétations des résultats
(qui forment votre valeur ajoutée !). Ce TP permet ainsi d’appliquer le cours.
– Découvrir un logiciel de statistiques que vous utiliserez ensuite en cours de marketing
(désolé pour ceux qui préfèrent la finance et détestent le marketing...). L’énoncé est
guidé, mais il faudra tâtonner un peu çà et là : c’est fait exprès. Je veux surtout vous
apprendre à apprendre SPSS (et non simplement vous apprendre SPSS).
– Cette année, nous avons un unique TP d’une heure et demie là où les années précédentes, il y avait deux TPs de deux heures. Ainsi va la vie... J’espère que vous ne
serez pas frustrés.
TP sous SPSS — Eléments de statistique — Gilles Stoltz
1
Enoncé du TP
Exercice 1 : Accidents routiers selon le sexe
On tire un certain nombre d’assurés au hasard dans un fichier clients et on reporte leur
sexe, leur âge et le nombre d’accidents responsables qu’ils ont eus lors de l’année écoulée.
(1) Faisons mieux connaissance avec ces données : précisez les statistiques d’échantillon
demandées. On utilisera à cet effet les éléments Effectifs et Descriptives du menu
Analyse / Statistiques descriptives.
(2) Distinguons les comportements hommes / femmes. Calculez deux intervalles de
confiance à 95 % donnant le nombre moyen d’accidents selon le sexe. Formez une
conclusion, à laquelle vous associerez un niveau de confiance.
(3) On veut approfondir cette conclusion. A cet effet, on effectue un test du χ2 d’homogénéité entre hommes et femmes quant au nombre d’accidents : on utilisera à cet effet
l’élément Tableaux croisés du menu Analyse / Statistiques descriptives (et
on pensera à bien cocher la case Chi-deux dans l’onglet d’options statistiques que
l’on peut faire apparaître en cliquant sur Statistiques... dans la fenêtre de dialogue). Le test du χ2 est-il validement appliqué ? Que faut-il faire ?
(4) Résoudre le problème soulevé à la question précédente en exploitant par exemple
la quatrième colonne du fichier de données. Quelle est votre conclusion, au vu du jeu
de données ?
(5) Ceci est-il en accord avec la réalité, d’après vous ?
(6) Traitez l’homogénéité de l’existence d’au moins un accident en fonction de l’âge
(mêmes questions que précédemment). A cet effet, il faudra d’abord créer une variable
qualitative précisant des regroupements par catégories d’âge (18–30 ans, 31–45 ans, 46
ans et plus) : on utilisera Transformer / Création de variables ; dans la fenêtre
qui s’affiche, on utilisera le bouton Anciennes et nouvelles valeurs pour préciser
la catégorisation.
TP sous SPSS — Eléments de statistique — Gilles Stoltz
2
Enoncé du TP
Exercice 2 : Performances de deux somnifères
On considère deux somnifères, DodoPlus et Morpheus ; on prend un groupe test de 10
volontaires, qui la nuit J testent un premier somnifère et la nuit J+7, un second somnifère.
On reporte les durées de sommeil réalisées (en heures) dans le fichier de données.
(1) Expliquez pourquoi, pour comparer ces performances, on s’intéresse aux différences
de temps de sommeil (colonne 3). On dit que les données des deux premières colonnes
sont appariées.
(2) Tester que les données de la troisième colonne sont issues d’une loi normale. Utiliser
à cet effet l’élément Explorer du menu Analyse / Statistiques descriptives ;
il faudra cliquer sur la case Graphes de répartition gaussiens avec tests dans
l’onglet appelé par Diagrammes.
(3) Effectuer alors un test de comparaison à la valeur de référence 0 : recourir à l’élément
Test-T pour échantillon unique du menu Analyse / Comparer les moyennes.
(4) D’après vous, pourquoi cet élément s’appelle-t-il Test-T ?
(5) Comment aurait-on pu procéder plus simplement sous SPSS, sans devoir calculer
ni exploiter la troisième colonne ? (Il s’agit de fouiller dans les menus de SPSS.) Quel
avantage voyez-vous à la méthode détaillée dans les questions (1)–(3) ?
Exercice 3 : Consommation d’alcool à HEC
Cet exercice est facultatif (parce que le TP est sans doute déjà trop long !). Chargez le
fichier de données : il indique pour chacun des deux groupes d’un professeur 1 la consommation d’alcool au POW de la veille, reportée en nombre de verres.
(1) Peut-on dire que les consommations relevées diffèrent sensiblement dans les deux
groupes ? On mènera un test de comparaison de moyennes. Vous devrez sans doute
me demander conseil pour lire la sortie SPSS obtenue.
(2) Certaines des données vous semblent-elles aberrantes ? Que faut-il faire selon vous ?
1. Ce n’est pas moi qui ai osé mener cette enquête, mais un/une collègue plus courageux/se...
TP sous SPSS — Eléments de statistique — Gilles Stoltz
3

Documents pareils