presentation statistiques avec le logiciel sas licence sciences
Transcription
presentation statistiques avec le logiciel sas licence sciences
PRESENTATION STATISTIQUES AVEC LE LOGICIEL SAS LICENCE SCIENCES SOCIALES – SEMESTRE 6 Les objectifs : Faire des applications proches de celles réalisées en TD et cours mais en utilisant un logiciel dédié aux traitements statistiques Approfondir la phase d’interprétation des résultats obtenus o Une notion centrale durant le semestre : la dépendance, la corrélation Entre variables qualitatives Entre variables quantitatives * Avantages de l’utilisation d’un logiciel statistique : Rapidité de l’exécution des calculs Possibilité de multiplier les traitements ce qui est indispensable dès que le nombre d’individus, de variables ou de traitements nécessaires sont nombreux. * Risque de l’utilisation d’un logiciel statistique : Fausse interprétation de résultats faux du fait d’une mauvaise manipulation. Le logiciel retourne presque toujours des résultats, même faux. Perte de l’esprit critique et de la rigueur de l’exécutant devant le côté magique et sacré de la machine. Le logiciel utilisé : - SAS® et plutôt SAS® Entreprise Guide®: o SAS® : logiciel d’informatique décisionnelle : traitement de données, gestion bases de données, traitements statistiques, data mining, datawharehouse, cartographie, etc.. o SAS® Entreprise Guide® - Version plus légère, plus limitée, plus interactive o Avantages de cette version plus conviviale limite la part de la programmation o Inconvénients moins rapide limitée dans les traitements car oblige que les données soient formatées parfaitement avant traitements. TRAVAIL DE LA SEANCE 1 1- Ouvrir une session de SAS® Entreprise Guide® 2- Créer un nouveau projet, l’intituler SEANCE 1 et l’enregistrer sur votre ordinateur de travail 3- Dans la zone « Tâches par catégorie » - « Créer des données à l’aide d’une grille » 4- Appeler cette table « Groupe_SAS_L6 » 5- Définir 6 variables en procédant suivant les deux étapes ci-dessous : a. NUMERO / SEXE / Type de BAC / Lieu de naissance : variable alphanumérique b. AGE (ddm) / Moyenne BAC : variable numérique 1. Utiliser le menu contextuel (clic droit de la souris) 2. Définir le nom et le type de la variable 6- Saisie des données de la table en utilisant les formats (codage) suivants : NOM NUMERO SEXE AGE MOYENNE BAC TYPE DE BAC LIEU DE NAISSANCE CODAGE (FORMAT) identifiant avec incrémentation de chaque enregistrement 1 : Homme / 2 : Femmes âge en différence de millésime moyenne générale au Bac L : Littéraire / S : Scientifique / ST : Technique / ES : Economie et social 1 : né en Alsace / 2 : autre région française / 3 : Etranger Les étudiants énoncent chacun leur tour les données leur correspondant 7- Dans la zone « Tâches par catégorie » - « Créer du code » 8- Appeler ce code « FORMAT » 9- Taper dans la zone code le texte ci-dessous : proc format ; value $sexe '1'='homme' '2'='femme' ; value $Lnais '1'='Alsace' '2'='Autre régions française' '3'='étranger'; run ; Puis « Exécuter » ce code en utilisant le Menu Code comme ci-dessous : 10- Attribuer aux variables SEXE et LNAIS les formats que l’on vient de définir. Qu’est qui change dans l’affichage ? 11- En utilisant dans le Menu « Analyse/Descriptive » et Analyse/Analyse d’une table (cf.dans l’image ci-dessous), faire la description de chacune des 6 variables (une par une) 12- En utilisant le Menu « Analyse/Analyse d’une table » vérifier la relation qu’il existe entre AGE et SEXE puis entre SEXE et TYPE DE BAC puis entre TYPE DE BAC et MOYENNE BAC puis SEXE et MOYENNE de BAC. A chaque fois, utiliser soit le Chi-2, soit un test demoyenne.