presentation statistiques avec le logiciel sas licence sciences

Transcription

presentation statistiques avec le logiciel sas licence sciences
PRESENTATION
STATISTIQUES AVEC LE LOGICIEL SAS
LICENCE SCIENCES SOCIALES – SEMESTRE 6
Les objectifs :
Faire des applications proches de celles réalisées en TD et cours mais en utilisant un logiciel
dédié aux traitements statistiques
Approfondir la phase d’interprétation des résultats obtenus
o Une notion centrale durant le semestre : la dépendance, la corrélation
Entre variables qualitatives
Entre variables quantitatives
* Avantages de l’utilisation d’un logiciel statistique :
Rapidité de l’exécution des calculs
Possibilité de multiplier les traitements ce qui est indispensable dès que le nombre
d’individus, de variables ou de traitements nécessaires sont nombreux.
* Risque de l’utilisation d’un logiciel statistique :
Fausse interprétation de résultats faux du fait d’une mauvaise manipulation. Le logiciel
retourne presque toujours des résultats, même faux.
Perte de l’esprit critique et de la rigueur de l’exécutant devant le côté magique et sacré
de la machine.
Le logiciel utilisé :
-
SAS® et plutôt SAS® Entreprise Guide®:
o SAS® : logiciel d’informatique décisionnelle : traitement de données, gestion bases
de données, traitements statistiques, data mining, datawharehouse, cartographie,
etc..
o SAS® Entreprise Guide®
- Version plus légère, plus limitée, plus interactive
o Avantages de cette version
plus conviviale
limite la part de la programmation
o Inconvénients
moins rapide
limitée dans les traitements car oblige que les données soient
formatées parfaitement avant traitements.
TRAVAIL DE LA SEANCE 1
1-
Ouvrir une session de SAS® Entreprise Guide®
2-
Créer un nouveau projet, l’intituler SEANCE 1 et l’enregistrer sur votre ordinateur de travail
3-
Dans la zone « Tâches par catégorie » - « Créer des données à l’aide d’une grille »
4-
Appeler cette table « Groupe_SAS_L6 »
5-
Définir 6 variables en procédant suivant les deux étapes ci-dessous :
a. NUMERO / SEXE / Type de BAC / Lieu de naissance : variable alphanumérique
b. AGE (ddm) / Moyenne BAC : variable numérique
1. Utiliser le menu contextuel (clic droit de la souris)
2. Définir le nom et le type de la variable
6-
Saisie des données de la table en utilisant les formats (codage) suivants :
NOM
NUMERO
SEXE
AGE
MOYENNE BAC
TYPE DE BAC
LIEU DE NAISSANCE
CODAGE (FORMAT)
identifiant avec incrémentation de chaque enregistrement
1 : Homme / 2 : Femmes
âge en différence de millésime
moyenne générale au Bac
L : Littéraire / S : Scientifique / ST : Technique / ES :
Economie et social
1 : né en Alsace / 2 : autre région française / 3 : Etranger
Les étudiants énoncent chacun leur tour les données leur correspondant
7-
Dans la zone « Tâches par catégorie » - « Créer du code »
8-
Appeler ce code « FORMAT »
9-
Taper dans la zone code le texte ci-dessous :
proc format ;
value $sexe
'1'='homme'
'2'='femme' ;
value $Lnais
'1'='Alsace'
'2'='Autre régions française'
'3'='étranger';
run ;
Puis « Exécuter » ce code en utilisant le Menu Code comme ci-dessous :
10- Attribuer aux variables SEXE et LNAIS les formats que l’on vient de définir. Qu’est qui change dans
l’affichage ?
11- En utilisant dans le Menu « Analyse/Descriptive » et Analyse/Analyse d’une table (cf.dans l’image ci-dessous),
faire la description de chacune des 6 variables (une par une)
12- En utilisant le Menu « Analyse/Analyse d’une table » vérifier la relation qu’il existe entre AGE et SEXE puis
entre SEXE et TYPE DE BAC puis entre TYPE DE BAC et MOYENNE BAC puis SEXE et MOYENNE
de BAC. A chaque fois, utiliser soit le Chi-2, soit un test demoyenne.

Documents pareils