03 - NTE Lyon 1

Transcription

03 - NTE Lyon 1
Version juin 2004
3 - CRÉER, ENREGISTRER, TRAITER, IMPRIMER ET IMPORTER
UN TABLEAU DE DONNEES
Nous nous proposons maintenant de découvrir l’éditeur de données
Qu'est ce que l'éditeur de données?
C'est un système permettant de créer et modifier des tableaux de données.
Comment accéder à un nouveau tableau de données?
Choisissez :
Fichier
Nouveau
Données
A quoi correspondent les lignes?
Une ligne correspond à un individu statistique, à une observation.
A quoi correspondent les colonnes?
Une colonne correspond à une variable, à un facteur.
Que peut contenir une cellule?
Une cellule ne peut contenir qu’une valeur unique. Cette valeur correspond à l’observation de la variable chez
l’individu. Cette cellule n’a pas du tout la même fonction qu’une cellule de tableur. En particulier on ne peut pas y
écrire une formule de calcul. Il est possible de créer de nouvelles variables calculées. Cette nouvelle variable est
alors créée pour tous les individus en une fois.
A propos des valeurs manquantes...
On appelle valeur manquante (missing value) toute valeur d’une variable observée chez un individu et non
renseignée (cellule vide). Un point (par défaut) représente ce vide dans SPSS.
Les valeurs manquantes apparaissent soit du fait d’un défaut d’observation (exemple : donnée non recueillie) ,
soit du fait d’une absence “logique” (exemple : nombre de grossesses chez un homme).
Il est conseillé de symboliser les valeurs manquantes par autre chose que le vide. Les valeurs manquantes peuvent
être représentées soit par une valeur prédéterminée (exemple : 9) soit par un intervalle de valeurs (exemple : de 7
à 9)
Les valeurs manquantes peuvent être, lors des analyses, soit exclues (c’est l’option par défaut dans SPSS), soit
assimilées à une valeur définie (moyenne par exemple).
Premiers pas dans SPSS ; Louis AYZAC
5
Version juin 2004
Le tableau ci-dessous regroupe une série de données totalement fictives concernant les séjours de plusieurs
patients dans un centre hospitalier.Ces données sont les suivantes :
identifi
cateur
02354
02356
02368
02378
02569
02654
02698
02705
02735
02812
02873
02932
02933
02934
sexe
age
m
f
f
f
m
m
f
m
m
;
m
f
f
f
45
56
36
29
63
64
75
32
21
17
65
47
42
incapa
test
1
2
1
-1
1
3
2
4
2
3
4
1
2
3
hospit
1
2
1
1
10
1
1
9
2
1
2
9
2
2
entrée
jour
mar
lun
mer
jeu
mer
sam
dim
lun
ven
sam
jeu
sam
ven
mar
entrée
heure
12:35
02:25
03:45
21:23
14:56
01:21
05:12
17:25
12:36
11:53
12:18
02:24
15:36
12:49
taux de
cholest
1.8365
1.6548
1.9857
1.9685
1.7852
1.9632
1.9423
1.9321
1.8963
1.7865
0.8963
0.8563
0.9632
diabète coûts
oui
oui
non
non
non
?
non
non
non
?
non
non
non
oui
$1,235
$1,326
$1,256
$1.269
$2,135
$1,265
$2,654
$3,125
$1,236
$2,236
$1,265
$2,365
$3,458
Incapa test
1 = "pas d'incapacité"
2 = "incapacité légère"
3 = "incapacité prononcée"
4 = "incapacité sévère"
Hospit
1 = "déjà hospitalisé"
2 = "jamais hospitalisé"
Diabet
oui = "sujet diabétique"
non = "sujet non diabétique"
Nous vous proposons d'analyser ces données dans SPSS.Pour ce faire, vous réaliserez une série d'étapes
indispensables regroupées par thèmes.
Premiers pas dans SPSS ; Louis AYZAC
6
Version juin 2004
A) Définir une variable...
1°étape : Donner un nom aux différentes variables du tableau.
Comment nommer ou renommer une variable?
Cliquez deux fois sur le nom de la
variable courante en haut de colonne
ou
cliquez une fois sur l’onglet Affichage
des variables
.
Le dictionnaire des données vous est affiché.
Tapez le nom de la variable dans la colonne Nom. La longueur de ce nom est limitée à 10 caractères sans
espace
2°étape : Définir un type qui vous semble le plus approprié aux différentes variables du tableau.
ŸAmener le curseur sur la colonne
Type et cliquer sur le bouton
d’extension de la colonne. Le
formulaire « Type de variable » est
affiché.
Type numérique : Les chiffres, le
signe + ou - en tête, le séparateur des
décimales sont autorisés.
Type chaine : Les lettres, les chiffres
et les autres caractères sont autorisés.
Premiers pas dans SPSS ; Louis AYZAC
7
Version juin 2004
Type date : Les dates et/ou les heures sont autorisées. Choisissez un format dans la liste.
Longueur : Nombre maximum de caractères.
Décimales : Nombre de décimales affichées.
A priori, on ne donne un type numérique qu'à des variables sur lesquelles on effectue des calculs, des
transformations ; toutefois, il est préférable sous SPSS de l'attribuer aussi à toute variable
correspondant à un identificateur.
3°étape : Pour les variables diabète, hospit, sexe, incapatest, traitez les caractères "?", "9, 10", ";", "-1"
apparaissant dans le tableau de données initial comme des valeurs manquantes. Pour les autres variables,
considérez la valeur manquante par défaut. Comment traîter les valeurs manquantes ?
Amener le curseur sur la colonne
Manquant et cliquer sur le bouton
d’extension de la colonne. Le
formulaire «Valeurs manquantes » est
affiché.
Aucune valeur manquante : Valeur
manquante par défaut ( le point).
Remarques :
Spécifier une valeur manquante par
une valeur facilement reconnaissable
et non utilisée.
(Par exemple, -1 quand les données
sont des entiers positifs).
4°étape : Pour des soucis de présentation, donner un format à la variable âge de façon à obtenir un texte
centré et une largeur acceptant 6 caractères et un à la variable taux de cholest permettant d'afficher
seulement 3 décimales.
Amener le curseur sur la colonne Colonnes et régler la taille par action sur les boutons Flèches
Amener le curseur sur la colonne Aligner et régler le format par action sur les boutons Flèches
5°étape : Etiqueter les variables sexe, incapatest, hospit, diabète et leurs valeurs.
Comment attribuer des étiquettes à une variable?
Amener le curseur sur la colonne « Etiquette » et tapper le nom étendu de la variable.
Comment attribuer des étiquettes à des valeurs d’une variable?
Amener le curseur sur la colonne
Valeurs et cliquer sur le bouton
d’extension de la colonne. Le
formulaire « Etiquettes de valeur »
est affiché.
Tapez la valeur de la variable
et son étiquette
dans les cases correspondantes.
Puis, ne pas oublier de cliquer sur
« Ajouter ».
Cliquez sur « OK »
Premiers pas dans SPSS ; Louis AYZAC
8
Version juin 2004
B) Introduire des données...
6°étape :
Entrer les données du tableau initial dans un nouveau fichier.
(Revenir aux premiers types définis pour les variables diabète, hospit, sexe)
Comment entrer les données?
Par observation, par variable, pour des zones sélectionnées ou pour des cellules individuelles.
ŸCliquez sur la cellule ou utiliser les touches fléchées pour l'atteindre.
ŸTapez la valeur (elle apparait dans l'éditeur de cellules).
ŸAppuyer sur la touche Entrée.
C) Faire une analyse descriptive des données...
7°étape :
Déterminer les fréquences et l'histogramme des différentes variables.
-
Cliquez sur le menu « Analyse »
Choisissez
l’option
« Statistiques
descriptives »
Choisissez la sous-option « Fréquences »
Premiers pas dans SPSS ; Louis AYZAC
9
Version juin 2004
.
Sélectionnez les variables à partir de la liste source
A partir de la liste des variables source,
on peut sélectionner des variables en les
mettant en surbrillance (en cliquant dessus) et
en les faisant passer dans la liste des
variables sélectionnées
en cliquant sur le bouton central.
On peut en sélectionner plusieurs (soit une par
une, soit en sélectionnant un groupe par la
méthode du cliquer-glisser).Pour les
désélectionner, il suffit d'effectuer l'opération
inverse, c'est à dire faire passer les variables
de la liste de sélection à la liste source.
Comment obtenir un histogramme?
Cliquez sur le bouton « Diagrammes »
Une boite de dialogue secondaire vous est
affichée.
Choisissez Histogrammes
Cliquez sur le bouton « Poursuivre »
Cliquez sur le bouton « OK »
Premiers pas dans SPSS ; Louis AYZAC
10
Version juin 2004
L’écran du Viewer SPSS vous est affiché.
Cet écran est divisé en deux parties :
- à gauche une partie navigation vous permet de vous déplacer parmi les résultats produits. Un clic de
souris sur une des feuilles de l’arbre vous permet d’accéder à son contenu. Un clic de souris sur le signe
+/- en tête du nœud de l’arbre dévellope ou restreint l’arborescence sous jacente
- à droite une partie affichage des résultats. Un double clic de souris dans le résultat affiché vous permet
d’accéder à son édition pour modifier sa présentation par exemple.
Fréquences
Avertissements
Avertissement lié à
l’exécution de la
demande d’analyse
DIABETE est une chaîne : aucun
histogramme ne peut être tracé.
SEXE est une chaîne : aucun
histogramme ne peut être tracé.
Validités des
données
Statistiques
N
Premiers pas dans SPSS ; Louis AYZAC
Valide
Manquante
CHOLESTE
13
1
DIABETE
12
2
SEXE
13
1
11
Version juin 2004
Effectif
Tableau de fréquences
Fréquence
CHOLESTE
Valide
,8563
,8963
,9632
1,6548
1,7852
1,7865
1,8365
Fréquence
1
1
1
1
Pour cent
7,1
7,1
7,1
7,1
Pourcentage
valide
7,7
7,7
7,7
7,7
1
1
1
1
1
7,1
7,1
7,1
7,1
7,1
7,7
7,7
7,7
7,7
7,7
38,5
46,2
53,8
61,5
69,2
1
1
1
1
13
7,1
7,1
7,1
7,1
92,9
7,7
7,7
7,7
7,7
100,0
76,9
84,6
92,3
100,0
1
14
7,1
100,0
1,8963
1,9321
1,9423
1,9632
1,9685
1,9867
Total
Système manquant
Manquante
Total
Pourcentage
cumulé
7,7
15,4
23,1
30,8
Fréquence
cumulée
DIABETE
Fréquence Pour cent
Valide
Manquante
Total
n
o
Total
?
9
3
12
2
14
64,3
21,4
85,7
14,3
100,0
Pourcentage Pourcentage
valide
cumulé
75,0
25,0
100,0
75,0
100,0
SEXE
Valide
Manquante
Total
Fréquence
Pour cent
7
6
13
1
14
50,0
42,9
92,9
7,1
100,0
f
m
Total
;
Pourcentage Pourcentage
valide
cumulé
53,8
46,2
100,0
53,8
100,0
Histogramme
CHOLESTE
5
4
3
Fréquence
2
1
Sigma = ,44
Moyenne = 1,65
N = 13,00
0
,88
1,00 1,13 1,25 1,38 1,50 1,63 1,75 1,88 2,00
CHOLESTE
Premiers pas dans SPSS ; Louis AYZAC
12
Version juin 2004
D) Modifier des données...
8°étape : Plusieurs individus ont été oubliés de l'étude, heureusement les données les concernant ont été
retrouvées.Insérer ces observations de façon à conserver un ordre croissant de l'identificateur.
02745 m
62
2
1
mar
13:45 0.985 non
$1195
02756 m
54
2
1
lun
14:06 0.365 non
$1275
02767 m
27
1
1
mer
19:23 0.326 non
$1225
02798 m
33
1
1
jeu
03:28 0.956 oui
$1123
02810 f
17
1
2
mer
06:54 0.965 oui
$1325
02771 m
68
4
1
ven
11:25 0.879 oui
$1256
Comment insérer des observations ?
Sélectionnez une cellule de la ligne au-dessous de la position où vous voulez insérer l'observation;
Choisissez :
Données
Insérer une observation
Comment copier les valeurs d'un groupe de cellules vers un autre groupe?
Sélectionnez l'ensemble de données que vous voulez copier;
Choisissez :
Edition
Copier
Sélectionnez les cellules de destination;
Choisissez :
Edition
Coller
9°étape : On souhaite présenter le tableau d'une autre façon. La première colonne correspond toujours à
l'identificateur, les autres colonnes correspondent aux autres variables rangées par ordre alphabétique.
Comment déplacer une variable au moyen du couper-coller dans l'éditeur de données?
1.Insérez une nouvelle variable à l'endroit où vous voulez déplacer la variable existante;
Pour ce faire, sélectionnez la colonne à droite de la position où vous voulez insérer la variable en cliquant
sur le nom de la variable en haut de la colonne ou bien sur une quelconque cellule de cette colonne. Puis,
choisissez :
Données
Insérer une variable
2.Sélectionnez la variable à déplacer en cliquant sur le nom de la variable en haut de la colonne concernée.
Puis, choisissez :
Edition
Couper
3.Se placer sur la variable insérée en cliquant sur le nom de la variable en haut de la colonne concernée et
choisissez :
Edition
Coller
E) Personnaliser un tableau de données...
10°étape : Pour les variables incapatest, sexe, hospit, remplacer les valeurs par leurs étiquettes.
Comment remplacer des valeurs par leurs étiquettes ?
Choisissez :
Premiers pas dans SPSS ; Louis AYZAC
13
Version juin 2004
Affichage
Etiquettes de valeur
Cette option permet aussi de fournir une liste d'étiquettes de valeur pour chaque variable et d'introduire des
données grâce à cette liste.
Pour ce faire :
1.Sélectionnez la cellule à l'aide de la souris.
2.Cliquez sur le bouton droit de la souris pour afficher la liste des étiquettes (si elle existe).
3.Sélectionnez dans la liste l'étiquette que vous voulez entrer.
4.Appuyez sur Enter pour introduire la valeur.
11°étape : Enlever le quadrillage pour l'impression du tableau de données et changer la police.
Comment valider ou non le quadrillage et modifier la police?
Choisissez :
Affichage
Quadrillage
puis :
Comment valider ou non le quadrillage et
modifier la police?
Choisissez :
Affichage
Polices
Lorsque vous sélectionnez une police, un style et
une taille, un exemple vous donne un aperçu de
ce que vous avez choisi.
F)Sauvegarder et imprimer un fichier de données...
12°étape :
1.Enregistrer le tableau de données dans un fichier "tab1.sav".
Choisissez :
Fichier
Enregistrer sous...
Pour enregistrer un fichier de données, il faut
tout d'abord lui donner un nom dans un
répertoire ou sous-répertoire
Les fichiers de données créés sous SPSS
doivent porter l'extension .sav.
Tapez le nom dans la case « Nom de fichier »
Choisissez le type SPSS(*.SAV).
Cliquez sur Enregistrer.
Premiers pas dans SPSS ; Louis AYZAC
14
Version juin 2004
2.Imprimer ce fichier.
Comment imprimer un fichier de données?
Choisissez :
Fichier
Imprimer
G) Importer un fichier de données...
Les fichiers de données peuvent avoir des formats très divers ; SPSS est conçu pour gérer la plupart de ces
formats, notamment :
Ÿles fichiers de type tableur créés avec Lotus 1-2-3, Excel et Multiplan.
Ÿles fichiers de type base de données créés avec dBASE.
Ÿles fichiers tabulés et autres types de fichiers texte ASCII.
13°étape : Ouvrir les fichiers de données "tab1.xls" (format Excel), et "tab1.dbf" (format dBASE) sous
SPSS.
Choisissez :
Fichier
Ouvrir
Données...
Placez vous sur le bon répertoire.
Utilisez la liste concernant le type de fichier pour
vous placer sur le format qui vous intéresse.
Choisissez le nom du fichier
Cliquez sur le bouton « Ouvrir » ; éventuellement
complétez les options proposées.
Premiers pas dans SPSS ; Louis AYZAC
15
Version juin 2004
Premiers pas dans SPSS ; Louis AYZAC
16