03 - NTE Lyon 1
Transcription
03 - NTE Lyon 1
Version juin 2004 3 - CRÉER, ENREGISTRER, TRAITER, IMPRIMER ET IMPORTER UN TABLEAU DE DONNEES Nous nous proposons maintenant de découvrir l’éditeur de données Qu'est ce que l'éditeur de données? C'est un système permettant de créer et modifier des tableaux de données. Comment accéder à un nouveau tableau de données? Choisissez : Fichier Nouveau Données A quoi correspondent les lignes? Une ligne correspond à un individu statistique, à une observation. A quoi correspondent les colonnes? Une colonne correspond à une variable, à un facteur. Que peut contenir une cellule? Une cellule ne peut contenir qu’une valeur unique. Cette valeur correspond à l’observation de la variable chez l’individu. Cette cellule n’a pas du tout la même fonction qu’une cellule de tableur. En particulier on ne peut pas y écrire une formule de calcul. Il est possible de créer de nouvelles variables calculées. Cette nouvelle variable est alors créée pour tous les individus en une fois. A propos des valeurs manquantes... On appelle valeur manquante (missing value) toute valeur d’une variable observée chez un individu et non renseignée (cellule vide). Un point (par défaut) représente ce vide dans SPSS. Les valeurs manquantes apparaissent soit du fait d’un défaut d’observation (exemple : donnée non recueillie) , soit du fait d’une absence “logique” (exemple : nombre de grossesses chez un homme). Il est conseillé de symboliser les valeurs manquantes par autre chose que le vide. Les valeurs manquantes peuvent être représentées soit par une valeur prédéterminée (exemple : 9) soit par un intervalle de valeurs (exemple : de 7 à 9) Les valeurs manquantes peuvent être, lors des analyses, soit exclues (c’est l’option par défaut dans SPSS), soit assimilées à une valeur définie (moyenne par exemple). Premiers pas dans SPSS ; Louis AYZAC 5 Version juin 2004 Le tableau ci-dessous regroupe une série de données totalement fictives concernant les séjours de plusieurs patients dans un centre hospitalier.Ces données sont les suivantes : identifi cateur 02354 02356 02368 02378 02569 02654 02698 02705 02735 02812 02873 02932 02933 02934 sexe age m f f f m m f m m ; m f f f 45 56 36 29 63 64 75 32 21 17 65 47 42 incapa test 1 2 1 -1 1 3 2 4 2 3 4 1 2 3 hospit 1 2 1 1 10 1 1 9 2 1 2 9 2 2 entrée jour mar lun mer jeu mer sam dim lun ven sam jeu sam ven mar entrée heure 12:35 02:25 03:45 21:23 14:56 01:21 05:12 17:25 12:36 11:53 12:18 02:24 15:36 12:49 taux de cholest 1.8365 1.6548 1.9857 1.9685 1.7852 1.9632 1.9423 1.9321 1.8963 1.7865 0.8963 0.8563 0.9632 diabète coûts oui oui non non non ? non non non ? non non non oui $1,235 $1,326 $1,256 $1.269 $2,135 $1,265 $2,654 $3,125 $1,236 $2,236 $1,265 $2,365 $3,458 Incapa test 1 = "pas d'incapacité" 2 = "incapacité légère" 3 = "incapacité prononcée" 4 = "incapacité sévère" Hospit 1 = "déjà hospitalisé" 2 = "jamais hospitalisé" Diabet oui = "sujet diabétique" non = "sujet non diabétique" Nous vous proposons d'analyser ces données dans SPSS.Pour ce faire, vous réaliserez une série d'étapes indispensables regroupées par thèmes. Premiers pas dans SPSS ; Louis AYZAC 6 Version juin 2004 A) Définir une variable... 1°étape : Donner un nom aux différentes variables du tableau. Comment nommer ou renommer une variable? Cliquez deux fois sur le nom de la variable courante en haut de colonne ou cliquez une fois sur l’onglet Affichage des variables . Le dictionnaire des données vous est affiché. Tapez le nom de la variable dans la colonne Nom. La longueur de ce nom est limitée à 10 caractères sans espace 2°étape : Définir un type qui vous semble le plus approprié aux différentes variables du tableau. ŸAmener le curseur sur la colonne Type et cliquer sur le bouton d’extension de la colonne. Le formulaire « Type de variable » est affiché. Type numérique : Les chiffres, le signe + ou - en tête, le séparateur des décimales sont autorisés. Type chaine : Les lettres, les chiffres et les autres caractères sont autorisés. Premiers pas dans SPSS ; Louis AYZAC 7 Version juin 2004 Type date : Les dates et/ou les heures sont autorisées. Choisissez un format dans la liste. Longueur : Nombre maximum de caractères. Décimales : Nombre de décimales affichées. A priori, on ne donne un type numérique qu'à des variables sur lesquelles on effectue des calculs, des transformations ; toutefois, il est préférable sous SPSS de l'attribuer aussi à toute variable correspondant à un identificateur. 3°étape : Pour les variables diabète, hospit, sexe, incapatest, traitez les caractères "?", "9, 10", ";", "-1" apparaissant dans le tableau de données initial comme des valeurs manquantes. Pour les autres variables, considérez la valeur manquante par défaut. Comment traîter les valeurs manquantes ? Amener le curseur sur la colonne Manquant et cliquer sur le bouton d’extension de la colonne. Le formulaire «Valeurs manquantes » est affiché. Aucune valeur manquante : Valeur manquante par défaut ( le point). Remarques : Spécifier une valeur manquante par une valeur facilement reconnaissable et non utilisée. (Par exemple, -1 quand les données sont des entiers positifs). 4°étape : Pour des soucis de présentation, donner un format à la variable âge de façon à obtenir un texte centré et une largeur acceptant 6 caractères et un à la variable taux de cholest permettant d'afficher seulement 3 décimales. Amener le curseur sur la colonne Colonnes et régler la taille par action sur les boutons Flèches Amener le curseur sur la colonne Aligner et régler le format par action sur les boutons Flèches 5°étape : Etiqueter les variables sexe, incapatest, hospit, diabète et leurs valeurs. Comment attribuer des étiquettes à une variable? Amener le curseur sur la colonne « Etiquette » et tapper le nom étendu de la variable. Comment attribuer des étiquettes à des valeurs d’une variable? Amener le curseur sur la colonne Valeurs et cliquer sur le bouton d’extension de la colonne. Le formulaire « Etiquettes de valeur » est affiché. Tapez la valeur de la variable et son étiquette dans les cases correspondantes. Puis, ne pas oublier de cliquer sur « Ajouter ». Cliquez sur « OK » Premiers pas dans SPSS ; Louis AYZAC 8 Version juin 2004 B) Introduire des données... 6°étape : Entrer les données du tableau initial dans un nouveau fichier. (Revenir aux premiers types définis pour les variables diabète, hospit, sexe) Comment entrer les données? Par observation, par variable, pour des zones sélectionnées ou pour des cellules individuelles. ŸCliquez sur la cellule ou utiliser les touches fléchées pour l'atteindre. ŸTapez la valeur (elle apparait dans l'éditeur de cellules). ŸAppuyer sur la touche Entrée. C) Faire une analyse descriptive des données... 7°étape : Déterminer les fréquences et l'histogramme des différentes variables. - Cliquez sur le menu « Analyse » Choisissez l’option « Statistiques descriptives » Choisissez la sous-option « Fréquences » Premiers pas dans SPSS ; Louis AYZAC 9 Version juin 2004 . Sélectionnez les variables à partir de la liste source A partir de la liste des variables source, on peut sélectionner des variables en les mettant en surbrillance (en cliquant dessus) et en les faisant passer dans la liste des variables sélectionnées en cliquant sur le bouton central. On peut en sélectionner plusieurs (soit une par une, soit en sélectionnant un groupe par la méthode du cliquer-glisser).Pour les désélectionner, il suffit d'effectuer l'opération inverse, c'est à dire faire passer les variables de la liste de sélection à la liste source. Comment obtenir un histogramme? Cliquez sur le bouton « Diagrammes » Une boite de dialogue secondaire vous est affichée. Choisissez Histogrammes Cliquez sur le bouton « Poursuivre » Cliquez sur le bouton « OK » Premiers pas dans SPSS ; Louis AYZAC 10 Version juin 2004 L’écran du Viewer SPSS vous est affiché. Cet écran est divisé en deux parties : - à gauche une partie navigation vous permet de vous déplacer parmi les résultats produits. Un clic de souris sur une des feuilles de l’arbre vous permet d’accéder à son contenu. Un clic de souris sur le signe +/- en tête du nœud de l’arbre dévellope ou restreint l’arborescence sous jacente - à droite une partie affichage des résultats. Un double clic de souris dans le résultat affiché vous permet d’accéder à son édition pour modifier sa présentation par exemple. Fréquences Avertissements Avertissement lié à l’exécution de la demande d’analyse DIABETE est une chaîne : aucun histogramme ne peut être tracé. SEXE est une chaîne : aucun histogramme ne peut être tracé. Validités des données Statistiques N Premiers pas dans SPSS ; Louis AYZAC Valide Manquante CHOLESTE 13 1 DIABETE 12 2 SEXE 13 1 11 Version juin 2004 Effectif Tableau de fréquences Fréquence CHOLESTE Valide ,8563 ,8963 ,9632 1,6548 1,7852 1,7865 1,8365 Fréquence 1 1 1 1 Pour cent 7,1 7,1 7,1 7,1 Pourcentage valide 7,7 7,7 7,7 7,7 1 1 1 1 1 7,1 7,1 7,1 7,1 7,1 7,7 7,7 7,7 7,7 7,7 38,5 46,2 53,8 61,5 69,2 1 1 1 1 13 7,1 7,1 7,1 7,1 92,9 7,7 7,7 7,7 7,7 100,0 76,9 84,6 92,3 100,0 1 14 7,1 100,0 1,8963 1,9321 1,9423 1,9632 1,9685 1,9867 Total Système manquant Manquante Total Pourcentage cumulé 7,7 15,4 23,1 30,8 Fréquence cumulée DIABETE Fréquence Pour cent Valide Manquante Total n o Total ? 9 3 12 2 14 64,3 21,4 85,7 14,3 100,0 Pourcentage Pourcentage valide cumulé 75,0 25,0 100,0 75,0 100,0 SEXE Valide Manquante Total Fréquence Pour cent 7 6 13 1 14 50,0 42,9 92,9 7,1 100,0 f m Total ; Pourcentage Pourcentage valide cumulé 53,8 46,2 100,0 53,8 100,0 Histogramme CHOLESTE 5 4 3 Fréquence 2 1 Sigma = ,44 Moyenne = 1,65 N = 13,00 0 ,88 1,00 1,13 1,25 1,38 1,50 1,63 1,75 1,88 2,00 CHOLESTE Premiers pas dans SPSS ; Louis AYZAC 12 Version juin 2004 D) Modifier des données... 8°étape : Plusieurs individus ont été oubliés de l'étude, heureusement les données les concernant ont été retrouvées.Insérer ces observations de façon à conserver un ordre croissant de l'identificateur. 02745 m 62 2 1 mar 13:45 0.985 non $1195 02756 m 54 2 1 lun 14:06 0.365 non $1275 02767 m 27 1 1 mer 19:23 0.326 non $1225 02798 m 33 1 1 jeu 03:28 0.956 oui $1123 02810 f 17 1 2 mer 06:54 0.965 oui $1325 02771 m 68 4 1 ven 11:25 0.879 oui $1256 Comment insérer des observations ? Sélectionnez une cellule de la ligne au-dessous de la position où vous voulez insérer l'observation; Choisissez : Données Insérer une observation Comment copier les valeurs d'un groupe de cellules vers un autre groupe? Sélectionnez l'ensemble de données que vous voulez copier; Choisissez : Edition Copier Sélectionnez les cellules de destination; Choisissez : Edition Coller 9°étape : On souhaite présenter le tableau d'une autre façon. La première colonne correspond toujours à l'identificateur, les autres colonnes correspondent aux autres variables rangées par ordre alphabétique. Comment déplacer une variable au moyen du couper-coller dans l'éditeur de données? 1.Insérez une nouvelle variable à l'endroit où vous voulez déplacer la variable existante; Pour ce faire, sélectionnez la colonne à droite de la position où vous voulez insérer la variable en cliquant sur le nom de la variable en haut de la colonne ou bien sur une quelconque cellule de cette colonne. Puis, choisissez : Données Insérer une variable 2.Sélectionnez la variable à déplacer en cliquant sur le nom de la variable en haut de la colonne concernée. Puis, choisissez : Edition Couper 3.Se placer sur la variable insérée en cliquant sur le nom de la variable en haut de la colonne concernée et choisissez : Edition Coller E) Personnaliser un tableau de données... 10°étape : Pour les variables incapatest, sexe, hospit, remplacer les valeurs par leurs étiquettes. Comment remplacer des valeurs par leurs étiquettes ? Choisissez : Premiers pas dans SPSS ; Louis AYZAC 13 Version juin 2004 Affichage Etiquettes de valeur Cette option permet aussi de fournir une liste d'étiquettes de valeur pour chaque variable et d'introduire des données grâce à cette liste. Pour ce faire : 1.Sélectionnez la cellule à l'aide de la souris. 2.Cliquez sur le bouton droit de la souris pour afficher la liste des étiquettes (si elle existe). 3.Sélectionnez dans la liste l'étiquette que vous voulez entrer. 4.Appuyez sur Enter pour introduire la valeur. 11°étape : Enlever le quadrillage pour l'impression du tableau de données et changer la police. Comment valider ou non le quadrillage et modifier la police? Choisissez : Affichage Quadrillage puis : Comment valider ou non le quadrillage et modifier la police? Choisissez : Affichage Polices Lorsque vous sélectionnez une police, un style et une taille, un exemple vous donne un aperçu de ce que vous avez choisi. F)Sauvegarder et imprimer un fichier de données... 12°étape : 1.Enregistrer le tableau de données dans un fichier "tab1.sav". Choisissez : Fichier Enregistrer sous... Pour enregistrer un fichier de données, il faut tout d'abord lui donner un nom dans un répertoire ou sous-répertoire Les fichiers de données créés sous SPSS doivent porter l'extension .sav. Tapez le nom dans la case « Nom de fichier » Choisissez le type SPSS(*.SAV). Cliquez sur Enregistrer. Premiers pas dans SPSS ; Louis AYZAC 14 Version juin 2004 2.Imprimer ce fichier. Comment imprimer un fichier de données? Choisissez : Fichier Imprimer G) Importer un fichier de données... Les fichiers de données peuvent avoir des formats très divers ; SPSS est conçu pour gérer la plupart de ces formats, notamment : Ÿles fichiers de type tableur créés avec Lotus 1-2-3, Excel et Multiplan. Ÿles fichiers de type base de données créés avec dBASE. Ÿles fichiers tabulés et autres types de fichiers texte ASCII. 13°étape : Ouvrir les fichiers de données "tab1.xls" (format Excel), et "tab1.dbf" (format dBASE) sous SPSS. Choisissez : Fichier Ouvrir Données... Placez vous sur le bon répertoire. Utilisez la liste concernant le type de fichier pour vous placer sur le format qui vous intéresse. Choisissez le nom du fichier Cliquez sur le bouton « Ouvrir » ; éventuellement complétez les options proposées. Premiers pas dans SPSS ; Louis AYZAC 15 Version juin 2004 Premiers pas dans SPSS ; Louis AYZAC 16