Importer des données au format texte brut avec Calc
Transcription
Importer des données au format texte brut avec Calc
Importer des données au format texte brut avec Calc Jerry Magnin Licence: CC-By-SA Table des matières I Pourquoi des données au format texte brut ? 1 1 L’origine des données 1 2 Comment reconnaître un fichier texte brut ? 2 II 2 Importer directement un fichier texte brut 3 L’import 2 4 Enregistrement du fichier 4 III Mettre en forme des données collées dans un tableur 4 Table des figures 1 2 3 4 La commande file et son retour sur Fenêtre d’import de texte brut . . . Définition des types de colonnes . . . Les données après import . . . . . . un fichier texte brut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 3 5 6 Première partie Pourquoi des données au format texte brut ? 1 L’origine des données Généralement, les capteurs de mesures divers enregistrent leurs données sous forme de fichiers texte brut. Certains sites permettent également l’export de 1 leurs données au format CSV. Pourquoi ces formats ? Ils présentent plusieurs avantages : – à volume de données égal, un fichier texte brut est moins lourd qu’un fichier de tableur (à titre d’exemple, le fichier qui m’a servi de base pour les captures d’écran de ce tutoriel — 4 lignes pour 3 colonnes — pèse 75 octets en texte brut, contre 16,2 ko en fichier calc) ; – ils peuvent être lus sur presque n’importe quel système d’exploitation, généralement sans avoir besoin d’installer un logiciel particulier (le blocnotes suffit à les ouvrir) ; – ils peuvent facilement être scriptés pour en intégrer le contenu dans des bases de données ; – ils peuvent être importés directement dans des outils de traitement statistiques comme R. 2 Comment reconnaître un fichier texte brut ? L’extension des fichiers est généralement un bon indicateur de son type. Un fichier portant l’extension .txt, .csv ou .dat est généralement un fichier texte brut. Pour en avoir le cœur net, il est possible, sous GNU/Linux, de faire appel à la commande file, qui, utilisée sans paramètre, vous retourne le type de fichier. Si le type de retour est ASCII text, vous avez un fichier texte brut (voir figure 1). Figure 1: La commande file et son retour sur un fichier texte brut Deuxième partie Importer directement un fichier texte brut 3 L’import Pour être utilisés dans un tableur (ici Calc), ces fichiers doivent être importés en définissant un certain nombre de paramètres. Tout d’abord, après avoir en2 registré le fichier du tutoriel sur votre disque dur, ouvrez-le avec un clic droit > Ouvrir (avec) > LibreOffice Calc. Une fenêtre similaire à celle de la figure 2 devrait apparaître. Figure 2: Fenêtre d’import de texte brut Définissez le séparateur (c’est-à-dire le caractère délimitant les différentes colonnes) dans « Options de séparateur ». Les données affichées dans « Champs » s’actualisent en fonction du ou des séparateurs que vous définissez, pour vous donner un aperçu du résultat après import. Dans la section « Champs », justement, vous pouvez définir un certain nombre de formats pour vos colonnes. Pour ce faire, sélectionnez le champ désiré en cliquant sur son en-tête, et modifiez son attribut (par défaut « Standard ») avec la liste déroulante « Type de colonne ». Pour sélectionner plusieurs champs contigus, sélectionnez le premier puis, en maintenant la touche maj enfoncée, sélectionnez le dernier. La première colonne du fichier de données du tutoriel contient des dates au 3 format « année - mois - jour ». Sélectionnez-la, et choisissez le format « Date (AMJ) » (figure 3a). Les deux colonnes suivantes utilisent des données chiffrées avec un point en guise de séparateur décimal. Ce format, c’est celui d’un nombre dans les pays anglo-saxons. Si nous importons ces colonnes sans rien faire, Calc considérera qu’il s’agit de texte. Il sera alors impossible d’utiliser des formules, de faire des graphiques. . . Pour que ces colonnes soient reconnues comme des nombres, il faut indiquer que leur format est « Anglais US » (figure 3b). Une fois ces opérations préliminaires effectuées, cliquez sur OK pour vous retrouver dans votre tableur. Les données ont été importées. Notez que Calc a converti le point décimal en virgule, et qu’il affiche la date au format JJ/MM/AA (figure 4). 4 Enregistrement du fichier Vous allez sans doute vouloir effectuer des calculs sur vos données importées, ou réaliser des graphiques. . . Ces objets ne peuvent être sauvegardés dans un fichier texte brut. Il faut donc impérativement enregistrer vos données en .ods en passant par Fichier >Enregistrer sous, en imposant l’extension .ods. Si vous tentez d’enregistrer en .csv, LibreOffice vous rappellera que les objets ne peuvent être sauvés dans ce format, et vous demandera confirmation pour savoir si oui ou non vous voulez enregistrer votre feuille au format texte brut. Si vous répondez par la négative, la boîte de dialogue « Enregistre sous » s’affichera. Vous pouvez changer le nom de fichier, mais ce n’est pas obligatoire. Il n’est pas nécessaire de spécifier l’extension .ods, LibreOffice s’en chargera. Troisième partie Mettre en forme des données collées dans un tableur Quelquefois, les données texte brut que vous aurez proviendront d’un copiercoller. Plutôt que de les enregistrer dans un fichier texte brut pour ensuite les importer comme vu ci-dessus, il est possible de les intégrer directement dans Calc. Parfois, lors du coller, LibreOffice vous affichera automatiquement la boîte de dialogue de la figure 2. Vous n’avez plus qu’à suivre les indications de la section 3. Mais, quelquefois, les données se retrouveront collées dans une cellule, sans mise en forme. Sélectionnez alors cette cellule, puis ouvrez le menu Données > Texte en colonnes Cette opération vous ouvrira la fenêtre de mise en forme de texte en colonnes, quasi-identique à la fenêtre d’import (au titre près). Suivez alors les indications de la section 3. 4 (a) Définition d’un type de date (b) Type « Anglais US » Figure 3: Définition des types de colonnes 5 Figure 4: Les données après import 6