Importer des données au format texte brut avec Calc

Transcription

Importer des données au format texte brut avec Calc
Importer des données au format
texte brut avec Calc
Jerry Magnin
Licence: CC-By-SA
Table des matières
I
Pourquoi des données au format texte brut ?
1
1 L’origine des données
1
2 Comment reconnaître un fichier texte brut ?
2
II
2
Importer directement un fichier texte brut
3 L’import
2
4 Enregistrement du fichier
4
III Mettre en forme des données collées dans un tableur
4
Table des figures
1
2
3
4
La commande file et son retour sur
Fenêtre d’import de texte brut . . .
Définition des types de colonnes . . .
Les données après import . . . . . .
un fichier texte brut
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
3
5
6
Première partie
Pourquoi des données au format
texte brut ?
1
L’origine des données
Généralement, les capteurs de mesures divers enregistrent leurs données sous
forme de fichiers texte brut. Certains sites permettent également l’export de
1
leurs données au format CSV. Pourquoi ces formats ? Ils présentent plusieurs
avantages :
– à volume de données égal, un fichier texte brut est moins lourd qu’un
fichier de tableur (à titre d’exemple, le fichier qui m’a servi de base pour
les captures d’écran de ce tutoriel — 4 lignes pour 3 colonnes — pèse 75
octets en texte brut, contre 16,2 ko en fichier calc) ;
– ils peuvent être lus sur presque n’importe quel système d’exploitation,
généralement sans avoir besoin d’installer un logiciel particulier (le blocnotes suffit à les ouvrir) ;
– ils peuvent facilement être scriptés pour en intégrer le contenu dans des
bases de données ;
– ils peuvent être importés directement dans des outils de traitement statistiques comme R.
2
Comment reconnaître un fichier texte brut ?
L’extension des fichiers est généralement un bon indicateur de son type. Un
fichier portant l’extension .txt, .csv ou .dat est généralement un fichier texte
brut. Pour en avoir le cœur net, il est possible, sous GNU/Linux, de faire appel à
la commande file, qui, utilisée sans paramètre, vous retourne le type de fichier.
Si le type de retour est ASCII text, vous avez un fichier texte brut (voir figure
1).
Figure 1: La commande file et son retour sur un fichier texte brut
Deuxième partie
Importer directement un fichier
texte brut
3
L’import
Pour être utilisés dans un tableur (ici Calc), ces fichiers doivent être importés
en définissant un certain nombre de paramètres. Tout d’abord, après avoir en2
registré le fichier du tutoriel sur votre disque dur, ouvrez-le avec un clic droit >
Ouvrir (avec) > LibreOffice Calc. Une fenêtre similaire à celle de la figure
2 devrait apparaître.
Figure 2: Fenêtre d’import de texte brut
Définissez le séparateur (c’est-à-dire le caractère délimitant les différentes
colonnes) dans « Options de séparateur ». Les données affichées dans « Champs »
s’actualisent en fonction du ou des séparateurs que vous définissez, pour vous
donner un aperçu du résultat après import.
Dans la section « Champs », justement, vous pouvez définir un certain nombre
de formats pour vos colonnes. Pour ce faire, sélectionnez le champ désiré en cliquant sur son en-tête, et modifiez son attribut (par défaut « Standard ») avec
la liste déroulante « Type de colonne ». Pour sélectionner plusieurs champs
contigus, sélectionnez le premier puis, en maintenant la touche maj enfoncée,
sélectionnez le dernier.
La première colonne du fichier de données du tutoriel contient des dates au
3
format « année - mois - jour ». Sélectionnez-la, et choisissez le format « Date
(AMJ) » (figure 3a). Les deux colonnes suivantes utilisent des données chiffrées
avec un point en guise de séparateur décimal. Ce format, c’est celui d’un nombre
dans les pays anglo-saxons. Si nous importons ces colonnes sans rien faire, Calc
considérera qu’il s’agit de texte. Il sera alors impossible d’utiliser des formules,
de faire des graphiques. . . Pour que ces colonnes soient reconnues comme des
nombres, il faut indiquer que leur format est « Anglais US » (figure 3b).
Une fois ces opérations préliminaires effectuées, cliquez sur OK pour vous
retrouver dans votre tableur. Les données ont été importées. Notez que Calc a
converti le point décimal en virgule, et qu’il affiche la date au format JJ/MM/AA
(figure 4).
4
Enregistrement du fichier
Vous allez sans doute vouloir effectuer des calculs sur vos données importées,
ou réaliser des graphiques. . . Ces objets ne peuvent être sauvegardés dans un
fichier texte brut. Il faut donc impérativement enregistrer vos données en .ods
en passant par Fichier >Enregistrer sous, en imposant l’extension .ods. Si
vous tentez d’enregistrer en .csv, LibreOffice vous rappellera que les objets ne
peuvent être sauvés dans ce format, et vous demandera confirmation pour savoir
si oui ou non vous voulez enregistrer votre feuille au format texte brut. Si vous
répondez par la négative, la boîte de dialogue « Enregistre sous » s’affichera.
Vous pouvez changer le nom de fichier, mais ce n’est pas obligatoire. Il n’est pas
nécessaire de spécifier l’extension .ods, LibreOffice s’en chargera.
Troisième partie
Mettre en forme des données
collées dans un tableur
Quelquefois, les données texte brut que vous aurez proviendront d’un copiercoller. Plutôt que de les enregistrer dans un fichier texte brut pour ensuite les
importer comme vu ci-dessus, il est possible de les intégrer directement dans
Calc.
Parfois, lors du coller, LibreOffice vous affichera automatiquement la boîte
de dialogue de la figure 2. Vous n’avez plus qu’à suivre les indications de la
section 3.
Mais, quelquefois, les données se retrouveront collées dans une cellule, sans
mise en forme. Sélectionnez alors cette cellule, puis ouvrez le menu Données > Texte
en colonnes Cette opération vous ouvrira la fenêtre de mise en forme de texte
en colonnes, quasi-identique à la fenêtre d’import (au titre près). Suivez alors
les indications de la section 3.
4
(a) Définition d’un type de date
(b) Type « Anglais US »
Figure 3: Définition des types de colonnes
5
Figure 4: Les données après import
6

Documents pareils