Manuel d`utilisation

Transcription

Manuel d`utilisation
man SP dos carré
27/06/03 17:25
Page 1
Manuel d'utilisation
man SP dos carré
27/06/03 17:25
Page 2
GOTO Software, S.A. au capital de 600 000 €, RCS Roubaix-Tourcoing 433 084 522
Avenue Antoine Pinay - Parc des Quatre Vents - 59510 Hem - France
Le logiciel et cette documentation constituent le produit SpéciaListe pour Windows et font l'objet d'un contrat d'utilisation. Veuillez le lire s'il-vous-plaît. Chaque contrat est unique. Le logiciel
qui lui est associé ne peut être utilisé que sur un même poste de travail informatique.
L'acquisition de ce produit ne vous permet en aucun cas d'effectuer des reproductions, même
partielles, et par quelque moyen que ce soit, du logiciel ou de la documentation. Des poursuites
seront engagées pour toute utilisation non conforme.
© 2 0 0 3 G OTO -
Tous droits réservés
Les logiciels, ordinateurs et marques cités dans ce manuel sont des marques déposées
et ne sont cités qu'à titre d'exemple.
2 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 3
TABLE DES MATIÈRES
Introduction : SpéciaListe, mais de quoi ? .............................................................................. 5
Configuration requise ................................................................................................................. 6
Conseils de consultation de l'aide .............................................................................. 6
Présentation ............................................................................................................................................................... 7
J'ai un vieux fichier de clients ... .................................................................................... 9
Il y a plein de doublons ... ................................................................................................. 10
J'aimerais pouvoir séparer ... ......................................................................................... 11
Ils ont tous tapé TOTO dans ce champ ?! ..................................................... 12
Combien de clients à moins de 50km ? ............................................................ 14
Le chargement d'un fichier .................................................................................................................... 15
Formats bureautiques spécifiques ........................................................................... 16
Le Carnet d'adresses de Windows .......................................................................... 16
Fichiers texte au premier chargement ................................................................ 17
Fichiers texte déjà analysés ............................................................................................. 18
Fonctions générales ....................................................................................................................................... 19
Tri ..................................................................................................................................................................... 20
Le tri par valeur .............................................................................................................. 20
Le tri par valeur sur plusieurs colonnes ............................................. 20
Les critères avancés de tri ................................................................................. 21
Marquage .............................................................................................................................................. 23
Indexation et vues ....................................................................................................................... 24
Obtenir un index .......................................................................................................... 27
Exploiter un index ....................................................................................................... 29
Changements groupés .......................................................................................................... 31
Recherche avancée .................................................................................................................... 32
Traitement des doublons .................................................................................................... 33
Fusion ......................................................................................................................................................... 35
Croisement ........................................................................................................................................... 35
Partez sur de bonnes bases
SpéciaListe // 3
man SP dos carré
27/06/03 17:25
Page 4
Traitements spécifiques aux champs ......................................................................................... 37
Noms et prénoms ........................................................................................................................ 38
La correction des champs d'identité ........................................................ 38
Segmentation en tranches d'âge ................................................................. 40
Statistiques .............................................................................................................................. 40
Codes SIRET et APE ................................................................................................................. 41
Numéros de téléphone ......................................................................................................... 41
Villes et codes postaux .......................................................................................................... 42
Adresses postales ........................................................................................................................ 42
Adresses de courrier électronique .......................................................................... 44
L'outil carte de France ................................................................................................................................ 46
Villes et départements ........................................................................................................... 47
Déplacements, agrandissements .............................................................................. 48
Sélections, élargissements, filtres ............................................................................. 49
Exportation en tant qu'image ....................................................................................... 50
Utilisation des résultats ............................................................................................................................. 51
L'extraction des nouvelles tables de données .......................................... 52
L'exportation des données ............................................................................................... 52
Briefings et présentations .................................................................................................. 53
L'impression ........................................................................................................................................ 53
Annexes ....................................................................................................................................................................... 55
A1. Etude de cas : data mining sur un site Web .................................... 55
Combien de visiteurs uniques ? ..................................................................... 58
Sommes-nous bien référencés sur la Toile ? .................................. 60
Quelles sont nos pages les plus lues ? .................................................. 62
Quels sont les créneaux horaires dominants ? ............................. 64
Evaluation de la qualité de service ............................................................. 66
A2. Expressions régulières ................................................................................................ 68
Licence ........................................................................................................................................................................... 71
4 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 5
INTRODUCTION :
SPÉCIALISTE, MAIS DE QUOI ?
Exprimé en une seule phrase, SpéciaListe est un logiciel
bureautique pour le traitement rapide des fichiers volumineux,
particulièrement adapté aux informations d'identité, d'adresse postale
et d'adresse électronique.
La vitesse de traitement de SpéciaListe, alliée à la reconnaissance
automatique des contenus, permet à l'utilisateur de regarder son
information sous des angles nouveaux, et de ce fait d'enrichir
continuellement les méthodes d'analyse et d'exploitation de ses fichiers.
SpéciaListe est donc avant tout un outil de productivité
personnelle :
• simple (comme un tableur),
• puissant (comme une base de données)
• rapide (sans terme de comparaison !)
Partez sur de bonnes bases
SpéciaListe // 5
man SP dos carré
27/06/03 17:25
Page 6
Configuration requise
• PC Compatible IBM®
• Processeur Pentium® ou équivalent
• Système d'exploitation Windows® 95, 98, Me, NT4, 2000 ou XP
(toutes éditions)
• Mémoire vive : environ le double de la taille des fichiers
traités
• Lecteur CD-ROM
• Connexion Internet pour la vérification complète des adresses
e-mail contenues dans un fichier.
Conseils de consultation de l'aide
Ce manuel est destiné à tout utilisateur de SpéciaListe, quelle
que soit l'étendue de son expérience bureautique.
Le chapitre Présentation est particulièrement destiné à faire
découvrir les capacités du logiciel, en s'appuyant sur des exemples qui
expriment des besoins professionnels courants.
Si vous découvrez SpéciaListe, nous vous conseillons la lecture de
ce chapitre avant d'utiliser le logiciel. Fort de cet acquis, même si les cas
d'étude présentés ne correspondent qu'à moitié au vôtre, vous
constaterez à l'usage qu'il vous sera bien plus facile de retrouver la
réponse à l'autre moitié parmi les fonctions du logiciel.
Les chapitres suivants sont des chapitres de référence, à consulter
en cas de question précise. L'ensemble de la documentation est
disponible dans l'aide en ligne.
6 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 7
PRÉSENTATION
Dans la panoplie des outils bureautiques d'aujourd'hui, SpéciaListe
vient occuper une place située entre le tableur et le logiciel de gestion
de bases de données. Seulement, la place était vide depuis tellement
longtemps qu'on a fini par oublier les questions auxquelles ni l'un,
ni l'autre ne savent apporter de réponse.
Historiquement, il revient au tableur le mérite d'avoir ouvert le
premier une fenêtre quadrillée sur les données bureautiques.
Il porte à l'écran informatique une métaphore qui nous est familière
depuis nos premiers cahiers à petits carreaux : les quantités à additionner
bien rangées les unes en dessous des autres, un trait, puis le total.
En faisant défiler l'écran, la feuille de calcul semble tout aussi
vaste qu'un cahier vierge le jour de la rentrée, et de toutes façons
jusqu'à la sixième un cahier était rangé ou perdu bien avant d'arriver à
la dernière page, n'est-ce pas ? Ca tombe bien, nous sommes en 1978
et la mémoire vive d'un ordinateur de bureau est à peine plus grande
que l'équivalent d'un cahier de 100 pages.
Mais la bureautique courante s'en accommodera pendant des
années, alors qu'il y a de plus en plus de mémoire vive en attente d'une
Partez sur de bonnes bases
SpéciaListe // 7
man SP dos carré
27/06/03 17:25
Page 8
utilisation qui ne vient pas ... Le tableur le plus utilisé sur la planète
attendra sa version de l'an 2000 pour s'affranchir de la limite de 65000
lignes !
Et pourtant, que faire si le problème à résoudre porte sur beaucoup
de lignes et refuse de se laisser exprimer par une formule mathématique
(même de terminale scientifique), disons "Quel est notre produit le plus
acheté par nos clients de moins de 30 ans ?"
Ce n'est pourtant pas compliqué ... Mais la réponse n'est plus à
la portée d'une fenêtre quadrillée avec une barre de menus déroulants.
Il vaut mieux alors se tourner vers le langage de requêtes d'un logiciel
de bases de données. Du reste, même si votre tableur tenait encore la
route pour des fichiers de taille moyenne, son langage de macroinstructions vous soumettrait à la même épreuve.
Va donc pour la programmation ! Mais l'effort et le laps de temps
nécessaires pour obtenir le résultat vous couperont du point de départ.
A l'arrivée, ne serait-ce que quelques minutes plus tard, le mélange de
curiosité, d'intuition et de légèreté qui vous poussait à la recherche
d'une idée nouvelle n'y est presque plus. Vos questions ne sont plus aussi
ouvertes qu'avant, car les trois quarts des chemins de traverse qu'une
réponse immédiate vous aurait ouverts sont maintenant derrière vous.
Vous pouvez encore solliciter l'aide d'un informaticien ... De toutes
façons, il en faudrait bien un pour faire tourner votre logiciel de bases
de données, au vu des messages qu'il affiche à l'installation ! Mais à partir
de maintenant, il n'y aura plus du tout de chemin de traverse.
Le logiciel SpéciaListe est une alternative à tout cela, rendue
possible notamment par l'impressionnante quantité de mémoire vive qui
équipe les ordinateurs de bureau d'aujourd'hui. Ceci, ajouté à une
technologie innovante développée par GOTO Software dans le cadre
d'un programme de développement de deux années aidé par l'ANVAR,
lui permet de vous apporter des réponses immédiates, rien qu'avec sa
fenêtre quadrillée et sa barre de menus déroulants.
8 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 9
J'ai un vieux fichier de clients ...
La constitution d'un fichier de clients passe par des sources
souvent hétérogènes, véritables témoins des "strates géologiques" de
l'informatisation d'une entreprise. Parfois les noms des colonnes n'y
sont plus, parfois la moitié des fichiers ont été constitués au bon vieux
temps du système MS-DOS et la place des lettres accentuées a été
prise au chargement par d'autres signes ...
SpéciaListe sera capable de ramener pratiquement tout fichier de
données texte à une forme exploitable, grâce à sa recherche en
profondeur alliée à une confrontation permanente à un savoir de
référence. Par exemple, quelles que soient les fautes de frappe sur les
prénoms dans un fichier, au-delà d'un nombre suffisant de confrontations,
SpéciaListe saura isoler le champ Prénom. Cela signifiera au passage que
le champ Nom n'est probablement pas loin.
Il en sera de même pour les numéros de téléphone, de télécopie,
de portable, pour les codes postaux, les villes, les adresses
e-mail… A la fin du processus, les colonnes du fichier chargé à l'écran
ne s'appellent plus A, B, C, mais bien Nom, Prénom, E-mail et ainsi de
suite. Toute analogie avec un tableur est maintenant dépassée,
SpéciaListe vient de s'ouvrir la voie pour déployer ses traitements dédiés
à chaque type d'information.
Partez sur de bonnes bases
SpéciaListe // 9
man SP dos carré
27/06/03 17:25
Page 10
Il y a plein de doublons ...
L'élimination des enregistrements multiples concernant la même
entité (client, prospect, fournisseur) constitue un passage obligé dans
l'informatique au service de toute activité professionnelle.
Pour les petits fichiers, le tableur a été - et continue d'être - l'outil
fidèle et inavoué de l'opération, bien que son support se réduise au tri
hiérarchique sur une, deux ou trois colonnes. Une fois les lignes ainsi
ordonnées, il appartient à l'utilisateur de décider des lignes à effacer,
tout en reportant au besoin sur la ligne qui reste les informations utiles
des autres, un code postal par exemple.
Avec un logiciel de bases de données, il s'agit au contraire
d'exprimer le besoin dans le langage de requêtes, autrement dit
d'indiquer les comparaisons, la tolérance quant aux différences, le fait
de garder la ligne "la mieux remplie", tout en remplissant ses champs
vides avec le contenu correspondant des lignes qui seront effacées,
etc.
C'est loin d'être trivial et surtout encore loin de couvrir tous les
cas de figures. Pour prendre un exemple, sur deux lignes identiques au
prénom près, écrit Philippe dans l'une et Philipppe dans l'autre, en
fonction des options exprimées :
• les deux lignes seront gardées, ou
• il y a exactement une chance sur deux pour que la ligne avec
une faute de frappe soit gardée au détriment de l'autre.
Pour SpéciaListe, l'élimination des doublons est un besoin de
premier plan dans le traitement des fichiers et non pas un jeu de LEGO
à construire à l'aide de mini-comparaisons qui peuvent s'emboîter de mille
autres façons. De ce fait, l'opération a bel et bien sa place dans les
menus du logiciel épaulée au besoin par des actions préalables comme
la correction des prénoms et la correction des villes.
10 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 11
Une fois choisie, il reste encore à cocher les noms des champs sur
lesquels porte la comparaison et d'opter pour la voie à suivre une fois
les doublons identifiés : marquage, fusion des informations, etc.
La puissance est là, la simplicité aussi. Seulement, elles ne se font
pas obstacle l'une à l'autre.
J'aimerais pouvoir séparer ...
Vous disposez d'un fichier de prospects comportant une colonne
pour le code postal. Il y aurait sans doute plein de choses utiles à en tirer
pour votre prochaine campagne de marketing, si seulement vous
connaissiez le poids relatif de chaque département ... Mais comment
faire ?
Cette fois-ci, nous laisserons à ceux qui ne disposent pas de
SpéciaListe le soin de trouver la solution avec leur tableur ou avec leur
logiciel de base de données (bon courage !).
Avec SpéciaListe, vous devez :
• sélectionner la colonne Code postal, et
• faire un clic droit et choisir dans le menu Indexer selon > Les
2 premiers caractères.
Maintenant, la fenêtre de SpéciaListe comporte un volet gauche
avec les numéros des départements et leurs représentations parmi vos
prospects, en valeurs absolues et en pourcentages, le tout par ordre
décroissant d'importance, bien entendu. Vous pouvez commencer votre
réflexion ...
Si vous préférez un aperçu graphique, utilisez le menu Index >
Histogramme. En plus, le résultat n'est rien d'autre qu'une page Web
locale, n'hésitez donc pas à l'annexer à votre présentation si vous devez
convaincre quelqu'un d'autre de la justesse de votre analyse.
Partez sur de bonnes bases
SpéciaListe // 11
man SP dos carré
27/06/03 17:25
Page 12
D'une manière générale, une découverte en appelant une autre,
vous pourrez créer une nouvelle table de données à partir d'un groupe
d'entrées sélectionnées de l'index, que vous pourrez soumettre de
nouveau à l'entière puissance du logiciel, et ainsi de suite. Avec
SpéciaListe, la réponse à la question "Quel est notre produit le plus
acheté par nos clients de moins de 30 ans ?" (voir Présentation)
comporte deux opérations d'indexation et la sélection du bon segment
entre les deux, le tout sans entrer un seul mot de texte au clavier !
Cette capacité à indexer votre information selon les critères les plus
variés constitue une des grandes forces de SpéciaListe pour vous épauler
dans vos démarches d'analyse, de nettoyage, de reconstitution de vos
données, et ce quel que soit le contenu de vos fichiers.
Ils ont tous tapé TOTO dans ce champ ?!
Comme pour tout domaine informatisé, la qualité globale de
votre activité sera foncièrement tributaire de la qualité de vos fichiers de
données. Toute collecte d'informations apporte son lot d'erreurs plus
ou moins systématiques, et l'ère des nouvelles technologies n'améliore
pas forcément l'état des choses.
A titre d'exemple, la collecte d'adresses e-mail par un formulaire
Web produit un nombre surprenant de variantes pour le seul nom de
domaine wanadoo ! (Pourtant, il n'y que la bonne qui aboutira à l'envoi
d'un courrier électronique. En la matière, il n'y pas de postier pour
connaître le quartier, encore moins les occupants de chaque maison.)
12 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 13
Les fonctions de correction de données proposées par SpéciaListe
sont sans précédent parmi les logiciels bureautiques généralistes du
moment, d'une part grâce à l'indexation qui permet d'isoler des lignes
à "soigner" ensemble et d'autre part grâce à sa capacité à reconnaître
la signification des champs et de proposer des fonctions spécifiques :
• correction des prénoms
• correction des villes
• correction des numéros de téléphone
• mise en forme de l'adresse postale
• vérification des adresses e-mail.
Parmi ces fonctions, la vérification des adresses e-mail occupe
une place à part, car elle peut être configurée sur plusieurs niveaux de
profondeur, du contrôle syntaxique avec élimination des noms factices
(vous savez, les toto, les aaaa, les kjkjk ... ), jusqu'à l'utilisation d'Internet
pour effectivement vérifier l'existence d'une adresse en simulant l'envoi
d'un e-mail. Au passage, il corrigera si besoin est le nom de domaine
(par rapprochement d'un jeu de références qui s'enrichit au fur et à
mesure de l'utilisation).
SpéciaListe a bel et bien une casquette de postier pour tous les
quartiers du Net, mais il ne dérange personne ...
Partez sur de bonnes bases
SpéciaListe // 13
man SP dos carré
27/06/03 17:25
Page 14
Combien de clients à moins de 50km ?
Voici le genre de questions à laquelle se doit de répondre tout
logiciel cartographique "digne de ce nom". Souvent, cette appellation
officieuse implique des précisions compatibles avec le positionnement
par satellite et le support intégré de toutes sortes de fichiers croisés, ce
qui vous permettra d'utiliser un tel logiciel à la fois pour la gestion du
parc de voitures et pour l'optimisation de trajets de jogging proposés
par le comité d'entreprise. Mais, si votre entreprise n'a pas de flotte
commerciale et si votre comité d'entreprise préconise plutôt la piscine,
le logiciel vous sera quand même proposé au même prix. Disons-le
d'emblée, SpéciaListe n'est pas un logiciel cartographique à proprement
parler. Néanmoins, il saura répondre à la question-titre, moyennant
comme d'habitude une séquence d'actions à la souris :
• sélectionnez menu Outils > Carte de France
• cliquez sur votre ville, puis élargissez au rayon voulu
• appuyez sur Marquer les entrées, puis sur Revenir à la table.
D'une manière générale, le module Carte de France de
SpéciaListe vous permettra des visualisations en dégradés de couleurs
selon la fréquence des entrées, des sélections par département et par
région, des filtres de densité de population, sans oublier l'exportation
des "photos", à utiliser plus tard pour réfléchir et pour convaincre.
Besoin d'un logiciel cartographique ? Pas si sûr ...
14 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 15
LE CHARGEMENT D'UN FICHIER
Le chargement d'un fichier est l'opération par laquelle SpéciaListe
s'approprie et qualifie l'information, avant de vous la présenter. Au cours
de cette opération, les attributs de chaque champ sont évalués et
mémorisés séparément pour utilisation ultérieure.
Ce n'est qu'après cette étape qu'un fichier devient une table,
à savoir un ensemble d'informations de structure entièrement déterminée,
à laquelle SpéciaListe peut appliquer l'ensemble de ses opérations,
notamment le croisement et la fusion avec d'autres tables de structure
compatible.
La présence des données en tant que table dans SpéciaListe ne
vous empêche pas d'altérer le fichier d'origine en utilisant une autre
application active. Dans ce cas, SpéciaListe détecte automatiquement
le changement au moment où il repasse en avant-plan et vous propose
de recharger le fichier, par souci de cohérence. Toutefois, vous pouvez
également demander à tout moment le rechargement d'une table (menu
Fichier > Recharger).
Au chargement d'un fichier avec SpéciaListe, vous rencontrerez
plusieurs cas de figures, selon la provenance et le format des informations.
Partez sur de bonnes bases
SpéciaListe // 15
man SP dos carré
27/06/03 17:25
Page 16
Formats bureautiques spécifiques
Il s'agit d'une importation qui n'altérera pas le contenu d'origine,
les données étant automatiquement transférées en format texte. Dans ce
cas, les champs sont déjà définis en termes de position dans le fichier,
il ne reste plus qu'à en déduire la signification. A partir du menu Fichier
> Importer ..., sélectionnez le répertoire contenant votre fichier, puis
déployez la liste Fichiers de type :, afin de retrouver le format enregistré
par l'application bureautique qui est à l'origine du fichier : Microsoft
Access, Microsoft Excel, dBase, Paradox, etc., la liste étant plus ou
moins fournie selon les applications installées sur votre ordinateur.
Choisissez le fichier et cliquez sur Ouvrir.
Le Carnet d'adresses de Windows
Il s'agit d'un cas particulier d'importation d'information structurée,
pour laquelle SpéciaListe met en œuvre un assistant dédié, accessible
depuis le menu Fichier > Importer depuis le Carnet d'adresses ...
Dans un premier temps, choisissez entre le carnet d'adresses
local (propre à l'utilisateur courant sur l'ordinateur) et tout autre fichier
de type .wab (Windows Address Book), généralement mis en partage
à travers le réseau local d'entreprise.
SpéciaListe analyse la structure du fichier choisi et propose la
liste des champs à prendre en considération. Vous serez surpris par le
nombre de ces "cases" prévues par le système selon sa version, dont
la plupart sont vides. Pour vous faciliter la tâche, l'assistant sélectionne
par défaut toutes les colonnes, tout en vous proposant l'option Ne pas
importer les colonnes vides.
16 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 17
Fichiers texte au premier chargement
A partir du menu Fichier > Ouvrir ..., sélectionnez le répertoire
contenant votre fichier texte, qui présente normalement un des types
proposés par SpéciaListe en première position de sa liste de types,
à savoir Fichiers de type texte : txt, csv, dtl. Néanmoins, si votre
fichier provient d'une extraction qui lui a attribué un autre type (ou pas
de type du tout), choisissez Tous fichiers pour le faire apparaître dans
la liste de fichiers du répertoire et cliquez sur Ouvrir.
SpéciaListe effectue un travail en profondeur sur un fichier texte
qu'il ouvre pour la première fois, afin de détecter l'emplacement et la
signification de chaque champ.
L'étape est marquée à l'écran par l'affichage du message
Détection des champs .
Si les noms des champs sont présents sur la première ligne du
fichier, SpéciaListe les conserve et les enrichit d'une information de type
qui permettra l'application d'opérations spécifiques.
Dans le cas contraire, SpéciaListe attribue à chaque champ un nom
en relation avec sa signification déduite : Nom, Prénom, Adresse,
Complément d'adresse, Code postal, Ville, E-mail, etc.
A la fin de cette étape, vous aurez toute liberté de modifier
l'information de structure ainsi déduite, à partir du menu Table >
Propriétés ...
Cette commande vous permet avant tout de corriger le cas
échéant la position des champs dans le fichier, en modifiant le ou les
caractères de séparation que SpéciaListe doit prendre en considération :
un clic de validation sur le bouton Reconstruire les champs vous
permettra de visualiser de suite le résultat.
Ensuite, vous pouvez changer le type et la signification de chaque
champ, afin d'y imposer un jeu d'actions spécifiques.
Partez sur de bonnes bases
SpéciaListe // 17
man SP dos carré
27/06/03 17:25
Page 18
L'information de structure ainsi ajoutée par SpéciaListe sera
conservée dans un fichier à part, portant le même nom que le fichier
d'origine et le type .spec . Ceci lui permettra de charger ultérieurement
le fichier sans passer par l'étape de détection de champs (voir Fichiers
texte déjà analysés).
Fichiers texte déjà analysés
Aux chargements suivants d'un fichier déjà analysé, SpéciaListe
s'appuie sur le fichier de structure .spec correspondant pour accélérer
le processus. Néanmoins, vous pouvez à tout moment changer le type
et le contenu des champs d'un fichier chargé.
Pour vous faciliter l'accès à des fichiers déjà travaillés avec
SpéciaListe, le logiciel vous offre plusieurs possibilités.
1. Le plus simple en est la fermeture du logiciel avec les fichiers
en cours d'utilisation encore présents à l'écran. Au lancement
suivant du logiciel, ces fichiers seront automatiquement chargés,
reconstituant ainsi votre dernier environnement de travail.
2. Le menu Réouvrir vous donne un accès direct à la liste des
derniers fichiers ouverts dans le logiciel, puis fermés
explicitement.
3. Pour retrouver les répertoires d'origine des fichiers déjà chargés,
parcourez la liste des dossiers que SpéciaListe affiche à gauche
dans le dialogue d'ouverture. Vous y trouverez les endroits
récemment "visités" par le logiciel. C'est un moyen pratique de
retrouver rapidement d'autres fichiers candidats à l'ouverture,
semblables à ceux déjà travaillés avec SpéciaListe.
18 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 19
FONCTIONS GÉNÉRALES
SpéciaListe offre une large palette de fonctions basées sur la
colonne couramment sélectionnée, quel que soit son contenu. La plupart
de ces fonctions n'ont pas d'équivalent dans les outils de la bureautique
actuelle.
Leur application successive sur tout ou partie de vos données
vous permettra dans un premier temps une mise à niveau de vos fichiers
par des regroupements et des corrections parfaitement ciblés.
Ensuite, la fiabilité du résultat sera le point de départ de vos
explorations, analyses et vérifications d'hypothèses.
Il convient de souligner que chacune de ces opérations est
élémentaire, en ce sens que leur résultat est immédiatement visible à
l'écran, offert à votre réflexion et par conséquent à l'application de
l'opération suivante.
Avec les fonctions générales de SpéciaListe, vous n'êtes pas dans
l'obligation d'anticiper les résultats intermédiaires, comme vous le feriez
avec une suite d'instructions d'un quelconque langage. Le modèle de
travail de ces fonctions reste la boucle élémentaire qui inclut votre
regard, ce qui vous permet à tout moment de bifurquer sur une idée
nouvelle (voir Exploiter un index).
Partez sur de bonnes bases
SpéciaListe // 19
man SP dos carré
27/06/03 17:25
Page 20
Tri
En langage bureautique courant, le tri d'une table de données sur
une colonne correspond à l'agencement des lignes selon l'ordre
alphabétique ou numérique (croissant ou décroissant) des valeurs dans
une ou plusieurs colonnes.
SpéciaListe étend cette notion à un éventail de possibilités, dans
lequel la valeur alpha-numérique n'est qu'un critère parmi d'autres.
Le tri par valeur
Le tri par valeur est accessible par clic sur l'en-tête d'une colonne,
en maintenant la touche Ctrl enfoncée. Le sens de la flèche qui apparaît
sur l'en-tête de la colonne rappelle le sens croissant ou décroissant de
l'opération. En répétant l'action sur la même colonne vous obtenez le
tri par ordre inverse du premier. L'action sur une autre colonne annule
le tri précédent.
Le tri par valeur sur plusieurs colonnes
Pour entrer dans le régime de tri hiérarchique sur plusieurs
colonnes, vous devez cocher l'option Tri multi-colonnes dans l'onglet
de préférences Outils > Préférences ... Table.
Dans ce régime, les commandes Ctrl + clic sur les en-têtes des
colonnes introduisent des tris secondaires successifs à l'intérieur de
ceux déjà définis, en ce sens que les lignes ne changeront de place
qu'à valeurs égales des champs sur les tris hiérarchiquement supérieurs.
Le sens de chaque tri secondaire suit le sens du premier tri défini.
Des flèches de taille de plus en plus petite sur les en-têtes des colonnes
concernées matérialisent les tris introduits.
20 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 21
Les critères avancés de tri
Les critères de tri spécifiques à SpéciaListe sont accessibles par
clic droit sur l'en-tête de la colonne sélectionnée (menu Trier > ...).
Afin de ne pas compliquer votre choix avec l'alternative Croissant
- Décroissant, la fonction qui "retourne" les lignes d'une table (les
dernières lignes deviennent les premières) est disponible séparément,
en cliquant sur le coin supérieur gauche de la table (l'en-tête de la
colonne grise des numéros de lignes).
Le tri par le nombre de caractères ordonne les lignes selon la
longueur des contenus d'un champ. De ce fait, les lignes contenant
AM123
ZQ145
se retrouvent groupées dans le bloc à champs de 5 caractères et les lignes
contenant
A2002M342
Z2002Q230
se retrouvent dans le bloc à champs de 9 caractères.
Partez sur de bonnes bases
SpéciaListe // 21
man SP dos carré
27/06/03 17:25
Page 22
Cette fonction servira en premier dans le traitement des champsréférence hétérogènes, des codes produit de sources différentes par
exemple.
Le tri de droite à gauche permet de retourner la hiérarchie en
donnant la priorité aux derniers caractères d'un champ. Par exemple, si
dans le champ-référence d'un produit distribué la partie gauche est
consacrée à un canal de vente et la partie droite au produit :
GMSCD455
GMSCD421
GSSCD455
GSSCD421
c'est par ce tri en miroir que se formeront les blocs-quantités des produits
vendus quel que soit le canal de distribution :
GMSCD421
GSSCD421
GMSCD455
GSSCD455
Le tri par fréquence regroupe les lignes qui se partagent une
même valeur du champ, avec la mise en avant des blocs les plus
volumineux. Ce type de tri constitue le point de départ pour la mise en
évidence d'une tendance ou d'une erreur systématique.
Le tri par une séquence aléatoire permet l'obtention d'un
échantillon représentatif, à utiliser par exemple dans une opération de
marketing : tirage au sort, opération pilote, sondage, etc.
22 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 23
Marquage
La gestion des marques associées à chaque ligne d'une table de
données permet à SpéciaListe de vous suivre dans les étapes de votre
travail.
La colonne des marques est toujours présente à gauche de la
table de données et de toute vue partielle de celle-ci (voir également
Indexation et vues).
Jusqu'à un certain point, le marquage s'apparente à la sélection
telle qu'habituellement rencontrée dans l'interface graphique Windows,
dans la mesure où l'un comme l'autre servent de portée ou de
discriminant pour l'opération suivante : "prendre ceci", "prendre tout
sauf ceci", "séparer en deux", etc.
La différence réside dans le caractère cumulatif et persistant du
marquage tel que mis en œuvre par SpéciaListe. En effet, le marquage
ne se réinitialise pas suite à un clic malencontreux dans la fenêtre ; il suit
vos actions récentes en vue de la suivante et à ce titre il sera même
sauvegardé sur le disque dur en même temps que la table de données
à laquelle il est associé.
Pour alimenter le marquage des lignes, vous disposez de plusieurs
possibilités de différentes portées :
• le marquage individuel d'une ligne s'effectue en cochant la
marque correspondante à gauche
• pour marquer une plage de plusieurs lignes consécutives, cliquez
à gauche sur le numéro de la première, glissez la souris vers le
bas jusqu'au numéro de la dernière et sélectionnez l'entrée
Marquer dans le menu contextuel (clic droit sur place)
Partez sur de bonnes bases
SpéciaListe // 23
man SP dos carré
27/06/03 17:25
Page 24
• pour obtenir un marquage aléatoire de portée réglable en
absolu ou en pourcentage sur l'ensemble des lignes, utilisez la
commande Marquer aléatoirement du menu principal
Marquage
• pour marquer selon les valeurs particulières d'une colonne de
données vous disposez des commandes dédiées dans le menu
contextuel de chaque colonne : Marquer les doublons, Marquer
les uniques, Marquer les champs vides
• le marquage peut servir à isoler une vue dans une indexation (voir
Exploiter un index) ou encore le résultat d'une géolocalisation
(voir L'outil carte de France)
• enfin, le marquage peut être le résultat d'une fonction portant
sur le contenu, la recherche par exemple (voir aussi Recherche
avancée).
Le menu principal Marquage vous permet de changer globalement
le jeu des lignes marquées (Tout marquer, Tout démarquer, Inverser)
et d'accéder aux opérations les plus fréquentes qui s'y appliquent : la
suppression et l'indexation (voir aussi Indexation et vues).
La commande Marquage > Trier sur le marquage constitue une
aide à la visualisation avant l'action suivante. Elle a pour résultat le
regroupement des lignes marquées en haut de la table de données.
24 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 25
Indexation et vues
Avec SpéciaListe, l'index est à la fois le résultat d'une action
et un élément d'interface de premier plan. Il s'agit d'un instrument
d'investigation des données entièrement nouveau dans la bureautique
individuelle, que chaque corps de métier s'appropriera sous un nom
différent, le trouvant tour à tour synonyme de "segmentation de l'offre",
"structure des stocks", "contrôle analytique de gestion", "classement
socio-professionnel", "pyramide des âges", "distribution aléatoire
discrète", "fréquentation du site Web", "tables de risques par génération"
et bien d'autres. Nous avons la conviction qu'à force d'utiliser SpéciaListe
vous en inventerez vous-même quelques-uns.
Pour l'essentiel, indexer une table de données selon un critère
revient à distribuer ses lignes en autant de groupes qu'il y a de
valeurs différentes du critère.
Chaque groupe ainsi obtenu est caractérisé par la valeur de l'index
commune à toutes ses lignes et par son poids relatif dans le fichier
(le nombre de ses lignes par rapport au total).
Il est donc évident qu'il n'y a aucune ligne qui reste en dehors des
groupes, car son tour d'analyse venu, si sa valeur d'index ne correspond
à aucun groupe existant, SpéciaListe en crée un nouveau, dont elle est
le seul élément pour le moment (et pourrait bien le rester jusqu'à la fin
de l'indexation).
De même, il n'y a jamais de ligne commune à deux ou plusieurs
groupes, car pour chaque ligne SpéciaListe passe en revue tous les
groupes existants à la recherche de celui qui pourrait l'accueillir, avant
d'en créer un nouveau.
Partez sur de bonnes bases
SpéciaListe // 25
man SP dos carré
27/06/03 17:25
Page 26
(Pour celles et ceux qui ont prêté attention au tableau en classe
de maths ce jour-là, cela peut s'exprimer également en termes de
réunion exhaustive et d'intersections vides, ce qui revient à dire qu'un
index créé par SpéciaListe réalise une partition de la table de données.
L'utilité de la fonction est la conséquence directe de la force du concept
mathématique qui la sous-tend. Maintenant c'est promis, on n'en parlera
plus !)
Pour prendre un exemple, pensez les lignes d'une table de
données comme correspondant à autant de factures comptables, comme
toute activité économique en génère par milliers. Suite à une commande
d'indexation sur l'année, SpéciaListe construit un classeur avec autant
d'intercalaires que d'années différentes et classe chaque facture au bon
endroit. L'opération étant instantanée, il ne lui reste plus qu'à vous
donner les moyens d'un accès facile (c'est bien le moins qu'on attend
d'un classeur). Le volet qui s'ouvre à gauche de la fenêtre sur la
table de données concentre l'interface que SpéciaListe dédie à
l'index.
On y trouve notamment la liste des groupes avec leurs poids
respectifs dans l'ensemble du fichier. En cliquant à gauche d'une des
valeurs dans le volet d'index, la sélection du groupe sera mémorisée par
une flèche rouge, mais vous vous apercevrez surtout que seules les
lignes du groupe sélectionné apparaissent dans le volet à droite. C'est
ce qu'on appellera une vue sur la table de données (voir plus loin
Exploiter un index). Pour retrouver l'ensemble des données tout en
maintenant l'index à l'écran, sélectionnez la toute première ligne dans
le volet de l'index. Cette ligne, libellée Tous est toujours présente en
haut de l'index et se trouve créditée de 100% des entrées, bien entendu.
26 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 27
Obtenir un index
1. Pour indexer votre table de données selon un champ,
commencez par sélectionner la colonne concernée, en cliquant
sur son en-tête, puis faites un clic droit au même endroit pour
obtenir le menu contextuel qui s'y applique. La commande
Indexer selon > ... regroupe les possibilités d'indexation :
• l'indexation selon les valeurs prendra en compte le contenu de
la colonne dans son intégralité, pour regrouper les lignes
contenant la même valeur du champ. Pour le champ du code
SIRET dans un fichier de factures, cette opération mettra dans
le volet gauche de l'index une ligne pour chacun de vos
fournisseurs. En cliquant à gauche d'une de ces lignes, vous
obtiendrez à droite une vue sur toutes les factures concernant
le fournisseur sélectionné
Partez sur de bonnes bases
SpéciaListe // 27
man SP dos carré
27/06/03 17:25
Page 28
• l'indexation sur le nombre de caractères mettra dans le même
groupe toutes les lignes dont le champ d'index a la même
longueur. Dans l'exemple des codes SIRET, l'opération devrait
produire un seul groupe, celui des champs à 14 caractères.
Si ce n'est pas le cas, il vous faudra ouvrir tour à tour les vues
sur les autres, car il y a des erreurs à corriger ... (Pour les moyens
d'une correction efficace, lire Changements groupés)
• les indexations sur les mots et sur le premier mot seront très
utiles pour les champs de texte, tels que les réponses libres
dans un sondage ou encore la saisie correspondant à la case
Autre, préciser : d'une collecte d'informations à travers le Web
• l'indexation sur une partie de longueur fixe du champ
(au début, au milieu ou à la fin) isole d'abord la partie demandée
d'un champ agrégé, avant de classer les lignes sur les valeurs
extraites : département à partir du code postal, année à partir
d'une date, etc.
2. Le marquage de vos lignes (voir Marquage) constitue souvent
la matière première de l'indexation au fil de vos manipulations
de données (ne serait-ce que pour faire d'un clic la part des
choses entre le travail effectué et restant). Pour vous en faciliter
l'accès, la commande Indexer selon le marquage est présente
aussi bien dans le menu principal Index que dans les menus
contextuels de chaque colonne, bien que l'opération n'ait pas
pour point de départ un champ en particulier. A la fin de
l'opération, le contenu de l'index se limitera bien entendu à
Tous, Marqués et Non marqués.
3. Les dialogues de préparation qui précèdent la plupart des
fonctions avancées de SpéciaListe vous offrent la possibilité
de l'indexation automatique sur les résultats à la fin de
l'opération. En y recourant systématiquement dans vos
manipulations habituelles, votre travail gagnera en fluidité.
28 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 29
Exploiter un index
1. Souvent, l'indexation en tant que coupe transversale des vos
données peut être un but en soi, comme pour vérifier une
hypothèse ou pour mettre en évidence une tendance. Si tel est
votre cas, la deuxième partie du menu principal Index vous
offrira les moyens d'extraire vos conclusions.
La commande Index > Histogramme produit une représentation
graphique de la distribution des valeurs, avec des barres de
longueur proportionnelle au poids relatif de chaque groupe.
Il s'agit d'une page Web locale, générée à chaque fois sous un
nom différent dans le répertoire temporaire du système. Vous
pourrez donc la conserver ou l'intégrer à d'autres documents
en toute indépendance de votre travail avec SpéciaListe.
La commande Index > Nouvelle table contenant les résultats
produira une table à trois colonnes : valeur du champ, nombre
de lignes et pourcentage. Pour en disposer après la fermeture
de SpéciaListe, il vous appartient de confirmer sa sauvegarde,
qui aura lieu par défaut au même endroit que la table d'origine.
2. L'indexation peut également n'être qu'une étape intermédiaire
de votre travail, destinée à isoler dans une vue une partie des
données indexées. Le menu contextuel de l'index est prévu
pour répondre à ce type de besoin. Pour le faire apparaître, faites
un clic droit dans le volet index.
Sa première commande vous permet d'ajouter ou de retirer de
la vue le groupe sélectionné. Pour soumettre à cette commande
plusieurs groupes à la fois, commencez par les sélectionner en
cliquant dans la colonne des nombres ou dans celle des
pourcentages (pour une suite, faites glisser la souris jusqu'au
dernier groupe). Leur mise en surbrillance fera écho à vos
actions. Quant aux groupes déjà présents dans la vue, ils seront
marqués chacun d'une flèche rouge.
Partez sur de bonnes bases
SpéciaListe // 29
man SP dos carré
27/06/03 17:25
Page 30
Une fois votre vue constituée, le menu contextuel de l'index vous
permet de marquer l'ensemble de ses lignes et surtout d'en
créer une nouvelle table. C'est cette dernière possibilité qui
est essentielle dans une démarche d'exploration de vos données
selon plusieurs axes. Conceptuellement, cette fonction ouvre
un SpéciaListe dans SpéciaListe : le nouveau se concentre sur
une hypothèse, le premier reste prêt à ouvrir une exploration
parallèle.
Le mécanisme est théoriquement reproductible à l'infini ...
Dans la pratique, pensez toutefois à "fermer les portes derrière
vous" au fur et à mesure, en fermant les tables-extraits qui ne
vous servent plus, car chaque table ouverte à l'écran est bien
entendu consommatrice de mémoire vive.
30 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 31
Changements groupés
SpéciaListe met à votre disposition toute une palette d'outils
pour effectuer des modifications de grande portée sur les données
d'une colonne. Vous pouvez bien entendu faire précéder leur application
par toute suite de marquages et d'indexations à votre convenance, afin
de cerner au plus près dans la vue courante les lignes qui subiront des
changements.
Les fonctions de modification sont accessibles depuis l'entrée
Cellules > du menu contextuel correspondant à chaque colonne.
1. Les fonctions lexicographiques portent sur les transformations
des minuscules en majuscules et réciproquement, l'enlèvement
des accents, la suppression des séparateurs et des espaces
superflus, ainsi que sur des combinaisons d'opérations
correspondant aux utilisations les plus courantes.
2. La commande Cellules > Effacer mettra à blanc la colonne
sélectionnée dans toutes les lignes de la vue.
3. La commande Cellules > Remplir fait entrer une même valeur
dans les champs de la colonne. Toutefois, vous pouvez choisir
de préserver en même temps les valeurs existantes, qui recevront
la nouvelle valeur par concaténation, soit à gauche, soit à droite.
Cochez les options qui conviennent dans le dialogue de
préparation.
4. La commande Cellules > Remplacer aura bien entendu une
portée a priori plus réduite que l'ensemble de la colonne, à la
faveur des correspondances avec le texte recherché. A noter
que SpéciaListe supporte dans ses recherches textuelles
l'utilisation des expressions régulières, un standard de
l'informatique professionnelle pour la description des suites
de caractères complexes et d'une longueur arbitraire (voir
Expressions régulières).
Partez sur de bonnes bases
SpéciaListe // 31
man SP dos carré
27/06/03 17:25
Page 32
Recherche avancée
La fonction de recherche avancée est accessible depuis le menu
principal Edition, ainsi que par le menu contextuel propre à chaque
colonne. Comme c'est le cas pour la plupart des fonctions paramétrables
du logiciel, le dialogue qui précède la recherche a pour but de vous aider
à définir trois éléments :
- 1 - la portée
- 2 - les critères d'application, et enfin
- 3 - l'opération à effectuer sur le résultat.
1. Vous pouvez indiquer en tant que portée "horizontale" de la
recherche l'ensemble des colonnes ou une seule, ou encore
confiner la recherche au volet d'index, si celui-ci est présent à
l'écran. Pour le déroulement "vertical" (sur les lignes), vous
pouvez laisser la recherche s'effectuer sur l'ensemble des lignes
ou la limiter aux enregistrements de la vue courante, voire avec
imposition de la ligne couramment sélectionnée en tant que
point de départ.
2. Le dialogue de configuration propose un choix de la méthode
de correspondance qui satisfait à toutes les utilisations, de la
plus simple (correspondance exacte) à la plus complexe (voir
Expressions régulières), en passant par la détection du texte
recherché au début, à la fin ou à l'intérieur d'un texte plus long.
3. Pour l'action à effectuer en cas de correspondance, vous avez
le choix entre :
• l'arrêt sur la première correspondance trouvée. Dans
ce cas, la recherche est semblable à celle des outils
bureautiques courants, avec l'amorce de la recherche
suivante depuis le menu Edition > Occurrence suivante
(touche raccourci F3)
32 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 33
• le parcours sans arrêt de tout l'espace de recherche,
avec marquage des lignes concernées. L'action
alimente le marquage déjà présent ou le ré-initialise,
selon votre choix quant à l'effacement préalable des
marques existantes.
Traitement des doublons
La fonction de recherche et d'élimination des doublons est
accessible depuis le menu principal Table > Doublons .... Le dialogue
de préparation qui la précède vous permet d'en spécifier la portée
verticale (en lignes), les critères de comparaison et l'action à effectuer
après identification. L'option Appliquer uniquement sur les lignes de
la vue se présente cochée par défaut si vous vous trouvez dans une vue
partielle de votre table de données.
La liste Filtre vous propose des cases à cocher pour chaque
colonne de votre table. Deux lignes seront considérées comme doublons
en cas de coïncidence des contenus sur l'ensemble des colonnes choisies.
Le choix de l'opération à effectuer sur les doublons identifiés
dépend de votre contexte de travail.
1. Sur des fichiers où tous les champs sont correctement remplis, une
opération de marquage ou de démarquage des lignes en double suffit.
Dans ce cas, vous pouvez demander en option de traiter de la même
façon le premier exemplaire, par exemple pour mettre en évidence une
fréquence des coïncidences dans votre table de données.
Partez sur de bonnes bases
SpéciaListe // 33
man SP dos carré
27/06/03 17:25
Page 34
2. En revanche, les fichiers bruts issus de la collecte d'informations
auront souvent des lignes en double (concernant une même personne,
par exemple), mais portant chacune sur un champ une information utile
absente dans son double :
DUPONT Marcel
DUPONT Marcel 11, rue du Soleil
75019 PARIS
Bât. C
PARIS
C'est pour ce genre de situations que SpéciaListe propose parmi ses
opérations de traitement des doublons la fusion des lignes en double.
L'unique ligne obtenue ne sera identique à aucune de ses sources, mais
une réunion qui retiendra le maximum d'informations :
DUPONT Marcel 11, rue du Soleil Bât. C
75019 PARIS
3. Enfin, les lignes en double peuvent contenir chacune des bribes
d'information différentes dans les champs :
DUPONT Marcel 11, r. Sol.
C
75019 PARIS
DUPONT Marcel rue du Soleil
Bât. C
75
PARIS
Dans ce cas, l'idéal serait de former une seule ligne contenant :
DUPONT Marcel 11, rue du Soleil Bât. C
75019 PARIS
mais seulement l'utilisateur possesseur d'une connaissance du domaine
saurait le faire avec succès dans tous les cas de figures et sur une
information de structure arbitraire.
Pour vous assister dans cette intervention, SpéciaListe prévoit
l'action Indexer sur les groupes de doublons, qui aura comme effet
la mise en parallèle des lignes à comparer, chaque groupe de doublons
ayant sa propre entrée dans l'index.
4. A l'opposé des besoins de nettoyage, la recherche des doublons suivie
de fusion s'avère un moyen très efficace d'analyse de vos données.
Nous ne mentionnerons ici que l'analyse du comportement et du panier
34 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 35
moyen des clients, avec la conviction que votre travail y ajoutera bien
d'autres utilisations possibles. D'une façon générale, ce type de traitement
répondra aux besoins de création d'une seule ligne avec une information
synthétique dans les champs variables, en fonction de leur type :
le maximum, le minimum, la somme, le OU logique, le ET logique, etc.
Pour prendre un exemple, imaginons un fichier d'actes d'achat
contenant entre autres les montants et les coordonnées des clients.
Commencez par spécifier le comportement souhaité dans les propriétés
de la colonne des montants (clic droit sur l'en-tête, menu Propriétés,
Opération à effectuer en cas de fusion). Choisissez Effectuer la
somme des valeurs.
Ensuite, lancez une recherche-fusion des doublons sur les champs
nom, prénom et code postal.
Vous obtenez le classement de vos clients en fonction de la valeur
cumulée de leurs achats : efficace, non ? Il ne vous reste plus qu'à
sauvegarder la table sous un autre nom.
Fusion
La fusion permet d'ajouter à une table de données les lignes
d'une autre, également ouverte à l'écran par SpéciaListe, à condition que
les deux aient le même format.
Pour l'utiliser, commencez par mettre en avant-plan la table qui
recevra les nouvelles lignes. Ensuite, le menu Table > Fusionner avec …
vous présentera automatiquement le choix des autres tables ouvertes
qui présentent un format identique à la table-cible.
Après l'opération, le nombre de lignes est rigoureusement la
somme entre le nombre de lignes avant l'opération et celui de la table
choisie pour la fusion ; il n'y a donc aucun traitement implicite d'éventuels
doublons.
Partez sur de bonnes bases
SpéciaListe // 35
man SP dos carré
27/06/03 17:25
Page 36
Croisement
L'opération de croisement permet le marquage ou le démarquage
des lignes sur des éléments d'information communs avec ceux d'une autre
table, également ouverte dans SpéciaListe.
L'opération est utile partout où il s'agit de mettre en évidence les
mêmes éléments présents dans des contextes différents, comme les
produits achetés ensemble selon le jour de la semaine, la part de
prospects transformés en clients, les internautes abonnés à plusieurs
lettres d'information en même temps, etc.
La commande Table > Croiser ... ouvre l'assistant de l'opération,
avec pour point de départ la liste des autres tables ouvertes ayant au
moins un champ commun avec la table en avant-plan.
Une fois la table choisie, la liste Champs disponibles pour le
croisement vous propose des cases à cocher pour chacun des champs
communs entre les deux tables. Sélectionnez celui ou ceux qui serviront
de critère de croisement.
Enfin, spécifiez en tant qu'action finale le marquage ou bien le
démarquage des lignes trouvées.
36 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 37
TRAITEMENTS SPÉCIFIQUES
AUX CHAMPS
Les fonctions spécifiques de SpéciaListe prennent appui sur la
reconnaissance de vos données comme appartenant à des catégories
bureautiques courantes : noms, prénoms, sociétés, numéros de
téléphone, adresses postales, adresses de courrier électronique.
Bien qu'en ayant l'apparence, ces fonctions ne sont pas de simples
enchaînements d'opérations générales allant dans le sens des besoins
bureautiques habituels, mais bien des opérations spécialisées, intimement
liées à la structure d'un et parfois de plusieurs champs traités ensemble.
De fait, elles seront proposées dans les menus contextuels uniquement
sur les colonnes qui constituent leur domaine de prédilection.
Pour vérifier la possibilité d'utiliser ces fonctions sur une table de
données, parcourez à la souris les entrées correspondantes dans le
menu principal du logiciel. Par exemple, si les commandes du menu
Identité sont désactivées, cela signifie que SpéciaListe ne reconnaît
pas de façon systématique des noms et des prénoms dans les données
de la table courante. Dans ce cas, vous pouvez l'aider en modifiant les
propriétés des colonnes, pour forcer la signification souhaitée.
Partez sur de bonnes bases
SpéciaListe // 37
man SP dos carré
27/06/03 17:25
Page 38
Il en va de même pour les opérations regroupées dans les menus
Société, Adresse et E-mail.
Pour vous aider à garder le contrôle sur les modifications massives
effectuées, chaque opération spécifique produit au préalable des
colonnes de sauvegarde de l'information initiale, intitulées Copie de
Prénom, Copie de Ville, etc. Le menu contextuel de ces colonnes
prévoit la commande de retour à l'état d'avant l'opération : Restituer
la colonne d'origine.
Noms et prénoms
Les commandes liées aux noms et aux prénoms sont regroupées
dans le menu principal Identité.
La correction des champs d'identité
Le traitement des champs d'identité a pour point de départ la
correction des prénoms, basée sur un référentiel de prénoms
francophones. Néanmoins, la présence d'autres champs d'identité
(notamment Nom) offre à SpéciaListe un appui précieux pour affiner son
travail.
Le dialogue qui prépare l'opération présente un large éventail
d'options pour contrôler la détection et la distribution de l'information
dans les champs d'identité.
1. La détection des identités factices (frappes aléatoires au
clavier, personnalités historiques des siècles passés, etc.) est un
auxiliaire indispensable dans le nettoyage des fichiers de collecte
d'information par formulaire électronique, en particulier ceux
venant du Web.
2. Les options du traitement jumelé des champs Nom et Prénom
répondent aux différents cas dominants dans les fichiers
d'adresses, notamment les inversions et les fusions :
38 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 39
• le traitement des inversions entre le nom et le prénom
est un moyen facile de pallier à un des problèmes les
plus fréquents des formulaires de collecte
• les différentes possibilités de fusion entre les deux
champs permettront la reconstitution systématique
d'une information saisie là par inattention ou "faute de
mieux", notamment dans le cas des professions
libérales, PME/PMI, associations, institutions, etc.
3. Le traitement de la civilité peut prendre en compte cette
information en tant que point de départ ou bien d'arrivée, et
de ce fait se trouve contrôlé par deux options complémentaires.
Si un champ de civilité est déjà présent, vous pouvez indiquer
à SpéciaListe de l'utiliser au cours de la correction par
rapprochement. Par exemple, une civilité connue lui permettra
de corriger de manière sûre Jeann par Jean ou bien par Jeanne.
Indifféremment de la présence a priori d'un champ Civilité,
vous pouvez demander à Spécialiste d'évaluer (ou de réévaluer)
la civilité à partir du seul contenu des champs Nom et Prénom,
sous forme complète ou abrégée. Si le champ Civilité existe
avant l'opération, son contenu est sauvegardé dans la colonne
Copie de Civilité.
4. Enfin, dans le cas des prénoms multiples, vous pouvez spécifier
le traitement spécifique souhaité : tout conserver, ne conserver
que le premier en ordre de frappe, ne conserver que le prénom
masculin ou féminin.
Outre les habituelles colonnes de sauvegarde Copie de ...,
la colonne de résultat de l'opération (utilisée par défaut comme index
à la fin de l'opération) reflète les cas de figures rencontrés. Les catégories
Inchangé et Mis en forme regroupent les entrées à conserver sans
hésitation dans une vue séparée. En effet, la mise en forme ne concerne
que les modifications minuscules - majuscules et les corrections mineures
d'accent et de trait d'union.
Partez sur de bonnes bases
SpéciaListe // 39
man SP dos carré
27/06/03 17:25
Page 40
En revanche, les catégories Prénom corrigé, Aucun prénom
approchant, Personne morale, Permutation Nom-Prénom, Filtré
(factice) et les différents cas de fusion auront besoin de votre inspection
afin de décider de la suite.
Etant donné la richesse des options de cette opération (qui fait
écho à la complexité des situations rencontrées), il est conseillé
d'enregistrer votre fichier sur disque avant le traitement. Ceci vous
permettra de revenir facilement en arrière par le menu Fichier >
Recharger et d'essayer une autre combinaison d'options, en meilleure
adéquation avec l'information d'identité à corriger.
Segmentation en tranches d'âge
La segmentation en tranches d'âge est basée sur la fréquence
relative de chaque prénom à travers les générations de la population
française.
L'assistant de l'opération vous propose un jeu d'intervalles d'âge
que vous pouvez modifier à volonté avant de lancer l'opération.
De même, la précision des résultats sera améliorée si vous indiquez
à l'assistant les âges minimum et maximum de votre population, à partir
de considérations qui échappent au traitement informatique. Par exemple,
pour le fichier de clients d'un concessionnaire auto, il est inutile d'opérer
une segmentation en préservant la tranche d'âge 0-17 ans.
En fin d'opération, la fonction Histogramme vous offre un aperçu
graphique du résultat.
Statistiques
Le calcul statistique basé sur les prénoms produit une estimation
de l'âge moyen et la répartition par sexe de votre population.
40 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 41
Codes SIRET et APE
SpéciaListe reconnaît les champs de code SIRET et APE d'une table
d'informations sur les entreprises et propose la vérification de leurs
contenus respectifs, à partir du menu principal Identité.
Pour les codes SIRET, SpéciaListe effectue une vérification de
cohérence, à savoir qu'un code SIRET diagnostiqué par SpéciaListe
comme étant incorrect ne saurait être attribué à une quelconque entité.
En revanche, un code SIRET valide ne préjuge pas de son attribution
effective.
Pour les codes APE, SpéciaListe effectue une vérification exhaustive
d'existence par rapport à la Nomenclature d'Activités Française (NAF)
de l'INSEE.
Numéros de téléphone
Le menu contextuel correspondant à une colonne de numéros de
téléphone donne l'accès à la vérification des numéros, avec une option
sur la mise en forme. Dans ce dernier cas, l'assistant de l'opération vous
propose la création d'une colonne de sauvegarde, comme pour toutes
les autres fonctions de modification massive.
Les options de vérification se déclinent selon le type du numéro :
réseau national fixe, téléphonie mobile, étranger.
L'option d'indexer directement sur la colonne Etat téléphone
en fin d'opération apporte plus de visibilité sur le résultat, car dans le
cas le plus général il y aura plusieurs lignes d'index qui regroupent des
numéros corrects : fixes, mobiles, étrangers, numéros verts et tarifés
0 8XXX, services.
Partez sur de bonnes bases
SpéciaListe // 41
man SP dos carré
27/06/03 17:25
Page 42
Villes et codes postaux
La commande Adresse > Vérifier et corriger les champs Ville
et Code postal déclenche une opération complexe de correction
jumelée des deux contenus, basée sur un dictionnaire incorporé portant
sur le territoire français.
L'opération produit deux colonnes de sauvegarde et la colonne
résultat Etat ville, cette dernière reflétant les cas de figure rencontrés.
Pour isoler l'ensemble des lignes valides depuis l'index du résultat, il vous
appartient de recueillir en une seule vue les groupes libellés Correct,
CP corrigé, Ville et CP corrigé.
S'il est présent, le groupe libellé Non vérifiable réclame une
attention particulière, car il regroupe typiquement les adresses à CEDEX
et les destinations Poste aux Armées.
Adresses postales
La fonction de mise en forme des adresses postales, accessible
depuis le menu Adresse > Mettre en forme les champs d'adresse, vous
permet d'obtenir des adresses conformes à la norme AFNOR XP Z10011, qui spécifie les différents contenus, conventions et restrictions
d'une adresse préparée pour un envoi postal.
L'assistant qui vous aide à préparer l'opération vous propose la
correction préalable des champs Code postal et Ville : laissez cette
option activée, à moins que vous n'ayez déjà fait cette opération sur
exactement la même vue de vos données (cf. Villes et codes postaux).
42 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 43
La création des colonnes de sauvegarde prend ici tout son sens,
du fait des modifications complexes opérées par la fonction. Pour ne
prendre que quelques exemples :
• si vos données contiennent les adresses dans leur intégralité en
un seul champ, il serait surprenant que SpéciaListe n'en trouve
au moins une qui nécessite la scission en deux, du fait de la
longueur maximum d'une ligne d'adresse à 38 caractères
imposée par la norme. De ce fait, à la fin de l'opération, la table
se trouvera enrichie d'un champ supplémentaire, créé pour la
circonstance sous le nom Complément d'adresse
• si les adresses de la table sont déjà scindées en champs Adresse
et Complément d'adresse, les différentes règles de répartition
du contenu appliquées par l'opération produiront un important
brassage des différents éléments sur les deux colonnes
• enfin, la manière de saisir une adresse sur deux lignes dans un
formulaire de collecte n'étant pas toujours celle attendue par
l'acheminement postal, il n'est pas rare de voir des pans entiers
d'un fichier avec les deux contenus inversés. Si c'est le cas du
vôtre, SpéciaListe se chargera de le remettre d'aplomb.
L'index sur le résultat de l'opération, toujours proposé par défaut,
regroupe les diagnostics et les modifications effectuées. Les catégories
les plus courantes à récupérer dans une vue des adresses valides sont
Correct et Corrigé : permutation adresse - complément.
Si elle est présente, la catégorie Aucun type de voie reconnu
réclame votre attention pour un éventuel rattrapage partiel, notamment
en ce qui concerne les lieux-dits.
Partez sur de bonnes bases
SpéciaListe // 43
man SP dos carré
27/06/03 17:25
Page 44
Adresses de courrier électronique
Les fonctions dédiées aux champs proposées par SpéciaListe
s'appuient en général sur le savoir-faire des règles et des formats et le cas échéant - sur l'utilisation d'un référentiel. A ces deux piliers, la
vérification d'adresses e-mail associe sur demande un troisième : le Net
lui-même. L'assistant de l'opération, invoqué depuis le menu E-mail >
Vérification ..., vous met devant un choix sur trois niveaux de profondeur.
1. La simple analyse des adresses fera pour l'essentiel la part des
choses entre les adresses correctes, les adresses incorrectes
qui peuvent faire l'objet d'une retouche automatique par
rapprochement à des noms de domaine connus, et les adresses
factices (saisies de circonstance dans le seul but de passer
outre les restrictions d'un formulaire de collecte).
C'est le seul type de vérification qui ne fait aucun usage du
Net, et par conséquent le seul à produire un résultat avec la
rapidité propre aux autres fonctions de SpéciaListe. Ses options
portent notamment sur la correction automatique par
rapprochement et sur le jeu de fausses saisies caractéristiques
à détecter.
2. Le test d'existence du domaine marque le premier degré
d'implication du Net dans le processus. Non seulement le gain
de fiabilité est sensible par rapport à la première méthode,
mais surtout les tests d'existence de domaine ont un effet
bénéfique à moyen terme sur le référentiel des domaines
existants, utilisé par la première méthode ! En d'autres termes,
en utilisant régulièrement cette méthode sur une grande variété
d'adresses, vous capitalisez pour la réussite d'une future action
de vérification rapide. Disons (à tout hasard) un vendredi soir
avec un fichier d'adresses particulièrement volumineux et
destiné à une campagne d'e-mailing particulièrement en retard...
44 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 45
3. Le test d'existence de la boîte aux lettres constitue la
méthode de vérification la plus sûre, mais également la plus
longue. Par ailleurs, elle fait implicitement usage des deux
premières, afin de réduire au maximum le nombre d'adresses
à vérifier complètement. La fenêtre de suivi vous informe en
permanence du déroulement de l'opération, sans pour autant
pouvoir vous offrir une estimation du temps restant, du fait de
l'extrême variété des temps de réponse sur le Net quant aux
échanges requis par cette méthode. SpéciaListe fait de son
mieux pour les optimiser, notamment en traitant en premier les
domaines les plus présents parmi les adresses à traiter.
Ceci vous permet en outre de rester sur le meilleur résultat
partiel possible si vous décidez l'abandon de l'opération.
En effet, il n'est pas rare de voir la vérification passer de longues
minutes en attente de réponse de quelques domaines marginaux
qui comptent pour moins de 5% dans l'ensemble de vos
adresses. Les adresses encore à traiter au moment de l'annulation
apparaîtront dans l'index final dans la catégorie A vérifier.
Paradoxalement, c'est cette méthode qui pousse la rigueur
jusqu'à produire une catégorie d'adresses non vérifiables dans
l'index sur le résultat. En effet, il existe des domaines Internet
qui confirment mécaniquement l'existence de toute adresse
e-mail dans leur giron. SpéciaListe détecte ce comportement et
fait état de son doute sur l'ensemble des adresses du domaine.
Partez sur de bonnes bases
SpéciaListe // 45
man SP dos carré
27/06/03 17:25
Page 46
L'OUTIL CARTE DE FRANCE
La carte de France proposée par SpéciaListe est un outil de
projection géographique de vos données, à condition que celles-ci
présentent un champ de code postal. En quelque sorte, il est aux
lieux ce que l'indexation est aux données générales. Toutefois, la
transposition cartographique confère à cet "index" des capacités
accrues de visualisation et de traitement, regroupées en une fenêtre
séparée, accessible depuis le menu Adresse > Carte de France.
Le menu en clic droit sur la carte fait office de bascule pour le
contexte de vos actions, notamment entre celles liées à l'affichage et
celles destinées à la sélection d'une partie des données.
46 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 47
Villes et départements
En premier lieu, la carte est un moyen de mettre en avant des
densités d'implantation de vos prospects, clients et autres entités qui
ont un "port d'attache". Vous pouvez faire varier l'unité de répartition
entre la ville, le département et l'ensemble des deux, en utilisant les
commandes Carte > Statistiques.
Le coloriage suit dans chaque cas un dégradé modulé par les
densités d'implantation respectives. Vous pouvez en modifier la palette
depuis l'assistant Carte > Préférences ... Statistiques, afin d'obtenir le
rendu le plus adapté à vos données.
Partez sur de bonnes bases
SpéciaListe // 47
man SP dos carré
27/06/03 17:25
Page 48
Déplacements, agrandissements
Le menu contextuel de la carte fournit des outils d'exploration qui
vous permettront de vous concentrer sur une partie de la projection.
Outre les commandes de zoom en avant et en arrière depuis
l'endroit couramment représenté, vous avez la possibilité de re-cadrer
directement l'affichage : la commande Région > vous permet un
recentrage de la vue sur deux niveaux, en choisissant directement dans
le menu la région ou un de ses départements. L'affichage qui en résulte
met en œuvre automatiquement la meilleure échelle de visualisation de
l'entité retenue dans son intégralité.
Une vignette vous rappelle en permanence la position de la partie
visualisée dans l'ensemble de la carte.
48 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 49
Sélections, élargissements, filtres
Les commandes de sélection vous permettent d'isoler, puis de
traiter ensemble une ou plusieurs parties de vos données, notamment
dans le but d'obtenir un marquage de celles-ci dans la table maintenue
par SpéciaListe en arrière-plan.
Outre la sélection par clic dans la carte pour les régions et les
départements, les deux régimes qui incluent la ville comme critère
statistique vous permettent la recherche d'une ville par saisie au clavier
dans le volet gauche de la fenêtre. Dans ce cas, une liste des
correspondances affichées s'affine au fur et à mesure de la frappe, pour
vous aider à choisir le plus rapidement possible.
Une fois la ville sélectionnée, vous pouvez y associer un rayon de
voisinage allant de 1 à 50 km.
Partez sur de bonnes bases
SpéciaListe // 49
man SP dos carré
27/06/03 17:25
Page 50
Vous disposez également d'un outil pour modérer votre sélection
sur un critère démographique : l'option Filtrer sur la population vous
permet de ne retenir que les localités au-dessus d'un seuil pouvant aller
jusqu'à 10 000 habitants.
A l'issue de cette étape, il vous reste à effectuer deux actions
pour reporter votre sélection sur les données en arrière-plan : Marquer
les villes sélectionnées, puis Revenir à la table.
Exportation en tant qu'image
A tout moment de votre travail sur la carte de France, vous pouvez
prendre des photos pour une utilisation indépendante de SpéciaListe.
Pour ce faire, cliquez sur le bouton Enregistrer la vue comme image
et indiquez la taille souhaitée.
50 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 51
UTILISATION DES RÉSULTATS
Au fur et à mesure de votre travail, vos données s'affinent et
gagnent de nouvelles dimensions. SpéciaListe prévoit un large choix de
fonctions pour préparer l'utilisation future de vos travaux :
• avec SpéciaListe lui-même
• avec d'autres applications bureautiques
• pour étoffer des rapports et des présentations
• pour une action de marketing direct, par voie postale,
téléphonique ou de courrier électronique.
Partez sur de bonnes bases
SpéciaListe // 51
man SP dos carré
27/06/03 17:25
Page 52
L'extraction des nouvelles
tables de données
Les tables de données extraites de vos fichiers et enregistrées sur
disque constituent un moyen simple de préserver dans l'état une réflexion
sur vos données.
Le menu contextuel Vue > Créer une table à partir de cette vue
(également accessible depuis le menu principal Table) produit des
tables avec des noms générés automatiquement, à partir de la table
initiale et contenant le mot Extrait. Il vous appartient de confirmer la
sauvegarde de celles qui sont significatives pour la suite de votre travail.
La commande Créer une table contenant cet index (menu
contextuel, également disponible depuis le menu principal Table) est
un moyen simple de prendre la photo d'une distribution de vos données
selon un critère significatif. Les noms des tables créées à l'aide de cette
commande contiennent le mot Index.
L'exportation des données
La commande Fichier > Exporter ... constitue le point de passage
des données travaillées avec SpéciaListe vers d'autres applications
bureautiques, utilisant des formats spécifiques. Le choix qui vous est
présenté par le dialogue de préparation dépend des applications
installées sur votre ordinateur.
Vous pouvez également opter pour l'exportation de tout ou partie
des champs de la table. Les noms des champs dont le contenu est
reconnu par SpéciaListe apparaissent en gras dans la sélection.
52 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 53
Briefings et présentations
SpéciaListe vous permet la création au fil de votre travail
d'histogrammes de distribution sur un critère. Ce dernier peut être un
résultat déterminé (comme la segmentation en tranches d'âge à partir
des prénoms) ou un élément entièrement spécifique à vos données
(l'index courant).
Les histogrammes sont stockés sur votre disque dur en tant que
pages Web locales dans le répertoire temporaire de Windows et portent
des noms générés automatiquement. N'oubliez donc pas de transférer
à un autre endroit celles que vous souhaitez garder pour future référence,
à l'aide de la commande Enregistrer sous ... de votre navigateur.
L'impression
Les fonctions d'impression de SpéciaListe portent toujours sur la
vue courante, donc sur toutes les lignes s'il n'y a pas d'index défini (voir
Indexation et vues).
Dans ce cadre, vous avez la possibilité de filtrer encore les lignes
à imprimer à l'aide du marquage, en prenant soin de bien spécifier la
prise en compte du marquage dans les assistants d'impression.
Horizontalement, les assistants d'impression vous proposent le
choix des champs à imprimer pour chaque ligne de données.
SpéciaListe effectue deux types d'impression, adaptés à des
usages bien distincts et de ce fait précédés par des assistants spécifiques.
Partez sur de bonnes bases
SpéciaListe // 53
man SP dos carré
27/06/03 17:25
Page 54
Le mode tableau est le plus rapproché de la présentation de vos
données à l'écran, avec une rangée de texte imprimé pour chaque ligne
de données. L'assistant de l'impression dédié à ce mode vous permet
de contrôler la largeur de chaque colonne, par saisie directe (en
pourcentage et en centimètres) ou directement à la souris dans l'aperçu
des premiers enregistrements, tels qu'ils apparaîtront sur papier.
Le mode étiquettes est particulièrement adapté à l'impression
d'adresses pour un envoi postal. Son assistant inclut les définitions pour
les planches d'étiquettes les plus courantes, tout en vous laissant la
possibilité d'en définir une nouvelle.
54 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 55
ANNEXES
A1. Etude de cas :
data mining sur un site Web
Nous nous proposons ici de montrer les fonctions génériques de
SpéciaListe à l'œuvre dans une problématique aussi répandue que
réputée ésotérique (et de ce fait réservée au traitement par des progiciels
dédiés) : les mesures d'audience d'un site Web à partir de ses journaux
de fonctionnement.
Contrairement aux idées reçues, la structure d'un journal de
serveur Web n'est ni difficile à appréhender, ni spécifique à chaque
logiciel serveur : elle fait l'objet d'une définition publique, le W3C
Extended Logging Format, exhaustive et suivie par les éditeurs de
solutions Web, quel que soit l'environnement (Windows Internet
Information Server, Linux Apache, etc.).
Partez sur de bonnes bases
SpéciaListe // 55
man SP dos carré
27/06/03 17:25
Page 56
Pour l'essentiel, les fichiers journal (.log) contiennent quelques
lignes d'en-tête préfixées par le caractère # :
#Software: Microsoft Internet Information Services 5.0
#Version: 1.0
#Date: 2002-08-11 05:25:49
#Fields: date time c-ip cs-method cs-uri-stem …
suivies d'autant de lignes d'information que de pages Web, images ou
autres documents demandés au site par les internautes.
Chaque ligne contient tous les champs prévus dans la ligne d'entête #Fields:, dans l'ordre et séparés par un espace. Pour éviter la
confusion, les espaces à l'intérieur d'un champ sont transformés en
caractères +. L'absence d'information dans un champ est explicitement
marquée par le caractère -.
Pour préparer un fichier .log au chargement avec SpéciaListe,
il suffit d'en retirer la partie de l'en-tête qui empêche la séparation des
colonnes.
Pour ce faire, chargez le fichier avec l'utilitaire WordPad de
Windows, puis sélectionnez et effacez le début jusqu'aux caractères
#Fields: (espace après : compris), de sorte à ramener les noms des
champs en début de la première ligne.
56 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 57
Enregistrez le fichier ainsi modifié, fermez WordPad, puis chargez
le fichier avec SpéciaListe. Vérifiez au besoin dans les propriétés de la
table (menu Table > Propriétés) l'utilisation de l'espace comme
séparateur et l'utilisation de la première ligne pour les noms des champs.
A la fin de cette étape de préparation, SpéciaListe vous présente
une table avec des colonnes portant respectivement les noms définis dans
la ligne #Fields: initiale : date, time, c-ip, etc.
Partez sur de bonnes bases
SpéciaListe // 57
man SP dos carré
27/06/03 17:25
Page 58
Combien de visiteurs uniques ?
Le nombre brut des documents servis par le site correspond
simplement au nombre de lignes dans la table. Il sera souvent
impressionnant, même pour des sites d'audience relativement modeste.
(Souvent, c'était ce chiffre brut qui était annoncé à la presse et aux
acteurs boursiers par des start-up de la "nouvelle économie" à la fin des
années '90. La suite est connue.)
Pour obtenir le nombre des visiteurs uniques, il faudra prendre en
considération les points suivants :
• une seule page Web avec trois images correspond à quatre
lignes dans le journal, 1+3
• un seul visiteur qui regarde cette page, puis clique sur un lien vers
une autre page contenant deux images provoque l'enregistrement de sept lignes de journal, 1+3 + 1+2.
Pour faire la part des choses, nous allons nous intéresser au champ
Cs(referer) qui mémorise l'origine de la demande d'un document :
• si une page A est demandée explicitement par l'utilisateur en
saisissant son adresse, ce champ sera vide
• si l'utilisateur a sous les yeux la page A et clique dans cette
page sur un lien vers la page B, la ligne de journal correspondant
à l'envoi de cette deuxième page B contient dans son champ
Cs(referer) la valeur A (car le visiteur est arrivé à la page B en
venant de A).
Cette information d'origine permet donc d'éliminer facilement
du compte la navigation d'une page à l'autre à l'intérieur du site, ainsi
que les images et autres documents imbriqués dans les pages, pour ne
garder qu'une seule ligne par visiteur.
58 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 59
Indexez la table de SpéciaListe sur les valeurs de ce champ, triez
sur le libellé à gauche, puis éliminez de la vue (en glissant le curseur de
la souris sur les pourcentages) toutes les valeurs http://www...
appartenant à votre site.
Le résultat ne contenant plus qu'une ligne par visiteur du site,
la réponse se trouve sur la ligne d'état, en bas de la fenêtre de SpéciaListe.
Partez sur de bonnes bases
SpéciaListe // 59
man SP dos carré
27/06/03 17:25
Page 60
Sommes-nous bien
référencés sur la Toile ?
L'extraction qui fournit la réponse à la question précédente recèle
une autre information d'intérêt majeur : la notoriété de votre site sur le
reste de la Toile.
Afin de l'étudier, créez un nouvel extrait de la table, en éliminant
les entrées avec le champ Cs(referer) à vide (caractère -).
La table ainsi obtenue, toujours indexée sur les valeurs du champ
Cs(referer), présente en ordre décroissant la répartition des visites
d'après les sites Web externes qui renvoient les internautes vers le vôtre
: moteurs de recherche, annuaires, portails de galerie marchande, etc.
L'histogramme sur les valeurs (menu Index > Histogramme) vous
permettra d'évaluer l'efficacité de vos actions de référencement et d'en
préparer de nouvelles.
Par exemple, pour améliorer le référencement dans le spectre
médian, vous pouvez éliminer les sites les plus importants (buts atteints)
et les moins importants (contingences), pour mettre en évidence les
sites encore à travailler, les sites émergeants, etc.
60 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Partez sur de bonnes bases
Page 61
SpéciaListe // 61
man SP dos carré
27/06/03 17:25
Page 62
Quelles sont nos pages les plus lues ?
Rappelons que le serveur Web fait l'amalgame entre ce que
l'internaute perçoit comme étant une page, une image contenue dans
une page, un son d'accompagnement etc., et que de ce fait il est
nécessaire d'opérer une séparation entre les différents types de
documents avant de les classer par fréquence de consultation.
Les types de documents courants sur un site Web sont les suivants :
.htm, .html
Page Web (HTML)
.asp,.php,.cgi
Page Web dynamique (en général avec
des paramètres)
.css
Feuille de style utilisée par plusieurs pages
(parfois toutes)
.js
Code JavaScript regroupé dans un fichier
.jpg,.gif,.png
Fichier image
.au,.wav,.ram
Fichier son
.pdf
Format de lecture indépendant de plateforme
…
L'indication de type apparaissant à la fin du nom, vous utiliserez
une des variantes avancées de l'indexation (à partir du menu Index >
Autres critères ...), en basant les comparaisons sur les quatre derniers
caractères dans le champ Cs-Uri-Stem.
En parcourant l'index ainsi créé, introduisez dans votre vue-extrait
non seulement .htm, html et le type des pages dynamiques sur votre
site, mais également les fins de répertoires (avec ou sans caractère / en
dernier), car les requêtes de ce type correspondent aussi à des contenus
Web (les index des répertoires invoqués).
62 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 63
Une fois la table créée, il ne reste plus qu'à l'indexer, toujours sur
le champ Cs-Uri-Stem, mais simplement par la valeur cette fois-ci.
Vous obtiendrez ainsi le "hit-parade" des pages lues par les internautes
sur votre site.
Partez sur de bonnes bases
SpéciaListe // 63
man SP dos carré
27/06/03 17:25
Page 64
Quels sont les créneaux horaires dominants ?
L'analyse de l'audience de votre site Web en corrélation avec les
heures de la journée et les jours de la semaine vous ouvre de nombreuses
voies de réflexion pour améliorer l'accueil des internautes sur votre site.
En premier lieu, il est utile de différencier les types de cibles
intéressées par vos produits ou services, telles que B to B (Business to
Business) plutôt connectée le matin, ou B to C (Business to Consumer),
plus à même de visiter votre site le soir, en dehors des heures de bureau,
et le week-end.
Outre la séparation des consultations entre le domicile et le lieu
de travail pour l'ensemble de votre site, le suivi heure par heure des
demandes pour une page en particulier (isolée en préalable par le
champ Cs-Uri-Stem) vous permettra d'affiner votre cible, voire de
mesurer l'impact d'une publicité radio ou télé, par comparaison avec les
données correspondantes de la veille.
Pour obtenir un classement par tranches d'une heure, sélectionnez
la colonne Time, puis indexez sur les trois premiers caractères.
Pour affiner encore l'audience dans une plage horaire donnée,
sélectionnez dans une vue les heures souhaitées et créez une tableextrait à partir de celle-ci. Enfin, indexez la nouvelle table sur les valeurs
du champ Time, cette fois-ci sur les quatre premiers caractères. Vous
obtiendrez ainsi une répartition de l'audience par tranches de dix minutes.
ATTENTION ! Le standard W3C Extended Logging Format impose
l'écriture dans le fichier journal non pas de l'heure locale, mais de
l'heure GMT (Greenwich). Ceci signifie que toutes les valeurs dans le
champ Time sont en retard par rapport à l'heure de Paris :
• d'une heure en hiver
• de deux heures en été.
64 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Partez sur de bonnes bases
Page 65
SpéciaListe // 65
man SP dos carré
27/06/03 17:25
Page 66
Evaluation de la qualité de service
Le champ Sc-Status (état de la réponse du Serveur vers le client)
retient sous une forme concentrée l'état de succès ou d'échec d'une
demande issue du navigateur de l'internaute. Il s'agit d'un code
numérique compris entre 100 et 599, avec des classes de valeurs séparées
par le premier chiffre. L'indexation sur ce champ avec SpéciaListe est donc
particulièrement adaptée pour la mise en évidence de la qualité globale
du service. Les valeurs qui réclament une attention particulière sont les
suivantes :
400 - Erreur de syntaxe. Une proportion importante peut être le
signe d'un lien mal formé, notamment un lien cliquable
dans un e-mail
404 - Document non trouvé. Le plus souvent, il s'agit de liens
obsolètes, soit sur les pages du site, soit sur les sites externes
de référencement. A analyser en corrélation avec le champ
Cs(referer) (voir Sommes-nous bien référencés sur la
Toile ?)
5xx - Erreur interne. Une proportion significative indique la
saturation des capacités de traitement du serveur (mémoire
vive, disque).
66 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Partez sur de bonnes bases
Page 67
SpéciaListe // 67
man SP dos carré
27/06/03 17:25
Page 68
A2. Expressions régulières
Les expressions régulières permettent de spécifier d'une manière
symbolique et concise des suites de caractères à chercher dans une
information textuelle.
Leur apparente complexité est due au fait qu'elles se composent
à leur tour de caractères, mais qui représentent un peu plus qu'euxmêmes ... Par exemple, lue comme une expression régulière, la suite de
six caractères :
HEU...
n'exprime pas une hésitation, mais un (très) large groupe de suites
de six caractères, dont une petite partie appartient à la langue française :
HEURES, HEURTE, HEURTS
et d'autres pourraient être tout ou partie d'une référence de
produit comme 12BHEU2003, d'une plaque minéralogique, etc.
La force des expressions régulières est de représenter avec peu
de caractères des combinaisons virtuellement infinies, mettant ainsi à la
portée de l'utilisateur un moyen de description à la hauteur des capacités
de traitement de son ordinateur.
1. Décrire une seule position
.
Tout caractère à cet endroit
[]
Un caractère parmi ceux mentionnés entre les
parenthèses carrées :
[aeoiu] une voyelle
[0-9A-Za-z] un chiffre ou une lettre majuscule ou une
lettre minuscule
68 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
[^ ]
Page 69
Tout caractère sauf ceux spécifiés entre les parenthèses
carrées :
[^0-9] pas de chiffre à cet endroit
2. Décrire des répétitions
?
A cet endroit, tout caractère ou rien (directement la
suite) :
[A-Z]?19[0-9][0-9] une année 1900 à 1999, précédée ou
pas d'une lettre majuscule
*
La description qui précède, zéro ou plusieurs fois :
[A-Z]*2002 une quelconque suite de majuscules, suivie
de l'année 2002 ou bien l'année 2002 toute seule
+
La description qui précède, une ou plusieurs fois :
[A-Z]+2002 au moins une lettre majuscule devant
l'année 2002
{n}
La description qui précède, exactement n fois :
[0-9A-Za-z]{16} groupe de seize chiffres et lettres
{n,N}
La description qui précède, au minimum n fois et au
maximum N fois :
[0-9A-Za-z]{12,16} groupe de chiffres et lettres de
longueur comprise entre 12 et 16
Partez sur de bonnes bases
SpéciaListe // 69
man SP dos carré
27/06/03 17:25
Page 70
3. Position dans une chaîne de caractères
^
Toute l'expression qui suit doit se trouver en début de
chaîne :
^AB trouve la référence AB2002CD02, mais pas
AD2002AB16
$
Toute l'expression qui précède doit se trouver en fin de
chaîne :
02$ trouve la référence AB2002CD02, mais pas
AD2002AB16
70 // SpéciaListe
Partez sur de bonnes bases
man SP dos carré
27/06/03 17:25
Page 71
LICENCE D'UTILISATION
DU LOGICIEL
Vous avez acquis un logiciel de la gamme GOTO Software, en l'occurrence SpéciaListe, et nous vous en
remercions. Cette acquisition ne fait pas de vous le propriétaire du Logiciel mais le bénéficiaire des droits pour
son utilisation dont les conditions sont détaillées ci-après. En ouvrant la pochette contenant le Cédérom ou en téléchargeant le logiciel, vous acceptez sans réserve de vous conformer aux termes de la présente Licence. Si vous
n'acceptez pas les clauses du contrat, vous devez retourner le Cédérom sans rompre son emballage d'origine ainsi que le matériel l'accompagnant à l'endroit où vous avez acheté le Produit afin d'en obtenir le remboursement,
ou refuser le téléchargement du produit en cas d'un achat en ligne. Les droits du Licencié sur le logiciel sont spécifiés dans la présente Licence, à l'exclusion de ceux qui n'ont pas été expressément concédés par les présentes.
I - ETENDUE DE LA LICENCE
Sauf stipulation contraire établie de façon expresse par GOTO, la Licence d'utilisation du logiciel vous est concédée pour un seul ordinateur en un seul lieu. En cas de contrôle, un justificatif d'achat (Cédérom original, facture
ou ticket de caisse) sera demandé pour chaque installation constatée du Logiciel. Dans le cadre d'un achat en ligne,
il vous est donc conseillé d'imprimer la facture correspondante. Le transfert physique du Logiciel d'un ordinateur
à un autre est autorisé à condition que le Logiciel ne soit utilisé que sur un ordinateur à la fois. La copie de sau vegarde est seule autorisée et devra être effectuée conformément aux dispositions de l'article 2 ci-dessous. L'utilisateur n'est pas non plus autorisé à copier la documentation imprimée du Logiciel, celle-ci étant protégée par
les droits de propriété intellectuelle. Toute utilisation non prévue au paragraphe précédent est interdite et en particulier, sans que ce ne soit limitatif, vous ne pouvez pas sans l'autorisation écrite de GOTO : Diffuser, céder, louer,
vendre, donner en crédit bail, sous licencier, donner ou distribuer tout ou partie du logiciel à un Tiers, de quelque
façon que ce soit Altérer, désassembler, décompiler, adapter, créer des œuvres dérivées, intégrer dans un autre
logiciel, traduire ou modifier de quelque façon que ce soit, tout ou partie du Logiciel. Effectuer des copies de tout
ou partie du Logiciel (autres que la copie de sauvegarde dans les conditions définies ci-après). IL EST NOTAMMENT PRECISE QU'IL EST INTERDIT DE METTRE TOUT OU PARTIE DU LOGICIEL A DISPOSITION DU PUBLIC
PAR LE BIAIS D'INTERNET, DE BBS OU DE SERVEURS MINITEL SANS L'AUTORISATION PREALABLE ECRITE
DE GOTO.
Partez sur de bonnes bases
SpéciaListe // 71
man SP dos carré
27/06/03 17:25
Page 72
II - COPIE DE SAUVEGARDE
Dans le cas d'achat du Cédérom ou de la disquette d'origine et si c'est le Cédérom ou la disquette d'origine qui
sont utilisés pour l'exploitation du Logiciel, la présente Licence vous autorise à disposer d'une copie de sauvegarde de la forme de votre choix. En revanche, dès lors que le programme est copié sur disque dur, c'est le Cédérom d'origine qui fera office de sauvegarde. Dans le cas d'un achat en ligne, vous êtes autorisé, en plus de l'installation du logiciel sur votre disque dur, à disposer d'une copie de sauvegarde de la forme de votre choix. Cette
copie a pour seul but de régénérer le logiciel original en cas de détérioration accidentelle. En aucun cas elle ne
pourra être utilisée à d'autres fins. Conservez-la en lieu sûr. Attention, votre responsabilité pourra être engagée
en cas d'utilisation illicite par un Tiers. La présente Licence s'applique à la copie de sauvegarde.
III - PROPRIETE
GOTO dispose de tous les droits d'édition et de reproduction sur le Logiciel et sa documentation et sur toute copie
autorisée dans le cadre de la présente Licence conformément à la législation sur les droits d'auteurs. Vous prendrez en conséquence toutes les mesures nécessaires à la protection desdits droits et en particulier respecterez et
ferez respecter toutes les mentions et avertissements relatifs à ces droits qui sont portés sur les éléments constitutifs du logiciel ou de sa copie de sauvegarde.
IV - DUREE - RESILIATION
La présente Licence est concédée pour une durée indéterminée sauf manquement de votre part aux termes et conditions de la présente Licence qui conférera à GOTO la faculté de résilier automatiquement la présente Licence sans
préavis et sans préjudice des autres recours dont elle pourra disposer. En cas de résiliation, vous vous engagez à
en cesser toute utilisation et à retourner à GOTO, sans délai et sur simple demande de GOTO, le Logiciel ainsi
que sa copie de sauvegarde le cas échéant.
V - GARANTIE ET RESPONSABILITÉ
GOTO ne garantit en aucune façon que le Logiciel réponde à quelque fonctionnalité que ce soit ni aux spécifications de l'utilisateur, qu'elles aient été écrites ou non préalablement à l'acquisition. GOTO ne pourra être tenu
pour responsable des dommages ou problèmes causés par le logiciel sous Licence et qui pourrait résulter de son
utilisation. Ceci comprend de manière non exhaustive le matériel informatique, les logiciels, le système d'exploitation
ou tout autre accessoire informatique quel qu'il soit. La garantie est strictement limitée au support matériel, qui
sera échangé en cas de vice constaté. La présente garantie s'applique pour une durée de 6 mois suivant la date
d'acquisition étant entendu qu'en cas de retour du produit, les frais de port restent à la charge de l'expéditeur. NONOBSTANT CE QUI PRECEDE, GOTO NE POURRA EN AUCUN CAS ÊTRE TENUE POUR RESPONSABLE DE
QUELQUE DOMMAGE, DIRECT OU INDIRECT, CAUSE A VOUS OU A UN TIERS, NOTAMMENT, A TITRE PUREMENT INDICATIF ET NON LIMITATIF, LES MANQUES A GAGNER, DEPENSES, PERTES DE LOGICIEL, DETERIORATIONS OU PERTES DE MATERIELS SUPPORTES PAR VOUS MEME OU PAR UN TIERS, Y COMPRIS LES
FRAIS DE RECUPERATION, REPRODUCTION, OU DE REPARATION DE TELLES PERTES OU DETERIORATIONS.
Vous indemniserez GOTO pour tout dommage résultant de la mise en cause de GOTO et ayant son origine dans
un manquement à la présente Licence ou dans l'utilisation du Logiciel.
VI - ASSISTANCE A L'UTILISATION
La présente Licence n'entraîne aucune obligation d'assistance de GOTO concernant l'utilisation du Logiciel.
L'utilisateur trouvera des compléments d'informations, une aide permanente à l'utilisation et sera averti des évolutions et des nouvelles versions du logiciel à l'adresse http://www.goto.fr
VII - DISPOSITIONS GENERALES
La présente Licence est soumise au droit français. Le tribunal compétent pour connaître de tout litige relatif à l'utilisation du produit ou à l'interprétation de la présente Licence est le Tribunal de commerce de Lille. La présente
Licence est concédée pour la France Métropolitaine. GOTO diligentera des poursuites à l'encontre des contrevenants aux termes de la présente Licence.
Goto Software - Avenue Antoine Pinay
Parc d'Activités des 4 Vents - 59510 Hem - France

Documents pareils