Manuel d`utilisation
Transcription
Manuel d`utilisation
man SP dos carré 27/06/03 17:25 Page 1 Manuel d'utilisation man SP dos carré 27/06/03 17:25 Page 2 GOTO Software, S.A. au capital de 600 000 €, RCS Roubaix-Tourcoing 433 084 522 Avenue Antoine Pinay - Parc des Quatre Vents - 59510 Hem - France Le logiciel et cette documentation constituent le produit SpéciaListe pour Windows et font l'objet d'un contrat d'utilisation. Veuillez le lire s'il-vous-plaît. Chaque contrat est unique. Le logiciel qui lui est associé ne peut être utilisé que sur un même poste de travail informatique. L'acquisition de ce produit ne vous permet en aucun cas d'effectuer des reproductions, même partielles, et par quelque moyen que ce soit, du logiciel ou de la documentation. Des poursuites seront engagées pour toute utilisation non conforme. © 2 0 0 3 G OTO - Tous droits réservés Les logiciels, ordinateurs et marques cités dans ce manuel sont des marques déposées et ne sont cités qu'à titre d'exemple. 2 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 3 TABLE DES MATIÈRES Introduction : SpéciaListe, mais de quoi ? .............................................................................. 5 Configuration requise ................................................................................................................. 6 Conseils de consultation de l'aide .............................................................................. 6 Présentation ............................................................................................................................................................... 7 J'ai un vieux fichier de clients ... .................................................................................... 9 Il y a plein de doublons ... ................................................................................................. 10 J'aimerais pouvoir séparer ... ......................................................................................... 11 Ils ont tous tapé TOTO dans ce champ ?! ..................................................... 12 Combien de clients à moins de 50km ? ............................................................ 14 Le chargement d'un fichier .................................................................................................................... 15 Formats bureautiques spécifiques ........................................................................... 16 Le Carnet d'adresses de Windows .......................................................................... 16 Fichiers texte au premier chargement ................................................................ 17 Fichiers texte déjà analysés ............................................................................................. 18 Fonctions générales ....................................................................................................................................... 19 Tri ..................................................................................................................................................................... 20 Le tri par valeur .............................................................................................................. 20 Le tri par valeur sur plusieurs colonnes ............................................. 20 Les critères avancés de tri ................................................................................. 21 Marquage .............................................................................................................................................. 23 Indexation et vues ....................................................................................................................... 24 Obtenir un index .......................................................................................................... 27 Exploiter un index ....................................................................................................... 29 Changements groupés .......................................................................................................... 31 Recherche avancée .................................................................................................................... 32 Traitement des doublons .................................................................................................... 33 Fusion ......................................................................................................................................................... 35 Croisement ........................................................................................................................................... 35 Partez sur de bonnes bases SpéciaListe // 3 man SP dos carré 27/06/03 17:25 Page 4 Traitements spécifiques aux champs ......................................................................................... 37 Noms et prénoms ........................................................................................................................ 38 La correction des champs d'identité ........................................................ 38 Segmentation en tranches d'âge ................................................................. 40 Statistiques .............................................................................................................................. 40 Codes SIRET et APE ................................................................................................................. 41 Numéros de téléphone ......................................................................................................... 41 Villes et codes postaux .......................................................................................................... 42 Adresses postales ........................................................................................................................ 42 Adresses de courrier électronique .......................................................................... 44 L'outil carte de France ................................................................................................................................ 46 Villes et départements ........................................................................................................... 47 Déplacements, agrandissements .............................................................................. 48 Sélections, élargissements, filtres ............................................................................. 49 Exportation en tant qu'image ....................................................................................... 50 Utilisation des résultats ............................................................................................................................. 51 L'extraction des nouvelles tables de données .......................................... 52 L'exportation des données ............................................................................................... 52 Briefings et présentations .................................................................................................. 53 L'impression ........................................................................................................................................ 53 Annexes ....................................................................................................................................................................... 55 A1. Etude de cas : data mining sur un site Web .................................... 55 Combien de visiteurs uniques ? ..................................................................... 58 Sommes-nous bien référencés sur la Toile ? .................................. 60 Quelles sont nos pages les plus lues ? .................................................. 62 Quels sont les créneaux horaires dominants ? ............................. 64 Evaluation de la qualité de service ............................................................. 66 A2. Expressions régulières ................................................................................................ 68 Licence ........................................................................................................................................................................... 71 4 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 5 INTRODUCTION : SPÉCIALISTE, MAIS DE QUOI ? Exprimé en une seule phrase, SpéciaListe est un logiciel bureautique pour le traitement rapide des fichiers volumineux, particulièrement adapté aux informations d'identité, d'adresse postale et d'adresse électronique. La vitesse de traitement de SpéciaListe, alliée à la reconnaissance automatique des contenus, permet à l'utilisateur de regarder son information sous des angles nouveaux, et de ce fait d'enrichir continuellement les méthodes d'analyse et d'exploitation de ses fichiers. SpéciaListe est donc avant tout un outil de productivité personnelle : • simple (comme un tableur), • puissant (comme une base de données) • rapide (sans terme de comparaison !) Partez sur de bonnes bases SpéciaListe // 5 man SP dos carré 27/06/03 17:25 Page 6 Configuration requise • PC Compatible IBM® • Processeur Pentium® ou équivalent • Système d'exploitation Windows® 95, 98, Me, NT4, 2000 ou XP (toutes éditions) • Mémoire vive : environ le double de la taille des fichiers traités • Lecteur CD-ROM • Connexion Internet pour la vérification complète des adresses e-mail contenues dans un fichier. Conseils de consultation de l'aide Ce manuel est destiné à tout utilisateur de SpéciaListe, quelle que soit l'étendue de son expérience bureautique. Le chapitre Présentation est particulièrement destiné à faire découvrir les capacités du logiciel, en s'appuyant sur des exemples qui expriment des besoins professionnels courants. Si vous découvrez SpéciaListe, nous vous conseillons la lecture de ce chapitre avant d'utiliser le logiciel. Fort de cet acquis, même si les cas d'étude présentés ne correspondent qu'à moitié au vôtre, vous constaterez à l'usage qu'il vous sera bien plus facile de retrouver la réponse à l'autre moitié parmi les fonctions du logiciel. Les chapitres suivants sont des chapitres de référence, à consulter en cas de question précise. L'ensemble de la documentation est disponible dans l'aide en ligne. 6 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 7 PRÉSENTATION Dans la panoplie des outils bureautiques d'aujourd'hui, SpéciaListe vient occuper une place située entre le tableur et le logiciel de gestion de bases de données. Seulement, la place était vide depuis tellement longtemps qu'on a fini par oublier les questions auxquelles ni l'un, ni l'autre ne savent apporter de réponse. Historiquement, il revient au tableur le mérite d'avoir ouvert le premier une fenêtre quadrillée sur les données bureautiques. Il porte à l'écran informatique une métaphore qui nous est familière depuis nos premiers cahiers à petits carreaux : les quantités à additionner bien rangées les unes en dessous des autres, un trait, puis le total. En faisant défiler l'écran, la feuille de calcul semble tout aussi vaste qu'un cahier vierge le jour de la rentrée, et de toutes façons jusqu'à la sixième un cahier était rangé ou perdu bien avant d'arriver à la dernière page, n'est-ce pas ? Ca tombe bien, nous sommes en 1978 et la mémoire vive d'un ordinateur de bureau est à peine plus grande que l'équivalent d'un cahier de 100 pages. Mais la bureautique courante s'en accommodera pendant des années, alors qu'il y a de plus en plus de mémoire vive en attente d'une Partez sur de bonnes bases SpéciaListe // 7 man SP dos carré 27/06/03 17:25 Page 8 utilisation qui ne vient pas ... Le tableur le plus utilisé sur la planète attendra sa version de l'an 2000 pour s'affranchir de la limite de 65000 lignes ! Et pourtant, que faire si le problème à résoudre porte sur beaucoup de lignes et refuse de se laisser exprimer par une formule mathématique (même de terminale scientifique), disons "Quel est notre produit le plus acheté par nos clients de moins de 30 ans ?" Ce n'est pourtant pas compliqué ... Mais la réponse n'est plus à la portée d'une fenêtre quadrillée avec une barre de menus déroulants. Il vaut mieux alors se tourner vers le langage de requêtes d'un logiciel de bases de données. Du reste, même si votre tableur tenait encore la route pour des fichiers de taille moyenne, son langage de macroinstructions vous soumettrait à la même épreuve. Va donc pour la programmation ! Mais l'effort et le laps de temps nécessaires pour obtenir le résultat vous couperont du point de départ. A l'arrivée, ne serait-ce que quelques minutes plus tard, le mélange de curiosité, d'intuition et de légèreté qui vous poussait à la recherche d'une idée nouvelle n'y est presque plus. Vos questions ne sont plus aussi ouvertes qu'avant, car les trois quarts des chemins de traverse qu'une réponse immédiate vous aurait ouverts sont maintenant derrière vous. Vous pouvez encore solliciter l'aide d'un informaticien ... De toutes façons, il en faudrait bien un pour faire tourner votre logiciel de bases de données, au vu des messages qu'il affiche à l'installation ! Mais à partir de maintenant, il n'y aura plus du tout de chemin de traverse. Le logiciel SpéciaListe est une alternative à tout cela, rendue possible notamment par l'impressionnante quantité de mémoire vive qui équipe les ordinateurs de bureau d'aujourd'hui. Ceci, ajouté à une technologie innovante développée par GOTO Software dans le cadre d'un programme de développement de deux années aidé par l'ANVAR, lui permet de vous apporter des réponses immédiates, rien qu'avec sa fenêtre quadrillée et sa barre de menus déroulants. 8 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 9 J'ai un vieux fichier de clients ... La constitution d'un fichier de clients passe par des sources souvent hétérogènes, véritables témoins des "strates géologiques" de l'informatisation d'une entreprise. Parfois les noms des colonnes n'y sont plus, parfois la moitié des fichiers ont été constitués au bon vieux temps du système MS-DOS et la place des lettres accentuées a été prise au chargement par d'autres signes ... SpéciaListe sera capable de ramener pratiquement tout fichier de données texte à une forme exploitable, grâce à sa recherche en profondeur alliée à une confrontation permanente à un savoir de référence. Par exemple, quelles que soient les fautes de frappe sur les prénoms dans un fichier, au-delà d'un nombre suffisant de confrontations, SpéciaListe saura isoler le champ Prénom. Cela signifiera au passage que le champ Nom n'est probablement pas loin. Il en sera de même pour les numéros de téléphone, de télécopie, de portable, pour les codes postaux, les villes, les adresses e-mail… A la fin du processus, les colonnes du fichier chargé à l'écran ne s'appellent plus A, B, C, mais bien Nom, Prénom, E-mail et ainsi de suite. Toute analogie avec un tableur est maintenant dépassée, SpéciaListe vient de s'ouvrir la voie pour déployer ses traitements dédiés à chaque type d'information. Partez sur de bonnes bases SpéciaListe // 9 man SP dos carré 27/06/03 17:25 Page 10 Il y a plein de doublons ... L'élimination des enregistrements multiples concernant la même entité (client, prospect, fournisseur) constitue un passage obligé dans l'informatique au service de toute activité professionnelle. Pour les petits fichiers, le tableur a été - et continue d'être - l'outil fidèle et inavoué de l'opération, bien que son support se réduise au tri hiérarchique sur une, deux ou trois colonnes. Une fois les lignes ainsi ordonnées, il appartient à l'utilisateur de décider des lignes à effacer, tout en reportant au besoin sur la ligne qui reste les informations utiles des autres, un code postal par exemple. Avec un logiciel de bases de données, il s'agit au contraire d'exprimer le besoin dans le langage de requêtes, autrement dit d'indiquer les comparaisons, la tolérance quant aux différences, le fait de garder la ligne "la mieux remplie", tout en remplissant ses champs vides avec le contenu correspondant des lignes qui seront effacées, etc. C'est loin d'être trivial et surtout encore loin de couvrir tous les cas de figures. Pour prendre un exemple, sur deux lignes identiques au prénom près, écrit Philippe dans l'une et Philipppe dans l'autre, en fonction des options exprimées : • les deux lignes seront gardées, ou • il y a exactement une chance sur deux pour que la ligne avec une faute de frappe soit gardée au détriment de l'autre. Pour SpéciaListe, l'élimination des doublons est un besoin de premier plan dans le traitement des fichiers et non pas un jeu de LEGO à construire à l'aide de mini-comparaisons qui peuvent s'emboîter de mille autres façons. De ce fait, l'opération a bel et bien sa place dans les menus du logiciel épaulée au besoin par des actions préalables comme la correction des prénoms et la correction des villes. 10 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 11 Une fois choisie, il reste encore à cocher les noms des champs sur lesquels porte la comparaison et d'opter pour la voie à suivre une fois les doublons identifiés : marquage, fusion des informations, etc. La puissance est là, la simplicité aussi. Seulement, elles ne se font pas obstacle l'une à l'autre. J'aimerais pouvoir séparer ... Vous disposez d'un fichier de prospects comportant une colonne pour le code postal. Il y aurait sans doute plein de choses utiles à en tirer pour votre prochaine campagne de marketing, si seulement vous connaissiez le poids relatif de chaque département ... Mais comment faire ? Cette fois-ci, nous laisserons à ceux qui ne disposent pas de SpéciaListe le soin de trouver la solution avec leur tableur ou avec leur logiciel de base de données (bon courage !). Avec SpéciaListe, vous devez : • sélectionner la colonne Code postal, et • faire un clic droit et choisir dans le menu Indexer selon > Les 2 premiers caractères. Maintenant, la fenêtre de SpéciaListe comporte un volet gauche avec les numéros des départements et leurs représentations parmi vos prospects, en valeurs absolues et en pourcentages, le tout par ordre décroissant d'importance, bien entendu. Vous pouvez commencer votre réflexion ... Si vous préférez un aperçu graphique, utilisez le menu Index > Histogramme. En plus, le résultat n'est rien d'autre qu'une page Web locale, n'hésitez donc pas à l'annexer à votre présentation si vous devez convaincre quelqu'un d'autre de la justesse de votre analyse. Partez sur de bonnes bases SpéciaListe // 11 man SP dos carré 27/06/03 17:25 Page 12 D'une manière générale, une découverte en appelant une autre, vous pourrez créer une nouvelle table de données à partir d'un groupe d'entrées sélectionnées de l'index, que vous pourrez soumettre de nouveau à l'entière puissance du logiciel, et ainsi de suite. Avec SpéciaListe, la réponse à la question "Quel est notre produit le plus acheté par nos clients de moins de 30 ans ?" (voir Présentation) comporte deux opérations d'indexation et la sélection du bon segment entre les deux, le tout sans entrer un seul mot de texte au clavier ! Cette capacité à indexer votre information selon les critères les plus variés constitue une des grandes forces de SpéciaListe pour vous épauler dans vos démarches d'analyse, de nettoyage, de reconstitution de vos données, et ce quel que soit le contenu de vos fichiers. Ils ont tous tapé TOTO dans ce champ ?! Comme pour tout domaine informatisé, la qualité globale de votre activité sera foncièrement tributaire de la qualité de vos fichiers de données. Toute collecte d'informations apporte son lot d'erreurs plus ou moins systématiques, et l'ère des nouvelles technologies n'améliore pas forcément l'état des choses. A titre d'exemple, la collecte d'adresses e-mail par un formulaire Web produit un nombre surprenant de variantes pour le seul nom de domaine wanadoo ! (Pourtant, il n'y que la bonne qui aboutira à l'envoi d'un courrier électronique. En la matière, il n'y pas de postier pour connaître le quartier, encore moins les occupants de chaque maison.) 12 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 13 Les fonctions de correction de données proposées par SpéciaListe sont sans précédent parmi les logiciels bureautiques généralistes du moment, d'une part grâce à l'indexation qui permet d'isoler des lignes à "soigner" ensemble et d'autre part grâce à sa capacité à reconnaître la signification des champs et de proposer des fonctions spécifiques : • correction des prénoms • correction des villes • correction des numéros de téléphone • mise en forme de l'adresse postale • vérification des adresses e-mail. Parmi ces fonctions, la vérification des adresses e-mail occupe une place à part, car elle peut être configurée sur plusieurs niveaux de profondeur, du contrôle syntaxique avec élimination des noms factices (vous savez, les toto, les aaaa, les kjkjk ... ), jusqu'à l'utilisation d'Internet pour effectivement vérifier l'existence d'une adresse en simulant l'envoi d'un e-mail. Au passage, il corrigera si besoin est le nom de domaine (par rapprochement d'un jeu de références qui s'enrichit au fur et à mesure de l'utilisation). SpéciaListe a bel et bien une casquette de postier pour tous les quartiers du Net, mais il ne dérange personne ... Partez sur de bonnes bases SpéciaListe // 13 man SP dos carré 27/06/03 17:25 Page 14 Combien de clients à moins de 50km ? Voici le genre de questions à laquelle se doit de répondre tout logiciel cartographique "digne de ce nom". Souvent, cette appellation officieuse implique des précisions compatibles avec le positionnement par satellite et le support intégré de toutes sortes de fichiers croisés, ce qui vous permettra d'utiliser un tel logiciel à la fois pour la gestion du parc de voitures et pour l'optimisation de trajets de jogging proposés par le comité d'entreprise. Mais, si votre entreprise n'a pas de flotte commerciale et si votre comité d'entreprise préconise plutôt la piscine, le logiciel vous sera quand même proposé au même prix. Disons-le d'emblée, SpéciaListe n'est pas un logiciel cartographique à proprement parler. Néanmoins, il saura répondre à la question-titre, moyennant comme d'habitude une séquence d'actions à la souris : • sélectionnez menu Outils > Carte de France • cliquez sur votre ville, puis élargissez au rayon voulu • appuyez sur Marquer les entrées, puis sur Revenir à la table. D'une manière générale, le module Carte de France de SpéciaListe vous permettra des visualisations en dégradés de couleurs selon la fréquence des entrées, des sélections par département et par région, des filtres de densité de population, sans oublier l'exportation des "photos", à utiliser plus tard pour réfléchir et pour convaincre. Besoin d'un logiciel cartographique ? Pas si sûr ... 14 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 15 LE CHARGEMENT D'UN FICHIER Le chargement d'un fichier est l'opération par laquelle SpéciaListe s'approprie et qualifie l'information, avant de vous la présenter. Au cours de cette opération, les attributs de chaque champ sont évalués et mémorisés séparément pour utilisation ultérieure. Ce n'est qu'après cette étape qu'un fichier devient une table, à savoir un ensemble d'informations de structure entièrement déterminée, à laquelle SpéciaListe peut appliquer l'ensemble de ses opérations, notamment le croisement et la fusion avec d'autres tables de structure compatible. La présence des données en tant que table dans SpéciaListe ne vous empêche pas d'altérer le fichier d'origine en utilisant une autre application active. Dans ce cas, SpéciaListe détecte automatiquement le changement au moment où il repasse en avant-plan et vous propose de recharger le fichier, par souci de cohérence. Toutefois, vous pouvez également demander à tout moment le rechargement d'une table (menu Fichier > Recharger). Au chargement d'un fichier avec SpéciaListe, vous rencontrerez plusieurs cas de figures, selon la provenance et le format des informations. Partez sur de bonnes bases SpéciaListe // 15 man SP dos carré 27/06/03 17:25 Page 16 Formats bureautiques spécifiques Il s'agit d'une importation qui n'altérera pas le contenu d'origine, les données étant automatiquement transférées en format texte. Dans ce cas, les champs sont déjà définis en termes de position dans le fichier, il ne reste plus qu'à en déduire la signification. A partir du menu Fichier > Importer ..., sélectionnez le répertoire contenant votre fichier, puis déployez la liste Fichiers de type :, afin de retrouver le format enregistré par l'application bureautique qui est à l'origine du fichier : Microsoft Access, Microsoft Excel, dBase, Paradox, etc., la liste étant plus ou moins fournie selon les applications installées sur votre ordinateur. Choisissez le fichier et cliquez sur Ouvrir. Le Carnet d'adresses de Windows Il s'agit d'un cas particulier d'importation d'information structurée, pour laquelle SpéciaListe met en œuvre un assistant dédié, accessible depuis le menu Fichier > Importer depuis le Carnet d'adresses ... Dans un premier temps, choisissez entre le carnet d'adresses local (propre à l'utilisateur courant sur l'ordinateur) et tout autre fichier de type .wab (Windows Address Book), généralement mis en partage à travers le réseau local d'entreprise. SpéciaListe analyse la structure du fichier choisi et propose la liste des champs à prendre en considération. Vous serez surpris par le nombre de ces "cases" prévues par le système selon sa version, dont la plupart sont vides. Pour vous faciliter la tâche, l'assistant sélectionne par défaut toutes les colonnes, tout en vous proposant l'option Ne pas importer les colonnes vides. 16 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 17 Fichiers texte au premier chargement A partir du menu Fichier > Ouvrir ..., sélectionnez le répertoire contenant votre fichier texte, qui présente normalement un des types proposés par SpéciaListe en première position de sa liste de types, à savoir Fichiers de type texte : txt, csv, dtl. Néanmoins, si votre fichier provient d'une extraction qui lui a attribué un autre type (ou pas de type du tout), choisissez Tous fichiers pour le faire apparaître dans la liste de fichiers du répertoire et cliquez sur Ouvrir. SpéciaListe effectue un travail en profondeur sur un fichier texte qu'il ouvre pour la première fois, afin de détecter l'emplacement et la signification de chaque champ. L'étape est marquée à l'écran par l'affichage du message Détection des champs . Si les noms des champs sont présents sur la première ligne du fichier, SpéciaListe les conserve et les enrichit d'une information de type qui permettra l'application d'opérations spécifiques. Dans le cas contraire, SpéciaListe attribue à chaque champ un nom en relation avec sa signification déduite : Nom, Prénom, Adresse, Complément d'adresse, Code postal, Ville, E-mail, etc. A la fin de cette étape, vous aurez toute liberté de modifier l'information de structure ainsi déduite, à partir du menu Table > Propriétés ... Cette commande vous permet avant tout de corriger le cas échéant la position des champs dans le fichier, en modifiant le ou les caractères de séparation que SpéciaListe doit prendre en considération : un clic de validation sur le bouton Reconstruire les champs vous permettra de visualiser de suite le résultat. Ensuite, vous pouvez changer le type et la signification de chaque champ, afin d'y imposer un jeu d'actions spécifiques. Partez sur de bonnes bases SpéciaListe // 17 man SP dos carré 27/06/03 17:25 Page 18 L'information de structure ainsi ajoutée par SpéciaListe sera conservée dans un fichier à part, portant le même nom que le fichier d'origine et le type .spec . Ceci lui permettra de charger ultérieurement le fichier sans passer par l'étape de détection de champs (voir Fichiers texte déjà analysés). Fichiers texte déjà analysés Aux chargements suivants d'un fichier déjà analysé, SpéciaListe s'appuie sur le fichier de structure .spec correspondant pour accélérer le processus. Néanmoins, vous pouvez à tout moment changer le type et le contenu des champs d'un fichier chargé. Pour vous faciliter l'accès à des fichiers déjà travaillés avec SpéciaListe, le logiciel vous offre plusieurs possibilités. 1. Le plus simple en est la fermeture du logiciel avec les fichiers en cours d'utilisation encore présents à l'écran. Au lancement suivant du logiciel, ces fichiers seront automatiquement chargés, reconstituant ainsi votre dernier environnement de travail. 2. Le menu Réouvrir vous donne un accès direct à la liste des derniers fichiers ouverts dans le logiciel, puis fermés explicitement. 3. Pour retrouver les répertoires d'origine des fichiers déjà chargés, parcourez la liste des dossiers que SpéciaListe affiche à gauche dans le dialogue d'ouverture. Vous y trouverez les endroits récemment "visités" par le logiciel. C'est un moyen pratique de retrouver rapidement d'autres fichiers candidats à l'ouverture, semblables à ceux déjà travaillés avec SpéciaListe. 18 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 19 FONCTIONS GÉNÉRALES SpéciaListe offre une large palette de fonctions basées sur la colonne couramment sélectionnée, quel que soit son contenu. La plupart de ces fonctions n'ont pas d'équivalent dans les outils de la bureautique actuelle. Leur application successive sur tout ou partie de vos données vous permettra dans un premier temps une mise à niveau de vos fichiers par des regroupements et des corrections parfaitement ciblés. Ensuite, la fiabilité du résultat sera le point de départ de vos explorations, analyses et vérifications d'hypothèses. Il convient de souligner que chacune de ces opérations est élémentaire, en ce sens que leur résultat est immédiatement visible à l'écran, offert à votre réflexion et par conséquent à l'application de l'opération suivante. Avec les fonctions générales de SpéciaListe, vous n'êtes pas dans l'obligation d'anticiper les résultats intermédiaires, comme vous le feriez avec une suite d'instructions d'un quelconque langage. Le modèle de travail de ces fonctions reste la boucle élémentaire qui inclut votre regard, ce qui vous permet à tout moment de bifurquer sur une idée nouvelle (voir Exploiter un index). Partez sur de bonnes bases SpéciaListe // 19 man SP dos carré 27/06/03 17:25 Page 20 Tri En langage bureautique courant, le tri d'une table de données sur une colonne correspond à l'agencement des lignes selon l'ordre alphabétique ou numérique (croissant ou décroissant) des valeurs dans une ou plusieurs colonnes. SpéciaListe étend cette notion à un éventail de possibilités, dans lequel la valeur alpha-numérique n'est qu'un critère parmi d'autres. Le tri par valeur Le tri par valeur est accessible par clic sur l'en-tête d'une colonne, en maintenant la touche Ctrl enfoncée. Le sens de la flèche qui apparaît sur l'en-tête de la colonne rappelle le sens croissant ou décroissant de l'opération. En répétant l'action sur la même colonne vous obtenez le tri par ordre inverse du premier. L'action sur une autre colonne annule le tri précédent. Le tri par valeur sur plusieurs colonnes Pour entrer dans le régime de tri hiérarchique sur plusieurs colonnes, vous devez cocher l'option Tri multi-colonnes dans l'onglet de préférences Outils > Préférences ... Table. Dans ce régime, les commandes Ctrl + clic sur les en-têtes des colonnes introduisent des tris secondaires successifs à l'intérieur de ceux déjà définis, en ce sens que les lignes ne changeront de place qu'à valeurs égales des champs sur les tris hiérarchiquement supérieurs. Le sens de chaque tri secondaire suit le sens du premier tri défini. Des flèches de taille de plus en plus petite sur les en-têtes des colonnes concernées matérialisent les tris introduits. 20 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 21 Les critères avancés de tri Les critères de tri spécifiques à SpéciaListe sont accessibles par clic droit sur l'en-tête de la colonne sélectionnée (menu Trier > ...). Afin de ne pas compliquer votre choix avec l'alternative Croissant - Décroissant, la fonction qui "retourne" les lignes d'une table (les dernières lignes deviennent les premières) est disponible séparément, en cliquant sur le coin supérieur gauche de la table (l'en-tête de la colonne grise des numéros de lignes). Le tri par le nombre de caractères ordonne les lignes selon la longueur des contenus d'un champ. De ce fait, les lignes contenant AM123 ZQ145 se retrouvent groupées dans le bloc à champs de 5 caractères et les lignes contenant A2002M342 Z2002Q230 se retrouvent dans le bloc à champs de 9 caractères. Partez sur de bonnes bases SpéciaListe // 21 man SP dos carré 27/06/03 17:25 Page 22 Cette fonction servira en premier dans le traitement des champsréférence hétérogènes, des codes produit de sources différentes par exemple. Le tri de droite à gauche permet de retourner la hiérarchie en donnant la priorité aux derniers caractères d'un champ. Par exemple, si dans le champ-référence d'un produit distribué la partie gauche est consacrée à un canal de vente et la partie droite au produit : GMSCD455 GMSCD421 GSSCD455 GSSCD421 c'est par ce tri en miroir que se formeront les blocs-quantités des produits vendus quel que soit le canal de distribution : GMSCD421 GSSCD421 GMSCD455 GSSCD455 Le tri par fréquence regroupe les lignes qui se partagent une même valeur du champ, avec la mise en avant des blocs les plus volumineux. Ce type de tri constitue le point de départ pour la mise en évidence d'une tendance ou d'une erreur systématique. Le tri par une séquence aléatoire permet l'obtention d'un échantillon représentatif, à utiliser par exemple dans une opération de marketing : tirage au sort, opération pilote, sondage, etc. 22 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 23 Marquage La gestion des marques associées à chaque ligne d'une table de données permet à SpéciaListe de vous suivre dans les étapes de votre travail. La colonne des marques est toujours présente à gauche de la table de données et de toute vue partielle de celle-ci (voir également Indexation et vues). Jusqu'à un certain point, le marquage s'apparente à la sélection telle qu'habituellement rencontrée dans l'interface graphique Windows, dans la mesure où l'un comme l'autre servent de portée ou de discriminant pour l'opération suivante : "prendre ceci", "prendre tout sauf ceci", "séparer en deux", etc. La différence réside dans le caractère cumulatif et persistant du marquage tel que mis en œuvre par SpéciaListe. En effet, le marquage ne se réinitialise pas suite à un clic malencontreux dans la fenêtre ; il suit vos actions récentes en vue de la suivante et à ce titre il sera même sauvegardé sur le disque dur en même temps que la table de données à laquelle il est associé. Pour alimenter le marquage des lignes, vous disposez de plusieurs possibilités de différentes portées : • le marquage individuel d'une ligne s'effectue en cochant la marque correspondante à gauche • pour marquer une plage de plusieurs lignes consécutives, cliquez à gauche sur le numéro de la première, glissez la souris vers le bas jusqu'au numéro de la dernière et sélectionnez l'entrée Marquer dans le menu contextuel (clic droit sur place) Partez sur de bonnes bases SpéciaListe // 23 man SP dos carré 27/06/03 17:25 Page 24 • pour obtenir un marquage aléatoire de portée réglable en absolu ou en pourcentage sur l'ensemble des lignes, utilisez la commande Marquer aléatoirement du menu principal Marquage • pour marquer selon les valeurs particulières d'une colonne de données vous disposez des commandes dédiées dans le menu contextuel de chaque colonne : Marquer les doublons, Marquer les uniques, Marquer les champs vides • le marquage peut servir à isoler une vue dans une indexation (voir Exploiter un index) ou encore le résultat d'une géolocalisation (voir L'outil carte de France) • enfin, le marquage peut être le résultat d'une fonction portant sur le contenu, la recherche par exemple (voir aussi Recherche avancée). Le menu principal Marquage vous permet de changer globalement le jeu des lignes marquées (Tout marquer, Tout démarquer, Inverser) et d'accéder aux opérations les plus fréquentes qui s'y appliquent : la suppression et l'indexation (voir aussi Indexation et vues). La commande Marquage > Trier sur le marquage constitue une aide à la visualisation avant l'action suivante. Elle a pour résultat le regroupement des lignes marquées en haut de la table de données. 24 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 25 Indexation et vues Avec SpéciaListe, l'index est à la fois le résultat d'une action et un élément d'interface de premier plan. Il s'agit d'un instrument d'investigation des données entièrement nouveau dans la bureautique individuelle, que chaque corps de métier s'appropriera sous un nom différent, le trouvant tour à tour synonyme de "segmentation de l'offre", "structure des stocks", "contrôle analytique de gestion", "classement socio-professionnel", "pyramide des âges", "distribution aléatoire discrète", "fréquentation du site Web", "tables de risques par génération" et bien d'autres. Nous avons la conviction qu'à force d'utiliser SpéciaListe vous en inventerez vous-même quelques-uns. Pour l'essentiel, indexer une table de données selon un critère revient à distribuer ses lignes en autant de groupes qu'il y a de valeurs différentes du critère. Chaque groupe ainsi obtenu est caractérisé par la valeur de l'index commune à toutes ses lignes et par son poids relatif dans le fichier (le nombre de ses lignes par rapport au total). Il est donc évident qu'il n'y a aucune ligne qui reste en dehors des groupes, car son tour d'analyse venu, si sa valeur d'index ne correspond à aucun groupe existant, SpéciaListe en crée un nouveau, dont elle est le seul élément pour le moment (et pourrait bien le rester jusqu'à la fin de l'indexation). De même, il n'y a jamais de ligne commune à deux ou plusieurs groupes, car pour chaque ligne SpéciaListe passe en revue tous les groupes existants à la recherche de celui qui pourrait l'accueillir, avant d'en créer un nouveau. Partez sur de bonnes bases SpéciaListe // 25 man SP dos carré 27/06/03 17:25 Page 26 (Pour celles et ceux qui ont prêté attention au tableau en classe de maths ce jour-là, cela peut s'exprimer également en termes de réunion exhaustive et d'intersections vides, ce qui revient à dire qu'un index créé par SpéciaListe réalise une partition de la table de données. L'utilité de la fonction est la conséquence directe de la force du concept mathématique qui la sous-tend. Maintenant c'est promis, on n'en parlera plus !) Pour prendre un exemple, pensez les lignes d'une table de données comme correspondant à autant de factures comptables, comme toute activité économique en génère par milliers. Suite à une commande d'indexation sur l'année, SpéciaListe construit un classeur avec autant d'intercalaires que d'années différentes et classe chaque facture au bon endroit. L'opération étant instantanée, il ne lui reste plus qu'à vous donner les moyens d'un accès facile (c'est bien le moins qu'on attend d'un classeur). Le volet qui s'ouvre à gauche de la fenêtre sur la table de données concentre l'interface que SpéciaListe dédie à l'index. On y trouve notamment la liste des groupes avec leurs poids respectifs dans l'ensemble du fichier. En cliquant à gauche d'une des valeurs dans le volet d'index, la sélection du groupe sera mémorisée par une flèche rouge, mais vous vous apercevrez surtout que seules les lignes du groupe sélectionné apparaissent dans le volet à droite. C'est ce qu'on appellera une vue sur la table de données (voir plus loin Exploiter un index). Pour retrouver l'ensemble des données tout en maintenant l'index à l'écran, sélectionnez la toute première ligne dans le volet de l'index. Cette ligne, libellée Tous est toujours présente en haut de l'index et se trouve créditée de 100% des entrées, bien entendu. 26 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 27 Obtenir un index 1. Pour indexer votre table de données selon un champ, commencez par sélectionner la colonne concernée, en cliquant sur son en-tête, puis faites un clic droit au même endroit pour obtenir le menu contextuel qui s'y applique. La commande Indexer selon > ... regroupe les possibilités d'indexation : • l'indexation selon les valeurs prendra en compte le contenu de la colonne dans son intégralité, pour regrouper les lignes contenant la même valeur du champ. Pour le champ du code SIRET dans un fichier de factures, cette opération mettra dans le volet gauche de l'index une ligne pour chacun de vos fournisseurs. En cliquant à gauche d'une de ces lignes, vous obtiendrez à droite une vue sur toutes les factures concernant le fournisseur sélectionné Partez sur de bonnes bases SpéciaListe // 27 man SP dos carré 27/06/03 17:25 Page 28 • l'indexation sur le nombre de caractères mettra dans le même groupe toutes les lignes dont le champ d'index a la même longueur. Dans l'exemple des codes SIRET, l'opération devrait produire un seul groupe, celui des champs à 14 caractères. Si ce n'est pas le cas, il vous faudra ouvrir tour à tour les vues sur les autres, car il y a des erreurs à corriger ... (Pour les moyens d'une correction efficace, lire Changements groupés) • les indexations sur les mots et sur le premier mot seront très utiles pour les champs de texte, tels que les réponses libres dans un sondage ou encore la saisie correspondant à la case Autre, préciser : d'une collecte d'informations à travers le Web • l'indexation sur une partie de longueur fixe du champ (au début, au milieu ou à la fin) isole d'abord la partie demandée d'un champ agrégé, avant de classer les lignes sur les valeurs extraites : département à partir du code postal, année à partir d'une date, etc. 2. Le marquage de vos lignes (voir Marquage) constitue souvent la matière première de l'indexation au fil de vos manipulations de données (ne serait-ce que pour faire d'un clic la part des choses entre le travail effectué et restant). Pour vous en faciliter l'accès, la commande Indexer selon le marquage est présente aussi bien dans le menu principal Index que dans les menus contextuels de chaque colonne, bien que l'opération n'ait pas pour point de départ un champ en particulier. A la fin de l'opération, le contenu de l'index se limitera bien entendu à Tous, Marqués et Non marqués. 3. Les dialogues de préparation qui précèdent la plupart des fonctions avancées de SpéciaListe vous offrent la possibilité de l'indexation automatique sur les résultats à la fin de l'opération. En y recourant systématiquement dans vos manipulations habituelles, votre travail gagnera en fluidité. 28 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 29 Exploiter un index 1. Souvent, l'indexation en tant que coupe transversale des vos données peut être un but en soi, comme pour vérifier une hypothèse ou pour mettre en évidence une tendance. Si tel est votre cas, la deuxième partie du menu principal Index vous offrira les moyens d'extraire vos conclusions. La commande Index > Histogramme produit une représentation graphique de la distribution des valeurs, avec des barres de longueur proportionnelle au poids relatif de chaque groupe. Il s'agit d'une page Web locale, générée à chaque fois sous un nom différent dans le répertoire temporaire du système. Vous pourrez donc la conserver ou l'intégrer à d'autres documents en toute indépendance de votre travail avec SpéciaListe. La commande Index > Nouvelle table contenant les résultats produira une table à trois colonnes : valeur du champ, nombre de lignes et pourcentage. Pour en disposer après la fermeture de SpéciaListe, il vous appartient de confirmer sa sauvegarde, qui aura lieu par défaut au même endroit que la table d'origine. 2. L'indexation peut également n'être qu'une étape intermédiaire de votre travail, destinée à isoler dans une vue une partie des données indexées. Le menu contextuel de l'index est prévu pour répondre à ce type de besoin. Pour le faire apparaître, faites un clic droit dans le volet index. Sa première commande vous permet d'ajouter ou de retirer de la vue le groupe sélectionné. Pour soumettre à cette commande plusieurs groupes à la fois, commencez par les sélectionner en cliquant dans la colonne des nombres ou dans celle des pourcentages (pour une suite, faites glisser la souris jusqu'au dernier groupe). Leur mise en surbrillance fera écho à vos actions. Quant aux groupes déjà présents dans la vue, ils seront marqués chacun d'une flèche rouge. Partez sur de bonnes bases SpéciaListe // 29 man SP dos carré 27/06/03 17:25 Page 30 Une fois votre vue constituée, le menu contextuel de l'index vous permet de marquer l'ensemble de ses lignes et surtout d'en créer une nouvelle table. C'est cette dernière possibilité qui est essentielle dans une démarche d'exploration de vos données selon plusieurs axes. Conceptuellement, cette fonction ouvre un SpéciaListe dans SpéciaListe : le nouveau se concentre sur une hypothèse, le premier reste prêt à ouvrir une exploration parallèle. Le mécanisme est théoriquement reproductible à l'infini ... Dans la pratique, pensez toutefois à "fermer les portes derrière vous" au fur et à mesure, en fermant les tables-extraits qui ne vous servent plus, car chaque table ouverte à l'écran est bien entendu consommatrice de mémoire vive. 30 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 31 Changements groupés SpéciaListe met à votre disposition toute une palette d'outils pour effectuer des modifications de grande portée sur les données d'une colonne. Vous pouvez bien entendu faire précéder leur application par toute suite de marquages et d'indexations à votre convenance, afin de cerner au plus près dans la vue courante les lignes qui subiront des changements. Les fonctions de modification sont accessibles depuis l'entrée Cellules > du menu contextuel correspondant à chaque colonne. 1. Les fonctions lexicographiques portent sur les transformations des minuscules en majuscules et réciproquement, l'enlèvement des accents, la suppression des séparateurs et des espaces superflus, ainsi que sur des combinaisons d'opérations correspondant aux utilisations les plus courantes. 2. La commande Cellules > Effacer mettra à blanc la colonne sélectionnée dans toutes les lignes de la vue. 3. La commande Cellules > Remplir fait entrer une même valeur dans les champs de la colonne. Toutefois, vous pouvez choisir de préserver en même temps les valeurs existantes, qui recevront la nouvelle valeur par concaténation, soit à gauche, soit à droite. Cochez les options qui conviennent dans le dialogue de préparation. 4. La commande Cellules > Remplacer aura bien entendu une portée a priori plus réduite que l'ensemble de la colonne, à la faveur des correspondances avec le texte recherché. A noter que SpéciaListe supporte dans ses recherches textuelles l'utilisation des expressions régulières, un standard de l'informatique professionnelle pour la description des suites de caractères complexes et d'une longueur arbitraire (voir Expressions régulières). Partez sur de bonnes bases SpéciaListe // 31 man SP dos carré 27/06/03 17:25 Page 32 Recherche avancée La fonction de recherche avancée est accessible depuis le menu principal Edition, ainsi que par le menu contextuel propre à chaque colonne. Comme c'est le cas pour la plupart des fonctions paramétrables du logiciel, le dialogue qui précède la recherche a pour but de vous aider à définir trois éléments : - 1 - la portée - 2 - les critères d'application, et enfin - 3 - l'opération à effectuer sur le résultat. 1. Vous pouvez indiquer en tant que portée "horizontale" de la recherche l'ensemble des colonnes ou une seule, ou encore confiner la recherche au volet d'index, si celui-ci est présent à l'écran. Pour le déroulement "vertical" (sur les lignes), vous pouvez laisser la recherche s'effectuer sur l'ensemble des lignes ou la limiter aux enregistrements de la vue courante, voire avec imposition de la ligne couramment sélectionnée en tant que point de départ. 2. Le dialogue de configuration propose un choix de la méthode de correspondance qui satisfait à toutes les utilisations, de la plus simple (correspondance exacte) à la plus complexe (voir Expressions régulières), en passant par la détection du texte recherché au début, à la fin ou à l'intérieur d'un texte plus long. 3. Pour l'action à effectuer en cas de correspondance, vous avez le choix entre : • l'arrêt sur la première correspondance trouvée. Dans ce cas, la recherche est semblable à celle des outils bureautiques courants, avec l'amorce de la recherche suivante depuis le menu Edition > Occurrence suivante (touche raccourci F3) 32 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 33 • le parcours sans arrêt de tout l'espace de recherche, avec marquage des lignes concernées. L'action alimente le marquage déjà présent ou le ré-initialise, selon votre choix quant à l'effacement préalable des marques existantes. Traitement des doublons La fonction de recherche et d'élimination des doublons est accessible depuis le menu principal Table > Doublons .... Le dialogue de préparation qui la précède vous permet d'en spécifier la portée verticale (en lignes), les critères de comparaison et l'action à effectuer après identification. L'option Appliquer uniquement sur les lignes de la vue se présente cochée par défaut si vous vous trouvez dans une vue partielle de votre table de données. La liste Filtre vous propose des cases à cocher pour chaque colonne de votre table. Deux lignes seront considérées comme doublons en cas de coïncidence des contenus sur l'ensemble des colonnes choisies. Le choix de l'opération à effectuer sur les doublons identifiés dépend de votre contexte de travail. 1. Sur des fichiers où tous les champs sont correctement remplis, une opération de marquage ou de démarquage des lignes en double suffit. Dans ce cas, vous pouvez demander en option de traiter de la même façon le premier exemplaire, par exemple pour mettre en évidence une fréquence des coïncidences dans votre table de données. Partez sur de bonnes bases SpéciaListe // 33 man SP dos carré 27/06/03 17:25 Page 34 2. En revanche, les fichiers bruts issus de la collecte d'informations auront souvent des lignes en double (concernant une même personne, par exemple), mais portant chacune sur un champ une information utile absente dans son double : DUPONT Marcel DUPONT Marcel 11, rue du Soleil 75019 PARIS Bât. C PARIS C'est pour ce genre de situations que SpéciaListe propose parmi ses opérations de traitement des doublons la fusion des lignes en double. L'unique ligne obtenue ne sera identique à aucune de ses sources, mais une réunion qui retiendra le maximum d'informations : DUPONT Marcel 11, rue du Soleil Bât. C 75019 PARIS 3. Enfin, les lignes en double peuvent contenir chacune des bribes d'information différentes dans les champs : DUPONT Marcel 11, r. Sol. C 75019 PARIS DUPONT Marcel rue du Soleil Bât. C 75 PARIS Dans ce cas, l'idéal serait de former une seule ligne contenant : DUPONT Marcel 11, rue du Soleil Bât. C 75019 PARIS mais seulement l'utilisateur possesseur d'une connaissance du domaine saurait le faire avec succès dans tous les cas de figures et sur une information de structure arbitraire. Pour vous assister dans cette intervention, SpéciaListe prévoit l'action Indexer sur les groupes de doublons, qui aura comme effet la mise en parallèle des lignes à comparer, chaque groupe de doublons ayant sa propre entrée dans l'index. 4. A l'opposé des besoins de nettoyage, la recherche des doublons suivie de fusion s'avère un moyen très efficace d'analyse de vos données. Nous ne mentionnerons ici que l'analyse du comportement et du panier 34 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 35 moyen des clients, avec la conviction que votre travail y ajoutera bien d'autres utilisations possibles. D'une façon générale, ce type de traitement répondra aux besoins de création d'une seule ligne avec une information synthétique dans les champs variables, en fonction de leur type : le maximum, le minimum, la somme, le OU logique, le ET logique, etc. Pour prendre un exemple, imaginons un fichier d'actes d'achat contenant entre autres les montants et les coordonnées des clients. Commencez par spécifier le comportement souhaité dans les propriétés de la colonne des montants (clic droit sur l'en-tête, menu Propriétés, Opération à effectuer en cas de fusion). Choisissez Effectuer la somme des valeurs. Ensuite, lancez une recherche-fusion des doublons sur les champs nom, prénom et code postal. Vous obtenez le classement de vos clients en fonction de la valeur cumulée de leurs achats : efficace, non ? Il ne vous reste plus qu'à sauvegarder la table sous un autre nom. Fusion La fusion permet d'ajouter à une table de données les lignes d'une autre, également ouverte à l'écran par SpéciaListe, à condition que les deux aient le même format. Pour l'utiliser, commencez par mettre en avant-plan la table qui recevra les nouvelles lignes. Ensuite, le menu Table > Fusionner avec … vous présentera automatiquement le choix des autres tables ouvertes qui présentent un format identique à la table-cible. Après l'opération, le nombre de lignes est rigoureusement la somme entre le nombre de lignes avant l'opération et celui de la table choisie pour la fusion ; il n'y a donc aucun traitement implicite d'éventuels doublons. Partez sur de bonnes bases SpéciaListe // 35 man SP dos carré 27/06/03 17:25 Page 36 Croisement L'opération de croisement permet le marquage ou le démarquage des lignes sur des éléments d'information communs avec ceux d'une autre table, également ouverte dans SpéciaListe. L'opération est utile partout où il s'agit de mettre en évidence les mêmes éléments présents dans des contextes différents, comme les produits achetés ensemble selon le jour de la semaine, la part de prospects transformés en clients, les internautes abonnés à plusieurs lettres d'information en même temps, etc. La commande Table > Croiser ... ouvre l'assistant de l'opération, avec pour point de départ la liste des autres tables ouvertes ayant au moins un champ commun avec la table en avant-plan. Une fois la table choisie, la liste Champs disponibles pour le croisement vous propose des cases à cocher pour chacun des champs communs entre les deux tables. Sélectionnez celui ou ceux qui serviront de critère de croisement. Enfin, spécifiez en tant qu'action finale le marquage ou bien le démarquage des lignes trouvées. 36 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 37 TRAITEMENTS SPÉCIFIQUES AUX CHAMPS Les fonctions spécifiques de SpéciaListe prennent appui sur la reconnaissance de vos données comme appartenant à des catégories bureautiques courantes : noms, prénoms, sociétés, numéros de téléphone, adresses postales, adresses de courrier électronique. Bien qu'en ayant l'apparence, ces fonctions ne sont pas de simples enchaînements d'opérations générales allant dans le sens des besoins bureautiques habituels, mais bien des opérations spécialisées, intimement liées à la structure d'un et parfois de plusieurs champs traités ensemble. De fait, elles seront proposées dans les menus contextuels uniquement sur les colonnes qui constituent leur domaine de prédilection. Pour vérifier la possibilité d'utiliser ces fonctions sur une table de données, parcourez à la souris les entrées correspondantes dans le menu principal du logiciel. Par exemple, si les commandes du menu Identité sont désactivées, cela signifie que SpéciaListe ne reconnaît pas de façon systématique des noms et des prénoms dans les données de la table courante. Dans ce cas, vous pouvez l'aider en modifiant les propriétés des colonnes, pour forcer la signification souhaitée. Partez sur de bonnes bases SpéciaListe // 37 man SP dos carré 27/06/03 17:25 Page 38 Il en va de même pour les opérations regroupées dans les menus Société, Adresse et E-mail. Pour vous aider à garder le contrôle sur les modifications massives effectuées, chaque opération spécifique produit au préalable des colonnes de sauvegarde de l'information initiale, intitulées Copie de Prénom, Copie de Ville, etc. Le menu contextuel de ces colonnes prévoit la commande de retour à l'état d'avant l'opération : Restituer la colonne d'origine. Noms et prénoms Les commandes liées aux noms et aux prénoms sont regroupées dans le menu principal Identité. La correction des champs d'identité Le traitement des champs d'identité a pour point de départ la correction des prénoms, basée sur un référentiel de prénoms francophones. Néanmoins, la présence d'autres champs d'identité (notamment Nom) offre à SpéciaListe un appui précieux pour affiner son travail. Le dialogue qui prépare l'opération présente un large éventail d'options pour contrôler la détection et la distribution de l'information dans les champs d'identité. 1. La détection des identités factices (frappes aléatoires au clavier, personnalités historiques des siècles passés, etc.) est un auxiliaire indispensable dans le nettoyage des fichiers de collecte d'information par formulaire électronique, en particulier ceux venant du Web. 2. Les options du traitement jumelé des champs Nom et Prénom répondent aux différents cas dominants dans les fichiers d'adresses, notamment les inversions et les fusions : 38 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 39 • le traitement des inversions entre le nom et le prénom est un moyen facile de pallier à un des problèmes les plus fréquents des formulaires de collecte • les différentes possibilités de fusion entre les deux champs permettront la reconstitution systématique d'une information saisie là par inattention ou "faute de mieux", notamment dans le cas des professions libérales, PME/PMI, associations, institutions, etc. 3. Le traitement de la civilité peut prendre en compte cette information en tant que point de départ ou bien d'arrivée, et de ce fait se trouve contrôlé par deux options complémentaires. Si un champ de civilité est déjà présent, vous pouvez indiquer à SpéciaListe de l'utiliser au cours de la correction par rapprochement. Par exemple, une civilité connue lui permettra de corriger de manière sûre Jeann par Jean ou bien par Jeanne. Indifféremment de la présence a priori d'un champ Civilité, vous pouvez demander à Spécialiste d'évaluer (ou de réévaluer) la civilité à partir du seul contenu des champs Nom et Prénom, sous forme complète ou abrégée. Si le champ Civilité existe avant l'opération, son contenu est sauvegardé dans la colonne Copie de Civilité. 4. Enfin, dans le cas des prénoms multiples, vous pouvez spécifier le traitement spécifique souhaité : tout conserver, ne conserver que le premier en ordre de frappe, ne conserver que le prénom masculin ou féminin. Outre les habituelles colonnes de sauvegarde Copie de ..., la colonne de résultat de l'opération (utilisée par défaut comme index à la fin de l'opération) reflète les cas de figures rencontrés. Les catégories Inchangé et Mis en forme regroupent les entrées à conserver sans hésitation dans une vue séparée. En effet, la mise en forme ne concerne que les modifications minuscules - majuscules et les corrections mineures d'accent et de trait d'union. Partez sur de bonnes bases SpéciaListe // 39 man SP dos carré 27/06/03 17:25 Page 40 En revanche, les catégories Prénom corrigé, Aucun prénom approchant, Personne morale, Permutation Nom-Prénom, Filtré (factice) et les différents cas de fusion auront besoin de votre inspection afin de décider de la suite. Etant donné la richesse des options de cette opération (qui fait écho à la complexité des situations rencontrées), il est conseillé d'enregistrer votre fichier sur disque avant le traitement. Ceci vous permettra de revenir facilement en arrière par le menu Fichier > Recharger et d'essayer une autre combinaison d'options, en meilleure adéquation avec l'information d'identité à corriger. Segmentation en tranches d'âge La segmentation en tranches d'âge est basée sur la fréquence relative de chaque prénom à travers les générations de la population française. L'assistant de l'opération vous propose un jeu d'intervalles d'âge que vous pouvez modifier à volonté avant de lancer l'opération. De même, la précision des résultats sera améliorée si vous indiquez à l'assistant les âges minimum et maximum de votre population, à partir de considérations qui échappent au traitement informatique. Par exemple, pour le fichier de clients d'un concessionnaire auto, il est inutile d'opérer une segmentation en préservant la tranche d'âge 0-17 ans. En fin d'opération, la fonction Histogramme vous offre un aperçu graphique du résultat. Statistiques Le calcul statistique basé sur les prénoms produit une estimation de l'âge moyen et la répartition par sexe de votre population. 40 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 41 Codes SIRET et APE SpéciaListe reconnaît les champs de code SIRET et APE d'une table d'informations sur les entreprises et propose la vérification de leurs contenus respectifs, à partir du menu principal Identité. Pour les codes SIRET, SpéciaListe effectue une vérification de cohérence, à savoir qu'un code SIRET diagnostiqué par SpéciaListe comme étant incorrect ne saurait être attribué à une quelconque entité. En revanche, un code SIRET valide ne préjuge pas de son attribution effective. Pour les codes APE, SpéciaListe effectue une vérification exhaustive d'existence par rapport à la Nomenclature d'Activités Française (NAF) de l'INSEE. Numéros de téléphone Le menu contextuel correspondant à une colonne de numéros de téléphone donne l'accès à la vérification des numéros, avec une option sur la mise en forme. Dans ce dernier cas, l'assistant de l'opération vous propose la création d'une colonne de sauvegarde, comme pour toutes les autres fonctions de modification massive. Les options de vérification se déclinent selon le type du numéro : réseau national fixe, téléphonie mobile, étranger. L'option d'indexer directement sur la colonne Etat téléphone en fin d'opération apporte plus de visibilité sur le résultat, car dans le cas le plus général il y aura plusieurs lignes d'index qui regroupent des numéros corrects : fixes, mobiles, étrangers, numéros verts et tarifés 0 8XXX, services. Partez sur de bonnes bases SpéciaListe // 41 man SP dos carré 27/06/03 17:25 Page 42 Villes et codes postaux La commande Adresse > Vérifier et corriger les champs Ville et Code postal déclenche une opération complexe de correction jumelée des deux contenus, basée sur un dictionnaire incorporé portant sur le territoire français. L'opération produit deux colonnes de sauvegarde et la colonne résultat Etat ville, cette dernière reflétant les cas de figure rencontrés. Pour isoler l'ensemble des lignes valides depuis l'index du résultat, il vous appartient de recueillir en une seule vue les groupes libellés Correct, CP corrigé, Ville et CP corrigé. S'il est présent, le groupe libellé Non vérifiable réclame une attention particulière, car il regroupe typiquement les adresses à CEDEX et les destinations Poste aux Armées. Adresses postales La fonction de mise en forme des adresses postales, accessible depuis le menu Adresse > Mettre en forme les champs d'adresse, vous permet d'obtenir des adresses conformes à la norme AFNOR XP Z10011, qui spécifie les différents contenus, conventions et restrictions d'une adresse préparée pour un envoi postal. L'assistant qui vous aide à préparer l'opération vous propose la correction préalable des champs Code postal et Ville : laissez cette option activée, à moins que vous n'ayez déjà fait cette opération sur exactement la même vue de vos données (cf. Villes et codes postaux). 42 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 43 La création des colonnes de sauvegarde prend ici tout son sens, du fait des modifications complexes opérées par la fonction. Pour ne prendre que quelques exemples : • si vos données contiennent les adresses dans leur intégralité en un seul champ, il serait surprenant que SpéciaListe n'en trouve au moins une qui nécessite la scission en deux, du fait de la longueur maximum d'une ligne d'adresse à 38 caractères imposée par la norme. De ce fait, à la fin de l'opération, la table se trouvera enrichie d'un champ supplémentaire, créé pour la circonstance sous le nom Complément d'adresse • si les adresses de la table sont déjà scindées en champs Adresse et Complément d'adresse, les différentes règles de répartition du contenu appliquées par l'opération produiront un important brassage des différents éléments sur les deux colonnes • enfin, la manière de saisir une adresse sur deux lignes dans un formulaire de collecte n'étant pas toujours celle attendue par l'acheminement postal, il n'est pas rare de voir des pans entiers d'un fichier avec les deux contenus inversés. Si c'est le cas du vôtre, SpéciaListe se chargera de le remettre d'aplomb. L'index sur le résultat de l'opération, toujours proposé par défaut, regroupe les diagnostics et les modifications effectuées. Les catégories les plus courantes à récupérer dans une vue des adresses valides sont Correct et Corrigé : permutation adresse - complément. Si elle est présente, la catégorie Aucun type de voie reconnu réclame votre attention pour un éventuel rattrapage partiel, notamment en ce qui concerne les lieux-dits. Partez sur de bonnes bases SpéciaListe // 43 man SP dos carré 27/06/03 17:25 Page 44 Adresses de courrier électronique Les fonctions dédiées aux champs proposées par SpéciaListe s'appuient en général sur le savoir-faire des règles et des formats et le cas échéant - sur l'utilisation d'un référentiel. A ces deux piliers, la vérification d'adresses e-mail associe sur demande un troisième : le Net lui-même. L'assistant de l'opération, invoqué depuis le menu E-mail > Vérification ..., vous met devant un choix sur trois niveaux de profondeur. 1. La simple analyse des adresses fera pour l'essentiel la part des choses entre les adresses correctes, les adresses incorrectes qui peuvent faire l'objet d'une retouche automatique par rapprochement à des noms de domaine connus, et les adresses factices (saisies de circonstance dans le seul but de passer outre les restrictions d'un formulaire de collecte). C'est le seul type de vérification qui ne fait aucun usage du Net, et par conséquent le seul à produire un résultat avec la rapidité propre aux autres fonctions de SpéciaListe. Ses options portent notamment sur la correction automatique par rapprochement et sur le jeu de fausses saisies caractéristiques à détecter. 2. Le test d'existence du domaine marque le premier degré d'implication du Net dans le processus. Non seulement le gain de fiabilité est sensible par rapport à la première méthode, mais surtout les tests d'existence de domaine ont un effet bénéfique à moyen terme sur le référentiel des domaines existants, utilisé par la première méthode ! En d'autres termes, en utilisant régulièrement cette méthode sur une grande variété d'adresses, vous capitalisez pour la réussite d'une future action de vérification rapide. Disons (à tout hasard) un vendredi soir avec un fichier d'adresses particulièrement volumineux et destiné à une campagne d'e-mailing particulièrement en retard... 44 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 45 3. Le test d'existence de la boîte aux lettres constitue la méthode de vérification la plus sûre, mais également la plus longue. Par ailleurs, elle fait implicitement usage des deux premières, afin de réduire au maximum le nombre d'adresses à vérifier complètement. La fenêtre de suivi vous informe en permanence du déroulement de l'opération, sans pour autant pouvoir vous offrir une estimation du temps restant, du fait de l'extrême variété des temps de réponse sur le Net quant aux échanges requis par cette méthode. SpéciaListe fait de son mieux pour les optimiser, notamment en traitant en premier les domaines les plus présents parmi les adresses à traiter. Ceci vous permet en outre de rester sur le meilleur résultat partiel possible si vous décidez l'abandon de l'opération. En effet, il n'est pas rare de voir la vérification passer de longues minutes en attente de réponse de quelques domaines marginaux qui comptent pour moins de 5% dans l'ensemble de vos adresses. Les adresses encore à traiter au moment de l'annulation apparaîtront dans l'index final dans la catégorie A vérifier. Paradoxalement, c'est cette méthode qui pousse la rigueur jusqu'à produire une catégorie d'adresses non vérifiables dans l'index sur le résultat. En effet, il existe des domaines Internet qui confirment mécaniquement l'existence de toute adresse e-mail dans leur giron. SpéciaListe détecte ce comportement et fait état de son doute sur l'ensemble des adresses du domaine. Partez sur de bonnes bases SpéciaListe // 45 man SP dos carré 27/06/03 17:25 Page 46 L'OUTIL CARTE DE FRANCE La carte de France proposée par SpéciaListe est un outil de projection géographique de vos données, à condition que celles-ci présentent un champ de code postal. En quelque sorte, il est aux lieux ce que l'indexation est aux données générales. Toutefois, la transposition cartographique confère à cet "index" des capacités accrues de visualisation et de traitement, regroupées en une fenêtre séparée, accessible depuis le menu Adresse > Carte de France. Le menu en clic droit sur la carte fait office de bascule pour le contexte de vos actions, notamment entre celles liées à l'affichage et celles destinées à la sélection d'une partie des données. 46 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 47 Villes et départements En premier lieu, la carte est un moyen de mettre en avant des densités d'implantation de vos prospects, clients et autres entités qui ont un "port d'attache". Vous pouvez faire varier l'unité de répartition entre la ville, le département et l'ensemble des deux, en utilisant les commandes Carte > Statistiques. Le coloriage suit dans chaque cas un dégradé modulé par les densités d'implantation respectives. Vous pouvez en modifier la palette depuis l'assistant Carte > Préférences ... Statistiques, afin d'obtenir le rendu le plus adapté à vos données. Partez sur de bonnes bases SpéciaListe // 47 man SP dos carré 27/06/03 17:25 Page 48 Déplacements, agrandissements Le menu contextuel de la carte fournit des outils d'exploration qui vous permettront de vous concentrer sur une partie de la projection. Outre les commandes de zoom en avant et en arrière depuis l'endroit couramment représenté, vous avez la possibilité de re-cadrer directement l'affichage : la commande Région > vous permet un recentrage de la vue sur deux niveaux, en choisissant directement dans le menu la région ou un de ses départements. L'affichage qui en résulte met en œuvre automatiquement la meilleure échelle de visualisation de l'entité retenue dans son intégralité. Une vignette vous rappelle en permanence la position de la partie visualisée dans l'ensemble de la carte. 48 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 49 Sélections, élargissements, filtres Les commandes de sélection vous permettent d'isoler, puis de traiter ensemble une ou plusieurs parties de vos données, notamment dans le but d'obtenir un marquage de celles-ci dans la table maintenue par SpéciaListe en arrière-plan. Outre la sélection par clic dans la carte pour les régions et les départements, les deux régimes qui incluent la ville comme critère statistique vous permettent la recherche d'une ville par saisie au clavier dans le volet gauche de la fenêtre. Dans ce cas, une liste des correspondances affichées s'affine au fur et à mesure de la frappe, pour vous aider à choisir le plus rapidement possible. Une fois la ville sélectionnée, vous pouvez y associer un rayon de voisinage allant de 1 à 50 km. Partez sur de bonnes bases SpéciaListe // 49 man SP dos carré 27/06/03 17:25 Page 50 Vous disposez également d'un outil pour modérer votre sélection sur un critère démographique : l'option Filtrer sur la population vous permet de ne retenir que les localités au-dessus d'un seuil pouvant aller jusqu'à 10 000 habitants. A l'issue de cette étape, il vous reste à effectuer deux actions pour reporter votre sélection sur les données en arrière-plan : Marquer les villes sélectionnées, puis Revenir à la table. Exportation en tant qu'image A tout moment de votre travail sur la carte de France, vous pouvez prendre des photos pour une utilisation indépendante de SpéciaListe. Pour ce faire, cliquez sur le bouton Enregistrer la vue comme image et indiquez la taille souhaitée. 50 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 51 UTILISATION DES RÉSULTATS Au fur et à mesure de votre travail, vos données s'affinent et gagnent de nouvelles dimensions. SpéciaListe prévoit un large choix de fonctions pour préparer l'utilisation future de vos travaux : • avec SpéciaListe lui-même • avec d'autres applications bureautiques • pour étoffer des rapports et des présentations • pour une action de marketing direct, par voie postale, téléphonique ou de courrier électronique. Partez sur de bonnes bases SpéciaListe // 51 man SP dos carré 27/06/03 17:25 Page 52 L'extraction des nouvelles tables de données Les tables de données extraites de vos fichiers et enregistrées sur disque constituent un moyen simple de préserver dans l'état une réflexion sur vos données. Le menu contextuel Vue > Créer une table à partir de cette vue (également accessible depuis le menu principal Table) produit des tables avec des noms générés automatiquement, à partir de la table initiale et contenant le mot Extrait. Il vous appartient de confirmer la sauvegarde de celles qui sont significatives pour la suite de votre travail. La commande Créer une table contenant cet index (menu contextuel, également disponible depuis le menu principal Table) est un moyen simple de prendre la photo d'une distribution de vos données selon un critère significatif. Les noms des tables créées à l'aide de cette commande contiennent le mot Index. L'exportation des données La commande Fichier > Exporter ... constitue le point de passage des données travaillées avec SpéciaListe vers d'autres applications bureautiques, utilisant des formats spécifiques. Le choix qui vous est présenté par le dialogue de préparation dépend des applications installées sur votre ordinateur. Vous pouvez également opter pour l'exportation de tout ou partie des champs de la table. Les noms des champs dont le contenu est reconnu par SpéciaListe apparaissent en gras dans la sélection. 52 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 53 Briefings et présentations SpéciaListe vous permet la création au fil de votre travail d'histogrammes de distribution sur un critère. Ce dernier peut être un résultat déterminé (comme la segmentation en tranches d'âge à partir des prénoms) ou un élément entièrement spécifique à vos données (l'index courant). Les histogrammes sont stockés sur votre disque dur en tant que pages Web locales dans le répertoire temporaire de Windows et portent des noms générés automatiquement. N'oubliez donc pas de transférer à un autre endroit celles que vous souhaitez garder pour future référence, à l'aide de la commande Enregistrer sous ... de votre navigateur. L'impression Les fonctions d'impression de SpéciaListe portent toujours sur la vue courante, donc sur toutes les lignes s'il n'y a pas d'index défini (voir Indexation et vues). Dans ce cadre, vous avez la possibilité de filtrer encore les lignes à imprimer à l'aide du marquage, en prenant soin de bien spécifier la prise en compte du marquage dans les assistants d'impression. Horizontalement, les assistants d'impression vous proposent le choix des champs à imprimer pour chaque ligne de données. SpéciaListe effectue deux types d'impression, adaptés à des usages bien distincts et de ce fait précédés par des assistants spécifiques. Partez sur de bonnes bases SpéciaListe // 53 man SP dos carré 27/06/03 17:25 Page 54 Le mode tableau est le plus rapproché de la présentation de vos données à l'écran, avec une rangée de texte imprimé pour chaque ligne de données. L'assistant de l'impression dédié à ce mode vous permet de contrôler la largeur de chaque colonne, par saisie directe (en pourcentage et en centimètres) ou directement à la souris dans l'aperçu des premiers enregistrements, tels qu'ils apparaîtront sur papier. Le mode étiquettes est particulièrement adapté à l'impression d'adresses pour un envoi postal. Son assistant inclut les définitions pour les planches d'étiquettes les plus courantes, tout en vous laissant la possibilité d'en définir une nouvelle. 54 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 55 ANNEXES A1. Etude de cas : data mining sur un site Web Nous nous proposons ici de montrer les fonctions génériques de SpéciaListe à l'œuvre dans une problématique aussi répandue que réputée ésotérique (et de ce fait réservée au traitement par des progiciels dédiés) : les mesures d'audience d'un site Web à partir de ses journaux de fonctionnement. Contrairement aux idées reçues, la structure d'un journal de serveur Web n'est ni difficile à appréhender, ni spécifique à chaque logiciel serveur : elle fait l'objet d'une définition publique, le W3C Extended Logging Format, exhaustive et suivie par les éditeurs de solutions Web, quel que soit l'environnement (Windows Internet Information Server, Linux Apache, etc.). Partez sur de bonnes bases SpéciaListe // 55 man SP dos carré 27/06/03 17:25 Page 56 Pour l'essentiel, les fichiers journal (.log) contiennent quelques lignes d'en-tête préfixées par le caractère # : #Software: Microsoft Internet Information Services 5.0 #Version: 1.0 #Date: 2002-08-11 05:25:49 #Fields: date time c-ip cs-method cs-uri-stem … suivies d'autant de lignes d'information que de pages Web, images ou autres documents demandés au site par les internautes. Chaque ligne contient tous les champs prévus dans la ligne d'entête #Fields:, dans l'ordre et séparés par un espace. Pour éviter la confusion, les espaces à l'intérieur d'un champ sont transformés en caractères +. L'absence d'information dans un champ est explicitement marquée par le caractère -. Pour préparer un fichier .log au chargement avec SpéciaListe, il suffit d'en retirer la partie de l'en-tête qui empêche la séparation des colonnes. Pour ce faire, chargez le fichier avec l'utilitaire WordPad de Windows, puis sélectionnez et effacez le début jusqu'aux caractères #Fields: (espace après : compris), de sorte à ramener les noms des champs en début de la première ligne. 56 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 57 Enregistrez le fichier ainsi modifié, fermez WordPad, puis chargez le fichier avec SpéciaListe. Vérifiez au besoin dans les propriétés de la table (menu Table > Propriétés) l'utilisation de l'espace comme séparateur et l'utilisation de la première ligne pour les noms des champs. A la fin de cette étape de préparation, SpéciaListe vous présente une table avec des colonnes portant respectivement les noms définis dans la ligne #Fields: initiale : date, time, c-ip, etc. Partez sur de bonnes bases SpéciaListe // 57 man SP dos carré 27/06/03 17:25 Page 58 Combien de visiteurs uniques ? Le nombre brut des documents servis par le site correspond simplement au nombre de lignes dans la table. Il sera souvent impressionnant, même pour des sites d'audience relativement modeste. (Souvent, c'était ce chiffre brut qui était annoncé à la presse et aux acteurs boursiers par des start-up de la "nouvelle économie" à la fin des années '90. La suite est connue.) Pour obtenir le nombre des visiteurs uniques, il faudra prendre en considération les points suivants : • une seule page Web avec trois images correspond à quatre lignes dans le journal, 1+3 • un seul visiteur qui regarde cette page, puis clique sur un lien vers une autre page contenant deux images provoque l'enregistrement de sept lignes de journal, 1+3 + 1+2. Pour faire la part des choses, nous allons nous intéresser au champ Cs(referer) qui mémorise l'origine de la demande d'un document : • si une page A est demandée explicitement par l'utilisateur en saisissant son adresse, ce champ sera vide • si l'utilisateur a sous les yeux la page A et clique dans cette page sur un lien vers la page B, la ligne de journal correspondant à l'envoi de cette deuxième page B contient dans son champ Cs(referer) la valeur A (car le visiteur est arrivé à la page B en venant de A). Cette information d'origine permet donc d'éliminer facilement du compte la navigation d'une page à l'autre à l'intérieur du site, ainsi que les images et autres documents imbriqués dans les pages, pour ne garder qu'une seule ligne par visiteur. 58 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 59 Indexez la table de SpéciaListe sur les valeurs de ce champ, triez sur le libellé à gauche, puis éliminez de la vue (en glissant le curseur de la souris sur les pourcentages) toutes les valeurs http://www... appartenant à votre site. Le résultat ne contenant plus qu'une ligne par visiteur du site, la réponse se trouve sur la ligne d'état, en bas de la fenêtre de SpéciaListe. Partez sur de bonnes bases SpéciaListe // 59 man SP dos carré 27/06/03 17:25 Page 60 Sommes-nous bien référencés sur la Toile ? L'extraction qui fournit la réponse à la question précédente recèle une autre information d'intérêt majeur : la notoriété de votre site sur le reste de la Toile. Afin de l'étudier, créez un nouvel extrait de la table, en éliminant les entrées avec le champ Cs(referer) à vide (caractère -). La table ainsi obtenue, toujours indexée sur les valeurs du champ Cs(referer), présente en ordre décroissant la répartition des visites d'après les sites Web externes qui renvoient les internautes vers le vôtre : moteurs de recherche, annuaires, portails de galerie marchande, etc. L'histogramme sur les valeurs (menu Index > Histogramme) vous permettra d'évaluer l'efficacité de vos actions de référencement et d'en préparer de nouvelles. Par exemple, pour améliorer le référencement dans le spectre médian, vous pouvez éliminer les sites les plus importants (buts atteints) et les moins importants (contingences), pour mettre en évidence les sites encore à travailler, les sites émergeants, etc. 60 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Partez sur de bonnes bases Page 61 SpéciaListe // 61 man SP dos carré 27/06/03 17:25 Page 62 Quelles sont nos pages les plus lues ? Rappelons que le serveur Web fait l'amalgame entre ce que l'internaute perçoit comme étant une page, une image contenue dans une page, un son d'accompagnement etc., et que de ce fait il est nécessaire d'opérer une séparation entre les différents types de documents avant de les classer par fréquence de consultation. Les types de documents courants sur un site Web sont les suivants : .htm, .html Page Web (HTML) .asp,.php,.cgi Page Web dynamique (en général avec des paramètres) .css Feuille de style utilisée par plusieurs pages (parfois toutes) .js Code JavaScript regroupé dans un fichier .jpg,.gif,.png Fichier image .au,.wav,.ram Fichier son .pdf Format de lecture indépendant de plateforme … L'indication de type apparaissant à la fin du nom, vous utiliserez une des variantes avancées de l'indexation (à partir du menu Index > Autres critères ...), en basant les comparaisons sur les quatre derniers caractères dans le champ Cs-Uri-Stem. En parcourant l'index ainsi créé, introduisez dans votre vue-extrait non seulement .htm, html et le type des pages dynamiques sur votre site, mais également les fins de répertoires (avec ou sans caractère / en dernier), car les requêtes de ce type correspondent aussi à des contenus Web (les index des répertoires invoqués). 62 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 63 Une fois la table créée, il ne reste plus qu'à l'indexer, toujours sur le champ Cs-Uri-Stem, mais simplement par la valeur cette fois-ci. Vous obtiendrez ainsi le "hit-parade" des pages lues par les internautes sur votre site. Partez sur de bonnes bases SpéciaListe // 63 man SP dos carré 27/06/03 17:25 Page 64 Quels sont les créneaux horaires dominants ? L'analyse de l'audience de votre site Web en corrélation avec les heures de la journée et les jours de la semaine vous ouvre de nombreuses voies de réflexion pour améliorer l'accueil des internautes sur votre site. En premier lieu, il est utile de différencier les types de cibles intéressées par vos produits ou services, telles que B to B (Business to Business) plutôt connectée le matin, ou B to C (Business to Consumer), plus à même de visiter votre site le soir, en dehors des heures de bureau, et le week-end. Outre la séparation des consultations entre le domicile et le lieu de travail pour l'ensemble de votre site, le suivi heure par heure des demandes pour une page en particulier (isolée en préalable par le champ Cs-Uri-Stem) vous permettra d'affiner votre cible, voire de mesurer l'impact d'une publicité radio ou télé, par comparaison avec les données correspondantes de la veille. Pour obtenir un classement par tranches d'une heure, sélectionnez la colonne Time, puis indexez sur les trois premiers caractères. Pour affiner encore l'audience dans une plage horaire donnée, sélectionnez dans une vue les heures souhaitées et créez une tableextrait à partir de celle-ci. Enfin, indexez la nouvelle table sur les valeurs du champ Time, cette fois-ci sur les quatre premiers caractères. Vous obtiendrez ainsi une répartition de l'audience par tranches de dix minutes. ATTENTION ! Le standard W3C Extended Logging Format impose l'écriture dans le fichier journal non pas de l'heure locale, mais de l'heure GMT (Greenwich). Ceci signifie que toutes les valeurs dans le champ Time sont en retard par rapport à l'heure de Paris : • d'une heure en hiver • de deux heures en été. 64 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Partez sur de bonnes bases Page 65 SpéciaListe // 65 man SP dos carré 27/06/03 17:25 Page 66 Evaluation de la qualité de service Le champ Sc-Status (état de la réponse du Serveur vers le client) retient sous une forme concentrée l'état de succès ou d'échec d'une demande issue du navigateur de l'internaute. Il s'agit d'un code numérique compris entre 100 et 599, avec des classes de valeurs séparées par le premier chiffre. L'indexation sur ce champ avec SpéciaListe est donc particulièrement adaptée pour la mise en évidence de la qualité globale du service. Les valeurs qui réclament une attention particulière sont les suivantes : 400 - Erreur de syntaxe. Une proportion importante peut être le signe d'un lien mal formé, notamment un lien cliquable dans un e-mail 404 - Document non trouvé. Le plus souvent, il s'agit de liens obsolètes, soit sur les pages du site, soit sur les sites externes de référencement. A analyser en corrélation avec le champ Cs(referer) (voir Sommes-nous bien référencés sur la Toile ?) 5xx - Erreur interne. Une proportion significative indique la saturation des capacités de traitement du serveur (mémoire vive, disque). 66 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Partez sur de bonnes bases Page 67 SpéciaListe // 67 man SP dos carré 27/06/03 17:25 Page 68 A2. Expressions régulières Les expressions régulières permettent de spécifier d'une manière symbolique et concise des suites de caractères à chercher dans une information textuelle. Leur apparente complexité est due au fait qu'elles se composent à leur tour de caractères, mais qui représentent un peu plus qu'euxmêmes ... Par exemple, lue comme une expression régulière, la suite de six caractères : HEU... n'exprime pas une hésitation, mais un (très) large groupe de suites de six caractères, dont une petite partie appartient à la langue française : HEURES, HEURTE, HEURTS et d'autres pourraient être tout ou partie d'une référence de produit comme 12BHEU2003, d'une plaque minéralogique, etc. La force des expressions régulières est de représenter avec peu de caractères des combinaisons virtuellement infinies, mettant ainsi à la portée de l'utilisateur un moyen de description à la hauteur des capacités de traitement de son ordinateur. 1. Décrire une seule position . Tout caractère à cet endroit [] Un caractère parmi ceux mentionnés entre les parenthèses carrées : [aeoiu] une voyelle [0-9A-Za-z] un chiffre ou une lettre majuscule ou une lettre minuscule 68 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 [^ ] Page 69 Tout caractère sauf ceux spécifiés entre les parenthèses carrées : [^0-9] pas de chiffre à cet endroit 2. Décrire des répétitions ? A cet endroit, tout caractère ou rien (directement la suite) : [A-Z]?19[0-9][0-9] une année 1900 à 1999, précédée ou pas d'une lettre majuscule * La description qui précède, zéro ou plusieurs fois : [A-Z]*2002 une quelconque suite de majuscules, suivie de l'année 2002 ou bien l'année 2002 toute seule + La description qui précède, une ou plusieurs fois : [A-Z]+2002 au moins une lettre majuscule devant l'année 2002 {n} La description qui précède, exactement n fois : [0-9A-Za-z]{16} groupe de seize chiffres et lettres {n,N} La description qui précède, au minimum n fois et au maximum N fois : [0-9A-Za-z]{12,16} groupe de chiffres et lettres de longueur comprise entre 12 et 16 Partez sur de bonnes bases SpéciaListe // 69 man SP dos carré 27/06/03 17:25 Page 70 3. Position dans une chaîne de caractères ^ Toute l'expression qui suit doit se trouver en début de chaîne : ^AB trouve la référence AB2002CD02, mais pas AD2002AB16 $ Toute l'expression qui précède doit se trouver en fin de chaîne : 02$ trouve la référence AB2002CD02, mais pas AD2002AB16 70 // SpéciaListe Partez sur de bonnes bases man SP dos carré 27/06/03 17:25 Page 71 LICENCE D'UTILISATION DU LOGICIEL Vous avez acquis un logiciel de la gamme GOTO Software, en l'occurrence SpéciaListe, et nous vous en remercions. Cette acquisition ne fait pas de vous le propriétaire du Logiciel mais le bénéficiaire des droits pour son utilisation dont les conditions sont détaillées ci-après. En ouvrant la pochette contenant le Cédérom ou en téléchargeant le logiciel, vous acceptez sans réserve de vous conformer aux termes de la présente Licence. Si vous n'acceptez pas les clauses du contrat, vous devez retourner le Cédérom sans rompre son emballage d'origine ainsi que le matériel l'accompagnant à l'endroit où vous avez acheté le Produit afin d'en obtenir le remboursement, ou refuser le téléchargement du produit en cas d'un achat en ligne. Les droits du Licencié sur le logiciel sont spécifiés dans la présente Licence, à l'exclusion de ceux qui n'ont pas été expressément concédés par les présentes. I - ETENDUE DE LA LICENCE Sauf stipulation contraire établie de façon expresse par GOTO, la Licence d'utilisation du logiciel vous est concédée pour un seul ordinateur en un seul lieu. En cas de contrôle, un justificatif d'achat (Cédérom original, facture ou ticket de caisse) sera demandé pour chaque installation constatée du Logiciel. Dans le cadre d'un achat en ligne, il vous est donc conseillé d'imprimer la facture correspondante. Le transfert physique du Logiciel d'un ordinateur à un autre est autorisé à condition que le Logiciel ne soit utilisé que sur un ordinateur à la fois. La copie de sau vegarde est seule autorisée et devra être effectuée conformément aux dispositions de l'article 2 ci-dessous. L'utilisateur n'est pas non plus autorisé à copier la documentation imprimée du Logiciel, celle-ci étant protégée par les droits de propriété intellectuelle. Toute utilisation non prévue au paragraphe précédent est interdite et en particulier, sans que ce ne soit limitatif, vous ne pouvez pas sans l'autorisation écrite de GOTO : Diffuser, céder, louer, vendre, donner en crédit bail, sous licencier, donner ou distribuer tout ou partie du logiciel à un Tiers, de quelque façon que ce soit Altérer, désassembler, décompiler, adapter, créer des œuvres dérivées, intégrer dans un autre logiciel, traduire ou modifier de quelque façon que ce soit, tout ou partie du Logiciel. Effectuer des copies de tout ou partie du Logiciel (autres que la copie de sauvegarde dans les conditions définies ci-après). IL EST NOTAMMENT PRECISE QU'IL EST INTERDIT DE METTRE TOUT OU PARTIE DU LOGICIEL A DISPOSITION DU PUBLIC PAR LE BIAIS D'INTERNET, DE BBS OU DE SERVEURS MINITEL SANS L'AUTORISATION PREALABLE ECRITE DE GOTO. Partez sur de bonnes bases SpéciaListe // 71 man SP dos carré 27/06/03 17:25 Page 72 II - COPIE DE SAUVEGARDE Dans le cas d'achat du Cédérom ou de la disquette d'origine et si c'est le Cédérom ou la disquette d'origine qui sont utilisés pour l'exploitation du Logiciel, la présente Licence vous autorise à disposer d'une copie de sauvegarde de la forme de votre choix. En revanche, dès lors que le programme est copié sur disque dur, c'est le Cédérom d'origine qui fera office de sauvegarde. Dans le cas d'un achat en ligne, vous êtes autorisé, en plus de l'installation du logiciel sur votre disque dur, à disposer d'une copie de sauvegarde de la forme de votre choix. Cette copie a pour seul but de régénérer le logiciel original en cas de détérioration accidentelle. En aucun cas elle ne pourra être utilisée à d'autres fins. Conservez-la en lieu sûr. Attention, votre responsabilité pourra être engagée en cas d'utilisation illicite par un Tiers. La présente Licence s'applique à la copie de sauvegarde. III - PROPRIETE GOTO dispose de tous les droits d'édition et de reproduction sur le Logiciel et sa documentation et sur toute copie autorisée dans le cadre de la présente Licence conformément à la législation sur les droits d'auteurs. Vous prendrez en conséquence toutes les mesures nécessaires à la protection desdits droits et en particulier respecterez et ferez respecter toutes les mentions et avertissements relatifs à ces droits qui sont portés sur les éléments constitutifs du logiciel ou de sa copie de sauvegarde. IV - DUREE - RESILIATION La présente Licence est concédée pour une durée indéterminée sauf manquement de votre part aux termes et conditions de la présente Licence qui conférera à GOTO la faculté de résilier automatiquement la présente Licence sans préavis et sans préjudice des autres recours dont elle pourra disposer. En cas de résiliation, vous vous engagez à en cesser toute utilisation et à retourner à GOTO, sans délai et sur simple demande de GOTO, le Logiciel ainsi que sa copie de sauvegarde le cas échéant. V - GARANTIE ET RESPONSABILITÉ GOTO ne garantit en aucune façon que le Logiciel réponde à quelque fonctionnalité que ce soit ni aux spécifications de l'utilisateur, qu'elles aient été écrites ou non préalablement à l'acquisition. GOTO ne pourra être tenu pour responsable des dommages ou problèmes causés par le logiciel sous Licence et qui pourrait résulter de son utilisation. Ceci comprend de manière non exhaustive le matériel informatique, les logiciels, le système d'exploitation ou tout autre accessoire informatique quel qu'il soit. La garantie est strictement limitée au support matériel, qui sera échangé en cas de vice constaté. La présente garantie s'applique pour une durée de 6 mois suivant la date d'acquisition étant entendu qu'en cas de retour du produit, les frais de port restent à la charge de l'expéditeur. NONOBSTANT CE QUI PRECEDE, GOTO NE POURRA EN AUCUN CAS ÊTRE TENUE POUR RESPONSABLE DE QUELQUE DOMMAGE, DIRECT OU INDIRECT, CAUSE A VOUS OU A UN TIERS, NOTAMMENT, A TITRE PUREMENT INDICATIF ET NON LIMITATIF, LES MANQUES A GAGNER, DEPENSES, PERTES DE LOGICIEL, DETERIORATIONS OU PERTES DE MATERIELS SUPPORTES PAR VOUS MEME OU PAR UN TIERS, Y COMPRIS LES FRAIS DE RECUPERATION, REPRODUCTION, OU DE REPARATION DE TELLES PERTES OU DETERIORATIONS. Vous indemniserez GOTO pour tout dommage résultant de la mise en cause de GOTO et ayant son origine dans un manquement à la présente Licence ou dans l'utilisation du Logiciel. VI - ASSISTANCE A L'UTILISATION La présente Licence n'entraîne aucune obligation d'assistance de GOTO concernant l'utilisation du Logiciel. L'utilisateur trouvera des compléments d'informations, une aide permanente à l'utilisation et sera averti des évolutions et des nouvelles versions du logiciel à l'adresse http://www.goto.fr VII - DISPOSITIONS GENERALES La présente Licence est soumise au droit français. Le tribunal compétent pour connaître de tout litige relatif à l'utilisation du produit ou à l'interprétation de la présente Licence est le Tribunal de commerce de Lille. La présente Licence est concédée pour la France Métropolitaine. GOTO diligentera des poursuites à l'encontre des contrevenants aux termes de la présente Licence. Goto Software - Avenue Antoine Pinay Parc d'Activités des 4 Vents - 59510 Hem - France