Le nuage de mots-clés
Transcription
Le nuage de mots-clés
Le nuage de mots-clés Extrait du Documentation Académie de Rouen http://documentation.spip.ac-rouen.fr/spip.php?article226 Le nuage de mots-clés - Culture professionnelle - Culture de l'information - La recherche de l'information - Date de mise en ligne : jeudi 9 avril 2009 Description : Usages et évolutions du "tag cloud" Copyright © Documentation Académie de Rouen - Tous droits réservés Copyright © Documentation Académie de Rouen Page 1/7 Le nuage de mots-clés Le nuage de mots clefs est une représentation visuelle qui s'est développée notamment lors de l'apparition des différents services de partage en ligne. Le phénomène des folksonomies ou d'indexation sociale et collaborative a trouvé ainsi une forme de visibilité graphique qui dépasse, semble-t-il, le simple effet de mode au vu des multiples prolongements observés. 1. Origine de la forme cartographique Le nuage de "tags" est issu à l'origine de l'indexation collaborative des usagers fréquentant les sites communautaires de partage comme Flickr et Del.icio.us. 2. Typologie On distingue généralement deux types de nuages : Le nuage comme outil de navigation Cette catégorie regroupe et classe les termes (utilisés par les usagers pour caractériser tel ou tel contenu textuel ou iconographique) qui reviennent de manière récurrente sur un site ou un annuaire ( ex : Flickr, Technorati). La navigation plus ou moins guidée par les mots affichés s'effectue de manière transversale favorisant ainsi la recherche par sérendipité. Le nuage comme outil d'analyse textuelle Ce procédé permet de faire émerger les concepts saillants d'un texte selon le nombre d'occurrences. La typographie employée (fonte plus ou moins grande) dans les deux cas fait ressortir les termes en question. 3. Intérêts en RI Ce type de visualisation, en dépit de ses limites, peut permettre de combler le fossé qui réside entre, d'un côté un étiquetage hétérogène et partial des ressources (approche bottom-up) et de l'autre, un travail d'indexation experte mené par des professionnels (approche top-down). Dans ce souci d'aller vers l'usager, les interfaces publiques d'accès aux catalogues des bibliothèques proposent des fonctions qui s'inspirent directement des logiques évolutives de la recherche en ligne afin d'éviter toute éventualité de silence documentaire [1]. A titre d'exemple, le logiciel libre AFI-Opac 2.0 offre aux personnes consultant la base en ligne la possibilité de proposer un tag pour telle ou telle ressource, l'ensemble de ces mots étant par la suite regroupés sous forme de nuage (cf Figure 1). L'opac AquaBrowser va encore plus loin Copyright © Documentation Académie de Rouen Page 2/7 Le nuage de mots-clés Fig.1 Portail de la bibliothèque d'Yerres aussi bien au niveau graphique qu'au niveau des informations fournies par le "tag cloud" (relations sémantiques, variations orthographiques) comme l'illustre l'exemple de la Queen's Library (Figure 2) Fig.2 Exemple de nuage généré sous AquaBrowser Library Si l'on se positionne maintenant dans le cadre d'un recherche classique sur le Web, on peut faire appel notamment à l'extension Cloudlet pour Firefox qui constitue une aide appréciable en matière d'affinement de la recherche lorsque l'on utilise les moteurs Google ou Yahoo. Fig.3 Nuage de mots générés sous Google grâce au module Cloudlet Copyright © Documentation Académie de Rouen Page 3/7 Le nuage de mots-clés Enfin, divers générateurs de nuages de mots permettent d'appréhender le contenu d'un site (Figure 4), voire d'extraire les concepts récurrents d'un texte. ManyEyes, plateforme collaborative de visualisation de l'information, offre plusieurs options de traitement et de présentation graphique. Fig.4 Mozclouds Il est aussi possible de comparer deux corps de textes, ce qui peut s'avérer intéressant pour l'analyse de discours politiques comme par exemple : http://manyeyes.alphaworks.ibm.com/manyeyes/visualizations/tag-cloud-of-comparison-obama-mccain-3 4. Nuages de tags et VIRI [2] Comme on a pu l'apercevoir en figure 2, la présentation graphique du nuage évolue et ne se cantonne pas aux versions classiques linéaires et nébuleuses fréquemment observées à la manière de ce que propose Clusty Cloud creator (Figure 5), l'un des projets inscrits dans les laboratoires du métamoteur spécialisé dans la catégorisation thématique. Loading Clusty Cloud ... Fig.5 Nuage créé sous Clusty Les autres formes proposées sont circulaires comme Tagnautica ou Tag Galaxy. Les tags des utilisateurs de Del.icio.us permettent une autre visualisation sous forme de graphique associé à une ligne du temps (voir figure 6 ci-dessous) Copyright © Documentation Académie de Rouen Page 4/7 Le nuage de mots-clés Fig.6 Cloudalicious Enfin, le graphisme peut même s'approcher d'un certain esthétisme proche de l'ergonomie artistique [3] avec l'application en ligne Wordle (Figure 7) qui propose de nombreux modèles et différentes options typographiques (casse, police de caractères) et chromatiques. La visualisation est séduisante mais ne masque par pour autant les limites de l'outil en matière de traitement de l'information. Copyright © Documentation Académie de Rouen Page 5/7 Le nuage de mots-clés Fig.7 Wordle Comme le précisent Dominique Boullier et Maxime Crépel, le nuage de mots n'est plus aussi "nuageux". Cette brève présentation permet de voir une évolution [4] qui n'est pas que formelle comme on a pu le constater. Une certaine hiérarchisation s'installe progressivement pour aboutir à un système hybride [5] d'accès aux ressources (notamment au niveau des "opacs de nouvelle génération") qui s'appuie davantage sur les habitudes et les pratiques numériques des usagers peu enclins à recourir naturellement à des langages documentaires tels que le thésaurus car cela suppose certaines connaissances bibliothéconomiques. Cela dit, l'exemple de la Queen's Library (Figure 2) résout en quelque sorte ce hiatus en proposant les deux langages ainsi que des options d'affinement de la requête, ce qui permet de maintenir la possibilité de rebondir sans avoir à re-saisir sa demande dans le formulaire de recherche. Sources [6] 1. Collectif et Sous la direction de : Sophie Chauvin, Information & visualisation : Enjeux, recherches et applications (Editions Cépaduès, 2008). Cet ouvrage fait un état des lieux de la question. 2. Tosca Consultants et Marc Maisonneuve, Le catalogue de la bibliothèque à l'ère du Web 2.0 : Etude des opacs de nouvelle génération (ADBS, 2008). Présentation des nouvelles interfaces orientées vers l'usager afin de faciliter son accès à l'information. Une partie du livre est spécifiquement consacrée au nuage de tags. 3. Alexandre Boni et Nicolas Stemart, Web 2.0 et Web avancé (Editions Micro Application, 2006). Copyright © Documentation Académie de Rouen Page 6/7 Le nuage de mots-clés Ouvrage synthétique qui passe en revue les différents services étiquetés web 2.0 ainsi que certaines applications plus complexes. 4. Aschenbrenner, Claude. Les ressources du colloque Carto 2.0 [En ligne]. 2008 [consulté le 03 février 2009]. Disponible sur : http://www.mindomo.com/view.htm?m=5386ab98cc6b497399775936323ad6bd Une superbe carte interactive réalisée avec Mindomo de Claude Aschenbrenner qui regroupe toutes les interventions effectuées lors du colloque Carto 2.0 du 03 avril 2008. La communication de Dominique Boullier et de Maxime Crépel était précisément axée sur "la raison du nuage de tags". Armaury de Buchet évoque également ce thème dans le cadre de son exposé sur les "interfaces de navigation". [1] Le principe est le suivant : l'usager accepte plus facilement le bruit que l'absence totale de résultats [2] Visual information retrieval interface [3] Voir à ce sujet :http://www.fredcavazza.net/2007/09/19/connaissez-vous-lergonomie-artistique [4] Cela s'avérait être une obligation après lecture de certaines études qui semblent montrer que les internautes utilisent peu les nuages de tags. Exemple d'étude :http://www.slideshare.net/gschmitt/do-real-people-really-use-tag-clouds [5] Relire à ce sujet la réflexion d'Olivier Le Deuff sur les folksonomies en général :http://bbf.enssib.fr/consulter/bbf-2006-04-0066-002 [6] Bibliographie créée avec l'aide de Zotero (modèle Chicago) Copyright © Documentation Académie de Rouen Page 7/7