Le nuage de mots-clés

Transcription

Le nuage de mots-clés
Le nuage de mots-clés
Extrait du Documentation Académie de Rouen
http://documentation.spip.ac-rouen.fr/spip.php?article226
Le nuage de mots-clés
- Culture professionnelle - Culture de l'information - La recherche de l'information -
Date de mise en ligne : jeudi 9 avril 2009
Description :
Usages et évolutions du "tag cloud"
Copyright © Documentation Académie de Rouen - Tous droits réservés
Copyright © Documentation Académie de Rouen
Page 1/7
Le nuage de mots-clés
Le nuage de mots clefs est une représentation visuelle qui s'est développée notamment lors de l'apparition des
différents services de partage en ligne. Le phénomène des folksonomies ou d'indexation sociale et collaborative a
trouvé ainsi une forme de visibilité graphique qui dépasse, semble-t-il, le simple effet de mode au vu des multiples
prolongements observés.
1. Origine de la forme cartographique
Le nuage de "tags" est issu à l'origine de l'indexation collaborative des usagers fréquentant les sites communautaires
de partage comme Flickr et Del.icio.us.
2. Typologie
On distingue généralement deux types de nuages :
Le nuage comme outil de navigation
Cette catégorie regroupe et classe les termes (utilisés par les usagers pour caractériser tel ou tel contenu textuel ou
iconographique) qui reviennent de manière récurrente sur un site ou un annuaire ( ex : Flickr, Technorati). La
navigation plus ou moins guidée par les mots affichés s'effectue de manière transversale favorisant ainsi la
recherche par sérendipité.
Le nuage comme outil d'analyse textuelle
Ce procédé permet de faire émerger les concepts saillants d'un texte selon le nombre d'occurrences.
La typographie employée (fonte plus ou moins grande) dans les deux cas fait ressortir les termes en question.
3. Intérêts en RI
Ce type de visualisation, en dépit de ses limites, peut permettre de combler le fossé qui réside entre, d'un côté un
étiquetage hétérogène et partial des ressources (approche bottom-up) et de l'autre, un travail d'indexation experte
mené par des professionnels (approche top-down). Dans ce souci d'aller vers l'usager, les interfaces publiques
d'accès aux catalogues des bibliothèques proposent des fonctions qui s'inspirent directement des logiques évolutives
de la recherche en ligne afin d'éviter toute éventualité de silence documentaire [1].
A titre d'exemple, le logiciel libre AFI-Opac 2.0 offre aux personnes consultant la base en ligne la possibilité de
proposer un tag pour telle ou telle ressource, l'ensemble de ces mots étant par la suite regroupés sous forme de
nuage (cf Figure 1). L'opac AquaBrowser va encore plus loin
Copyright © Documentation Académie de Rouen
Page 2/7
Le nuage de mots-clés
Fig.1 Portail de la bibliothèque d'Yerres
aussi bien au niveau graphique qu'au niveau des informations fournies par le "tag cloud" (relations sémantiques,
variations orthographiques) comme l'illustre l'exemple de la Queen's Library (Figure 2)
Fig.2 Exemple de nuage généré sous AquaBrowser Library
Si l'on se positionne maintenant dans le cadre d'un recherche classique sur le Web, on peut faire appel notamment à
l'extension Cloudlet pour Firefox qui constitue une aide appréciable en matière d'affinement de la recherche lorsque
l'on utilise les moteurs Google ou Yahoo.
Fig.3 Nuage de mots générés sous Google grâce au module Cloudlet
Copyright © Documentation Académie de Rouen
Page 3/7
Le nuage de mots-clés
Enfin, divers générateurs de nuages de mots permettent d'appréhender le contenu d'un site (Figure 4), voire
d'extraire les concepts récurrents d'un texte. ManyEyes, plateforme collaborative de visualisation de l'information,
offre plusieurs options de traitement et de présentation graphique.
Fig.4 Mozclouds
Il est aussi possible de comparer deux corps de textes, ce qui peut s'avérer intéressant pour l'analyse de discours
politiques comme par exemple :
http://manyeyes.alphaworks.ibm.com/manyeyes/visualizations/tag-cloud-of-comparison-obama-mccain-3
4. Nuages de tags et VIRI [2]
Comme on a pu l'apercevoir en figure 2, la présentation graphique du nuage évolue et ne se cantonne pas aux
versions classiques linéaires et nébuleuses fréquemment observées à la manière de ce que propose Clusty Cloud
creator (Figure 5), l'un des projets inscrits dans les laboratoires du métamoteur spécialisé dans la catégorisation
thématique.
Loading Clusty Cloud ... Fig.5 Nuage créé sous Clusty
Les autres formes proposées sont circulaires comme Tagnautica ou Tag Galaxy. Les tags des utilisateurs de
Del.icio.us permettent une autre visualisation sous forme de graphique associé à une ligne du temps (voir figure 6
ci-dessous)
Copyright © Documentation Académie de Rouen
Page 4/7
Le nuage de mots-clés
Fig.6 Cloudalicious
Enfin, le graphisme peut même s'approcher d'un certain esthétisme proche de l'ergonomie artistique [3] avec
l'application en ligne Wordle (Figure 7) qui propose de nombreux modèles et différentes options typographiques
(casse, police de caractères) et chromatiques. La visualisation est séduisante mais ne masque par pour autant les
limites de l'outil en matière de traitement de l'information.
Copyright © Documentation Académie de Rouen
Page 5/7
Le nuage de mots-clés
Fig.7 Wordle
Comme le précisent Dominique Boullier et Maxime Crépel, le nuage de mots n'est plus aussi "nuageux". Cette brève
présentation permet de voir une évolution [4] qui n'est pas que formelle comme on a pu le constater. Une certaine
hiérarchisation s'installe progressivement pour aboutir à un système hybride [5] d'accès aux ressources (notamment
au niveau des "opacs de nouvelle génération") qui s'appuie davantage sur les habitudes et les pratiques numériques
des usagers peu enclins à recourir naturellement à des langages documentaires tels que le thésaurus car cela
suppose certaines connaissances bibliothéconomiques. Cela dit, l'exemple de la Queen's Library (Figure 2) résout
en quelque sorte ce hiatus en proposant les deux langages ainsi que des options d'affinement de la requête, ce qui
permet de maintenir la possibilité de rebondir sans avoir à re-saisir sa demande dans le formulaire de recherche.
Sources [6]
1. Collectif et Sous la direction de : Sophie Chauvin, Information & visualisation : Enjeux, recherches et applications
(Editions Cépaduès, 2008).
Cet ouvrage fait un état des lieux de la question.
2. Tosca Consultants et Marc Maisonneuve, Le catalogue de la bibliothèque à l'ère du Web 2.0 : Etude des opacs de
nouvelle génération (ADBS, 2008).
Présentation des nouvelles interfaces orientées vers l'usager afin de faciliter son accès à l'information. Une partie du
livre est spécifiquement consacrée au nuage de tags.
3. Alexandre Boni et Nicolas Stemart, Web 2.0 et Web avancé (Editions Micro Application, 2006).
Copyright © Documentation Académie de Rouen
Page 6/7
Le nuage de mots-clés
Ouvrage synthétique qui passe en revue les différents services étiquetés web 2.0 ainsi que certaines applications
plus complexes.
4. Aschenbrenner, Claude. Les ressources du colloque Carto 2.0 [En ligne]. 2008 [consulté le 03 février 2009].
Disponible sur : http://www.mindomo.com/view.htm?m=5386ab98cc6b497399775936323ad6bd
Une superbe carte interactive réalisée avec Mindomo de Claude Aschenbrenner qui regroupe toutes les
interventions effectuées lors du colloque Carto 2.0 du 03 avril 2008. La communication de Dominique Boullier et de
Maxime Crépel était précisément axée sur "la raison du nuage de tags". Armaury de Buchet évoque également ce
thème dans le cadre de son exposé sur les "interfaces de navigation".
[1] Le principe est le suivant : l'usager accepte plus facilement le bruit que l'absence totale de résultats
[2] Visual information retrieval interface
[3] Voir à ce sujet :http://www.fredcavazza.net/2007/09/19/connaissez-vous-lergonomie-artistique
[4] Cela s'avérait être une obligation après lecture de certaines études qui semblent montrer que les internautes utilisent peu les nuages de tags.
Exemple d'étude :http://www.slideshare.net/gschmitt/do-real-people-really-use-tag-clouds
[5] Relire à ce sujet la réflexion d'Olivier Le Deuff sur les folksonomies en général :http://bbf.enssib.fr/consulter/bbf-2006-04-0066-002
[6] Bibliographie créée avec l'aide de Zotero (modèle Chicago)
Copyright © Documentation Académie de Rouen
Page 7/7