Guide pour l`installation du glossaire sur un site DRUPAL 6.x

Transcription

Guide pour l`installation du glossaire sur un site DRUPAL 6.x
Installation du glossaire Eaufrance
sur un site DRUPAL (version 6.x)
Guide d’installation
Nicolas Dhuygelaere (OIEau)
12/11/2015
Version 1.2
Document élaboré en application du
schéma national des données sur l’eau

CONTEXTE
Ce document a été élaboré par l'Office International de l'Eau (OIEau) avec le soutien financier de
l'Office National de l'Eau et des Milieux Aquatiques (Onema). Il vient en appui aux utilisateurs des
outils communs du SIE mis en place sur les sites en application du schéma web de diffusion des
données (SWDD) sur l’eau. C’est un document technique à destination des administrateurs de sites
web.

DOCUMENTS DE REFERENCE
Schéma web de diffusion des données sur l’eau
Anne Lançon (ONEMA)
Un glossaire sur l’eau et les milieux aquatiques
Janik Michon (ONEMA)
Création d’un flux de syndication de concepts du glossaire
Eaufrance pour intégration à un site web
Installation du glossaire Eaufrance sur un site SPIP
(version 2.x)
Installation du glossaire Eaufrance sur un site Drupal
(version 7.x)
Nicolas Dhuygelaere (OIEau)

Nicolas Dhuygelaere (OIEau)
Nicolas Dhuygelaere (OIEau)
AUTEURS ET CONTRIBUTEURS
Nicolas Dhuygelaere, ingénieur études données (OIEau)
Avec la contribution de
Anne Lançon, chef de projet « diffusion des données » (ONEMA)
Janik Michon, chef de projet « valorisation des données » (ONEMA)
Sous la coordination de
Janik Michon, chef de projet « valorisation des données » (ONEMA)
Droits d’usage : http://creativecommons.org/licenses/by-nc-sa/2.0/fr
Mots-clés : Glossaire, eaufrance, eau, thésaurus, guide
Couverture géographique : France (dont DOM)
Niveau géographique : Niveau de lecture : Professionnel
Langue : Français
Diffuseur : Office national de l’eau et des milieux aquatiques (Onema)
OBJET ET DOMAINE D’APPLICATION
Ce document vient en appui aux utilisateurs des outils communs du SIE mis en place en application
du schéma web de diffusion des données (SWDD) sur l’eau. C’est un document technique à
destination des administrateurs de sites web, en particulier ceux de la toile eaufrance.fr, qui souhaitent
intégrer le glossaire Eaufrance sur leur site web développé en DRUPAL.
Les préconisations techniques qui suivent sont valables pour les sites développés en DRUPAL, pour
toutes versions de la branche 6.x qui utilise la version 1.2 du package « glossaire ».

SOMMAIRE
1. Introduction ......................................................................................................... 5
2. Présentation du package DRUPAL 6.x .............................................................. 6
3. Installation du package DRUPAL 6.x ................................................................. 7
3.1
3.2
Pré-requis .............................................................................................................. 7
Téléchargement et installation du package ....................................................... 8
3.2.1 Téléchargement ...................................................................................................... 8
3.2.2 Installation .............................................................................................................. 8
3.3
Configuration des modules et des droits utilisateurs..................................... 10
3.3.1 Attribution des droits utilisateurs ........................................................................... 10
3.3.2 Configuration du module « Glossaire syndicate » ................................................. 11
3.3.2.1 Créer une liste de concepts pour votre site depuis le glossaire Eaufrance ........ 11
3.3.2.2 Configurer la syndication à une liste de concepts .......................................... 11
3.3.3 Configuration du module « Glossaire auto » ......................................................... 12
3.3.3.1 Principe de fonctionnement ............................................................................ 12
3.3.3.2 Options de configurations ............................................................................... 13
3.3.4 Configuration du module « Glossaire eaufrance » et intégration dans un site
« eaufrance » ................................................................................................................. 16
4. Présentation du type de contenu « Concept SKOS » .................................... 17
4.1. Qu’est-ce qu’un « Concept SKOS » ? ............................................................... 17
4.2. Pourquoi un nouveau type de contenu? .......................................................... 18
4.3. Description des champs .................................................................................... 18
5. Intégration du glossaire selon la charte Eaufrance ....................................... 18
5.1. Modification du bandeau haut ........................................................................... 18
5.2. Style général de la page abécédaire ................................................................. 19
5.3. Style général de la page descriptive d’un concept ......................................... 21
6. Informations supplémentaires pour les développeurs .................................. 22

GUIDE
1. Introduction
De nombreux acteurs produisent et diffusent des informations relatives à l'eau et aux milieux
aquatiques, utilisant des termes plus ou moins techniques. Pour faciliter un langage commun, et dans
un souci de cohérence, les partenaires du système d'information sur l'eau (SIE) ont décidé de mettre
à disposition le glossaire qu'ils ont établi ensemble.
Ce glossaire est accessible à l'adresse suivante : http://www.glossaire.eaufrance.fr.
Figure 1 : Page d’accueil du site www.glossaire.eaufrance.fr
Le contenu actuel de ce glossaire repose sur l'analyse d'une cinquantaine de glossaires existants
(documents, sites web, ...), et comprend environ 1400 termes disponibles en 3 langues : français,
anglais et espagnol, dont la consultation est libre d'accès. Le glossaire est évolutif : tout utilisateur
peut proposer de modifier ou supprimer certains termes. Les propositions sont évaluées par un
groupe d'utilisateurs, partenaires du SIE. Ce site permet par ailleurs à d'autres sites web d'alimenter
dynamiquement leurs contenus, en s’abonnant au glossaire, et d'être mis à jour en temps réel. Si un
utilisateur gère lui-même un glossaire et qu’il souhaite bénéficier du contenu de celui-ci, il lui suffit de
s’abonner par flux RSS / RDF.
Par ailleurs, pour favoriser l'utilisation du glossaire par d'autres sites partenaires, des outils ont été
développés afin d'importer, de présenter et d'exploiter sur leur propre site les concepts définis dans le
glossaire Eaufrance. Il s'agit notamment de packages contenant les modules/plugin nécessaires à
l'intégration du glossaire sur des sites réalisés sous DRUPAL 6.x, 7x et SPIP 2.x. Ces outils sont
disponibles à l'adresse : http://www.glossaire.eaufrance.fr/noeud/comment-réutiliser-le-glossaire.
Le présent document détail les modalités d’utilisation de l’outil destiné aux sites fonctionnant
sous DRUPAL 6.x.
2. Présentation du package DRUPAL 6.x
Le package « glossaire Eaufrance pour DRUPAL 6.x », offre les fonctionnalités suivantes :

la création d'une page « glossaire » sur votre site
Figure 2 : Capture d'écran de la page "glossaire"

la syndication à une liste de concepts du glossaire eaufrance
Figure 3 : Capture d'écran de la page de configuration des flux de syndication

la recherche des mots du glossaire dans les pages de votre site afin de créer des
liens/infobulles présentant les concepts du glossaire (la création de ces éléments interactifs
ne modifie en rien le contenu de votre site)
Figure 4 : Exemple de fonctionnement du glossaire automatique
Le package pour DRUPAL 6.x est composé de 6 modules :

le module « glossaire » permet la mise en place d'un glossaire utilisant des concepts SKOS.
Il permet notamment d'ajouter le type de contenu « concept_skos » à votre installation
DRUPAL et une page spécifique pour le glossaire (http://www.monsitedrupal.fr/?q=glossaire
ou http://www.monsitedrupal.fr/glossaire) ;

le module « glossaire_syndicate » vient en complément du module « glossaire ». Ce
module permet de se syndiquer aux concepts d'un glossaire à partir de flux RSS ou RDFSKOS notamment diffusé(s) pour le site http://www.glossaire.eaufrance.fr ;

le module « glossaire_auto » vient en complément du module « glossaire ». Ce module
fournit des fonctions permettant de repérer des mots dans un texte à partir des mots d'un
glossaire et de créer des liens et/ou des infobulles pointant dessus ;

Le module « glossaire_eaufrance » propose différentes fonctionnalités spécifiques (ajout de
blocs, de liens…) pour les interactions avec le site http://www.glossaire.eaufrance.fr ;

Le module « jquery_tooltip » vient en complément du module « glossaire_auto ». Ce
module est une implémentation pour DRUPAL du plugin jquery « Tooltip » disponible à
l'adresse suivante : http://bassistance.de/jquery-plugins/jquery-plugin-tooltip/. Le plugin
« tooltip » fournit les librairies permettant l'affichage d'infobulles avec jquery.

Le module « link_image » ajoute un affichage des liens sous la forme d'image. Il s'agit d'un
appendis pour le module « link ».
Le package offre également de nombreuses options de configuration et une gestion fine des droits
utilisateurs.
3. Installation du package DRUPAL 6.x
Avertissement :
Même si le package a fait l'objet de nombreux tests, avant toute opération, effectuez une
sauvegarde complète de votre site (code+base de données) pour plus de précautions.
3.1 Pré-requis
Le package a été développé et testé pour une installation DRUPAL 6.x, sous PHP 5 fonctionnant avec
une base Mysql et/ou une base Postgres. Une installation sous PHP 4 est fortement déconseillée car
dans ce cas le module « glossaire_auto » peut avoir un fonctionnement dégradé et le module
« glossaire_syndicate » sera inopérant en raison de sa dépendance à la librairie simpleXML de PHP.
Vous devez bénéficier des droits d'écriture sur votre serveur web afin de déposer les fichiers des
différents modules nécessaires, et des droits administrateur sur votre site DRUPAL pour activer les
modules.
Par ailleurs, pour installer le module « glossaire », vous devez installer au préalable, et dans l'ordre
suivant, les modules présentés ci-après, préférentiellement dans leur dernière version stable pour
DRUPAL 6.x :

content (cck) : ce module permet aux administrateurs de définir de nouveaux types de
contenus. Il est disponible à l'adresse suivante : http://drupal.org/project/cck ;

text : ce module permet de définir des champs de type texte. Ce module est compris dans le
module cck ;

content_copy : ce module permet d'importer/exporter la définition des types de contenu. Ce
module est compris dans le module cck ;

link : ce module définit des champs de type texte lien. Il est disponible à l'adresse suivante :
http://drupal.org/project/link
Pour installer un module sous DRUPAL 6.x, référez-vous à la documentation officielle en ligne :
http://drupal.org/documentation/install/modules-themes/modules-5-6. Si votre installation dispose déjà
de l'un de ces modules, il n'est à priori pas nécessaire de le réinstaller.
Pour un fonctionnement optimal du package, il est également recommandé de :

disposer de la librairie curl, accessible à l’adresse : http://fr.php.net/manual/fr/book.curl.php
avec php. Cette librairie est notamment utile pour le module « glossaire_syndicate » afin de
charger le flux en provenance du glossaire eaufrance. Si cette librairie n'est pas disponible, le
module « glossaire_syndicate » utilisera la fonction php « file_get_contents() » avec le risque
d'atteindre un timeout si le glossaire met trop de temps à répondre ;

d'installer
le
module
« simplehtmldom »
disponible
à
l’adresse
suivante :
http://drupal.org/project/simplehtmldom. Ce module permet d'améliorer le fonctionnement du
module « glossaire_auto », c’est-à-dire les fonctions de recherche automatique des mots du
glossaire dans les textes du site (cf partie 3.3.3.2).
3.2 Téléchargement et installation du package
3.2.1 Téléchargement
Le package « glossaire Eaufrance » pour DRUPAL 6.x est disponible à l'adresse suivante :
http://www.glossaire.eaufrance.fr/noeud/comment-r%C3%A9utiliser-le-glossaire.
Dans la section « Comment utiliser un flux de syndication sur un site web ? » de la page concernée,
cliquez sur le lien de téléchargement des « Modules d’installation du glossaire sur un site DRUPAL
6.x » : le fichier en téléchargement est une archive zip.
Figure 5 : Page de téléchargement du package glossaire
3.2.2 Installation
Une fois le package téléchargé, décompressez l'archive zip et placez les fichiers sur votre serveur
web, au niveau du répertoire dédié aux modules complémentaires de DRUPAL, à savoir, au choix :

//chemin vers le répertoire d'installation drupal/sites/all/modules/custom

//chemin vers le répertoire d'installation drupal/sites/all/modules
Lorsque les fichiers sont en place, ouvrez l'interface d'administration de votre site DRUPAL 6.x, depuis
votre
navigateur
web,
à
la
page
de
gestion
des
modules :
http://www.monsite.fr/admin/build/modules/list (cela nécessite les droits administrateur).
Puis, cochez les modules suivants (voir image ci-dessous) :







Glossaire : le module de base du package ;
Glossaire Auto : si vous souhaitez disposez des fonctions du glossaire automatique ;
Glossaire syndicate : si vous souhaitez vous syndiquer aux définitions des concepts du
glossaire eaufrance ;
Glossaire Eaufrance : si vous souhaitez disposer des fonctions spécifiques pour le glossaire
eaufrance ;
jquery_tooltip : si vous souhaitez bénéficier des définitions des concepts retrouvés par le
glossaire de manière automatique ;
link_image,: si vous souhaitez pouvoir afficher les illustrations du glossaire sous forme
d'images ;
simplehtmldom API (facultatif mais recommandé - cf partie 3.3.3.2) : il se trouve dans la
section « Filter » de la page de gestion des modules.
Figure 6 : Page d'activation des modules Drupal
Enfin, cliquez sur le bouton « Enregistrer la configuration » (situé en bas de page) pour activer les
modules sélectionnés. A la fin du processus d'activation, un message du type « The configuration
options have been saved. » s’affichera, ainsi que, éventuellement, des détails sur les opérations
réalisées par DRUPAL sur la base de données.
Après l'activation des modules, il est conseillé de vider le cache de DRUPAL en lançant la page
suivante : http://www.monsite.fr/admin_menu/flush-cache. Afin de vérifier que installation est
correctement réalisée, vous pouvez :



ouvrir la page http://www.monsite.fr/?q=glossaire ;
tester l’existence du type de contenu « Concept SKOS » dans la section « Gestion du
contenu » de l'administration du site ;
constater la présence des items « Glossaire auto » et «Glossaire syndicate » dans la section
«configuration du site » de l'administration du site.
Note sur les fichiers de langues et la traduction du site :
Afin de prendre en compte le multilinguisme de DRUPAL, les interfaces du « package glossaire » ont
été développées en anglais. Des fichiers de traduction en langue française sont disponibles au niveau
de chaque module. Ils sont normalement installés automatiquement par DRUPAL lors de l'activation
des modules, si la langue française a été choisie lors de l'installation de votre site DRUPAL.
Si, lors de l'installation des modules, les fichiers de langues n'ont pas été pris en compte, vous pouvez
forcer leur activation en les téléchargeant depuis l'espace d'administration de votre site, en vous
rendant à l'adresse suivante sur votre site : http://www.monsite.fr/admin/build/translate/import
3.3 Configuration des modules et des droits utilisateurs
3.3.1 Attribution des droits utilisateurs
Généralement, DRUPAL n’accorde pas des droits d’accès aux différents profils d'utilisateurs. Cette
étape est donc importante, par exemple si vous souhaitez que vos visiteurs puissent consulter la page
du glossaire, voir les pages descriptives des concepts, etc. A minima, il est donc recommandé de faire
les réglages suivants dans la section « Permissions » de la partie « Gestion des utilisateurs » de
l'espace d'administration de votre site (http://www.monsite.fr/admin/user/permissions) :
Tableau 1 : Table d'attribution préférentielle des droits utilisateur
Module et permission
Utilisateur anonyme
Utilisateur authentifié
glossaire_module
access Glossaire
oui
oui
non
déconseillé
non
déconseillé
creat concept_skos content
déconseillé
déconseillé
delete concept_skos content
déconseillé
déconseillé
delete own concept_skos content
déconseillé
déconseillé
edit any concept_skos content
déconseillé
déconseillé
edit own concept_skos content
déconseillé
déconseillé
glossaire_syndicate_module
administer glossaire syndicate
glossaire_auto_module
administer glossaire auto
node module
La capture d'écran suivante vous présente un exemple d'interface d'attribution des droits sous
DRUPAL.
Figure 7 : Interface Drupal de l'attribution des droits
Après avoir attribué les droits aux différents rôles utilisateurs, n’oubliez pas de sauvegarder votre
configuration en cliquant sur « Enregistrer les droits d’accès » (en bas de la page).
3.3.2 Configuration du module « Glossaire syndicate »
3.3.2.1 Créer une liste de concepts pour votre site depuis le glossaire Eaufrance
Une guide spécifique décrit le processus. Il est également accessible à l’adresse :
http://www.glossaire.eaufrance.fr/node/8438.
3.3.2.2 Configurer la syndication à une liste de concepts
Une fois que vous avez établi votre liste de concepts et configuré son export en flux RSS ou RDF sur
le site http://www.glossaire.eaufrance.fr, vous pouvez réutiliser l'URL de votre flux pour importer les
concepts sur votre site grâce au module « glossaire_syndicate ».
L'accès à l'interface de configuration se trouve dans la section « configuration du site » de
l'administration de votre site. L'URL pour y accéder est de la forme suivante :
http://www.monsite.fr/admin/settings/glossaire_syndicate.
Sur cette page, vous trouverez la liste des flux déjà configurés avec les informations les concernant.
Figure 8 : Interface de configuration des flux de syndication
A la fin, de chaque ligne descriptive, vous trouverez des liens vous permettant de forcer la
synchronisation du flux avec le glossaire, de le modifier et de le supprimer. Sur cette page vous
trouverez également un lien pour créer un nouveau flux.
Lors de la modification ou de la création des flux vous disposez des options de configuration
suivantes :

le nom du flux ;

l'adresse du flux (celle que vous avez créée sur le site http://www.glossaire.eaufrance.fr ) ;

le format du flux : RSS, RDF-SKOS + mode de détermination automatique ;

la définition de la valeur par défaut du champ « source » ;

la fréquence de synchronisation de votre flux : elle nécessite d'avoir une tâche cron (ou, à
défaut, utilisez le module poormanscron : http://drupal.org/project/poormanscron);

la configuration des liens d’interaction avec le glossaire Eaufrance (fonctionnalités ajoutées
par le module glossaire_eaufrance).
Figure 9 : Formulaire de configuration d'un flux de syndication
Dans le cas d’une mise à jour depuis la version 1.0 du module, avant de resynchroniser les
concepts, il est recommandé de supprimer au préalable tous les concepts issus du site
www.glossaire.eaufrance.fr afin d’éviter les doublons de contenu lors de la mise en place de
la gestion multilingue.
3.3.3 Configuration du module « Glossaire auto »
3.3.3.1 Principe de fonctionnement
Le module « glossaire auto » permet de rechercher dans un texte une liste de termes prédéfinie. Nous
utilisons ici le mot « terme » et non pas « concept » car la liste des mots à rechercher est en fait
constituée des libellés, des libellés alternatifs et des sigles de chaque concept du glossaire importés
dans votre site.
Lors du processus de recherche des termes du glossaire dans un texte, l’algorithme recherche dans
le texte des séquences de mots correspondant aux termes du glossaire en utilisant une méthode
simplifiée de lemmatisation (cf : http://fr.wikipedia.org/wiki/Lemmatisation) associée à des expressions
régulières (cf http://fr.wikipedia.org/wiki/Expressions_régulières). La lemmatisation est dite simplifiée
car elle ne gère que les caractères accentués, les formes plurales et féminines simples, c'est à dire
des mots finissant par : s, x et e.
Par exemple le système trouvera :

« eaux douces » pour « eau douce » ;

« rejeté », « rejets », « rejetées » pour « rejet ».
Mais le système ne trouvera pas :

« arrêtés préfectoraux » pour « arrêté préfectoral » car la forme plurale est plus complexe ;

« normalisation » pour « norme » mots ayant pourtant le même lemme (même racine).
Dans cette première version, le glossaire automatique n'est pas capable de considérer le sens du
terme (en fonction d'une thématique) par rapport au sens du texte, en se basant sur un champ
sémantique ou sur une liste fermée de thématiques. Des contresens sont donc possibles sur des
termes ayant des homonymes ou des sigles significatifs (exemple : MISE). Dans la version suivante,
un correctif sera apporté.
Le tableau ci-dessous présente quelques exemples de résultats de recherche en fonction du mode de
recherche sur un texte de référence (les mots en italique indiquent quels sont les mots trouvés par le
glossaire auto).
Texte de référence :
Agence de l'eau
Établissement public de l'État à caractère administratif placé sous la tutelle du ministre chargé
de l'environnement. Dans le bassin ou groupement de bassins, l'agence de l'eau met en
œuvre le schéma directeur d'aménagement et de gestion des eaux (SDAGE) et les schémas
d'aménagement et de gestion des eaux (SAGE), en favorisant une gestion équilibrée et
économe de la ressource en eau et des milieux aquatiques, l'alimentation en eau potable, la
régulation des crues et le développement durable des activités économiques. Elle mène, de
plus, une politique foncière de sauvegarde des zones humides approuvée par le comité de
bassin. Ses ressources proviennent essentiellement de la perception de redevances sur les
prélèvements et la pollution des eaux...
Tableau 2 : Exemples de résultat en fonction du mode de recherche sur un texte de référence
Termes du glossaire
Recherche
simple (mot à
mot)
Recherche
Recherche
insensible à la insensible à la
casse
casse avec prise
en compte de la
ponctuation
Recherche avec
lemmatisation
Bassin
non
oui
oui
oui
non
oui
oui
Groupement de bassins non
Schéma directeur
non
oui
oui
oui
SDAGE
non
non
oui
oui
Schéma
d'aménagement et de
gestion des eaux
non
non
non
oui
SAGE
non
non
oui
oui
Eau potable
non
non
oui
oui
Crue
non
non
non
oui
oui
oui
oui
Développement durable non
Zone humide
non
non
non
oui
Comité de bassin
non
non
oui
oui
Prélèvement
non
non
oui
oui
Pollution
non
oui
oui
oui
3.3.3.2 Options de configurations
Le module propose différentes options de configuration dans la section « configuration du site » :

la sélection des types de contenu sur lesquels seront effectués les traitements du glossaire
automatique : DRUPAL permet de créer autant de types de contenus que souhaité, avec les
champs spécifiques (avec le module cck) correspondants (par exemple: des actualités, des
notices documentaires, des fiches de présentation d'un objet, d'un milieu, etc.). Vous pouvez
donc appliquer la recherche des termes sur les types de contenus que vous aurez définis. Il
n'est par contre pas possible dans cette version d'appliquer le glossaire automatique sur les
pages produites par d'autres modules, tels que : view, taxonomy, book, user.
Figure 10 : Configuration du glossaire_auto : sélection des types de contenu

la sélection de l'étape de génération du nœud pour effectuer la recherche des mots du
glossaire : DRUPAL propose plusieurs points d'ancrage/insertion (des hook, en langage
DRUPAL) de code dans son processus de rendu des nœuds. Pour l'instant, le glossaire auto
propose deux points d'entrée :
- avant le rendu du nœud : le traitement sera réalisé sur le champ « body » du nœud
et sur les champs cck de type texte n'utilisant pas le module « optionwidgets ». Cette
option offre le meilleur compromis entre le temps d'exécution et la complétude de la
recherche ;
- après le rendu du nœud : le traitement sera réalisé sur le contenu du nœud mis en
forme. Cette option permet une recherche très complète car basée sur l'intégralité du
contenu mais peut s’avérer très consommatrice en ressource car dans ce cas on
analyse le code HTML.

l’optimisation du mode recherche : le glossaire auto propose plusieurs options afin
d'augmenter la sensibilité de sa recherche ou de diminuer le temps d’exécution de la page.
Vous pouvez choisir :
- d'appliquer ou non la sensibilité à la casse : il est conseillé d'utiliser la sensibilité à la
casse même si le temps d’exécution s'en trouve légèrement augmenté, mais vos
chances de retrouver les termes du glossaire s'en trouveront fortement augmenté ;
- de chercher toutes les occurrences des mots du glossaire ou seulement la
première : ne chercher que la première occurrence d'un terme permet de réduire le
temps d’exécution du script et d'alléger la charge visuelle de vos pages ;
- de faire la recherche sur tout le code HTML de la page ou seulement sur le texte
c'est à dire sans les balises HTML. Cette option est celle qui aura le plus d'impact sur
le temps d’exécution ou sur l'intégrité de votre code HTML. Appliquer la recherche sur
tout le code HTML permet de réduire très fortement le temps d’exécution du script
surtout si les pages sont longues et riches en balises HTML (c'est souvent le cas
lorsque l'on utilise un éditeur wysiwyg : http://fr.wikipedia.org/wiki/Wysiwyg) et que le
glossaire contient beaucoup de termes. En revanche, effectuer une recherche sur tout
le code HTML peut conduire à la création d'erreurs dans le code HTML si certains
attributs ds balises HTML correspondent à des termes du glossaire (voir exemple 1)
et certains termes composés de plusieurs mots peuvent ne pas être détectés (voir
exemple 2). Le mode de recherche sur le texte évite les problèmes évoqués
précédemment mais est très consommateur en ressources machines et plus long à
exécuter. En effet, au préalable, le système doit éliminer tout le code HTML et
conserver les différents fragments de texte dans un tableau. Donc, au lieu de réaliser
tous ces traitements en une seule passe, le système est obligé de répéter la
séquence de recherche pour chaque fragment du tableau. Si vous souhaitez utiliser le
mode de recherche uniquement sur le texte, il est vivement conseillé d'activer le
cache DRUPAL afin d'éviter de refaire le traitement à chaque fois qu'un utilisateur
souhaite consulter une page déjà calculée.
Exemple 1 : génération d'erreur html (cas de la recherche sur le code HTML complet)
Texte HTML original :
« ...le site du <a href="http://www.glossaire.eaufrance.fr">glossaire</a> propose des définitions... »
Le système peut entrainer l'erreur suivante si « glossaire » est un des termes à rechercher :
Texte HTML générer par le glossaire auto :
« ...le site du <a href="http://www.<em>glossaire</em>.eaufrance.fr"><em>glossaire</em></a>
propose des définitions... »
Dans ce cas, le système a ajouté des balises <em> (emphase) à l'intérieur de l'attribut « href » du lien.
Cela casse au minimum le lien vers la page concernée, et, en fonction du navigateur, cela peut
également entrainer des erreurs d'affichage.
Exemple 2 : des termes du glossaire ne sont pas trouvés (cas de la recherche sur le code HTML
complet)
Texte HTML original :
« <p>Ceci est un <b>paragraphe</b> contenant des balises de <u>mise</u> en forme</p> »
Dans ce cas si le glossaire auto recherche les termes « paragraphe » et « mise en forme », il trouvera
« paragraphe » mais pas « mise en forme » à cause des balises <u>.
Figure 11 : Configuration du glossaire_auto : paramétrage des options de recherche

la sélection du mode d'affichage des mots trouvés : lorsqu'un terme est trouvé, vous avez
la possibilité de choisir quel masque appliquer :
- la seule création d'un lien vers la page de description du concept ;
- la seule création d'une infobulle contenant la définition du concept ;
- ou les deux.
Figure 12 : Configuration du glossaire_auto : sélection du masque de remplacement

la création d'une liste noire de concepts du glossaire à ne pas rechercher : il peut
s’avérer utile, dans certains cas, de retirer certains mots de la recherche du glossaire
automatique tout en souhaitant conserver le concept dans son glossaire. C'est notamment le
cas de certains mots pouvant avoir plusieurs sens (homonymie) ou de sigles pouvant se
trouver couramment dans la langue française. Par exemple :
- système d'information (SI) : il peut être intéressant de mettre « SI » dans la liste
noire pour éviter de marquer tous les « si » se trouvant dans le texte tout en
conservant « système d'information » dans son glossaire ;
- valeur : ce concept possède une définition propre dans le glossaire eaufrance, se
rapportant au sens économique du terme, mais le mot « valeur » peut aussi être
utilisé dans certaines expressions telles que « la mise en valeur d'un milieu ». Dans
ce cas, il est nécessaire de supprimer « valeur » de la base de recherche du glossaire
automatique pour éviter un contre sens.
Figure 13 : Configuration du glossaire_auto : utilisation d'une liste de mots à ne pas rechercher
A noter, la présence de trois items, se trouvant au même niveau que l'item de configuration dans le
menu. Ils ont un rôle d'aide au débogage et de forçage du cache du glossaire automatique.
Figure 14 : Configuration du glossaire_auto : items de gestion du cache du glossaire auto
3.3.4 Configuration du module « Glossaire eaufrance » et intégration dans un site
« eaufrance »
Le module « glossaire eaufrance » permet l’ajout de différents éléments tels que des blocs ou des
options de configuration, nécessaires à la bonne intégration graphique du glossaire sur votre site,
selon les préconisations de la charte eaufrance.
A son activation, le module « glossaire eaufrance » crée un bloc nommé « A propos du Glossaire
Eaufrance » : par défaut, ce bloc est désactivé. Or, pour un site de la toile Eaufrance, ce bloc doit être
positionné dans la colonne de droite du site, pour les pages de type « abécédaire » et les pages
descriptives de concept.
L’interface d’activation des blocs d’un site DRUPAL est disponible à l’adresse :
http://www.monsite.fr/admin/build/block/list, mais l’accès à cette page requière les droits
administrateur. La gestion de l’affichage du bloc en fonction des pages du site s’effectue dans la
section « Paramètres de visibilité spécifiques à la page » du formulaire de configuration du bloc. Il est
recommandé la configuration suivante :

cochez l’option « Afficher le bloc seulement sur les pages listées »,

puis, dans la zone de saisie, entrez les trois lignes suivantes : « glossaire », « glossaire/* » et
« concept/* »1.
Figure 15 : Configuration des blocs : affichage en fonction des pages
Le module « glossaire eaufrance » permet également d’ajouter des options sur la gestion des liens
d’interaction avec site www.glossaire.eaufrance.fr au niveau du formulaire de configuration de la
syndication au flux de concept.
Figure 16 : Configuration des liens d'interaction
4. Présentation du type de contenu « Concept SKOS »
Le fonctionnement du package repose sur l’utilisation d’un type de contenu DRUPAL définissant les
différentes propriétés des concepts du glossaire Eaufrance selon le standard SKOS.
4.1.
Qu’est-ce qu’un « Concept SKOS » ?
SKOS, ou Simple Knowledge Organisation System (Système simple d'organisation des
connaissances), est une famille de langages formels permettant une représentation standard des
thésaurus, classifications ou de tout autre type de vocabulaire contrôlé et structuré. SKOS est
construit sur la base du langage RDF, et son principal objectif est de permettre la publication facile de
vocabulaires structurés pour leur utilisation dans le cadre du Web sémantique. SKOS est une
recommandation du W3C depuis le 18/08/2009.
Pour aller plus loin sur le SKOS : http://www.w3.org/2004/02/skos/
1
La création des URL de la forme « concept/* » nécessite l’utilisation du module « pathauto » avec la configuration suivante :
pour l’item « Modèle de chemin pour les contenus de type Concept SKOS : » ajouter la ligne suivante « concept/[title-raw] »
Un concept est une représentation générale et abstraite d'un objet. Dans SKOS, un concept permet
de designer un mot ou un groupe de mots et son/leur sens (un mot ne permet pas de définir à lui seul
un concept à cause du risque d'homonymie). À chaque concept peuvent être attachés comme
propriétés RDF :




au maximum un terme préférentiel par langue ;
des synonymes, avec spécification possible de la langue ;
des définitions et notes, avec spécification possible de la langue ;
des concepts par des relations « générique-spécifique », ou par des relations associatives,
comme pour les termes d'un thésaurus.
4.2.
Pourquoi un nouveau type de contenu?
DRUPAL, avec l’aide du « module cck », permet de générer de nouveaux types de contenus
complètement customisables. Les possibilités offertes par l'utilisation d'un type de contenu spécifique
sont très larges. On peut notamment citer :




la gestion des droits d'accès ;
le paramétrage de la recherche ;
l’utilisation dans les vues DRUPAL ;
la gestion du style...
Ceci pour chaque type de contenu et ce sans perturber le fonctionnement initial du site. Par ailleurs, la
configuration de base du type de contenu est modifiable par le webmaster, via l’interface
d’administration du site.
4.3.
Description des champs
Le glossaire eaufrance est conçu pour gérer les différentes propriétés des concepts et leurs relations
avec les autres concepts selon le standard SKOS. Le but du package n'est pas de recréer toute cette
structuration, mais de fournir aux sites tiers une vue simplifiée des concepts afin de créer leur propre
glossaire. Dans cette première version, le glossaire Eaufrance ne gère pas le multilinguisme.
Chaque entrée du glossaire présente les champs suivants :








Libellé : libellé préférentiel du concept (obligatoire) ;
Libellé alternatif : synonyme du concept (facultatif) ;
Sigle : sigle du concept - exemple : DCE, Sandre, ONEMA (facultatif) ;
Définition : définition du concept (obligatoire) ;
Illustration : URL des images illustrant le concept (facultatif) ;
Source : source de la définition du concept (facultatif) ;
Lien : libellé + adresse des concepts associés au concept courant (facultatif) ;
Identifiant : adresse de la page ou est décrit le concept sur
http://www.glossaire.eaufrance.fr (obligatoire).
le
site
5. Intégration du glossaire selon la charte Eaufrance
5.1.
Modification du bandeau haut
Pour toutes les pages du site, le lien « glossaire » doit apparaître dans le bandeau haut, dans le coin
supérieur droit (à la droite du lien « contact »). Le libellé est en blanc gras (de même style de police
. Le lien pointe vers la page de l’abécédaire,
que le lien « contact ») et est précédé du pictogramme
présentant par défaut la première lettre du glossaire affichant au moins une définition (le plus souvent,
la lettre A).
Figure 17 : Exemple du bandeau charté pour le site www.gesteau.eaufrance.fr
Pour un site développé en DRUPAL, l’adresse URL de cette page
http://www.monsite.eaufrance.fr/glossaire/A, si au moins une définition existe pour la lettre A.
5.2.
est
:
Style général de la page abécédaire
Le plugin crée une page générique communément appelée « abécédaire ». Cette page présente la
liste des concepts par ordre alphabétique pour la lettre sélectionnée lors du paramétrage. Cette page
est accessible en utilisant une adresse URL du type : http://www.monsite.eaufrance.fr/glossaire/A
Ci-après, sont décrits les points qui doivent être respectés :
Figure 18 : Exemple de page abécédaire charté pour le site www.gesteau.eaufrance.fr

Le lien « Glossaire » est présent dans le bandeau haut de toutes les pages du site ;

Le fil d’Ariane est composé de 3 items : le lien vers l’accueil, puis le lien vers la page glossaire
abécédaire et la lettre consultée par l’utilisateur ;

Dans le menu de gauche, la rubrique de niveau 1 « Glossaire » apparaît sur fond bleu en
première position pour toutes les pages de l’abécédaire. Cette rubrique peut éventuellement
apparaître en deuxième position si la rubrique de niveau 1 « Espace perso » est également
activée ;

Le titre de niveau 1 de la page est « Glossaire ». Il apparait en police bleu foncé (#3D6098)
gras, et est suivi de l’alphabet en majuscule. Pour ce qui concerne l’alphabet :



la lettre de la page active est affichée en gras, de couleur blanche et sur fond bleu
foncé ;
les lettres pour lesquelles il existe des concepts sont affichées en gras, de couleur
bleu foncé sur fond blanc ;
les lettres pour lesquelles il n’existe pas de concept sont affichées en bleu foncé, sur
fond blanc, en gras ;


chaque lettre correspond à un lien (vers la page de la lettre concernée) qui n’est pas
souligné par défaut ; le soulignement apparaît au survol.
Les concepts sont affichés sous forme d’une liste. Pour chaque item :




le libellé est un lien renvoyant vers la page descriptive du concept. Il est affiché en
bleu foncé gras et n’est pas souligné (le soulignement n’apparaît qu’au survol avec la
souris). Il est suivi du sigle entre parenthèses quand il en existe un ;
10 px plus bas, est affichée la définition du concept ; le texte est justifié ;
10 px plus bas, est affichée la source éventuelle de la définition. Celle-ci est écrite en
caractères plus petits que la définition (font-size : 0.9em) ;
sur la ligne suivante, alignés à droite, sont affichés un pictogramme si la définition
possède une illustration, et un lien « En savoir plus » renvoyant vers la page
descriptive du concept ;
Figure 19 : Cas d'une définition possédant des illustrations

Les sigles seuls s’affichent de la même manière que les libellés des concepts, dans la liste. Ils
sont par contre suivis directement d’un lien faisant un renvoi vers la page descriptive du
concept. Ce lien de renvoi est en gris (#aaaaaa), gras, italique et n’est pas souligné ;

Dans la colonne de droite, est affiché un bloc présentant le glossaire eaufrance et son mode
de fonctionnement. Le texte de ce bloc est le suivant :
A propos du Glossaire Eaufrance
Techniciens, ingénieurs, scientifiques, services de l'état, élus, ... de nombreux acteurs
produisent et diffusent des informations relatives à l'eau et aux milieux aquatiques, utilisant
des termes spécifiques. Pour faciliter l'échange, améliorer la compréhension des termes et
créer un langage commun pédagogique, un glossaire a été établi par les partenaires du
système d'information sur l'eau (SIE). Son contenu complet est accessible sur le site
Glossaire, mais vous trouverez ici une extraction, correspondant aux termes utilisés dans le
site Gest'eau.
Le glossaire est collaboratif : vous pouvez proposer de modifier ou supprimer certains termes,
d'en ajouter d'autres. Les propositions seront évaluées par un groupe d'utilisateurs,
partenaires du SIE. N'hésitez pas à devenir contributeur, faites vivre le glossaire.

En cas d’utilisation du mode de recherche automatique des concepts du glossaire (module
« glossaire_auto »), les mots détectés doivent apparaître en gras, souligné par des pointillés
(utiliser la propriété CSS, border-bottom : 1px dashed #AAAAAA).
5.3.
Style général de la page descriptive d’un concept
La page descriptive d’un concept est accessible en utilisant une adresse URL du type :
http://www.monsite.eaufrance.fr/glossaire/A/concept
Ci-après, sont décrits les points qui doivent être respectés :
Figure 20 : Exemple d'une page de concept charté pour le site GESTEAU

Le lien « Glossaire » est présent dans le bandeau haut de toutes les pages du site ;

Le fil d’Ariane est composé de 4 items : le lien vers l’accueil, puis le lien vers la page glossaire
abécédaire, le lien vers la lettre concernée et le libellé du concept ;

Dans la rubrique de gauche, la rubrique de niveau 1 « Glossaire » apparaît sur fond bleu en
première position pour toutes les pages descriptives de concept. Cette rubrique peut
éventuellement apparaître en deuxième position si la rubrique de niveau 1 « espace perso »
est également activée ;

Le titre de niveau 1 de la page est le libellé du concept, suivi du sigle entre parenthèses
quand il en existe un. Il apparait en police bleu foncé (#3D6098), gras. La partie centrale de la
page permet d’afficher les champs du concept : l’ordre et l’affichage de ces champs sont ceux
définis par le squelette par défaut ;

Dans la colonne de droite, est affiché un bloc présentant le glossaire eaufrance et son mode
de fonctionnement. Le texte de ce bloc est le suivant :
A propos du Glossaire Eaufrance
Techniciens, ingénieurs, scientifiques, services de l'état, élus, ... de nombreux acteurs
produisent et diffusent des informations relatives à l'eau et aux milieux aquatiques, utilisant
des termes spécifiques. Pour faciliter l'échange, améliorer la compréhension des termes et
créer un langage commun pédagogique, un glossaire a été établi par les partenaires du
système d'information sur l'eau (SIE). Son contenu complet est accessible sur le site
Glossaire, mais vous trouverez ici une extraction, correspondant aux termes utilisés dans le
site Gest'eau.
Le glossaire est collaboratif : vous pouvez proposer de modifier ou supprimer certains termes,
d'en ajouter d'autres. Les propositions seront évaluées par un groupe d'utilisateurs,
partenaires du SIE. N'hésitez pas à devenir contributeur, faites vivre le glossaire.
6. Informations supplémentaires pour les développeurs
Dans cette version, le module de recherche automatique des concepts du glossaire (module
« glossaire_auto ») ne fonctionne que sur les pages présentant le contenu (« content ») d’un nœud.
Par conséquent, cette fonctionnalité ne s’applique pas aux différents blocs, vues (module « views »),
livres (module « book ») ou autres formes de contenu créés par les modules génériques DRUPAL.
Vous pouvez toutefois forcer l’appel de ce traitement en appliquant, au niveau des modules DRUPAL
ou des templates, la fonction: glossaire_auto_search_glossaire_arg($argument)
où
« $argument » est un tableau pouvant contenir les variables suivantes :

txt : chaines de caractères (pouvant contenir du code HTML) dans lesquelles sont recherchés
les mots du glossaire ;

nid : identifiant du nœud (ou tableau d'identifiant) ; les identifiants correspondant seront
éliminés du glossaire pour la recherche automatique ;

cid : identifiant du cache. La bonne pratique est de suivre le pattern suivant :
« ‘glossaire_auto_'.$objet.'_'$field.'_'.$nid » (: « glossaire_auto_node_body_333 », par
exemple)

last_update : timestamp de la dernière mise à jour du concept.

GLOSSAIRE
Terme : Mot, groupe de mots, expression.
Concept : Représentation générale et potentiellement abstraite d'un objet. Par exemple, dans SKOS,
un concept permet de designer à la fois un terme et son sens (le libellé ne permet pas de définir à lui
seul un concept à cause du risque d'homonymie).
Mot : Son, groupe de sons ou de lettres formant une unité de sens.
Nœud : Elément central du modèle de contenu employé par DRUPALl. Dans sa version la plus
simple, un nœud est un objet générique composé d’un titre et d’un contenu de type texte. Toute la
puissance de DRUPAL réside dans la possibilité de spécialiser un nœud en lui adjoignant des champs
supplémentaires. C’est ainsi que l’on va créer ce que l’on appelle un nouveau type de contenu. Ainsi,
chaque élément de contenu présent dans un site DRUPAL est un nœud et chaque nœud appartient à
un type de contenu. La distribution de base utilise deux types de contenu (article et page) : ce sont
des types de contenu génériques qui conviennent à de nombreuses situations. Cependant, en cas de
besoin d'autres types de contenu ; DRUPAL permet de les créer soit par l'intermédiaire de modules
optionnels, soit par l’utilisation d’un module indispensable appelé CCK. Pour différencier un type de
contenu, il est possible d’associer de nouveaux champs. Grâce à ces modules, DRUPAL dispose
d’une multitude de champs qui permettent de stocker des éléments de contenu extrêmement variés :
texte, chiffre, date, url, numéro de téléphone, image, vidéo, carte.
Exemple : pour un site web d’actualités, vous considérez que le contenu de type Article
n’est pas suffisamment structuré, vous pouvez alors créer un nouveau type de contenu
« Article_Journal » et lui adjoindre un sous-titre (champs texte) et une image principale
(champ image). Source : http://drupalfr.org/node/4679#noeud
Syndication de contenu web : Forme de syndication dans laquelle une partie d'un site est
accessible depuis d'autres sites. Cela est possible en y ajoutant une licence accordée à ses
utilisateurs. Bien souvent, la syndication consiste à mettre à disposition un flux RSS avec l’en-tête du
contenu récemment ajouté au site web (par exemple, la dernière news ou le dernier post du forum).
Source : http://fr.wikipedia.org/wiki/Syndication_de_contenu

SIGLES & ABREVIATIONS
API : Application Programming Interface
HTML : Hypertext Markup Language
RDF : Resource Description Framework
RSS : Really Simple Syndication
SIE : Système d’Information sur l’Eau
SKOS : Simple Knowledge Organisation System
W3C : World Wide Web Consortium

TABLE DES ILLUSTRATIONS
Figure 1 : Page d’accueil du site www.glossaire.eaufrance.fr................................................................. 5
Figure 2 : Capture d'écran de la page "glossaire" ................................................................................... 6
Figure 3 : Capture d'écran de la page de configuration des flux de syndication .................................... 6
Figure 4 : Exemple de fonctionnement du glossaire automatique .......................................................... 6
Figure 5 : Page de téléchargement du package glossaire ...................................................................... 8
Figure 6 : Page d'activation des modules Drupal .................................................................................... 9
Figure 7 : Interface Drupal de l'attribution des droits............................................................................. 10
Figure 8 : Interface de configuration des flux de syndication ................................................................ 11
Figure 9 : Formulaire de configuration d'un flux de syndication ............................................................ 11
Figure 10 : Configuration du glossaire_auto : sélection des types de contenu..................................... 14
Figure 11 : Configuration du glossaire_auto : paramétrage des options de recherche ........................ 15
Figure 12 : Configuration du glossaire_auto : sélection du masque de remplacement ........................ 15
Figure 13 : Configuration du glossaire_auto : utilisation d'une liste de mots à ne pas rechercher ....... 16
Figure 14 : Configuration du glossaire_auto : items de gestion du cache du glossaire auto ................ 16
Figure 15 : Configuration des blocs : affichage en fonction des pages ................................................ 17
Figure 16 : Configuration des liens d'interaction ................................................................................... 17
Figure 17 : Exemple du bandeau charté pour le site www.gesteau.eaufrance.fr ................................. 18
Figure 18 : Exemple de page abécédaire charté pour le site www.gesteau.eaufrance.fr .................... 19
Figure 19 : Cas d'une définition possédant des illustrations ................................................................. 20
Figure 20 : Exemple d'une page de concept charté pour le site GESTEAU ......................................... 21

LISTE DES TABLEAUX
Tableau 1 : Table d'attribution préférentielle des droits utilisateur ........................................................ 10
Tableau 2 : Exemples de résultat en fonction du mode de recherche sur un texte de référence......... 13