terminologie

Transcription

terminologie
www.adbs.fr
Ouvrages ADBS
Thésauroglossaire des langages documentaires
Un outil de contrôle sémantique
Danièle Dégez et Dominique Ménillet
Introduction
Table des matières
Introduction
Ce travail de terminologie a eu comme point de départ la révision du Vocabulaire de la
documentation, édité par l’AFNOR en 1987. Plusieurs groupes de travail avaient alors été constitués
pour traiter l’ensemble du vocabulaire. Nous avons participé, plus particulièrement, au sous-groupe
qui avait en charge la définition des termes appartenant au domaine spécifique de "l’analyse, de
l’indexation et des langages documentaires".
C’est dans ce cadre qu’il nous est apparu important d’apporter plus de précision sémantique à chacun
des termes, en redéfinissant des concepts fondamentaux et en approfondissant nos connaissances
acquises à travers notre expérience pratique d’"architectes de thésaurus".
Le vocabulaire spécifique, propre aux terminologues (hyperonymie, hyponymie, méronymie, etc.), n’a
pas été abordé, pour rester dans le strict domaine documentaire. Nous avons pu, cependant,
identifier beaucoup de concepts très proches, voire identiques, dans ces deux domaines.
Par ailleurs, la prise en compte du vocabulaire sur les classifications a enrichi notre réflexion initiale
sur les langages de type combinatoire, en particulier sur les thésaurus, en révélant les similitudes et
les spécificités de chacun de ces langages, dans une vision plus globale et plus harmonieuse.
Cet approfondissement a permis aussi de mieux comprendre la présence et l’intérêt des liens
indissociables entre langages documentaires et organisation des connaissances.
Du glossaire au thésaurus
Toutes les définitions des termes ont été revues, des exemples ajoutés pour illustrer des concepts
souvent trop abstraits. Et c’est ainsi que, d’un simple vocabulaire bilingue accompagné de définitions
et de quelques relations de synonymie et d’association, est née l’idée d’un outil terminologique plus
complet que nous avons nommé "thésauroglossaire".
En effet, la présentation alphabétique des termes s’est révélée insuffisante pour mettre en évidence
toute leur signification. La logique alphabétique crée une sémantique fractionnée, discontinue, ne
laissant pas apparaître la richesse contextuelle, malgré la présence de multiples renvois.
C’est ainsi que, en complémentarité d’un simple glossaire, il nous est apparu essentiel de replacer les
termes dans leur environnement sémantique, en les organisant en véritable thésaurus, avec ses
différentes présentations : liste alphabétique structurée, champs sémantiques, liste permutée. Enfin,
l’adjonction d’un lexique bilingue français-anglais (et inversement) a contribué à enrichir le
vocabulaire, en introduisant des équivalences linguistiques.
Ce travail a démontré clairement que le sens des termes n’apparaît pas uniquement dans leurs
définitions mais aussi dans les relations qu’ils entretiennent entre eux, relations synonymiques,
génériques, spécifiques et associatives. Chaque terme existe en tant qu’entité individuelle mais aussi
par rapport aux autres termes, membres de sa "famille" sémantique.
Le thésauroglossaire, un outil de contrôle sémantique
Le thésaurus, qui ne devait servir que d’illustration et d’exemple, s’est révélé, au fil du travail, un
merveilleux outil de contrôle du glossaire.
Ainsi, l’organisation des termes par champs sémantiques a permis de détecter un certain nombre
d’incohérences difficiles à repérer dans une liste alphabétique. Dans les définitions du glossaire, le
choix des mots et les renvois étaient souvent incompatibles ou non homogènes, malgré une relecture
attentive.
Doit-on parler de "langue" ou de "langage", de "mot" ou de "terme" ? Est-il préférable de choisir
"homonyme" ou "homonymie" ? Quel que soit le choix fait, il doit être le même pour "synonyme" et
"antonyme". Quelle différence peut-on identifier entre "arborescence", "arbre hiérarchique" et "niveau
hiérarchique" ? Doit-on garder tous ces termes ? Des questions se posent aussi pour "clé d’accès",
"point d’accès", "subdivision", "sous-vedette", "qualificatif"… Les notions de "précoordination" et de
"postcoordination", de "langage précoordonné" et de "langage postcoordonné", d’"indexation
précoordonnée" et d’"indexation postcoordonnée" ont fait l’objet de longues discussions !
Des mots ou termes se révèlent très proches dans leurs définitions. Doit-on les garder en
descripteurs dans le thésaurus ou peut-on les considérer comme des équivalents : "analyse
automatique" et "indexation automatique", "présentation systématique" et "présentation
thématique" ?
La lecture seule des définitions, sans adjonction de thésaurus, n’avait pas fait surgir ce besoin
nouveau d’identifier et de situer finement les concepts dans les deux mondes, classificatoire et
combinatoire. Quels termes sont spécifiques à l’un ou l’autre type de langage, ou communs aux
deux ?
Le thésauroglossaire regroupe des termes provenant des thésaurus et des classifications et qui
présentent plus de points communs qu’on ne le supposait au départ. C’est en rassemblant dans un
même champ sémantique du thésaurus tous les types de langage et, dans un autre champ, tous les
éléments constitutifs de ces mêmes langages que sont apparus les points communs entre eux. En
même temps, cette organisation a préservé la spécificité de chacun de ces langages.
Cette problématique "langage classificatoire" et "langage combinatoire" est encore aujourd’hui tout à
fait d’actualité. Serait-il en effet possible d’accéder facilement à une information, parmi toutes celles
présentes sur Internet, sans langage ni outil d’organisation et de recherche ? Les annuaires sur
Internet sont des schémas classificatoires, hiérarchisés, proposant à l’internaute un cheminement
dans des rubriques structurées en une arborescence. Parallèlement, les moteurs de recherche
travaillent, selon un mode combinatoire, avec les mots clés, issus des documents. Ainsi, les exemples
donnés en annexe pour illustrer cet ouvrage ne sont pas exclusivement issus de thésaurus ou de
classifications traditionnelles, mais aussi d’outils d’organisation des connaissances présents sur le
Web.
Les différentes présentations choisies pour la partie thésaurus de cet ouvrage ne sont pas que de
simples visualisations des relations entre les termes ; elles ont contribué pleinement, chacune en
complémentarité avec les autres, à nous donner des clés de contrôle sémantique :
la structuration par champ sémantique hiérarchisé est apparue comme un moyen très
performant pour vérifier la bonne "harmonie" des termes entre eux, gage de la qualité
des définitions choisies pour les concepts qu’ils représentent. L’organisation
hiérarchique nous a amenées, par exemple, à nous demander si "lexique", "liste
d’autorité" et "liste de vedettes matière" sont bien des termes spécifiques de "langage
combinatoire" ;
la liste alphabétique structurée, présentation minimale obligatoire de tout thésaurus,
apporte la richesse du rassemblement synthétique de toutes les informations relatives
à chacun des termes (équivalents anglais, relations sémantiques, notes d'application).
La réalisation de cette liste donne un éclairage complémentaire au travail de
structuration des termes par champ sémantique, en l'enrichissant de synonymes et de
termes associés ;
la liste permutée a permis de rapprocher sémantiquement et visuellement les termes
composés contenant le même mot et de les présenter ainsi dans un environnement
significatif. Cette présentation met en évidence la présence d'un concept dans les
différents termes qui le contiennent. Elle permet également de retrouver les concepts,
par l'ordre alphabétique des adjectifs qui, en français, sont le plus souvent porteurs de
sens et non accessibles dans l'ordre naturel des termes.
Enfin, le lexique bilingue français-anglais apporte aussi du sens aux termes. Ainsi, si l’équivalent
anglais n’existe pas ou n’est pas une traduction exacte du terme français, il faut réidentifier le plus
précisément possible le concept que le terme représente, donc revenir à une réflexion sur sa
signification. Un terme peut être plus précis en français, dans d’autres cas ce sera le terme anglais.
Autant de questions qui enrichissent le travail terminologique.
Deux approches complémentaires
La complémentarité de l’approche terminologique du glossaire et celle de l’élaboration d’un langage
documentaire structuré, le thésaurus, nous a semblé nécessaire à la qualité de l’un et de l’autre. Que
de fois la modification d’une définition du glossaire a conduit à bouleverser les champs sémantiques
du thésaurus ! Et, inversement, la structuration d’un champ sémantique nous a souvent obligées à
revoir des définitions. De même, la réalisation de chacune des présentations du thésaurus a permis
d’exercer un contrôle rigoureux du sens des termes et de leurs relations.
Ces contrôles permanents ont contribué à l’équilibre de l’ensemble, pour aboutir à l’"architecture"
solide et harmonieuse du thésauroglossaire qui s’est installée, pas à pas, après vérification et
confirmation des choix.
_______________________
Nous aimerions inviter tous ceux qui réalisent des travaux de terminologie dans tout autre domaine à
expérimenter notre démarche.
Nous souhaiterions les inciter à rapprocher thésaurus et glossaire pour aider à la précision
sémantique du vocabulaire, véhicule indispensable de nos connaissances.
Table des matières
Remerciements
Sommaire
Introduction
Du glossaire au thésaurus
Le thésauroglossaire, un outil de contrôle sémantique
Deux approches complémentaires
Présentation générale
Présentation du glossaire
Présentation du thésaurus
1 - La liste alphabétique structurée
1.1 - Le champ sémantique
1.2 - L’équivalent anglais
1.3 - Les relations sémantiques
1.3.1 - La relation d’équivalence
1.3.2 - La relation hiérarchique
1.3.3 - La relation associative
1.4 - La note d’application
2 - Les champs sémantiques
3 - La liste permutée
4 - Les normes d’abréviations
Présentation du lexique bilingue
Le glossaire
Le thésaurus
Liste alphabétique structurée
Structuration par champ sémantique
Liste permutée KWIC
Le lexique bilingue
Lexique français-anglais
Lexique anglais-français
Annexes - Exemples de langages documentaires
Sommaire des annexes
Liste des langages documentaires présentés en annexe
Classification décimale universelle (CDU)
Principales classes
Exemple de subdivision d’une classe
Extrait d’une classe
Tables auxiliaires
Classification décimale de Dewey (CDD)
Extrait des cent divisions
Table abrégée
Colon classification
Exemple de facettes
Plan de classement PASCAL
Extrait d’une rubrique du plan de classement français-anglais
Lexique PASCAL
Lexique français-anglais-espagnol
Liste de vedettes matière RAMEAU
Extrait de la liste
Thésaurus du CEMAGREF
Liste alphabétique structurée
Champ sémantique avec présentation hiérarchique - Microthésaurus
Liste permutée KWIC
Thésaurus de la CNAF
Liste alphabétique structurée
Champs sémantiques avec présentation hiérarchique - Microthésaurus
Liste permutée KWIC
Thésaurus de l’eau
Liste alphabétique structurée
Champ sémantique avec présentation hiérarchique
Liste permutée KWIC
Thésaurus du management
Liste alphabétique structurée
Champ sémantique avec liste alphabétique - Microthésaurus
Schéma fléché
Liste permutée KWIC
Thésaurus BDSP
Liste alphabétique structurée
Terminogramme - Microthésaurus
Champ sémantique avec liste alphabétique
Liste permutée KWIC
Thésaurus IBISCUS
Liste alphabétique structurée du thésaurus géographique
Thesaurofacet
Classements systématique et alphabétique
Thésaurus BIT
Liste alphabétique structurée anglais-français-espagnol
Thésaurus biomédical Pascal/MeSH français/anglais
Liste alphabétique structurée des descripteurs français MeSH
Présentation hiérarchique
Liste permutée KWOC
Index français Pascal/MeSH
Index anglais-français des descripteurs MeSH
Macrothésaurus de l’OCDE
Liste alphabétique structurée trilingue
Plan de classification
Liste hiérarchique
Liste permutée KWOC
EUROVOC : thésaurus multilingue
Liste alphabétique structurée
Champ sémantique avec présentation hiérarchique
Liste alphabétique multilingue
Thésaurus de l’OIE (http://eaudoc.oieau.fr/sie/)
Liste alphabétique
Présentation hiérarchique
Thésaurus de la photothèque du CNRS (http://phototheque.cnrs.fr/
WebTek/)
Liste alphabétique
Présentation hiérarchique
Thésaurus MeSH (http://www.nlm.nih.gov/mesh/2K/MeSHtree.html)
Présentation hiérarchique par écrans successifs
Répertoire Yahoo France (http://fr.yahoo.com)
Présentation hiérarchique par écrans successifs
Répertoire Nomade (http://www.nomade.fr)
Présentation hiérarchique par écrans successifs
Bibliographie sur les langages documentaires
Livres et monographies
Normes
Articles et contributions à des ouvrages collectifs
Webliographie : sites web (consultés le 23/04/2001)