PDF du texte dans la version HDR

Transcription

PDF du texte dans la version HDR
T17
Évolutions informatiques en lexicographie :
ce qui a changé et ce qui pourrait émerger 1
Résumé
L’outillage informatique occupe une place grandissante dans les travaux des éditeurs
français de dictionnaires commerciaux. Cette étude met en perspective les effets perceptibles de la mutation engagée depuis plus de dix ans et explore prospectivement ce qui
pourrait advenir : si les modes de conception et de rédaction et les interactions entre
la lexicographie et l’informatique éditoriale ont très significativement été modifiés, le
changement engagé pourrait aussi permettre de concevoir de puissants environnements
documentaires, constitués de ressources éditoriales et d’extraits d’études linguistiques,
et des produits neufs, créés pour l’édition électronique, comme un dictionnaire qui, pour
mieux aider les écoliers et collégiens à comprendre tous les énoncés et à diversifier et
normaliser leur expression, fournirait des sélections d’informations ciblées et explicites
dans des affichages variés.
[235 Ð
0.
Introduction
La présente contribution 2 cherche à évaluer quelles sont les pratiques observées
ou qui pourraient émerger du fait de la place grandissante des outils informatiques
dans l’édition commerciale de dictionnaires. L’intérêt pour cette activité professionnelle
est motivé par le fait qu’elle a des contraintes différentes de celles de la lexicographie
publique ou collaborative, qu’elle fournit les répertoires les plus communément employés
et qu’elle ne peut pas se contenter de publier des ébauches de dictionnaires, même
quand elle cherche de nouvelles formules 3. Cet intérêt a en outre été aiguisé par les
[235 Ð
1
2
3
Merci à Pierre Corbin pour son soutien constant, aux intervenants professionnels (cf. Corbin & Gasiglia (2009b,
n. 5), dans ce volume) du Master 2 e année “ Lexicographie, Terminographie et Traitement Automatique des
Corpus” (université Lille 3, http://stl.recherche.univ-lille3.fr/siteheberges/LTTAC/Interventions.htm) pour
la richesse de leurs témoignages, à Nicolas Arbouin, Martin Demontigny et Wanda Rzewuski pour leurs
réponses concernant les correcteurs orthographiques (cf. n. 64), à Luc Audrain pour son aide documentaire
et à Alise Lehmann pour sa relecture.
Les contenus accessibles à partir des URL mentionnées dans cet article ont été visités et contrôlés pour la
dernière fois le 10 avril 2009.
Dans le domaine encyclopédique, toutefois, les éditions Larousse offrent à la consultation un texte en évolution
au moins partielle, celui de l’Encyclopédie contributive Larousse (http://www.larousse.fr/encyclopedie/ : « Dé-
2009d, Lexique 19 (« Changer les dictionnaires ? », Pierre Corbin & Nathalie Gasiglia dir.), pp. 224-298.
[Article dans une revue internationale avec comité de lecture ; rédigé en 2008-2009 ; 225 306 caractères]
800
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
témoignages annuels 4 de lexicographes décrivant l’évolution de leur pratique et d’informaticiens présentant une partie de la veille technologique qui constitue leur quotidien.
Conséquemment, bien qu’également inspiré par des réalisations du monde universitaire,
le propos se limitera à des orientations compatibles avec les exigences particulières
des entreprises privées, qu’il s’agisse de contraintes de rentabilité ou de gestion de très
gros volumes de données (correspondant à un nombre croissant de produits commercialisés synchroniquement ou au fil du temps).
[236 Ð
Le travail d’investigation mené couvre plusieurs compartiments de la lexicographie
éditoriale. Il vise à présenter ce qui est stable, ce qui vient de se mettre en place et ce
qui pourrait encore changer du fait d’évolutions informatiques influant sur cette activité, en adoptant un ordre de présentation chronologique 5, assez comparable à celui
retenu par Atkins & Rundell (2008) : de la documentation préalable à toute rédaction,
qui alimente la culture linguistique des lexicographes, aux produits éditoriaux mis sur
le marché. Dans ce cadre, les tâches qui constituent l’activité la plus centrale (conception,
documentation ciblée, rédaction, révision, édition) occupent logiquement la place médiane de cette étude. Un centrage alternatif du propos sur les changements effectifs
n’aurait accordé de place qu’à ces tâches, qui sont en mutation depuis plus de dix ans
(ce qui a très significativement modifié les activités de l’informatique éditoriale) et qui
seraient certainement susceptibles de tirer un meilleur profit encore des évolutions
techniques qu’elles connaissent, en particulier en offrant un nouvel environnement
documentaire aux lexicographes (de plus en plus souvent externes et/ou temporaires)
afin de consolider la qualité linguistique des produits et en mobilisant de nouveaux
4
[236 Ð
5
couvrez une encyclopédie totalement inédite qui vous permettra de consulter à la fois les articles Larousse
(en orange) et les articles écrits par les internautes contributeurs (en violet). »).
Dans le cadre du master LTTAC (cf. n. 1), lors des interventions de professionnels et des suivis de stages,
nous avons de multiples contacts avec différents éditeurs qui ont une activité dictionnairique identitaire ou
significative.
Cette chronologie, comme le découpage de l’activité des lexicographes proposé par P. Corbin (2004), ne reflète
pas la segmentation effective des activités mais constitue une conceptualisation des types de tâches exploitée pour évoquer les changements méthodologiques induits par l’amplification de la place des outils informatiques, qui actuellement n’affecte pas sensiblement les produits, mais qui pourrait encore être accrue pour
mieux aider les lexicographes. Trois strates sont décrites par P. Corbin et reprises dans cette étude :
1) La strate métalinguistique subsume deux phases :
– d’une part la documentation qui couvre ce qui relève de la prise de connaissance des savoirs établis dans
les divers domaines linguistiques (lexicologie dans toutes ses composantes, sociolinguistique, etc.), du repérage
des types d’informations insérables dans les futures descriptions lexicales et de la recherche des propriétés
de chaque item, tâches qui font l’objet d’une attention inégale chez les éditeurs et qui pourraient significativement évoluer chez ceux qui consacreraient des moyens à l’intégration rationnelle d’outils documentaires
informatisés ;
– d’autre part, lors de l’élaboration d’un projet, l’identification des types d’informations linguistiques à fournir
pour chaque item, puis la sélection de nomenclature.
Les évolutions méthodologiques motivées par la disponibilité de nouvelles solutions informatiques et qui concernent la première phase sont développées au § 1., le § 2.1. se concentrant sur les aspects documentaires
synchrones avec les tâches de conception de projet et de rédaction.
2) La strate discursive correspond à la rédaction effective des articles : la manière de textualiser les informations fournies tient compte du projet, du public destinataire et des structures d’articles prévues (cf. § 2.2.).
3) La strate de posttraitement réunit ce qui donne aux dictionnaires leur personnalité visuelle (dont dépend
leur lisibilité), et ce qui les dote de fonctions de consultation avancées s’il s’agit d’une version électronique
(cf. §§ 2.3. et 3.).
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
801
savoir-faire (comme ceux de développeurs d’applications informatiques) afin de créer
des produits réellement conçus pour l’édition électronique, qui pourraient en premier
lieu cibler les plus jeunes utilisateurs (initiés à l’informatique dès l’école primaire et
le collège).
[237 Ð
Certaines des orientations défendues ci-après semblent pouvoir être mises en œuvre
dans les entreprises, alors que d’autres ont une probabilité de réalisation plus réduite,
du fait qu’elles impliqueraient des investissements difficilement assumables actuellement par les éditeurs commerciaux. La présentation de celles-ci dans le contexte d’une
publication spéculative est motivée par une recherche des mutations théoriquement
envisageables, qui évalue leur profit possible mais ne prend volontairement pas en
compte les contraintes économiques avec lesquelles les éditeurs doivent composer.
Débuter cette réflexion par la documentation métalinguistique 6 conçue comme une
activité nécessaire pour les lexicographes, qui doivent rester de fins observateurs de
la ou des langue(s) qu’ils décrivent tout en diversifiant leurs compétences, conduit à
convoquer les corpus et les outils qui permettent de les explorer, mais, outre ces ressources (mieux installées dans les pratiques britanniques que françaises et qui ne
semblent pas avoir beaucoup d’avenir en France (cf. Corbin & Gasiglia (2009b, § 5.),
introduisant ce volume)), ce sont la veille documentaire et la compilation de données
dictionnairiques qui sont évoquées, afin d’envisager comment il serait pertinent de
leur donner une place plus consistante. Bien qu’apparemment peu utile en cette période
de gestion de catalogues par changements de couvertures, métissages ou dérivations
de répertoires existants sans création textuelle, il se peut que la structuration en
base documentaire d’une sélection d’archives présente une certaine urgence dans la
mesure où les équipes de rédacteurs comptent encore des lexicographes d’expérience
qui ont fait leur carrière chez un éditeur dont ils connaissent les usages et les produits
antérieurs, mais qui, bientôt retraités, n’auront guère été en situation de transmettre
leur savoir autrement qu’en contribuant à faciliter les exploitations futures du fonds
éditorial.
Terminer cette étude par des orientations pour un dictionnaire électronique pour
l’école et le collège ne consiste pas à présenter le cahier des charges d’un produit, mais
plutôt, avec modestie et sans que ce soit dans le cadre d’une collaboration avec un éditeur, à suggérer sur quels types de pistes pourraient s’engager des recherches en vue
de l’élaboration d’un produit électronique novateur susceptible de contribuer à éduquer
le jeune public à l’analyse de la langue dont il apprend le maniement, et ainsi de lui
donner l’envie de consulter un bon dictionnaire plutôt qu’une ressource aléatoire dont
il peut ne tirer qu’un profit relatif. La conception de descriptions lexicales de qualité,
explicites, valorisant les propriétés linguistiques en jouant sur des affichages variés,
rendant la richesse des indications réunies perceptible et répondant à de multiples
[238 Ð
besoins constitue un projet complexe, ambitieux et important pour
que le secteur
de la référence puisse trouver une meilleure place auprès d’un public appelé à rédiger
[237 Ð
6
L’étude est focalisée sur les données métalinguistiques, mais l’élaboration des contenus non linguistiques
des dictionnaires dits “encyclopédiques” pourrait bénéficier de méthodes de documentation comparables à
celles présentées aux §§ 1.2. à 1.4. (pour autant que ce type de documentation ne serait pas pris en charge
à titre individuel par des experts externes).
802
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
et lire beaucoup de documents électroniques dans les environnements scolaires et personnels puis professionnels.
1.
Changer les modes de documentation
Les dictionnaires pris en compte dans cette étude sont tous des répertoires qui fournissent une sélection d’informations discursives, linguistiques et métalinguistiques 7,
en accordant une place plus ou moins importante à chacune de celles qui sont formulables
à propos de chaque unité linguistique décrite. Avant de définir la manière rédactionnelle de chacune et son mode de présentation, les concepteurs de projets doivent donc
sélectionner les types de données à présenter, ce qui implique qu’ils aient à la fois une
intuition fine du potentiel informationnel des dictionnaires et une bonne perception
des types de savoirs à fournir pour documenter au mieux les futurs utilisateurs des
ouvrages en gestation. Simultanément ils doivent prévoir les interactions susceptibles
d’exister entre les informations qui seront fournies afin de les distribuer stratégiquement dans les différents composants d’articles.
Afin que la rédaction d’un nouveau dictionnaire débute, les chefs de projets doivent
en outre expliquer aux rédacteurs les choix opérés et leur indiquer comment se documenter et sélectionner les informations pour ne pas en omettre d’importantes. Pour
cela, les sources documentaires peuvent être de quatre ordres : des “corpus”, une compilation structurée de ressources dictionnairiques de chaque éditeur 8, une collecte de
produits d’études lexicologiques ou une ressource métalinguistique unique. Ci-après,
l’ordre de présentation de chacune reflète l’accroissement de leurs ambitions documentaires et des investissements qu’elles impliqueraient. Il reflète donc également la réduction de leur probabilité de réalisation.
1.1. Corpus
Les “corpus”, que le terme ait été employé pour désigner une collection de documents
[239
primaires, constituée avec un objectif précis Ðinfluant sur leur sélection et éventuellement sur leur échantillonnage, une compilation plus opportuniste (des archives de
presse en particulier) ou l’accès commode à des textes (comme ceux disponibles sur le
web), ont mobilisé beaucoup d’auteurs qui ont défendu (ou non) leur emploi en lexicographie. Concernant ce type de ressource, les préoccupations des lexicographes ont
croisé celles des linguistes et des informaticiens, qui ont d’autant plus investi qu’ils en
attendaient beaucoup. Il en résulte une production foisonnante d’études de faisabilité
[238 Ð
7
8
Si les dictionnaires dits “de langue”, qui sont des répertoires métalinguistiques éventuellement enrichis de
citations (littéraires en particulier), ont vocation à soutenir autant la compréhension que l’expression riche
et normée, les dictionnaires dits “encyclopédiques”, en tant que répertoires métalinguistiques qui fournissent
aussi des informations sur les objets du monde que les items lexicaux nomment, sont plutôt destinés à servir
la seule compréhension.
La structure de cette compilation devrait faciliter la réexploitation des textes qui constituent le patrimoine
intellectuel de l’entreprise.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
803
ou de plus-values et de projets de développement de ressources et d’outils d’exploration.
Ces travaux, motivés par l’espoir d’accéder au fonctionnement “réel” de chaque langue,
ont permis que l’exploration de corpus soit assez bien connue dans son principe à défaut
d’être utilisée massivement chez les éditeurs privés français. 9
Un premier constat est que les corpus de langue française sont souvent constitués
pour la recherche et sont donc très rarement disponibles pour les éditeurs 10, ce qui,
après une phase de spéculations, les a incités à pallier la pénurie. Dans ce contexte,
deux ressources ont été exploitées : des archives de presse 11, qui ont été diversement
[240
appréciées, certains seulement en ayant tiré un profit jugé positif Ðau regard du temps
consacré au dépouillement, et le web, exploré en parcourant du regard des textes sélectionnés par les moteurs de recherche puis par les rédacteurs (à partir des “snippets” 12)
ou en ne posttraitant que les snippets, qui fournissent des contextes d’emploi souvent
partiels mais retravaillables afin d’obtenir des exemples interprétables, informatifs et
apparemment “authentiques”. 13
[239 Ð
9
10
11
[240 Ð
12
13
Les auteurs qui se sont exprimés à propos du recours aux corpus en lexicographie ont relaté leur expérience,
que celle-ci touche un corpus d’éditeur (comme Citron & Widmann (2006)) ou l’emploi de données du web
(comme Kilgarriff & Grefenstette (2003) et Braasch (2004)), ou évalué l’apport des données attestées à propos d’objets particuliers (comme les descriptions de “mots nouveaux” pour Laufer (1992), les patrons de constructions pour Hanks (2004)) ou de manière plus transversale (comme Béjoint (2007) et Atkins & Rundell
(2008, § 3.)), etc. Le nombre de contributions impliquant des corpus dans les actes des colloques EURALEX,
par exemple, témoigne de leur importance pour les chercheurs. Il n’est cependant pas certain qu’en France
l’ensemble de ceux qui œuvrent à la rédaction des dictionnaires aient les moyens d’avoir un avis documenté
les concernant : rares probablement sont les lexicographes qui ont eu la possibilité d’expérimenter comparativement leur emploi et leur non-emploi pour un même type de tâches (cf. n. 18).
Les éditeurs pourraient ne pas être les plus démunis pour constituer des compilations de textes publiés par
eux-mêmes ou par certains de leurs partenaires – qu’il s’agisse de textes littéraires ou techniques, d’œuvres ou de
manuels – et exploitables comme corpus. La disponibilité des textes en versions électroniques explorables
par leurs concordanciers pourrait permettre aux lexicographes d’évaluer les propriétés des items attestées
dans ces données et d’y sélectionner le cas échéant des contextes à citer qui illustrent remarquablement
certains emplois ou qui sont à valoriser pour la notoriété de leur auteur ou de l’œuvre source, pour la technicité de bon aloi des énoncés, pour la cohérence de l’environnement fictionnel de référence (en particulier
pour des dictionnaires destinés à un jeune public comme Mon premier dictionnaire avec Martine, ancré dans
l’univers de cette héroïne de littérature de jeunesse), etc.
Les concordanciers, qu’ils soient autonomes ou intégrés dans les interfaces de consultation de ces archives
conçues pour de la recherche documentaire thématique (par mots-clés, par dates, etc.), ne fournissent pas
des relevés des propriétés syntaxiques et sémantiques attestées qui soient directement utilisables : la part
de postanalyse des contextes extraits est souvent très importante et la qualité des informations fournies est
dépendante des règles linguistiques et/ou des méthodes statistiques implémentées dans ces outils, quand
ils ne se limitent pas à présenter des listes de contextes de chaque chaîne de caractères cherchée.
Les snippets sont les courts extraits de contextes fournis dans les listes de résultats retournés par les moteurs
de recherche en réponse à une requête.
Le web pourrait utilement compléter le travail de ceux qui traquent les “mots nouveaux” en vue de l’enrichissement des répertoires produits. Il s’agirait alors d’y évaluer la diffusion des néologismes déjà repérés et
d’y tester l’usage effectif des mots jugés possibles mais supposés non attestés ou rares (cf., dans le monde
universitaire, Dal & Namer (2000), qui créent des mots possibles et en cherchent des attestations, ou Namer
(2003), qui propose une chaîne de traitement qui va de l’extraction de textes sur Internet à l’analyse morphologique des mots qu’ils contiennent). L’actualité et la diversité des textes ainsi explorables feraient du
web un corpus pertinent dans ce cadre. Il ne semble cependant pas être exploité de cette manière chez les
éditeurs. Seules paraissent avoir été menées des expériences de collecte de toutes les formes graphiques non
répertoriées, mais la grande quantité de fautes de frappe et d’écritures “atypiques” bruite trop le produit de
cette exploration pour qu’elle soit effectivement exploitable.
804
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
Depuis quelques années, Adam Kilgarriff et différents collaborateurs promeuvent
auprès des lexicographes l’emploi de “portraits” 14 pour connaître le fonctionnement des
items lexicaux (cf. Kilgarriff & Tugwell (2002) ou Kilgarriff & al. (2004)). Ces portraits
sont élaborés en explorant de très gros corpus et ils correspondent à des listes de cooccurrents réguliers d’un item classés selon les relations syntaxiques qu’ils semblent
entretenir avec ce dernier (cf. Béjoint (2009, § 3.3.7.), dans ce volume, pour un exemple
relatif à l’item bank). 15 Ces portraits n’ont pas, dans les maisons d’édition françaises,
un accueil commensurable à celui qu’ils semblent recevoir dans le monde britannique 16.
Ce décalage peut être à corréler avec le fait que les lexicographes qui travaillent sur
le français accorderaient aux descriptions de collocations et de cooccurrences une place
[241 Ð
moindre que leurs homologues qui travaillent sur
la langue anglaise 17, que cette
différence soit imputable aux traditions lexicographiques, aux modèles de dictionnaires
ou au fonctionnement des langues. Mais cette différence d’accueil peut aussi être induite
par le processus d’élaboration des portraits :
– Dans la mesure où il s’agit de repérer les comportements lexicaux les plus réguliers,
des résultats probants ne peuvent être fournis qu’en explorant une très grande quantité
de données. En conséquence, les promoteurs du Sketch Engine ont préconisé l’exploitation du web comme corpus, ce qui peut être handicapant pour une communauté linguistique qui perçoit sans doute plus souvent le web comme une ressource de piètre
qualité que comme un gros et fiable stock de données reflétant le “bon usage” de la langue
française.
– Par ailleurs, le repérage des régularités s’opère en estompant les disparités non significatives, ce qui peut faire craindre des approximations descriptives, et notamment le
masquage de propriétés rarement attestées mais pertinentes pour une description minutieuse.
14
15
16
[241 Ð
17
Ces portraits (“word sketches”) sont générés par un outil, Sketch Engine, développé par Lexical Computing
Ltd. (dirigé par A. Kilgarriff ). Selon le site présentant cet outil (http://www.sketchengine.co.uk/), il est employé
pour effectuer de la désambiguïsation sémantique notamment en lexicographie : « Word Sketches were first
used in the Macmillan English Dictionary for Advanced Learners (2002, Edited by Michael Rundell). […] The
SkE is in use for lexicography at Oxford University Press, FrameNet, Collins, Chambers Harrap, Macmillan
and elsewhere. ».
Les relations syntaxiques sont repérées automatiquement, à partir de l’ordre de surface des constituants de
chaque phrase ou proposition, ce qui n’exclut pas un certain nombre d’analyses fausses que la grande quantité
de données est censée rendre non perceptibles en les masquant avec de gros volumes d’analyses valides.
Les propos de Rundell (2002) dans la préface du Macmillan English Dictionary for Advanced Learners sont
très positifs : « Intelligent data-extraction software enables us to get maximum value from the corpus, and
we have benefited from a collaboration with the University of Brighton’s Information Technology Research
Institute. The resulting ‘Word Sketches’, which provide a rich account of the collocational and syntactic
behaviour of the core vocabulary of English, have enabled us to describe these features in greater depth
than ever before. ».
Corbin & Gasiglia (2009b : 17-19), en écho à Blumenthal & Hausmann (2006 : 7), nuancent ce point en rappelant la présence d’une rubrique combinatoire spécifique dans le Trésor de la langue française et en pointant
la publication récente du Dictionnaire des combinaisons de mots du Robert (2007).
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
805
Des risques spéculés qui viennent d’être invoqués, aucune conclusion ne peut être tirée :
ils n’épuisent probablement pas les raisons qui pourraient expliquer la non-pénétration
à ce jour des portraits dans les travaux lexicographiques français 18.
Statuer sur ce qui fait que les corpus n’ont pas pleinement trouvé leur place dans
les maisons d’édition françaises alors qu’ils ont constitué un objet d’intérêt pour une
partie des lexicographes est tout aussi incertain. Est-ce dû à la lourdeur perçue des
posttraitements, qu’une amélioration des performances d’analyse des outils d’exploration pourrait réduire ? Est-ce lié à l’indétermination de ce qui est pris en compte quand
le web est utilisé comme corpus et au manque de ressources mieux adaptées aux différents projets dictionnairiques ? Est-ce encore, chez certains, une question de méthode
de travail, plus respectueuse des traditions que friande de pratiques novatrices ? Les
pistes de réflexion sont diverses et il est probablement trop tôt encore pour déterminer
ce qui pèse le plus. Il semble cependant clair que ce ne sont pas les corpus qui constitueront prochainement les meilleures sources d’information chez les éditeurs français.
1.2. Compilation structurée de ressources dictionnairiques
Alternativement, les éditeurs pourraient exploiter leur propre production plus systématiquement encore qu’ils ne semblent le faire. En effet, les produits lexicographiques
[242
|
étant de plus en plus Ðsou vent rédigés dans des environnements structurés (éditeurs
de documents XML 19 ou éventuellement bases de données SQL 20), les constituants
des articles produits sont de plus en plus aisément extractibles sélectivement afin de
documenter la rédaction de répertoires inédits. 21 Le réemploi de données n’est pas
nouveau, mais il est généralement conçu dans une perspective de réécriture à partir
d’anciens textes : dérivation d’un texte à partir d’une source unique ou de la fusion de
plusieurs 22, ou reprise ciblée ne concernant que certains éléments pertinents puisés
dans différentes ressources du fonds éditorial. Or ce réemploi pourrait aussi être envisagé autrement, de manière à permettre à ceux qui devront écrire de nouveaux textes
de se documenter à partir de toute la richesse des précédents, et ainsi se limiter à la
18
[242 Ð
19
20
21
22
En France, il semble qu’un seul éditeur ait adopté Sketch Engine, et encore l’a-t-il fait à date trop récente pour
que les améliorations descriptives susceptibles d’être apportées par cet outil soient observables dans ses
publications.
eXtensible Markup Language.
Structured Query Language.
D’autres ouvrages, rédigés avant l’emploi de structurations informatiques mais jugés comme étant de première importance pour la dérivation de nouveaux produits, peuvent être rétroconvertis (souvent à partir des
données des imprimeurs, parfois en ressaisissant le texte).
Quand un dictionnaire (D1) est utilisé pour en produire un nouveau (DN ) par dérivation mais que la nomenclature de l’ouvrage DN est augmentée par rapport à celle de D1, il est possible de puiser dans un autre dictionnaire du fonds (D2) pour en extraire les articles qui y décrivaient les items à ajouter à la nomenclature
du nouveau répertoire. Les rédacteurs n’ont ensuite qu’à réécrire les articles issus de D2 pour qu’ils s’harmonisent avec ceux de D1 révisés pour DN. La comparaison de nomenclature, la fusion et éventuellement la
restructuration “ mécanique” des articles sont généralement faites par l’informatique éditoriale en fonction
des recommandations du chef de projet, mais la sélection de nomenclature ajoutée et les réécritures fines
restent à la charge de ce dernier ou de ses collaborateurs.
806
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
compilation des productions novatrices antérieures 23 ou, mieux, constituer une valorisation de ce patrimoine. À cette fin, le fait que les natures des informations présentes
dans les textes déjà rédigés puissent être repérées, pour chaque segment de texte qui
les exprime, indépendamment des délimitations des composants d’articles où elles sont
formulées 24 et le fait que certaines de ces informations puissent être marquées comme
[243 Ð
|
ayant été traitées avec une minutie particulière dans certains ouvrages
per mettent
d’envisager des extractions sélectives des descriptions déjà effectuées les plus proches
de ce qui doit être produit, afin de ne mettre à la disposition des rédacteurs que ce qui
leur procurerait le meilleur rendement documentaire.
Le type de compilation envisagé ici 25 pourrait être une réaction doublement adaptée
aux évolutions des pratiques professionnelles actuellement observables : (i) les besoins,
à première vue peu compatibles, d’améliorer la qualité descriptive des ouvrages de référence publiés et de consacrer le moins de temps possible à la documentation préalable
à la rédaction afin d’augmenter les cadences de production de chaque rédacteur 26, et
(ii) le souhait de donner aux produits une marque “maison”, qui signe leur appartenance au catalogue d’un éditeur, alors qu’il est de plus en plus fréquent que les équipes
comptent une proportion non négligeable de rédacteurs externes, recrutés pour l’élaboration d’un produit mais peu ou pas formés sur le terrain par les lexicographes les
plus aguerris des entreprises, qui restent seuls à connaître les richesses des autres
ouvrages des catalogues. 27
23
24
[243 Ð
25
26
27
Il ne servirait à rien de stocker plusieurs fois un même segment de texte exploité dans différents produits
éditoriaux.
Actuellement, quand des données sont reprises, elles le sont par articles ou par composants d’articles. La
seconde option permettrait de mieux cibler ce qui serait repris, mais il semble qu’il serait alors impératif
de tenir compte du fait que certaines informations sont susceptibles de figurer dans différents composants
(par exemple, un synonyme dans le composant de synonymie ou dans la définition, une indication orthographique en adresse, dans une remarque ou dans une contextualisation), ce qui peut être textuellement motivé dans un dictionnaire mais qui ne le serait plus nécessairement dans un autre. La souplesse distributionnelle des types d’informations fournis dans les composants d’articles est une caractéristique des dictionnaires assez bien partagée. Elle ne doit cependant pas induire de silences dans une compilation éditoriale
dont l’objet est de documenter au mieux les rédacteurs. Pour que des textes dictionnairiques soient correctement intégrables à la compilation et que chaque information puisse bien être repérée quelle que soit sa
localisation dans le texte d’origine, il serait par conséquent utile d’y insérer un codage des types d’informations en plus des délimitations de constituants.
La réalisation d’une compilation documentaire de ce type ne poserait pas de problème technique, même dans
l’hypothèse d’une restructuration partielle des textes qui y sont intégrés (cf. n. 24).
P. Corbin seul (1998 et 2008) ou avec F. Corbin (2008) a exprimé des inquiétudes fondées sur des faits d’observation qui montrent bien que la recherche des réductions de temps de production ne s’accompagne pas
naturellement d’une amélioration des produits (cf. aussi Béjoint (2009 : 127-128)). Il n’en demeure pas moins
que, dans le cadre d’une réflexion portant sur la rationalisation positive des méthodes de travail, les gestionnaires pourraient décider de chercher à gagner sur les deux terrains.
Profitant de leur expérience interne, les lexicographes pourraient contribuer au rayonnement du patrimoine
d’une entreprise en définissant, avec l’équipe d’informatique éditoriale, les éléments des dictionnaires qui
mériteraient d’entrer dans la base parce qu’ils documenteraient validement les rédacteurs des futurs projets.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
807
1.3. Collecte des produits d’études lexicologiques
Les lexicographes sont supposés être de bons observateurs des usages langagiers
et de leurs évolutions, certains ont même une culture et une sensibilité linguistiques
remarquables, mais l’évolution de leurs conditions de travail fait qu’ils doivent élargir
leurs compétences et que cette polyvalence peut induire une moindre disponibilité sur
le terrain métalinguistique. Par ailleurs, de nombreuses études (produites le plus souvent dans le monde universitaire) pourraient utilement les documenter, mais ils ne
les connaissent pas nécessairement 28, n’y ont pas aisément accès ou n’ont pas le temps
d’en tirer un plein profit.
[244 Ð
Afin de soutenir les lexicographes dans l’appropriation des études lexicologiques pertinentes 29, il serait souhaitable que les services de documentation des maisons d’édition indexent les productions les plus directement utilisables et les leur rendent aisément consultables. Ceci pourrait faire porter la charge de la veille documentaire sur
un petit effectif de personnes 30 et permettrait aux rédacteurs de ne consulter que ce
qui est le plus utile pour leur culture générale ou pour un projet particulier, ce qui
nécessiterait de définir des critères de sélection des documents qui répondent à des
besoins au-delà des projets en cours. Dans ce cadre, il pourrait être particulièrement
intéressant d’indexer les exemples fournis dans une sélection de publications linguistiques. S’agissant par exemple d’études de morphologie, ce dispositif permettrait aux
lexicographes qui décriraient les constructions d’items dérivés d’accéder aux analyses
déjà produites pour chacun 31. Mais il impliquerait de repérer les items en mention dans
les publications scientifiques et de savoir retrouver dans leur contexte les indications
utiles pour une compréhension rapide des critères d’analyse, ce dernier point constituant
la difficulté majeure de cette entreprise.
Conjointement à la mise en place de protocoles de veille documentaire chez les éditeurs, il serait souhaitable de sensibiliser les linguistes qui s’engagent dans des études
dont les produits pourraient être utiles pour documenter des descriptions lexicographiques et de les inciter à formuler leurs résultats en veillant à favoriser leur réemploi
(cf. P. Corbin (1998, § 4. et 2002, § 3.1.)). Le Dictionnaire constructionnel du français
mis en chantier par D. Corbin avait clairement cette ambition 32, son initiatrice prin-
28
[244 Ð
29
30
31
32
Concernant la baisse d’influence de la linguistique sur la lexicographie française, cf. P. Corbin (1998 : 9091, 2002 : 9-10 et § 1.2., et 2008, § 2.3.) et Corbin & Gasiglia (2009b : 21-22).
La lexicographie profitera certainement mieux de recherches stabilisées que de modèles aussi en vogue
qu’éphémères, cf. Corbin & Gasiglia (2009b : 22).
Envisager l’effectuation de cette tâche de manière collaborative permettrait à tous les lexicographes d’être
impliqués, ce qui pourrait les mobiliser positivement, mais aussi induire une dispersion des recherches ou
des disparités de traitement des études prises en compte.
Tous les mots construits n’ayant pas fait l’objet d’une analyse dans un cadre théorique donné, il resterait un
travail de complémentation descriptive (cf. n. 39).
D. & P. Corbin (1991b : 157-158) évoquaient une « mise en forme lexicographique formalisée d’une théorie du
lexique construit, […] un recueil de données exploitables électroniquement », ce que D. Corbin (à paraître,
chap. 2, § 1.5.5.2.) reprend en destinant ce recueil aux lexicographes : « le Dictionnaire constructionnel du
français, métadictionnaire fondé sur une théorie linguistique dans lequel les lexicographes pourraient puiser
en fonction de leurs besoins propres. ».
808
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
cipale ayant pour projet de fournir aux lexicographes des relevés de propriétés morphologiques reformulables dans leurs ouvrages. 33
Certains travaux de linguistes, produits plutôt dans des cadres théoriques enclins
à formaliser leurs résultats, présentent des caractéristiques intéressantes pour la documentation des lexicographes et ont déjà été exploités. C’est le cas par exemple de la
[245
sémantique Ðdes cadres de Charles Fillmore, dont Beryl T. Sue Atkins a prôné l’exploitation 34, ou de la théorie Sens-Texte, qui donne lieu à l’élaboration de différentes pro[246 Ð
ductions lexicographiques 35 proposant
des analyses formalisées 36 dont une partie
33
[245 Ð
34
35
Cf. D. Corbin (à paraître, chap. 2, § 1.6.) : « L’ensemble des propriétés […] constitue la fiche identitaire des
individus lexicaux, qu’un dictionnaire “idéal” (un métadictionnaire) devrait remplir pour chacun de ces individus, et dont les dictionnaires “réels” ne donnent qu’un reflet nécessairement partiel et déformé. ».
De 1992 à 2003, seule, avec C. Fillmore ou avec d’autres coauteurs, elle a produit huit publications concernant de possibles articulations entre des travaux lexicographiques et la sémantique des cadres : Atkins (1995
et 2002b), Atkins, Fillmore & Johnson (2003), Atkins, Rundell & Sato (2003), Fillmore & Atkins (1992, 1994,
1998 et 2000) (cf. Fontenelle (2009) et Béjoint (2009, § 4.1.), dans ce volume). Plus encore peut-être que le
cadre théorique qui guide la description linguistique et qui paraît transposable au français, ce qui motive
cet engouement pour les travaux de C. Fillmore et de ses collaborateurs semble être lié à la disponibilité de
descriptions lexicales et d’un corpus annoté dans lesquels les lexicographes peuvent respectivement puiser
la matière de leurs propres descriptions et des contextes d’emploi attestés.
Selon ce qu’indique le site de l’Observatoire de linguistique Sens-Texte sur la page dédiée aux projets de linguistique (http://idefix.ling.umontreal.ca/recherche/linguistique/), trois productions lexicographiques sont
ancrées sur la recherche et une a des visés explicitement didactiques :
– le DECFC (Dictionnaire explicatif et combinatoire du français contemporain), élaboré à partir des principes
de la lexicographie explicative et combinatoire (Mel’čuk, Clas & Polguère (1995)) : « Pour chaque lexie à décrire, il s’agit de donner la définition, d’indiquer les connotations, de spécifier la cooccurrence syntaxique
(c’est-à-dire, les données du régime syntaxique avec tous les détails des conditions d’utilisation contextuelles),
de recenser la cooccurrence lexicale restreinte au moyen des fonctions lexicales, sans oublier les indications
sur la flexion, les marques d’usage ainsi que les spécifications orthographiques, prosodiques, pragmaticoculturelles et même encyclopédiques. » (http://idefix.ling.umontreal.ca/recherche/linguistique/dec/lang-pref/
fr/) ;
– la base de données BDéf, qui reprend en les formalisant les définitions lexicographiques des volumes du
DECFC (Altman & Polguère (2003)) : « La finalité de la Bdéf est double. Il s’agit, d’une part, de rendre disponible pour la recherche en sémantique computationnelle un ensemble représentatif de définitions lexicales
Sens-Texte. D’autre part, le travail de construction de la BDéf permet de mener une recherche sur la structure interne des sens lexicaux et sur la façon dont celle-ci doit être modélisée. Il s’agit donc d’élaborer un
métalangage formel de définition. » (http://idefix.ling.umontreal.ca/recherche/linguistique/base-bdef/langpref/fr/) ;
– la base de données lexicales du français DiCo (Dictionnaire de combinatoire, en ligne sous le nom de DiCouèbe
(http://olst.ling.umontreal.ca/dicouebe/)), qui se focalise sur les relations sémantiques et les collocations et
qui veut servir la recherche (en générant à partir d’elle des lexiques pour le TAL) et constituer un soubassement pour la rédaction d’un dictionnaire destiné au grand public (le LAF ) : « La finalité première de cette
base est de décrire chaque lexie apparaissant dans la nomenclature du DiCo selon deux axes : les dérivations
sémantiques (relations sémantiques fortes) qui la lient à d’autres lexies de la langue et les collocations (expressions semi-idiomatiques) qu’elle contrôle. Cette description s’accompagne d’une modélisation des structures syntaxiques régies par la lexie et d’une modélisation de son sens, sous forme d’étiquetage sémantique. »
(http://idefix.ling.umontreal.ca/recherche/linguistique/dico/lang-pref/fr/) ;
– le LAF (Lexique actif du français), manuel suivi d’un dictionnaire dérivé du DiCo : « La première partie,
Lexicologie et apprentissage du vocabulaire, présente de façon condensée un ensemble de notions de base qui
sont au cœur du fonctionnement du lexique. Elle offre aux enseignants et aux apprenants de la langue des
méthodes pour explorer et mieux comprendre les phénomènes lexicaux, à partir des descriptions données
dans la seconde partie. La seconde partie, Lexique actif, est le LAF proprement dit : la description lexicogra[246 Ð
|
contrô lées par un ensemble représentatif de mots français. » (http://
phique fine des relations lexicales
olst.ling.umontreal.ca/laf/le-laf/).
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
809
ont vocation à servir pour la dérivation de descriptions lexicales destinées à des applications informatiques ou réécrites pour le grand public (cf. n. 35). 37
Les études de linguistique donnent par ailleurs souvent lieu à des dépouillements
et des recensements préliminaires qui pourraient être utiles aux lexicographes : l’étude
d’un affixe, par exemple, implique le listage des items lexicaux qui l’intègrent, son repérage en leur sein et sa glose. Ce matériau préparatoire a peu de chances de figurer in
extenso dans une publication 38, à moins d’y être en annexe, mais s’il était rendu disponible pour les lexicographes, ils pourraient y reprendre les descriptions des items de
leurs nomenclatures et utiliser la publication pour appréhender les principes d’analyse en s’appuyant sur les exemples qui les illustrent. 39
Pour que la part de description linguistique présente dans les dictionnaires soit actuelle, il conviendrait que des procédures de veille documentaire soient mises en place,
ce qui impliquerait que des moyens humains soient dédiés à la recherche de publications pertinentes et que des moyens informatiques relaient les premiers pour les procédures d’indexation. Cet effort interne pourrait utilement être doublé d’une prise de
contacts avec des linguistes qui produisent des études exploitables en lexicographie
afin de susciter chez eux l’envie d’élaborer des descriptions systématiques 40. Que les
efforts documentaires envisagés exploitent des produits existants ou qu’ils impliquent
la création de nouvelles productions linguistiques, ils nécessiteraient, de la part des
éditeurs, un engagement de longue durée, qui pourrait se traduire par l’intégration de
linguistes – au sein du personnel permanent ou comme collaborateurs externes –, et
un effort plus ponctuel, qui permettrait aux lexicographes, aux linguistes et aux informaticiens de se concerter afin de mettre en place une méthodologie et des outils de veille
linguistique adaptés aux besoins particuliers de l’entreprise.
[247 Ð
1.4. Ressource métalinguistique unique
Les deux ressources précédentes et une sélection de données extraites de corpus
pourraient également être réunies dans une ressource documentaire unique. 41 Cette
36
37
38
39
40
[247 Ð
41
Les paratextes de ces productions et les publications qui les présentent explicitent les formalisations utilisées,
ce qui devrait permettre aux lexicographes de s’imprégner de leurs codifications et de pleinement comprendre
leurs descriptions.
Cf. Corbin & Gasiglia (2009b : 22-24).
D. & P. Corbin (1991a), par exemple, n’ont fourni qu’une sélection d’items en -ier analysés.
Pour les items de la nomenclature qui intégreraient bien l’affixe mais ne figureraient pas dans la liste, l’analyse
resterait à la charge des lexicographes.
Le projet de Dictionnaire constructionnel du français (cf. nn. 32 et 33), qui a été présenté par D. Corbin en
1990, approximativement au moment de la création de la formation lilloise de lexicographie (1991), ne s’inscrivait pas dans une collaboration avec un éditeur (cf. D. & P. Corbin (1991b)). Mais, dans la logique de projet
dans laquelle les chercheurs sont actuellement invités à trouver leur place, il pourrait tout à fait être envisageable de réunir des linguistes (universitaires ou membres du C.N.R.S.) et des éditeurs au sein de programmes
de recherche financés, qui, à défaut d’assurer une collaboration suivie, pourraient permettre de fonder des
méthodes de partage de compétences dont il faudrait ensuite établir les modalités de pérennisation.
Pierrel (2008, § 2.2.) plaide pour la création d’une ressource documentaire partagée. Pourrait-il s’agir d’un
projet réunissant des acteurs, linguistes et lexicographes, du privé et du public ? Si c’était le cas, il implique-
810
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
base de données permettrait d’enregistrer, afin de les présenter aux rédacteurs, les différentes informations disponibles pour chaque item indépendamment de la structure
et du mode rédactionnel des futurs dictionnaires.
Conçue comme un environnement de prise de notes dont le contenu (des données et
leurs métadonnées) s’enrichirait au fil de la veille documentaire, la base accueillerait
notamment
– le typage de la nature de chaque information et éventuellement une spécification relative à son exploitabilité par les rédacteurs (énoncé extrait de corpus, rédaction déjà
exploitée dans un ouvrage d’un type donné pour un public déterminé, description de
linguiste directement exploitable ou présente à titre documentaire) ;
– le référencement des sources documentaires (corpus, dictionnaires du catalogue ou
non, publications linguistiques, etc.) et la localisation en leur sein de ce qui en a été
extrait ;
– l’enrichissement des énoncés extraits de corpus au moyen d’étiquetages syntaxiques
et sémantiques et d’annotations (comme les codifications des structures argumentales
qui pourraient être exploitées pour la sélection et la présentation des contextualisations
reprises ou inspirées de ces extraits, cf. § 3.2.2.2.) 42 ;
– le marquage comme telles des données incompatibles 43 (issues de cadres théoriques
ou d’états de connaissance différents) et la mise en relation des textes de synthèse avec
les informations enregistrées, afin qu’un retour aux exposés théoriques dont dépendent
les éléments de description soit possible, ce qui pourrait faciliter les choix à effectuer
entre ces données ;
– l’établissement de liens entre les informations (de natures distinctes le plus souvent)
qui sont interdépendantes (comme une information étymologique ou morphologique et
[248 Ð
|
une description
séman tique 44 ou de prononciation (cf. n. 148)), afin de faciliter le
cas échéant, lors de la rédaction d’un ouvrage, la vérification de la coprésence de ces informations et du rendu de leur mise en relation ;
– la hiérarchisation de l’importance de chaque élément informationnel afin de faciliter
ensuite des sélections cohérentes (pouvant aller de la réunion de données minimales
42
43
[248 Ð
44
rait que chacun accepte de mettre le produit de son travail à la disposition des différents partenaires (dont
certains sont aussi des concurrents sur le plan commercial) et il devrait respecter les standards de structuration des données (qui ne sont pas nécessairement observés quand ces acteurs travaillent sans perspective
collaborative). La base envisagée ici est d’ambition plus modeste puisqu’elle ne prétend pas fédérer des efforts
d’entités de production concurrentes.
Ceci pourrait être inspiré par le corpus annoté de FrameNet, cf. n. 34.
La coprésence d’informations présentant des divergences ou des contradictions pourrait être bienvenue dans
une base documentaire richement dotée, qui aurait pour ambition de fournir à la fois des données exploitables et une culture linguistique plus large. Elle imposerait cependant un marquage fin des informations
pour éliminer les risques de sélections non cohérentes destinées à un même dictionnaire (voire entre deux
ouvrages d’un éditeur, si le défaut de cohérence n’est pas motivé).
Par exemple, le nom arène a un sens sorti de l’usage et trois sens en français moderne, qui correspondent à
quatre étymologies différentes, dont trois dérivent de celle qui a donné le sens sorti de l’usage. Que l’on se
fixe un programme d’information étymologique complet ou non, il convient de bien articuler la ou les étymologie(s) fournie(s) et le ou les sens décrit(s) (ce qui mériterait d’être mieux fait que dans certains dictionnaires
scolaires, cf. Gasiglia (2008b, § 3.2.)).
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
811
pour la rédaction d’un dictionnaire de faible envergure à celle de données plus complètes
privilégiant ce qui peut contribuer à améliorer les compétences en compréhension ou
en expression) 45 et des choix tributaires de différents critères de compatibilité (entre
informations ou avec un point de vue théorique) ou de disponibilité (pour toute la nomenclature ou un sous-ensemble pertinent).
Conçue conjointement comme une compilation des textes publiés antérieurement
(cf. § 1.2.), la base devrait permettre aussi
– le repérage des relations d’inclusion pouvant exister entre données de même nature
portant sur un même item (comme une définition correspondant à d’autres, plus précises sur certains points 46) ;
[249 Ð
– et la mise à disposition de formulations alternatives pour certaines informations dont
les modes d’exposé sont indexés fortement sur les types d’ouvrages ou les publics cibles 47.
Le bénéfice à attendre d’un tel outil documentaire pourrait être très appréciable :
elle permettrait aux lexicographes de disposer pour chaque item à décrire de données
de bonne tenue, provenant de sources variées, référées à des cadres théoriques le cas
échéant et présentant une certaine diversité de nature et de formulation, ce qui les ren-
45
46
[249 Ð
47
Par exemple, pour le nom canyon (ou cañon), les informations relatives à son étymologie et à son histoire méritent une attention particulière : il pourrait être utile d’enregistrer le parcours complet de ce nom emprunté à
l’espagnol via l’anglo-américain et d’y repérer les étapes importantes (la première langue et la langue intermédiaire), ce qui permettrait ensuite de ne retenir que la première langue pour un ouvrage (comme le Larousse
pratique ou le Petit Larousse illustré 2009) et de retenir toutes les langues avec valorisation de la dernière
dans un autre (par exemple le Dictionnaire des anglicismes du même éditeur). Disposer des mêmes informations pour tous les items permettrait d’éviter que les deux premiers dictionnaires ne changent de programme d’information comme ils semblent le faire (ils mentionnent la langue d’origine et la langue intermédiaire pour bungalow, pyjama ou encore shampooing), à moins que cette variation apparente ne soit motivée et que les rédacteurs ne la rendent compréhensible aux lecteurs.
Par exemple, le nom permutation pourrait se voir associer trois définitions issues de textes du fonds Hachette
de 2001 :
– la première traduirait simplement la relation morphologique liant le nom au verbe dont il dérive (« Action
de permuter ») : c’est ce qui est proposé par le Dictionnaire Hachette encyclopédique de poche et qui constitue
le premier membre de la première description de sens du Dictionnaire français Hachette électronique ;
– et les deux autres se focaliseraient sur les entités impliquées par l’action (des personnes ou des choses) :
c’est ce qui est indiqué dans les deuxième et troisième membres de la première description de sens du Dictionnaire français Hachette électronique (« échange d’emploi, de poste, d’heures de service. » ; « Par ext. Transposition effectuée entre deux choses. »).
La valeur sémantique présentée dans la description qui valorise la relation morphologique inclut les deux
valeurs distinguées par les entités impliquées. Si les trois descriptions étaient enregistrées dans la ressource
documentaire, cette relation d’inclusion sémantique devrait être marquée.
Les propriétés phonographiques d’un item pourront avoir fait l’objet d’une remarque autonome ou coprésente
avec une transcription phonétique à laquelle elle peut être textuellement articulée ou non. Concernant pouls,
la remarque du Larousse des débutants, destiné aux jeunes lecteurs, ne diffère pas sensiblement de celle
proposée à un large public adulte par le Larousse pratique (qui fournit en outre une transcription phonétique) : « Ce mot se termine par un l et un s qu’on ne prononce pas. » / « Attention à l’orthographe : ce mot
se termine par -ls, qui ne se prononce pas. ». Concernant accueil, le Larousse des débutants comporte en
revanche une remarque qui est beaucoup moins consistante que celle du Larousse pratique : « Il y a un u
après les deux c. » / « Attention à l’orthographe de tous les mots de cette famille : accuei-, l’u suit immédiatement les deux c, pour former le son [k]. »). La compilation devant être faite en veillant bien à enregistrer chaque remarque, sans doublon ni perte d’information, le stockage des deux formulations pourrait être
inutile dans le premier cas, mais souhaitable dans le second.
812
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
drait propices à la documentation comme au réemploi direct. Malgré l’intérêt de cette
ressource, le travail rendu nécessaire par sa conception puis par son enrichissement
régulier, diversifié et cohérent hypothèque très fortement sa mise en place. Il est plus
probable que, si des services de documentation se consacraient à la collecte de données
pour les lexicographes, ils utiliseraient bien des bases de données qui fourniraient des
informations structurées et enrichies de métadonnées (comme les références des sources
documentaires), mais que celles-ci seraient de portée plus limitée que celle envisagée
ci-dessus et qu’elles se focaliseraient sur des sélections d’informations qui auraient
été triées afin d’être aussi cohérentes et prêtes à l’emploi que possible. Si la perspective d’une grande base compilant toute la documentation ne semble pas devoir avoir
d’écho dans les maisons d’édition, elle constitue cependant un objet spéculatif intéressant dans la mesure où elle stimule une réflexion sur les besoins documentaires, sur
les méthodes de collecte et de valorisation des données et sur les modalités de leur mise
à disposition, réflexions qui seront réexploitables pour des bases plus modestes.
1.5. Réflexions conclusives sur la documentation métalinguistique
Alors que les maisons d’édition tendent à employer plus souvent des lexicographes
externes, missionnés pour des projets et parfois principalement en situation de télétravail, elles vont avoir besoin, plus que par le passé probablement, de veiller à ce que cha[250 Ð
cun puisse accéder dans les meilleures conditions à une documentation qui
garantisse le maintien de la qualité des ouvrages, voire son amélioration, en même temps
que la cohérence du catalogue. Ce qui pouvait être transmis du fait des collaborations
internes, et qui constituait en quelque sorte un apprentissage, va maintenant devoir
être rendu accessible à un grand nombre de collaborateurs ponctuels qui échangeront
des fichiers de données plus souvent qu’ils n’auront d’interactions susceptibles d’infléchir leurs méthodes de travail ou leur culture linguistique. Les progrès informatiques
accomplis laissent certes entrevoir un moyen de pallier les manques induits par la précarisation et l’externalisation du travail, mais encore faut-il évaluer si le coût de tâches
de documentation telles que celles envisagées précédemment serait assumable par les
entreprises (ce qui supposerait un investissement initial mais aussi le maintien d’une
équipe stable et qualifiée pour alimenter la ou les base(s)) et si elles ne s’en tiendront
pas à faire confiance à des lexicographes qui devront gérer isolément leur documentation. Si les moyens informatiques actuellement disponibles permettent de concevoir
des outils de documentation qui soutiendraient une rationalisation positive des méthodes
de travail, il reste à espérer que les éditeurs français pourront faire ces choix.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
2.
813
Changer les modes d’élaboration
Une longue tradition de production de répertoires métalinguistiques conçus pour
être consultés par articles 48 et, au sein de ceux-ci, par séquences d’informations a précédé l’avènement de l’informatique et, durant les premières années de la diffusion des
ordinateurs personnels, les produits lexicographiques sur support électronique n’ont
pas fondamentalement modifié cette conception des dictionnaires. Les manières de
travailler des lexicographes, elles, ont cependant déjà beaucoup changé et peuvent encore évoluer, ce qui motive que ce paragraphe, qui couvre les trois strates de l’activité
lexicographique (cf. n. 5), décrive ce qu’il est possible de connaître de la situation actuelle et d’imaginer pour le futur proche.
2.1. Strate métalinguistique
Les évolutions informatiques les plus perceptibles pour les lexicographes touchent
les environnements de rédaction, mais elles ont eu des corrélats sur l’ensemble des mé[251 Ð
thodes de travail : dès la phase
de conception des nouveaux projets, les informaticiens du service d’informatique éditoriale sont devenus des interlocuteurs directs des
lexicographes et en particulier des chefs de projets. Certes, pour préparer un nouveau
projet et évaluer s’il peut être jugé suffisamment rentable pour que les contrôleurs de
gestion décident de sa mise en chantier 49, ses concepteurs, comme autrefois, établissent
une sélection des types d’informations qu’ils souhaitent offrir à la consultation et les
distribuent sur les différents constituants des futurs articles, en spécifiant comment
chacun sera rédigé afin d’être pleinement accessible à un public déterminé, de respecter des traditions internes ou des filiations d’ouvrages, de faire écho à des évolutions
terminologiques (en grammaire par exemple) ou pédagogiques (pour les dictionnaires
scolaires ou pour ceux destinés aux allophones en particulier), etc. Mais ce qui a changé, c’est que les lexicographes font ce travail avec les informaticiens afin de concevoir
des patrons de rédaction qui tirent le meilleur parti des structurations informatiques,
qui, le cas échéant, rendront possible l’intégration de segments de textes issus de précédents ouvrages 50, et qui permettront de satisfaire aux modalités d’affichage définies
avec les maquettistes en fonction du ou des support(s) prévu(s).
Le produit de cette phase de mise en projet est formalisé par un patron, associé à
des directives de rédaction (le “cahier des charges”) et un échantillon d’articles. Selon
l’environnement de rédaction prévu, le patron peut prendre différentes formes : si la
[250 Ð
48
[251 Ð
49
50
Même si la consultation d’un article peut, via les renvois, conduire à celle d’autres articles ou de sous-parties de
certains d’entre eux, que cette circulation se fasse manuellement ou par un lien hypertextuel, il n’en demeure
pas moins que les articles n’ont pas vocation à être lus page après page, dans l’ordre alphabétique de leurs
adresses.
Cette estimation est faite sur la base d’une appréciation de la viabilité du projet tel qu’il est présenté par les
lexicographes et de différentes données chiffrées (coûts de fabrication, prévisions de vente établies avec le
service marketing, etc.).
Symétriquement le réemploi, au sein de futurs produits, de segments de textes rédigés dans le cadre du projet
actuel peut être envisagé (cf. § 2.3.3.).
814
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
rédaction doit s’effectuer dans un traitement de texte de suite bureautique, parce qu’il
a été jugé opportun de faire travailler les rédacteurs dans un environnement qui leur
est familier et que la structure du futur ouvrage est assez simple pour que l’emploi
systématique de styles suffise pour convertir a posteriori le texte en XML 51, c’est un
modèle de document 52 qui est fourni ; si le texte doit être directement structuré en
XML et donc rédigé dans un éditeur dédié (ce qui est de plus en plus souvent le cas),
[252 Ð
le patron prend la forme d’une DTD
(voire d’un schéma) 53 ; si la rédaction doit se
faire dans un environnement structuré de type base de données SQL 54, le patron se
concrétise par le schéma de relations des tables et le formulaire de saisie.
Le partenariat des informaticiens et des lexicographes, lors de la conception des projets, a permis aux premiers de mieux percevoir la finesse du découpage structurel des
articles dont ils assurent le posttraitement et aux seconds de concevoir leurs textes
comme des emboîtements de composants dont l’ordre d’apparition et la constitution interne sont mieux descriptibles qu’auparavant. Ce regard renouvelé porté sur les textes
dictionnairiques a probablement modifié le rapport des lexicographes aux programmes
métalinguistiques de leurs ouvrages, mais il est trop tôt pour en mesurer les effets.
Que ce soit une conséquence de ces collaborations ou une coïncidence, le passage à
des rédactions structurées s’est fait parallèlement à la diffusion de l’idée que les textes
des dictionnaires étaient souvent trop compliqués à lire du fait de leur haut degré de
codification et de leur complexité structurelle. La révision des codifications, très nombreuses et d’autant plus difficiles à décoder qu’elles sont abrégées dans les textes imprimés 55, dépend pour partie de décisions prises au niveau discursif et pour partie de
51
52
[252 Ð
53
54
55
Les logiciels de traitement de texte comme Microsoft Word ou OpenOffice.org Writer (qui semble peu utilisé
dans le monde de l’édition) permettent d’affecter des styles aux paragraphes et, au sein de ceux-ci, à des
chaînes de caractères. Chaque segment de texte porteur d’un style peut ensuite être converti en contenu
d’un élément XML, ce qui permet de générer des documents XML à deux niveaux d’enchâssement, ou plus
par posttraitement si des séquences d’éléments peuvent être automatiquement réunies dans un élément
enchâssant. Ces conversions s’avèrent donc d’autant moins complexes que les articles rédigés ont une structure peu profonde.
Selon l’aide de Microsoft Word 2000, « [u]n modèle détermine la structure de base d’un document et contient
les paramètres du document tels que les insertions automatiques, les polices, […] la mise en page, les mises
en forme spéciales et les styles. ».
Pour décrire la structure des documents XML qui s’y conforment, une DTD (Définition de Type de Document)
est codée pratiquement comme elle l’était déjà pour les documents SGML (Standard Generalized Markup
Language), alors qu’un schéma est écrit en XML (des éléments prédéfinis servant à déclarer les nouveaux
éléments et attributs et leur grammaire) et type les contenus des éléments et les valeurs des attributs, mais
ne permet pas de définir d’entités (cf. n. 61).
Bien que ce soit un choix techniquement valide et mis en œuvre pour le dictionnaire Encarta, il semble ne
pas être privilégié en France dans l’édition privée. Les bases de données relationnelles SQL semblent plutôt y
être utilisées pour stocker des données à insérer dans les textes (bases de transcriptions phonétiques, d’étymologies, etc.) ou à usage documentaire (bases de collecte de néologismes).
Les volumes imprimés doivent compter un nombre de pages important pour qu’ils puissent accueillir tout le
texte, mais suffisamment réduit pour qu’ils restent manipulables et, avant cela, pour qu’ils puissent être
reliés. Il est possible de jouer sur le grammage du papier, qui doit cependant rester assez épais pour qu’il ne
se froisse pas, et sur son opacité, qui doit toutefois demeurer suffisante pour qu’un recto de page imprimée
ne perturbe pas la lecture du verso. Le Petit Larousse illustré 2009 grand format, par exemple, a ainsi gagné
des pages par rapport au millésime 2008 (1 889 pages de texte dictionnairique et d’annexes contre 1 874 ;
124 pages de paratextes contre 113) tout en perdant en épaisseur (5 cm contre 6,2) et en poids (3,030 kg
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
815
décisions de posttraitement liées au support de présentation des articles. Les changements envisageables sur le plan discursif ne pouvaient pas être engagés sans une révision structurelle des articles. Les binômes de concepteurs (lexicographes et informaticiens) ont alors profité de la lisibilité qu’offrent les patrons formalisés pour en concevoir
qui soient susceptibles de présenter une meilleure correspondance entre types d’informations et composants d’articles. Cette évolution étant engagée, il reste à veiller à ce
[253 Ð
|
qu’elle n’induise pas un
appauvris sement du contenu linguistique. Là encore, le
recul actuel n’est pas suffisant : les dictionnaires scolaires imprimés semblent avoir
globalement gagné en lisibilité, mais ce n’est peut-être pas seulement un effet de ces
changements 56 ; le Larousse pratique (2003) et le Larousse des noms communs (2008),
dictionnaires de milieu de gamme 57, offrent un programme métalinguistique modeste ;
et aucun grand dictionnaire n’a été mis en chantier assez récemment pour offrir une
structure rédactionnelle moderne à des contenus d’une richesse comparable à ceux du
Grand Larousse de la langue française, du Grand Robert de la langue française ou du
Trésor de la langue française.
2.2. Strate discursive
Décider du passage à une rédaction structurée informatiquement devait se faire en
prenant en compte les habitudes de travail des rédacteurs et en les accompagnant dans
cette mutation : dans un premier temps, selon les équipes de rédaction, il pouvait être
fonctionnel de faire structurer manuellement a posteriori les textes ou de les faire saisir
dans les traitements de texte qui étaient déjà en usage, mais en imposant l’emploi de
styles (ce qui permettait une conversion de ceux-ci en structuration explicite, cf. n. 51).
Actuellement, une part importante des lexicographes ne travaillent plus que dans des
éditeurs XML, que ceux-ci disposent d’interfaces qui masquent le balisage pour n’offrir
que des zones de saisie correspondant aux différents éléments et attributs (ce qui peut
faire disparaître la textualité des articles et ainsi induire une gêne), ou qu’ils laissent
voir tout le balisage (ce qui peut noyer le texte saisi dans une grande quantité de caractères de structuration et gêner également), ou encore qu’ils n’affichent la structure que
de manière semi-codifiée, les balises étant remplacées par des délimitateurs moins
[253 Ð
56
57
contre 3,740) grâce à l’utilisation d’un papier moins épais, afin d’accueillir le texte jugé utile en gardant un
volume dont l’épaisseur n’avait pas d’incidence sur le choix du relieur.
La prédominance, depuis la fin des années 1990, des structures où les définitions sont illustrées par un ou
plusieurs exemples est concomitante avec l’introduction du balisage dans les articles (cf. P. Corbin (2006, vol.
1 : 180)), mais elle pourrait en partie aussi être induite par les critiques exprimées à propos des exemples
glosés à la mode auparavant (cf. notamment Rey-Debove (1988 : X) ou Lehmann (1993)).
Le Larousse pratique appartient au milieu de gamme avec ses « 40 000 mots » (quatrième de couverture).
Le Larousse des noms communs pourrait appartenir au segment de marché supérieur par sa nomenclature
(« 85 000 mots et locutions » (quatrième de couverture)), mais son programme d’information n’est pas très
différent de celui du Larousse pratique, avec lequel il est en filiation textuelle partielle.
816
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
visibles et les valeurs d’attributs intégrées au texte partiellement mis en forme 58 (ce
qui semble être la présentation la plus appréciée).
[254 Ð
Les éditeurs XML, bien qu’une partie seulement de leurs potentialités semble être
exploitée, peuvent, mieux que les traitements de texte, être configurés pour soutenir
le travail de rédaction :
– pour l’élaboration des descriptions, par l’affichage de la structure des articles et d’aides
contextuelles (infobulles pour des consignes ponctuelles ou fenêtres pour des extraits
du cahier des charges) ;
– pour la fusion de données élaborées antérieurement, par l’automatisation de leur import en bonne place (que celui-ci soit systématique ou conditionné par une propriété
des items et que les textes insérés soient repris en l’état ou qu’ils fassent l’objet d’une
réécriture automatique ou manuelle 59) ; 60
– pour la saisie, par l’insertion automatique des indicateurs de structuration (ordonnateurs alphanumériques, diacritiques) et la mise en place de menus déroulants, de notations abrégées (entités XML) ou d’une fonction de complétion pour les informations qui
doivent être rédigées de manière régulière (marques d’usage, remarques formulées
pour tous les items d’une famille lexicale, etc.) et pour les renvois (vers des tableaux
de conjugaisons, des planches, etc.) ; 61
58
[254 Ð
59
60
61
Cette mise en forme ne correspond pas à celle du texte publié, mais à une codification symbolique basée sur
des variations plus contrastées des polices ainsi que des couleurs de caractères et de trames de fond, en plus
des habituelles variations d’inclinaison, de graisse, de corps et de casse.
L1. Dans Corbin & Gasiglia (2004, § 2.2.2.3.2., (iii)), nous avions proposé que les textes à insérer soient stockés dans une base de données spécialisée comme il y en a par exemple pour les transcriptions phonétiques
(cf. n. 54), mais il pourrait également s’agir d’une base comparable à celles introduites aux §§ 1.2. et 1.4.
Les insertions envisagées peuvent par exemple concerner le réemploi direct des transcriptions phonétiques, le
réemploi ou la reformulation automatique de la catégorisation (un code comme “n.m.” pouvant être inséré à
l’identique ou sous la forme “nom masculin”, la réécriture pouvant également relever des posttraitements, cf.
§ 2.3.), l’insertion conditionnelle d’informations diverses (un identificateur de modèle de conjugaison, pour
les verbes qui se conforment à l’un de ceux présentés dans le paratexte ; une remarque, pour les items qui
partagent une propriété (comme, dans le Larousse des débutants, pour les noms en -tie, comme acrobatie :
« On écrit tie mais on prononce [si]. »)), ou encore l’intégration d’autres éléments informationnels à textualiser (pour les étymologies, par exemple, un étymon, sa langue et son équivalent en français importés pourraient devoir être insérés manuellement dans un texte pleinement interprétable par les publics ciblés).
Ces imports automatiques sont déjà réalisés au moins dans une certaine mesure, mais s’ils connaissaient
une plus grande extension, ils seraient exploitables par un outil de contrôle de qualité puisque, les propriétés
à énoncer étant fournies aux rédacteurs, ceux-ci ne risqueraient plus d’oublier de les mobiliser et de les mentionner et que, s’ils décidaient d’en supprimer l’expression pour un item, cette décision pourrait être notifiée
dans le fichier de rédaction et éventuellement signalée automatiquement dans les articles des items qui partagent la propriété qui motive ce choix. Cette aide se révélerait également utile dans les cas où deux propriétés interdépendantes doivent être présentées conjointement (prononciation ou sens et origine étrangère
par exemple, cf. nn. 44 et 148).
Pour les segments de texte qui sont strictement identiques dans une sélection d’articles mais qui n’ont pas fait
l’objet d’une insertion automatique comme celle décrite en note 59, des entités XML permettent de ne saisir
que le nom de l’entité là où le texte doit figurer (pour les noms en -tie, comme acrobatie, dans le Larousse
des débutants, si N_Xtie par exemple est une entité déclarée comme devant être remplacée par « On écrit
tie mais on prononce [si]. », chaque fois que &N_Xtie; figurera dans le corps du document, le parseur XML
remplacera cette référence à entité par le texte associé). Pour les textes qui ne sont que partiellement iden[255 Ð
par un l et un s
tiques (comme, dans le Larousse des débutants, s.v. pouls et iris : « Ce mot se termine
qu’on ne prononce pas. » (cf. n. 47) / « Ce mot se termine par un s qu’on prononce. »), il semble plus opportun
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
[255 Ð
817
– pour la recherche des formulations les mieux adaptées, par l’interfaçage d’un dictionnaire de synonymes ou, pour la lexicographie bilingue, d’un système de mémoire de
traduction 62 ;
– pour le contrôle orthographique (lors de la saisie et en relecture-correction), par l’intégration d’un correcteur orthographique et grammatical capable d’adapter sa recherche
de fautes à la langue de chaque segment de texte balisé (ce qui serait précieux pour les
dictionnaires bilingues, mais qui pourrait aussi être utile pour les descriptions étymologiques des monolingues) 63 ; 64
62
63
64
de prévoir un système de complétion capable de mémoriser les segments textuels déjà saisis et de les exploiter
pour proposer aux rédacteurs de choisir la fin pertinente ou la plus approchante de la saisie en cours. Ces
fonctionnalités, en partie déjà intégrées aux éditeurs XML, ne modifient pas fondamentalement le travail
de rédaction, mais elles contribuent à accroître la régularité des textes et à réduire le temps de saisie.
Les mémoires de traduction proposent des paires de segments de textes (de simples chaînes de caractères ou
des constituants délimités sur des bases linguistiques) mis en équivalence dans un corpus constitué pour
leur “entraînement”. Employer l’un de ces outils (en plus des données du fonds éditorial, cf. §§ 1.2. et 1.4.)
pour les contextualisations ou les expressions et collocations permettrait aux lexicographes d’accéder à des
formulations employées par des traducteurs qui ont travaillé sur des contextes d’emplois diversifiés, ce qui
serait susceptible d’enrichir la palette des équivalences traductionnelles proposées et d’illustrer mieux la
variété des usages. L’élaboration d’un dictionnaire bilingue électronique au sein duquel les indications métalinguistiques (sélecteurs de sens, explications traductionnelles, remarques, etc.) seraient formulées dans la
langue de l’item en adresse dans une interface dédiée à l’expression et dans l’autre langue dans une interface
dédiée à la compréhension pourrait également tirer profit d’une mémoire de traduction, mais, compte tenu
de la spécificité de ces textes, elle devrait avoir été entraînée avec un corpus d’écrits métalinguistiques.
Un attribut @xml:lang ayant comme valeur un code de langue doit pour cela être déclaré dans la DTD. Il peut
avoir une valeur fixe déclarée elle aussi dans la DTD pour les éléments dont le contenu est toujours dans la
même langue, ou des valeurs variées insérées dans le balisage pour ceux dont le contenu peut être dans différentes langues, comme les étymons.
Certains éditeurs XML offrent un correcteur orthographique interne qui repère au cours de la frappe des mots
(chaînes de caractères délimitées par des espaces ou des ponctuations) qui n’appartiennent pas à une liste de
formes (les graphies des items les plus courants de chaque langue). Les fonctions de correction grammaticale,
elles, ne sont généralement pas disponibles et il faut envisager l’intégration d’un correcteur externe. Sur leur
site web, les éditeurs des trois principaux logiciels externes de correction orthographique et grammaticale
pour le français – Antidote (Druide Informatique), Cordial (Synapse Développement) et ProLexis (Éditions
Diagonal) – n’évoquent pas d’éditeur XML (comme Arbortext’s Epic Editor, Altova XMLSpy ou <oXygen/>)
dans les éditeurs de textes compatibles. Interrogés, les services commerciaux des éditeurs de ces correcteurs
ont apporté des réponses contrastées : soit sans perspective pour les lexicographes (pas de compatibilité pour
Cordial ; pas non plus pour Antidote, qui propose cependant une solution alternative, même si celle-ci n’est
envisageable que pour de petits volumes de textes : il s’agit de copier-coller le texte saisi de l’éditeur XML
dans l’éditeur du correcteur, où il est possible de bénéficier d’un système “d’évitement de balises”, c’est-àdire de non-correction des caractères situés entre les chevrons des balises), soit encourageante (ProLexis a
été intégré dans Arbortext’s Epic Editor par la société de service en ingénierie informatique 4d Concept (c’est
[256 Ð
cette intégration n’est pas mentionnée sur le site des Éditions Diagonal) ; l’éditeur juridique
pourquoi
LexisNexis utilise ProLexis et Epic depuis quelques années et les Éditions Francis Lefebvre devraient le faire
prochainement). Les lexicographes de Larousse, qui travaillent avec Epic, pourraient donc, comme les rédacteurs de textes de référence juridiques, bénéficier de l’intégration de ProLexis sans avoir besoin de changer
d’environnement. Par ailleurs, les sites des trois éditeurs de correcteurs mentionnent des outils développés
par Adobe (InDesign, inclus dans la Creative Suite (CS), et FrameMaker) qui sont utilisés pour le posttraitement de dictionnaires imprimés (cf n. 100) : InDesign CS2 pour Cordial 2009 (http://www.synapse-fr.com/
produits/IntegrationCordial.htm) ; CS2 à CS4 pour Antidote RX version 7 (http://www.druide.com/a_spec.
html) ; CS4 (depuis février 2009) et FrameMaker pour Prolexis (http://www.prolexis.com/actualites/index.
php?id=62). Selon les informations fournies par les Éditions Diagonal, dans les logiciels d’Adobe, ProLexis
peut accéder au texte brut, en négligeant les balises, parce qu’il sait communiquer avec les API (interfaces
818
[256 Ð
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
– pour la fusion d’éléments élaborés parallèlement, par l’incorporation des composants
encyclopédiques ou des illustrations (confiés à des experts ou des illustrateurs externes)
au fil de leur réalisation, ce qui permettrait à ces prestataires de voir précisément comment leurs contributions s’intègrent dans le texte d’accueil et, si besoin, d’envisager
avec le chef de projet la rectification de l’élément inséré ou du texte 65 ;
– pour le contrôle de la rédaction, par l’analyse de conformité des informations saisies
(comme les tests de présence de chiffres dans les éléments de datation) 66 ;
– pour le contrôle du volume, par le calibrage des zones de saisie et l’évaluation au fil de
la rédaction du poids effectif de ce qui est déjà rédigé afin de signaler les dépassements
et/ou de limiter la taille des développements restants ;
– et pour la gestion du projet, par le dénombrement des occurrences de chaque constituant d’article 67, ce qui peut permettre de charger les rédacteurs en fonction d’une évaluation fine du travail de création ou d’adaptation textuelle nécessité par chaque lot d’articles 68.
[257 Ð
Bien que tout ce qui vient d’être évoqué ne soit pas (encore) mis en place, les changements déjà observés ont modifié en profondeur la manière de travailler des rédacteurs.
Ils ne semblent cependant pas avoir véritablement bouleversé leur conception de leur
tâche et, si les nouveaux environnements informatiques peuvent susciter des observations relatives aux fonctionnalités disponibles ou à l’ergonomie de l’interface de travail,
ils finissent par être bien acceptés, voire appréciés. Au cours de cette mutation, le contenu du texte dictionnairique s’est dissocié de sa mise en forme 69, ce qui induira probablement des rétroactions, mais, pour l’heure, ce sont des textes d’articles qui restent
élaborés et, s’il est devenu banal de poser qu’un article électronique n’a pas la même
65
66
67
68
69
de programmation applicative) éditées par Adobe. Si c’était vérifié pour Antidote et Cordial, ceci expliquerait
que les trois correcteurs proposent une correction de textes balisés dans les éditeurs d’Adobe.
Pour l’heure les textes et les iconographies sont élaborés de manière apparemment indépendante, ce qui produit
des discordances auxquelles il pourrait être remédié aisément (dans le Larousse des débutants par exemple,
s.v. rejoindre, la personne rejointe change de sexe sans bénéfice apparent entre la contextualisation et la
légende d’iconographie : « J’ai couru pour rejoindre mon frère. » / « Lucas court pour rejoindre sa sœur. »).
Il semble que ces contrôles ne concernent que des classes de caractères ou de séquences de caractères et qu’en
conséquence ils soient très limités.
Ceci permet également de fournir des données quantitatives au service marketing qui élabore les textes de
promotion des ouvrages. Si ces chiffres se révèlent inférieurs à ceux évalués pour des éditions précédentes
et indiqués dans les paratextes des ouvrages ou sur les supports publicitaires, ils posent d’ailleurs des cas
de conscience : une nouvelle édition ne peut pas aisément afficher qu’elle contient, par exemple, moins de mots
traités que celle à laquelle elle succède (même si c’est le cas pour le Grand Robert & Collins électronique,
cf. n. 72).
Pour les composants optionnels ou répétables des articles en création (comme les contextualisations, dont l’absence ou la répétition ne dépendent pas mécaniquement des propriétés des items), seule une estimation résul[257 Ð
avec d’autres ouvrages pourrait être faite. Fournir une évaluation prévisionnelle
tant de la comparaison
est par contre plus aisé quand un texte de base existe. Outre la charge de travail, c’est le salaire des rédacteurs externes payés “au signe” (en fonction du nombre de caractères saisis) qui pourrait être en jeu ici : d’une
part, l’insertion automatique de certains segments de texte allège le travail de saisie et donc le nombre de
signes à payer et, d’autre part, la valeur des signes pourrait être pondérée en fonction de l’effort qu’a nécessité leur insertion (lors d’une refonte, les caractères d’une nouvelle séquence définition - exemple pourraient
être mieux cotés que ceux d’une conversion d’exemple glosé (cf. n. 56)). Il semble qu’aucun éditeur n’ait pris
jusqu’à présent de mesure dans ce sens.
On parle communément d’une dissociation “du fond et de la forme”.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
819
présentation qu’un article imprimé, il est encore naturel de considérer qu’il s’agit d’un
article imprimé par ailleurs et posttraité de manière différente en vue d’une édition
électronique considérée comme seconde.
2.3. Strate de posttraitement
Toutes les actions qui visent à faire passer le texte dictionnairique tel qu’il est en fin
de rédaction à ce qu’il est lors d’une consultation ainsi que celles qui concernent ses
éventuels réemplois pour dériver un nouveau texte relèvent des posttraitements. Pour
les volumes imprimés, le passage du texte rédigé au texte à consulter mobilise traditionnellement les maquettistes de conception, qui créent l’identité visuelle du produit, les
maquettistes d’exécution, qui mettent en forme l’intégralité du texte, puis les techniciens qui participent à la fabrication effective du livre. Pour les éditions électroniques,
les derniers sont remplacés par des informaticiens développeurs d’interfaces de consultation et, le cas échéant, des fabricants de disques. Les contraintes de chacun influent sur l’élaboration des ouvrages dès leur conception, ce qui suppose de mettre en
synergie toutes les compétences utiles dès que possible.
2.3.1. De l’imprimé à l’électronique
Le souhait de pouvoir redoubler les versions imprimées par des versions électroniques
[258 Ð
a profité de la dynamique de structuration
des textes et l’a motivée tout à la fois. Il
devenait certes nécessaire de créer deux maquettes et de prévoir deux procédures de
mise en forme, mais le même texte pouvait trouver deux publics ou les mêmes usagers
dans des situations distinctes.
2.3.1.1. Quelques textes publiés sur plusieurs supports
Bien que les potentialités de double publication aient fait espérer des bénéfices, il
faut constater aujourd’hui que le nombre de dictionnaires monolingues français commerciaux 70 décrivant des états de langue actuels et disponibles en versions imprimée et
électronique 71 est modeste 72 :
[258 Ð
70
71
72
Seuls sont considérés ici les dictionnaires vendus directement à leurs utilisateurs et, pour les versions électroniques, ceux qui peuvent être consultés indépendamment d’une autre application. Les dictionnaires proposés en consultation gratuite, intégrés à des portails commerciaux ou à des sites financés par la publicité,
ne sont pas pris en compte en première intention, mais peuvent l’être en cas de multidiffusion, pour partie
payante (imprimée, sur disque ou en ligne) et pour partie gratuite (en ligne seulement), cf. nn. 72, 74 et 87.
Le Trésor de la langue française et le Dictionnaire de l’Académie française sont exclus de cet inventaire au
double motif que, bien qu’accessibles en ligne gratuitement, ils ne le sont plus ou pas intégralement en version imprimée et que, produits respectivement par le C.N.R.S. et l’Académie française, ils n’ont pas un caractère commercial.
La double édition concerne aussi des bilingues :
– Le disque du Dictionnaire Hachette-Oxford de 1994 est sorti en 1997.
820
[259 Ð
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
– le Petit Larousse illustré imprimé est vendu avec son disque au moins depuis le millésime 2003, mais la version électronique était déjà vendue isolément depuis 1996 ; 73
– le Larousse pratique de 2003 constitue depuis 2005 l’un des modules du multidictionnaire Larousse illico (cf. n. 72) 74 ;
– le Grand Robert de la langue française électronique, dérivé de la version imprimée
publiée en 2001, est disponible depuis 2005 75 alors que les six volumes sources ne le
sont plus que dans un tirage spécial de Britannica France 76 ;
73
74
75
76
– Chez Larousse, les dictionnaires sont publiés isolément ou dans des compilations : (i) les dérivés du Larousse
Chambers et de deux Dictionnaire compact (français / allemand et espagnol) sont réunis depuis 2004 dans le
Larousse multilingue, sur disque achetable ou en édition en ligne consultable sur abonnement (via le Kiosque
Numérique de l’Éducation (http://www.kiosque-edu.com/CATALOGUE_KNE_2008_2009.pdf) en France et
via De Marque (http://larousse.demarque.com/fr/ca/dictionnaire-anglais-en-ligne/larousse-multilingue/) au
Canada), et les disques du Larousse Chambers et du Dictionnaire compact français / espagnol sont vendus
individuellement, le premier sous le même nom, le second sous celui de Larousse français-espagnol ; (ii) les
quatre volumes intitulés Dictionnaire compact (français / allemand, anglais, espagnol et italien) sont inclus
dans le Larousse illico, multidictionnaire modulaire qui existe depuis 2005, qui a été réédité en 2007, et qui
peut intégrer les quatre bilingues dérivés des Dictionnaire compact et un monolingue (le Larousse illico multidictionnaire français dérivé du Larousse pratique, cf. n. 74) ou un sous-ensemble de ces ressources (ces produits étant achetables séparément ou dans deux compilations : le Larousse illico dictionnaire multilingue,
qui réunit les trois premiers bilingues, et le Larousse illico multidictionnaire, qui regroupe les bilingues anglais
et espagnol et le monolingue français) ; (iii) les quatre mêmes volumes bilingues sont annoncés, sur le site
Larousse (http://www.larousse.fr/), comme prochainement disponibles sur abonnement alors qu’ils sont déjà
consultables gratuitement mais malcommodément (soit sans interface de sélection de langues et de saisie
du mot cherché, en indiquant dans l’URL les codes de langues (fra ; all ; ang ; esp ; ita) et le mot cherché
(par exemple, pour dictionnaire dans le texte français-allemand : http://www.larousse.fr/ref/bilingues/fraall/dictionnaire.htm), ce qui semble être une mise en ligne accidentelle, soit à partir d’une page de sélection
des paires de langues (http://www.larousse.fr/ref/IndexBilingues.htm) qui donne accès à la liste des items
[259Ð
être une interface de test), et ils sont actuellement
adresses d’articles et par eux aux articles, ce qui paraît
publiés imprimés sous l’intitulé Dictionnaire maxipoche plus ; (iv) le Grand Larousse italien, bilingue français / italien imprimé de 2006, vendu en Italie avec son disque sous le titre Il Larousse francese, est consultable gratuitement sur le site du journal Corriere della Sera (http://dizionari.corriere.it/dizionario_italiano_
francese.shtml).
– Le Grand Robert & Collins électronique fusionne les textes du Robert & Collins senior et du Robert & Collins
super senior. Les éditions imprimées précédant l’édition électronique de 2003 dataient respectivement de 2002
et 2000. Les correspondants imprimés de la version 2 (2008), rebaptisés Robert & Collins et Grand Robert
& Collins, datent de 2006 et 2008. L’édition électronique est consultable en ligne (cf. n. 78). En 2003 le dos
du boîtier annonçait « 500 000 mots et expressions », alors que celui de 2008 mentionne « 425 000 mots et
expressions » sans que rien n’indique si la différence de 75 000 items est motivée par une sélection de nomenclature plus drastique ou un dénombrement plus fiable (cf. n. 67).
Le disque de chaque millésime propose des options de consultation partiellement différentes. Le Petit Larousse
imprimé peut toujours être acheté sans disque.
Une version gratuite est consultable sur le site TheFreeDictionary (http://fr.thefreedictionary.com/). Chaque
article du « Larousse Pratique. © 2005 Editions Larousse » y est suivi de celui du Grand dictionnaire des
synonymes et contraires (« Larousse Le Grand Dictionnaire des Synonymes et Contraires. © 2004 Editions
Larousse ») quand les deux existent. Le texte du Larousse pratique est actuellement commercialisé en version imprimée en tant que Dictionnaire compact.
Le Grand Robert de la langue française est vendu sur disque et accessible par abonnement à partir du site
du Canal Numérique des Savoirs (http://gr.bvdep.com/), de celui du Robert et de celui de De Marque (cf. n.
78). Les premières versions électroniques de cet ouvrage, qui ont été publiées sur disque de 1989 à 1994
(version DOS en 1989, puis version Mac en 1992 et version Windows en 1994), correspondaient à l’édition
imprimée en neuf volumes de 1985.
Cf. http://www.britannica.fr/viewPrd.asp?idproduct=25.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
821
– le (Nouveau) Petit Robert existe dans les deux versions de manière asynchrone depuis
1996 et de manière synchrone depuis le millésime 2007 77 ; 78
[260 Ð
– le Robert junior a deux versions asynchrones depuis 1998 79 ;
– le Dictionnaire Auzou junior inclut un disque dans le volume imprimé depuis 2008 80.
Le nombre de dictionnaires commercialisés en version électronique seulement est
encore plus réduit. Quatre l’ont été par deux des éditeurs présents par ailleurs sur le
marché des dictionnaires imprimés et un par un éditeur de logiciels :
– Hachette a publié dès 1993 le Dictionnaire Hachette multimédia, répertoire encyclopédique qui incluait un dictionnaire de langue française 81 et qui a été réédité jusqu’en
2005 au moins, et, en 1998, l’Encyclopédie Hachette multimédia, qui intégrait un autre
dictionnaire de langue française 82 et qui est régulièrement rééditée 83 ;
– Larousse a produit deux compilations notables : en 1996, le Bibliorom Larousse 84 (réédité en 1998) et, en 2002, le Larousse expression 85 (rebaptisé Larousse multidico depuis
2004 86) ;
77
78
[260 Ð
79
80
81
82
83
84
85
86
Le disque de 1996 correspondait à l’édition imprimée de 1993. Les volumes imprimés sont millésimés depuis
2005 (millésime 2006) et les disques depuis 2006 (millésime 2007). En 2008, le volume imprimé et le disque
du millésime 2009 pouvaient être achetés conjointement pour un prix inférieur à la somme de celui de ces
produits achetés indépendamment. Pour les établissements scolaires, des licences sont aussi achetables en
nombre via le site du Canal Numérique des Savoirs (http://www.cns-edu.com/ressource-15---le-nouveaupetit-robert-2.html).
Le Nouveau Petit Robert, le Grand Robert de la langue française et le Grand Robert & Collins sont également
consultables sur abonnements. Ces derniers peuvent être souscrits sur le site de l’éditeur (http://www.lerobert.
com/espace-numerique.html, respectivement dans les versions 3.2, 2.1 et 2.0 en avril 2009) ou, pour les organismes et institutions canadiens, sur le site de De Marque (http://lerobert.demarque.com/fr/ca/dictionnaire
-en-ligne/, dans des versions qui semblent être les mêmes).
Les disques de 1998, 1999 et 2003, puis 2006 sous le nom de Robert des enfants, correspondent à l’édition imprimée de 1993 (rééditée jusqu’en 1998) enrichie de médias (cf. F. Corbin (2009), dans ce volume). La refonte de
2005 n’est disponible qu’en version imprimée. Pour les établissements scolaires, des licences sont achetables
en nombre via le site du Canal Numérique des Savoirs (http://www.cns-edu.com/ressource-16---le-robertjunior.html). Cette version n’a intégré les médias qu’en janvier 2008 (cf. http://junior.bvdep.com/demo/infos.
htm). Comme les trois ouvrages mentionnés en note 78, le Robert des enfants est proposé par De Marque
(http://lerobert.demarque.com/fr/ca/dictionnaire-enfants-en-ligne/robert-junior/), mais il ne l’est pas (ou pas
encore) par Le Robert.
En 2006, à son entrée sur le marché, seule la version imprimée était disponible.
Il dérive du Dictionnaire pratique du français (de 1987) du même éditeur, qui a connu diverses éditions imprimées sous différents titres jusqu’en 2001 (où il paraissait comme Dictionnaire Hachette langue française) et
qui a aussi été publié comme Dictionnaire français Hachette électronique de 2001 à 2004 au moins.
Le texte du dictionnaire de langue présente une très forte parenté avec Alpha. Encyclopédie alphabétique
Hachette.
Une consultation sur abonnement est proposée sur les sites d’Hachette Multimédia (http://www.ehmelhm.
hachette-multimedia.fr/infos/accueil) et du Kiosque Numérique de l’Éducation (http://www.kiosque-edu.com/
CATALOGUE_KNE_2008_2009.pdf) en France, et de De Marque (http://hachette.demarque.com/) au Canada.
Le Bibliorom Larousse réunissait le Petit Larousse, le Thésaurus, le Dictionnaire des citations françaises et
étrangères et trois bilingues “compact ” (français / allemand, anglais et espagnol). Toutes ces versions électroniques portaient un copyright 1996 et seul le Petit Larousse était vendu de manière autonome (cf. n. 73).
Le Larousse expression intégrait en particulier le Grand usuel Larousse (version brochée désiconographiée du
Grand Larousse en 5 volumes).
Le Larousse multidico est vendu sur disques et est accessible en ligne sur abonnement via le Kiosque Numérique de l’Éducation (http://www.kiosque-edu.com/CATALOGUE_KNE_2008_2009.pdf) en France et De
822
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
– Microsoft a créé en 2002 un dictionnaire pour l’édition française de l’encyclopédie
Encarta commercialisée sur disque et en ligne 87.
[261 Ð
Plusieurs explications sont avancées par les professionnels pour justifier le nombre
relativement faible de versions électroniques : il semble que les disques isolés se vendent
mal 88, que ceux inclus dans les volumes imprimés posent un problème de calcul de
TVA et qu’ils soient aisément abîmés ou volés chez les revendeurs, et enfin que les
consultations en ligne 89 et les téléchargements n’aient pas trouvé leur formule commerciale. 90
87
88
89
90
Marque (http://larousse.demarque.com/fr/ca/dictionnaire-francais-ligne/larousse-multidico/) au Canada. En
2007, il a été réédité sous le nom de Larousse illico multidico. Il partage ainsi une partie de son titre avec le
multidictionnaire modulaire présenté en note 72, mais n’est pas intégrable dans ce dernier (contrairement
au Larousse illico français, cf. n. 74).
Le dictionnaire Encarta français est maintenant consultable gratuitement (http://fr.encarta.msn.com/encnet/
[261Ð
|
dif férentes versions d’Encarta sont en sursis, Microsoft
features/dictionary/dictionaryhome.aspx), mais les
ayant annoncé (cf. http://fr.encarta.msn.com/guide_page_FAQ/FAQ.html) la fin de la vente de tous les produits de la gamme Encarta en juin 2009 et la fermeture de son portail international MSN Encarta en octobre
2009 (décembre pour le site japonais).
Est-ce une question de prix, de relative inconnaissabilité de ce que contient un disque à partir de son emballage, d’incompatibilités informatiques redoutées entre différents produits installés simultanément sur un
ordinateur (ce qui pouvait effectivement poser des problèmes il y a quelques années), de mauvaise perception de ce qu’un dictionnaire électronique acheté apporterait de plus qu’une ressource consultée gratuitement en ligne (question qui peut se poser légitimement pour ceux qui sont doublement accessibles, cf. nn.
72, 74 et 87), ou autre chose encore ?
Pour les métalexicographes, ces produits seraient susceptibles de poser d’insurmontables difficultés d’identification (de quel texte s’agit-il ? dans quelle filiation textuelle s’inscrit-il ?) et de référenciation (les versions
en ligne pouvant être actualisées selon un calendrier non nécessairement communiqué par l’éditeur, ce qui
aura été lu ou copié un jour pourra avoir disparu le lendemain, rendant les analyses métalexicographiques
infalsifiables). Jacquet-Pfau (2005 : 70) s’inquiétait de savoir « [c]omment le chercheur aura […] accès, dès
le moyen terme, aux différentes versions d’un dictionnaire » et concluait en indiquant que « [c]’est un débat
sur lequel il n’est plus possible de faire l’impasse ». Le problème est réel pour les chercheurs, mais cela n’infléchira vraisemblablement pas les politiques éditoriales.
Même si, pour que son nom soit présent sur le web, un éditeur fait le choix d’offrir gratuitement certains de
ses produits, il est confronté à un dilemme pour les autres : d’un côté, il constate que des concurrents gratuits
existent, même s’ils n’ont pas le même projet éditorial et que, de fait, ils ne fournissent pas les mêmes informations ou la même qualité ou densité informationnelle, et d’un autre côté il ne perçoit pas les internautes
comme étant suffisamment critiques pour que leurs choix de consultation se portent sur des ouvrages payants,
même si ces derniers leur rendraient de meilleurs services que certains de ceux qui sont consultables gratuitement. Il semble cependant que l’offre de versions en ligne (sur abonnement ou en consultation libre)
soit relativement consistante (cf. nn. 72, 74, 75, 77, 78, 79, 83, 86 et 87). Malgré la probable incomplétude
de cet inventaire, il apparaît que les trois éditeurs majeurs de dictionnaires semblent avoir choisi des fournisseurs de ressources pour les établissements scolaires partiellement différents (le Kiosque Numérique de
l’Éducation pour Larousse et Hachette ; le Canal Numérique des Savoirs pour Le Robert ; De Marque pour
les trois) mais aussi des stratégies divergentes (la déclinaison multiple des sources textuelles et la consultation libre en ligne parallèle à la vente pour Larousse ; des produits bien identifiés mais peu nombreux pour
Hachette et Le Robert). Des téléchargements (non inventoriés ici) sont également proposés. Ils semblent
cependant limités à quelques dictionnaires édités chez Larousse et Hachette.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
823
2.3.1.2. Quelques adaptations liées à la publication électronique
En cas de copublication de versions imprimée et électronique, le même texte subit
[262
deux mises en forme distinctes. Mais alors que le Ðvisuel d’une version imprimée est
défini une fois pour toutes, celui d’une version électronique est susceptible d’être plus
polymorphe, l’interface de consultation pouvant être personnalisable afin de l’accommoder aux goûts de chaque lecteur 91 ou de permettre une lecture adaptée à certains
handicaps visuels 92. Ces changements d’affichage peuvent n’affecter que la feuille de
styles qui régit la présentation du texte dictionnairique (taille, forme, couleurs, etc. des
caractères et des zones d’affichage) et se limiter à un choix de configurations proposées
aux utilisateurs. Ils peuvent cependant aussi exploiter des transformations textuelles,
automatiques ou non, comme (i) le remplacement des abréviations par les formes développées correspondantes, ce qui non seulement apporterait un meilleur confort de
lecture à tous les usagers mais s’avérerait capital pour les malvoyants qui utilisent un
système de synthèse vocale pour percevoir ce qui est affiché à l’écran 93, ou (ii) la présentation d’affichages partiels 94, le texte d’un ou plusieurs composant(s) des articles n’étant
par défaut pas présenté mais représenté par un condensé ou un bouton à partir duquel
un lien donnerait accès au texte complet (ce qui nécessiterait un contrôle de la source
textuelle concernant la compréhensibilité des textes condensés et de leur relation avec
[263 Ð
|
les textes développés qui leur sont liés, la coprésence
d’indica tions interdépendantes
dans les segments sélectionnés pour chaque affichage et la vérification de la cohérence
des sélections d’informations entre articles comparables). Ces potentialités (parmi
d’autres, cf. § 3.) ne semblent pas avoir inspiré la majorité des éditeurs 95, peut-être
[262 Ð
91
92
93
94
[263 Ð
95
Le Trésor de la langue française informatisé offre ce type de fonctionnalité avec une gamme d’options réduites.
Seuls des grossissements de caractères sont généralement proposés, mais il serait possible de permettre de
changer les couleurs du fond pour améliorer le confort visuel de ceux qui ne supportent pas la luminosité de
l’écran, et celles des caractères pour rendre les contrastes mieux perceptibles.
Jaws, « l’un des rares logiciels permettant aux non-voyants d’accéder à l’informatique » (http://www.01net.
com/editorial/352298/linformatique-sans-la-vue/), est un outil de synthèse vocale et de conversion en braille
(cf. http://www.freedomscientific.com/products/fs/jaws-product-page.asp). D’après le site de Larousse (http://
www.encyclopedie-larousse.fr/actualites.htm), « [l]’encyclopédie Larousse en ligne est compatible avec Jaws »,
mais rien n’explique en quoi elle l’est plus qu’une autre et rien de tel ne paraît indiqué pour d’autres produits
de cet éditeur ou de ses concurrents.
Les dictionnaires Robert sont déjà assez bien dotés en affichages partiels. Au sein des articles pour lesquels
c’est pertinent, le Petit Robert de 2001 propose un « Plan » et un « Explorateur » (« Plan » et « Explorateur
f Plan de l’article » à partir de 2006) qui, comme l’« Explorateur (plan) » du Grand Robert de la langue française de 2005, extraient ce qui correspond aux textes par lesquels débutent les subdivisions majeures des
articles. À partir de ces dernières versions, les deux produits proposent un « Explorateur (locutions) » que
le Nouveau Petit Robert appelle « Explorateur f Expressions, locutions et proverbes » et auquel il adjoint
un « Explorateur f Termes et composés ». D’autres visualisations sont en outre proposées : (i) déjà dans le
Grand Robert de 1994, l’article « Abrégé » (moins filtré que l’« Explorateur (plan) » de 2005) et « Détaillé »,
l’« Étymologie », les « Citations », les corrélats (« Syn. / Ana. »), et les homonymes, dérivés, contraires et composés (« Hom. / Dér. ») ; (ii) dans les deux ouvrages à partir de 2001, l’« Article complet » (présenté mais non
nommé dans le Petit Robert de 2001), l’« Étymologie », les « Renvois et contraires », les « Exemples et expressions », les « Citations » et les « Homonymes » ; et (iii) dans le Grand Robert depuis 2005, les précédentes
plus l’« Article sans les citations » en 2005 (version 2.0) ou « Abrégé » depuis 2008 (version 2.1), les « Citations étendu[es] » et les « Dérivés et composés ».
Les dictionnaires Robert se démarquent de leurs concurrents (cf. nn. 94 et 96).
824
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
parce qu’elles ont été jugées trop peu rentables 96, même pour ce qui ne concerne que
les adaptations qui permettraient aux déficients visuels d’accéder aux contenus dictionnairiques 97.
Du point de vue des contenus, les éditions électroniques sont souvent des reproductions, enrichies d’hyperliens, des articles prévus pour les éditions imprimées ou, au
mieux, des compilations réunissant plusieurs textes d’un éditeur, comme le Larousse
expression (cf. n. 85). Selon les commentaires déposés sur les sites de vente de dictionnaires, ce dernier produit a reçu un écho favorable chez certains utilisateurs, séduits
par la possibilité de trouver au sein d’un seul dictionnaire des informations jugées trop
souvent disséminées. Si ces assemblages ont ouvert la voie, ils montrent leurs limites,
comme les rétroconversions et les copublications, pour l’élaboration de nouvelles fonctionnalités (en dépit des efforts qui ont été faits, cf. nn. 94 et 96) et incitent à penser
que seules seront vraiment opératoires les descriptions qui seront conçues pour le support électronique, parce qu’elles seront élaborées en tenant compte des affichages at[264 Ð
tendus, avec des sélections d’informations encore
inhabituelles. 98 Si les maisons
d’édition avaient les moyens d’affecter une partie du temps de travail des lexicographes
et des informaticiens à la recherche et au développement, il leur incomberait d’imaginer des ébauches de produits dont la finalité serait de dégager et de tester des pistes
de réflexion pour de futures productions électroniques conçues, elles, pour être viables.
96
97
[264 Ð
98
Peut-être est-ce aussi ce qui motive qu’il y ait des fonctionnalités qui disparaissent. Le Petit Robert de 2001
offrait une fonction, très utile pour les linguistes et les pédagogues au moins, de constitution de listes exportables d’adresses (lemmes et flexions) accompagnées de leur(s) catégorie(s) qui soit représentaient des items
partageant une propriété identifiée au moyen de différents critères proposés au sein des onglets de recherches
avancées (chaîne de caractères intégrant des jokers, prononciation approchée, catégorie grammaticale et
flexionnelle, appartenance à une série morphologique, étymologie (langue ou groupe de langues et datation),
présence dans les citations d’un auteur), soit introduisaient des articles contenant des mots ou des séquences
de mots recherchés, combinés ou en disjonction et graphiés intégralement ou avec caractère joker final, dans
le texte intégral, le plan, les exemples et expressions ou les renvois et contraires. Le Nouveau Petit Robert
(à partir de 2006) et le Grand Robert de la langue française n’offrent pas l’export des listes de résultats mais
proposent différentes options de recherche : alors que le Grand Robert de 1994 permettait des recherches
puissantes, avec caractères jokers en toutes positions dans la nomenclature, et avec jokers et opérateurs
booléens dans les citations et leurs références, celui de 2005 sur disque (version 2.0) n’autorise que la
recherche d’un mot dans l’intégralité du texte ou dans les citations (sans caractère joker ni opérateurs
booléens), tandis que le Nouveau Petit Robert sur disque et en ligne (cf. n. 78) et le Grand Robert de 2008 et
en ligne (version 2.1) proposent les mêmes options de recherche que le Petit Robert de 2001, sauf concernant
celles en plein texte, qui explorent maintenant aussi les définitions et les marques d’usage et de domaines,
mais qui n’offrent plus ni caractère joker ni opérateurs booléens, et celles dans les étymologies, non proposées par le Grand Robert.
En revanche Mediadico, dictionnaire gratuit en ligne, propose des articles assez textualisés pour en fournir
une version oralisée (cf. Corbin & Gasiglia (2009a, n. 10)), qui est tout à fait compréhensible quoique la courbe
intonative soit très plate.
Selon Hausmann (2003 : 261-262), « [c]omme aucun autre, le texte lexicographique a vocation à profiter des
nouvelles possibilités médiales. […] l’avenir n’est pas le dictionnaire informatisé après coup, mais le dictionnaire électronique conçu comme tel et exploitant à fond ses potentialités hypertextuelles. C’est là le défi à
relever […]. ». S’il est effectif que les liens joueraient un rôle crucial dans un dictionnaire électronique “ natif ”,
il est malaisé d’imaginer dépasser le stade de cohabitation textuelle hypertextualisée des produits compilatoires (les plus novateurs aujourd’hui) sans que la conception des articles en tant que texte soit réformée
elle aussi (cf. Verlinde, Selva & Binon (2009, § 3.), dans ce volume, et § 3.2. ci-après).
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
825
Pour l’heure, c’est la recherche publique qui innove 99, mais ses acteurs n’ont pas vocation à concevoir plus que des prototypes et n’ont qu’une influence très indirecte sur
les projets éditoriaux.
2.3.2. Une diversification des posttraitements induisant un changement de métier
pour l’informatique éditoriale
Alors que l’édition électronique n’a pas (encore) véritablement pris son essor et par
conséquent pas pleinement profité de la structuration des textes de dictionnaires, c’est
l’édition imprimée qui semble en tirer le meilleur profit à date récente. En effet, un
transfert de compétences très marquant a été opéré chez certains éditeurs, qui ont décidé de ne plus faire appel systématiquement à des compositeurs externes et de traiter
eux-mêmes une partie de la mise en page. Ce choix a été rendu possible par le fait que
[265 Ð
le logiciel InDesign 100 traite des “flux XML” 101, données structurées dont la
mise
en forme peut être effectuée selon des règles établies par les équipes internes d’informatique éditoriale, et que sa manipulation n’est pas très complexe concernant des tâches
de correction de composition à réaliser manuellement sur certaines pages, ce qui permet de les confier à des lexicographes formés à son maniement en plus des relecturescorrections du texte qu’ils assuraient déjà 102. L’internalisation de cette tâche a été
motivée en partie par la possibilité de produire des versions partielles stylées à tout
moment de la rédaction, ce qui semble permettre de mieux contrôler l’élaboration du
texte, et en partie par la réduction du temps de traitement, puisque au lieu d’envoyer
les fichiers XML au compositeur pour traitement et envoi en retour de fichiers PDF
99
Par exemple en concevant des projets comme le Dictionnaire d’apprentissage du français langue étrangère
ou seconde (DAFLES ) intégré dans la Base lexicale du français (cf. Verlinde, Selva & Binon (2009)).
100 Le logiciel de mise en page Adobe InDesign a concurrencé Quark Xpress, très bien implanté chez les compositeurs et les imprimeurs. Cela tient au fait qu’InDesign a intégré le traitement de documents XML dans sa
version CS2, dès 2005, alors que Quark Xpress ne l’a fait que plus tard (en 2006, pour sa version 7, par l’adjonction de XML QuarkXTensions software 7.02) et, semble-t-il, avec un succès moindre. Chez les compositeurs,
pour les textes dont la composition est très régulière (comme les dictionnaires non illustrés), InDesign n’a
pas remplacé Adobe FrameMaker, plus adapté pour de la mise en page automatisée.
101 Ce traitement consiste à associer des “styles paragraphes” et des “styles caractères” aux contenus des éléments
XML. Il nécessite donc que chaque document soit structuré de manière compatible avec cette double articulation des styles, alors qu’un document XML peut avoir une profondeur d’enchâssement des éléments bien
supérieure à deux niveaux. Il implique aussi que le contenu textuel de chaque document XML contienne
strictement les espaces et sauts de lignes qui devront figurer dans le texte mis en forme, ce qui requiert un
prétraitement minutieux (en particulier si, comme c’est parfois le cas, l’éditeur XML indente les éléments
enchâssés afin d’améliorer la lecture structurelle du document).
[265 Ð
102 Ces ajustements peuvent être faits lors de l’une des relectures du texte s’ils sont assez peu nombreux pour
ne pas déconcentrer de la relecture de fond.
826
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
un lexicographe peut maintenant générer instantanément un PDF 103 composé automatiquement 104. 105
Indépendamment de ce transfert de compétences, la structuration des textes a permis à l’informatique éditoriale de participer plus activement encore à la conception des
nouveaux projets et de proposer que, dès sa conception, un texte ne soit pas celui d’un
dictionnaire mais de plusieurs : les versions imprimée et électronique, de multiples dérivés (dont la nouveauté peut ne consister qu’en un changement de maquette ou qui se
distinguent de leur source par les suppressions ou déplacements d’éléments textuels 106
qui y ont été opérés 107) et des textes nouveaux créés par métissage 108, ce qui implique
une assez bonne connaissance du fonds pour y sélectionner, avec les lexicographes, les
sources les plus pertinentes pour chaque projet en plus de la capacité, attendue chez
un informaticien éditorial, à fusionner des segments de textes (éventuellement à réviser)
ou à élaborer des interfaces de travail présentant simultanément les éléments perti[266
nents de toutes les sources choisies afin de laisser les Ðlexicographes opter pour celles
qui conviennent le mieux pour chaque article.
Autrefois interfaces entre les lexicographes et les compositeurs externes, les équipes
d’informatique éditoriale ont vu leur champ d’intervention s’élargir. Leurs rapports avec
les compositeurs ont évolué avec l’internalisation d’une partie de leur tâche et donc des
partages de savoir-faire, mais c’est sur le terrain de la conception de projet que leur investissement a fait le plus évoluer leur métier. D’accompagnatrices, elles sont devenues
coresponsables voire porteuses autonomes de projets (exploitant des textes antérieurement rédigés) et influentes dans les prises de décisions des gestionnaires.
2.4. Réflexions conclusives sur les modes d’élaboration
Tant que les dictionnaires ont été des ouvrages imprimés dont le contenu comme la
présentation étaient figés jusqu’à la publication suivante, l’interdépendance du texte
et de sa mise en forme n’était pas remise en cause. Le besoin de réemployer des élé103 Selon les expériences relatées par des partenaires professionnels (cf. n. 1), vingt-quatre heures pouvaient
s’écouler entre l’envoi du XML et la réception du PDF. L’instantanéité qui est valorisée ne tient pas compte
du temps qu’il a fallu aux informaticiens pour élaborer les règles de mise en forme utilisées par InDesign,
mais ce temps était antérieurement rétribué au compositeur qui assurait ce travail.
104 Ce qui est généré automatiquement doit être révisé avant publication, mais c’est une ébauche suffisamment aboutie pour permettre de procéder aux relectures.
105 Gabino Alonso, directeur de l’informatique éditoriale chez Larousse, décrit cette internalisation (http://www.
adobe.com/fr/showcase/pdfs/200701_larousse.pdf).
106 Ces manipulations de textes impliquent directement les lexicographes, qui doivent veiller à ce que ces suppressions et déplacements ne nuisent pas à la compréhension du reste de l’article, mais elles peuvent être
engagées par des informaticiens qui ont acquis une bonne connaissance de la structure des articles.
107 Ces remodelages structurels de documents XML se font avec des “feuilles de styles” XSLT (langage XML de
transformation dédié à la création de nouveaux documents XML, HTML ou TXT à partir d’un document XML)
ou de scripts Perl (langage de programmation polyvalent qui traite des chaînes de caractères et dont des
bibliothèques offrent des modules spécialisés : XML::Parser, XML::Dom, etc.).
108 Le Larousse pratique, par exemple, a plusieurs dérivés (cf. nn. 74 et 72, et F. & P. Corbin (2008, § 4.2.)) et il
est un des parents de textes plus métissés comme le Larousse des noms communs, cf. n. 57.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
827
ments textuels afin d’en dériver d’autres était cependant avéré et c’est pour mieux y
répondre que les efforts de structuration ont été engagés avec d’une part la rétroconversion des textes antérieurement publiés jugés importants pour les dérivations à venir
et d’autre part la rédaction structurée des nouveaux produits. Cette évolution a eu des
incidences sur le travail accompli au sein des trois strates, et elle a induit des transferts de compétences qui ont principalement touché les équipes d’informatique éditoriale, mais elle n’a remis en cause ni le fait que la textualité des articles trouve parfois
des accommodements avec le principe de répartition des informations dans les composants qui les subdivisent (cf. n. 24), ni l’idée répandue qu’un dictionnaire répond à
des besoins en fournissant un texte qui associe des descriptions de propriétés linguistiques à des adresses lexicales.
Cette conception des produits et des services qu’ils doivent rendre fonde les méthodes
actuelles de l’activité lexicographique. L’adéquation supposée entre les besoins informationnels éprouvés par des personnes et les réponses fournies par les dictionnaires
peut être évaluée de deux manières différentes par les éditeurs : soit il existe un segment de marché bien établi avec des utilisateurs ciblés identifiés et des besoins auxquels des éditeurs concurrents ont déjà tenté d’apporter une réponse, soit il s’agit d’un
besoin perçu par les éditeurs mais pas nécessairement par le public et à propos duquel
il faut développer des arguments de vente consistants afin que les potentiels acquéreurs
s’identifient, perçoivent les services que le nouveau dictionnaire est susceptible de leur
rendre et se muent en acheteurs effectifs. 109 Pour un éditeur, l’appréciation de l’adé[267 Ð
|
quation d’un projet dictionnairique et d’un besoin correspond donc
large ment à une
prévision de vente : capacité de l’ouvrage à trouver sa place à côté de concurrents sur
un segment de marché repéré ou capacité du public à souscrire à une offre commerciale
répondant à un “nouveau” besoin. Ce mode d’évaluation, qui est cohérent avec une logique de constitution de catalogue et de diversification des services rendus aux lecteurs
du fait de la diversité des ouvrages mis à leur disposition, ne semble pas avoir notablement évolué avec les changements informatiques, ces dernières années étant plutôt
caractérisées par un repli sur des produits de facture éprouvée et dont la rentabilité
est supposée assurée (cf. P. Corbin (2008, § 3.)). Pourrait-on imaginer que ce soit à l’informatique éditoriale qu’il revienne de bouleverser les principes actuels de gestion des
catalogues ? Serait-il envisageable, pour un éditeur, de proposer un dictionnaire électronique qui contiendrait “ toutes” les informations susceptibles d’être utiles 110 et qui
disposerait d’une interface dont la lisibilité permettrait aux utilisateurs de s’orienter
aisément vers la sélection d’informations pertinentes pour répondre à ce qui motiverait chaque consultation ? Cette révolution dictionnairique a été en partie imaginée
par Atkins (2002a [1996] : 12-13 111) à propos de descriptions combinables (selon des
[266 Ð
109 Pour les métalexicographes, cette adéquation s’apprécie à partir d’une analyse qualitative d’un produit publié
et d’une évaluation théorisée des besoins.
[267 Ð
110 S’il n’est pas aisé d’imaginer comment les présenter toutes, il est au moins possible d’envisager d’en fournir
un certain nombre qui sont actuellement distribuées dans différents produits ou qui ne sont que rarement
sélectionnées, faute peut-être de bien savoir à qui, pourquoi et comment les énoncer.
111 « 2.2.1. Real databases, real links and virtual dictionaries » (p. 12) ; « (b) The dictionaries These will be of at
least three types: monolingual, bilingual and multilingual, and indeed when enough dictionaries have been
828
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
liens établis entre elles) afin de constituer des dictionnaires mono- ou plurilingues proposant différents niveaux d’informations pour répondre mieux que les ouvrages sélectifs
actuels à tous les besoins des usagers. Cette idée constitue une base de réflexion stimulante, dont s’est inspirée la spéculation présentée au § 3., qui limite sa portée à la
description du français et au public d’âge scolaire, celui qui, conjointement, acquiert
la pleine maîtrise de sa langue, apprend à se documenter et apprécie souvent les outils
électroniques.
3.
Changer les produits : le cas des dictionnaires scolaires
Les mutations informatiques ne concernent pas que les milieux professionnels. Les
foyers sont de plus en plus souvent équipés en micro-ordinateurs 112 et les enfants sont
[268 Ð
initiés à leur manipulation
dès le cours préparatoire 113. Outre ces évolutions, trois
paramètres pourraient conduire à produire de nouveaux dictionnaires électroniques
polymorphes destinés aux écoliers et collégiens 114 :
– les programmes scolaires 115 prévoient que les enseignants initient au maniement des
[269 Ð
dictionnaires 116, ce qui autorise à penser que ces
derniers apparaissent comme des
112
113
114
115
compiled the user will be able to switch dictionary types at will. Each type of dictionary will offer the user
various levels of information, from brief and simple to long and complex. » (p. 13).
Selon une enquête de l’institut d’études de marketing Gfk, « le taux d’équipement français en micro-ordinateurs personnels (PC de bureau et portables) s’élevait en 2007 à 60% , soit 15,5 millions de foyers » (« deux
[268Ð
Si ce taux reste faible chez les plus de 65 ans, « il est de 80% chez les 25-34 ans. »
fois plus qu’en 2000 »).
(cf. http://www.commentcamarche.net/actualites/les-francais-ont-achete-pres-de-5-millions-de-pc-en-20074742551-actualite.php3).
Les programmes du cycle 2 (limité aux cours préparatoire et élémentaire 1 e année : http://www.education.
gouv.fr/bo/2008/hs3/programme_CP_CE1.htm) mentionnent l’usage des ordinateurs dans deux contextes :
en « Français » (« Lecture, écriture »), les élèves « sont amenés à utiliser l’ordinateur : écriture au clavier,
utilisation d’un dictionnaire électronique. », et, au titre de la « Découverte du monde », ils « commencent à
acquérir les compétences constitutives du brevet informatique et internet (B2i). Ils découvrent et utilisent
les fonctions de base de l’ordinateur. ». Certaines écoles maternelles proposent aussi des initiations à la manipulation d’ordinateurs, mais ce n’est pas inscrit dans les programmes officiels.
Cette limitation au collège correspond aux limites actuelles de l’offre des éditeurs. Les lycéens peuvent être
inclus dans les destinataires des dictionnaires généraux (c’est le cas pour le Lexis Larousse), mais leur établissement n’est pas mentionné comme l’est le collège dans le titre des ouvrages (cf. Corbin & Gasiglia (2009c,
§ 2.), dans ce volume) : tout au plus peut-on faire état de la mention du lycée sur la couverture d’un dictionnaire bilingue, le Robert & Collins compact plus.
Entre 2002 et 2008, la place faite aux dictionnaires a progressé dans les instructions officielles pour l’école
primaire. En 2002, celles pour le cycle 2 n’en faisaient pas mention (http://www.education.gouv.fr/bo/2002/
hs1/cycle2.htm), alors que celles de 2008 mentionnent l’usage du dictionnaire électronique (cf. n. 113). En 2002,
celles pour le cycle 3, invitaient à « consolider l’usage du dictionnaire » sans autre précision (http://www.
education.gouv.fr/bo/2002/hs1/cycle3.htm), alors qu’en 2008 elles le mobilisent pour la « rédaction » (les élèves
« sont entraînés à rédiger, à corriger, et à améliorer leurs productions, en utilisant le vocabulaire acquis, leurs
connaissances grammaticales et orthographiques ainsi que les outils mis à disposition (manuels, dictionnaires,
répertoires etc.). ») et lors des séances de « vocabulaire » (« L’usage du dictionnaire, sous une forme papier
ou numérique, est régulière. »). De manière surprenante, selon les textes de cadrage de 2006 (http://www.
education.gouv.fr/cid81/les-programmes.html#francais), les dictionnaires ne sont à mobiliser au collège que
pour la vérification orthographique (« maîtriser les principales règles d’orthographe grammaticale et lexicale ;
avoir recours spontanément et efficacement aux outils de vérification (dictionnaire, correcteur d’orthographe). »).
Ce cantonnement n’est pas cohérent avec la mention en introduction des « deux objectifs indissociables : la
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
829
ouvrages trop codifiés pour être abordés par les élèves seuls. Cependant, la grande majorité des entraînements prévus dans les manuels sont destinés aux plus jeunes lecteurs,
ce qui ne semble pouvoir être motivé ni par le fait que les dictionnaires sont perçus
comme plus abordables quand leur programme d’information s’enrichit, car ce serait
paradoxal, ni par le fait que les élèves de fin d’école primaire et de collège sont considérés comme des lecteurs rompus à leur consultation, même en ce qui concerne les indications les plus complexes, car cela témoignerait d’un optimisme excessif (cf. Corbin
& Gasiglia (2009c, § 4.3.) ou Macron (1999, §§ 2.2. et 2.3.)) ;
– l’offre actuelle en matière de dictionnaires scolaires 117, en faisant l’hypothèse qu’elle
reflète bien les besoins pédagogiques, semble indiquer que, durant les premières années de la scolarité, les élèves doivent pouvoir accéder à une proportion croissante d’informations formulées dans des termes adaptés à leur maturité intellectuelle ;
– les environnements numériques de travail (appelés métaphoriquement “cartables
électroniques” 118) semblent destinés à être déployés dans les écoles primaires et les
collèges, et dès à présent une part non négligeable des enfants d’âge scolaire pourrait
consulter un dictionnaire sur un ordinateur familial, ce qui serait susceptible de faire
maîtrise de la langue et l’acquisition des repères culturels et esthétiques », auxquels les dictionnaires peuvent
contribuer.
116 Les enseignants sont aidés par les manuels qui proposent des entraînements à la manipulation des dictionnaires. Certains de ces exercices portent sur des pages de répertoires reproduites dans le manuel (par exemple,
dans la série À portée de mots, le Dictionnaire Hachette benjamin de 1996 pour le manuel du CE1 (pp. 114115 et 118), le Dictionnaire Hachette junior de 1998 pour celui du CE2 (pp. 120-121)) et son édition de 2006
pour celui du CM1 (pp. 140 et 142), d’autres sont d’autant plus faciles à réaliser en classe que tous les enfants
disposent d’un même dictionnaire (dans le précédent manuel pour le CE1 : « Cherche ces mots dans ton dictionnaire et écris les mots repères qui sont en haut de chaque page » (exercices 5 et 6, p. 116), « Dans ton
dictionnaire, retrouve et écris le mot qui est juste avant chacun de ces mots » (exercices 10 et 11, p. 117) ou
« Dans ton dictionnaire, retrouve et écris le mot qui est juste après chacun de ces mots » (exercices 12 et 13,
[269Ð
mots ? », « À l’aide
p. 117), « Dans ton dictionnaire, combien de définitions trouves-tu pour chacun de ces
de ton dictionnaire, recherche et recopie les bonnes définitions des mots en gras. » (exercices 4 et 5, p. 119)).
Par ailleurs, certains éditeurs proposent des fiches pédagogiques à télécharger. C’est le cas par exemple
pour Le Robert (http://www.lerobert.com/home-enseignants-documentalistes-2.html), qui fournit une fiche
pour le cycle 2, quatre pour le cycle 3, huit pour le collège (qui bénéficie en outre d’un document de synthèse,
« Comment utiliser le dictionnaire en classe ? », et de trois fiches dédiées à l’étude de différents genres littéraires), quand Larousse offre quarante fiches pour le seul cycle 2 (http://www.editions-larousse.fr/Actualites/
larousse_debutants/fiches_larousse_debutants.pdf ) mais rien pour les élèves plus âgés.
117 Cf. Gasiglia (2008a, tab. 1) pour une présentation généalogique des dictionnaires scolaires et périscolaires,
qui donne une bonne idée de l’offre pour les cycles 2 et 3 en 2007, mais qui n’est plus tout à fait à jour (le
Dictionnaire Auzou débutant n’était pas encore publié, le Dictionnaire Auzou junior était vendu sans
disque et le Larousse junior n’avait pas encore été refondu). Cf. Corbin & Gasiglia (2009c, § 2.) pour l’offre
faite aux collégiens.
118 Selon le site officiel EducNet (http://www.educnet.education.fr/dossier/manuel/notions/ent-cartable-numerique),
cartable électronique est une marque qui a été déposée en 1999 par l’université de Savoie. Il s’agissait à l’origine d’un projet de plate-forme de travail et de collaboration. La notion a été reprise sous différentes dénominations (cartable numérique, e-cartable, manuel électronique, manuel numérique, e-manuel, etc.) pour parler soit d’un équipement informatique mobile dont seraient équipés les élèves dans l’enceinte de leur établissement et dans leurs foyers, soit d’un environnement numérique de travail, un portail Internet, auquel
les élèves pourraient se connecter à partir de leur établissement ou de leur foyer.
830
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
évoluer rapidement une offre qui est actuellement principalement constituée de volumes
imprimés 119.
[270 Ð
Cette évolution induit ci-après une analyse de ce qui pourrait constituer une offre
adaptée à ce public, qui va massivement avoir besoin d’outils électroniques. Cette réflexion prolonge d’autres développements relatifs aux dictionnaires considérés comme
des outils d’accès à l’autonomie (cf. P. Corbin (2008, § 4.) ou Corbin & Gasiglia (2009c,
§ 1.)) en insistant sur le fait que, afin que les locuteurs soient en mesure de profiter
pleinement des services que peuvent rendre les dictionnaires, il faut leur apprendre dès
leur plus jeune âge à les apprécier comme sources documentaires, ce qui implique d’entraîner les élèves à les consulter efficacement et à en percevoir la richesse et la qualité
informationnelles qui les distinguent d’autres sources plus aléatoires. 120
Deux produits sont envisagés ci-après : le premier hériterait strictement des dictionnaires scolaires actuels, dont il compilerait les textes en leur adjoignant des fonctionnalités propres au support électronique ; le second, le plus novateur et le mieux à même
d’aider les élèves, nécessiterait de concevoir des modalités d’accès et des textes assez
substantiellement renouvelés.
Outre leur support, ces dictionnaires partageraient quatre orientations éditoriales
originales (rappelées localement aux §§ 3.1. et 3.2.) :
– La coprésence de textes concurrents pour décrire certaines propriétés des items permettrait d’y combiner des sélections d’informations adaptées aux compétences croissantes et aux besoins variés des élèves des écoles et collèges.
– En rendant accessibles des descriptions exclues des dictionnaires des élèves des cycles 2
et 3 mais présentes dans ceux destinés à leurs aînés, ils pallieraient l’une des limites
des ouvrages imprimés en réduisant, pour les écoliers, le nombre de recherches d’unités
linguistiques ou de sens infructueuses et, de ce fait, démotivantes.
– En garantissant le maintien de points de repères stables quel que soit l’accroissement
de la richesse des informations fournies, ce qui fait actuellement défaut dans les volumes
imprimés, ils sécuriseraient les élèves 121. Sur ce point trois objets au moins méritent
une attention particulière : (i) la lisibilité pourrait être augmentée par exemple en rem[271 Ð
plaçant systématiquement les abréviations par
les formes développées correspon119 Cf. nn. 79 et 80 concernant les versions électroniques du Robert junior de 1993 et du Dictionnaire Auzou junior
de 2008. Pour l’heure, les exercices faits en classe semblent encore n’entraîner qu’à la manipulation de volumes imprimés. La recherche de l’article dédié à un mot dans l’un de ces volumes implique de savoir lem[270 Ð
suite alphabétique des
matiser l’item puis de repérer la position relative du lemme en adresse dans la
autres adresses, ce qui nécessite un entraînement et qui semble difficile et fastidieux aux débutants. Il pourrait paraître plus aisé aux élèves de chercher un article électronique par hyperappel (comme le Petit Robert
le permet à un autre public) ou copie de la forme de l’item motivant la recherche (cf. nn. 131 et 146).
120 L’éducation des lecteurs augmenterait l’impact des améliorations de la lisibilité des dictionnaires (celle de
leur structure (cf. p. 252), des informations qu’ils fournissent (cf. p. 272) et de la présentation du texte (cf.
n. 5 et pp. 267 et 270-271)).
121 Les dictionnaires imprimés marquent leur appartenance à un segment de marché et valorisent les progrès
présumés des utilisateurs. Les dictionnaires électroniques pourraient ne suivre que partiellement cet usage et
proposer des visuels évolutifs, adaptés à chaque âge afin de refléter les compétences croissantes des élèves,
mais le faire en offrant des repères textuels stables qui soutiendraient les efforts de décodage des contenus
informationnels, ce qui est d’autant plus nécessaire que, alors que la quantité et l’abstraction des informations
fournies augmentent, certains utilisateurs restent des lecteurs hésitants.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
831
dantes (cf. § 2.3.2.) et en ajoutant des infobulles associées à chaque élément de métalangue ; (ii) les données d’un même type pourraient avoir la même mise en forme, de
sorte que les élèves perçoivent que des informations exprimées de manière différente
sont en fait de même nature même si elles se complexifient ; (iii) certaines informations,
complexes en elles-mêmes pour des élèves qui sont en train d’acquérir les notions grammaticales qui permettent de comprendre les indications du dictionnaire, pourraient
recevoir des formulations adaptées aux compétences croissantes du public cible (cf.
§ 3.2.1.3.).
– Enfin, enrichis d’exercices de manipulation comparables à ceux présents dans les
manuels scolaires 122 et de jeux motivant des recherches d’informations au sein des
articles 123, ils pourraient être des outils au maniement desquels les élèves seraient en
mesure de s’entraîner de manière ludique et autonome.
Malgré leurs points communs, un dictionnaire compilant d’anciens textes et un autre
neuf et conçu pour le support électronique ne pourraient pas mettre en œuvre similairement les orientations éditoriales précédentes : en fonction de leur mode d’élaboration
chacun des produits envisagés ne constituerait une ressource innovante qu’à la hauteur
des investissements qui lui seraient consacrés. Selon des modalités différentes, ils assureraient aux élèves de trouver des informations utiles pour le décodage d’une unité
linguistique en contexte et la vérification orthographique (les deux principaux motifs
de consultation des articles), mais, les répertoires actuels n’étant que mal exploitables
pour l’aide à l’expression, seul le plus novateur pourrait constituer un outil efficace sur
ce terrain et permettre de dépasser les limites présentes en matière d’usage des dictionnaires (cf. Corbin & Gasiglia (2009c, § 5.)).
3.1. Un dictionnaire produit par compilation et posttraitements
Une manière économique, pour un éditeur, d’élaborer un dictionnaire électronique
pour l’école primaire et le collège, fourni dans les diverses formes d’environnements numériques de travail ou installé sur les ordinateurs scolaires ou familiaux, consisterait
[272 Ð
à prévoir un réemploi compilatoire 124 de textes déjà publiés, avec accès
prioritaire
à ceux destinés au niveau scolaire dans lequel est inséré chaque élève, et à la demande
aux autres. Pour les textes structurés 125, ceci pourrait être fait en choisissant de ne
pas investir dans une refonte de contenu, mais seulement dans la création d’une ma[271 Ð
122 Une partie de ceux évoqués à la note 116, qui visent à permettre aux élèves de se repérer dans le volume imprimé puis dans la page, n’auraient plus de pertinence pour l’entraînement à la consultation d’une version
électronique, mais celle-ci nécessite d’autres automatismes, en particulier si des fonctions de recherche comparables à celles des dictionnaires Robert électroniques sont mises à disposition (cf. nn. 94 et 96 et l’« Aide »
du Robert junior puis du Robert des enfants).
123 Les matériaux existant dans différents produits scolaires et parascolaires des éditeurs pourraient permettre
aux lexicographes, aux informaticiens (ceux de l’informatique éditoriale et ceux qui développent l’interface
de consultation) et aux pédagogues de concevoir conjointement ces enrichissements.
124 Les deux compilations déjà publiées par Larousse (cf. nn. 84 et 85) ne ciblaient pas particulièrement les
élèves.
[272 Ð
125 La plupart des éditeurs semblent avoir structuré leurs dictionnaires destinés aux élèves des cycles 2 et 3,
mais ils ne paraissent pas l’avoir fait aussi systématiquement pour les volumes destinés aux collégiens.
832
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
quette adaptée et l’élaboration de transformations informatiques réalisant le nouveau
posttraitement des données. 126
Comme c’est généralement le cas dans les versions électroniques, les articles de ce
dictionnaire pourraient être enrichis de liens, en particulier depuis les synonymes et
contraires listés vers les articles décrivant ces corrélats 127, ce qui faciliterait la circulation dans le texte dictionnairique pour les jeunes lecteurs (cf. n. 119).
Un dictionnaire élaboré selon ces principes permettrait assurément de répondre rapidement et à moindre coût à une demande qui risque de devenir pressante. Il pourrait
néanmoins ne pas être très satisfaisant :
– La modestie relative des textes sources pourrait conduire à s’interroger sur l’opportunité de proposer ceux de certains articles pour le cycle 2, qui, une fois à l’écran, risqueraient de paraître très peu consistants alors que la lisibilité de ceux destinés aux
élèves du cycle 3 semble assez bonne même pour des lecteurs débutants. 128
– La progression de la densité informationnelle des articles coprésents n’est pas nécessairement avérée et ceux destinés aux lecteurs les plus confirmés pourraient, pour certains items, ne rien contenir de plus que ceux destinés aux plus novices, voire fournir
[273
|
moins Ðd’in dications en présupposant chez les premiers une compétence linguistique
et une connaissance des objets du monde supérieures. 129
– Le point fort théorique que constitue l’accès à des descriptions plus complexes pourrait par ailleurs devenir un facteur de trouble si certains items étaient décrits de manière non compatible dans des dictionnaires échelonnés dans une progression qui laisse
attendre une cohérence entre eux. 130
126 Un enfant qui grandit change, mais ses progrès ne sont pas strictement en phase avec ses changements de
classes, ce que l’offre de dictionnaires imprimés ne prend pas en compte autrement qu’en laissant à chacun
le choix de consulter l’ouvrage qui lui convient le mieux. Il n’est pas certain qu’un dictionnaire électronique
compilant d’anciens textes imprimés puisse aller plus loin dans l’accompagnement des élèves, mais, en rendant tous les articles accessibles à chacun, il leur permettrait au moins d’atteindre aisément ceux qui leur
conviennent le mieux lors de chaque consultation. Il serait ainsi possible d’envisager qu’un élève de cours
moyen 1 e année accède directement aux articles prévus pour le cycle 3, mais que des boutons lui proposent
l’affichage d’une description plus simple (celle normalement destinée aux élèves du cycle 2) s’il trouve la première trop complexe, ou de tout ou partie d’une description plus consistante (destinée aux élèves à la jonction du cycle 3 et du collège ou aux collégiens) s’il n’a pas trouvé de réponse à l’interrogation qui motivait
sa recherche ou qu’il est désireux d’en apprendre plus.
127 La mise en place de ces liens impliquerait une révision du texte structuré : un script associerait à chaque corrélat un lien vers un article ayant une adresse de même forme, puis un lexicographe effectuerait le contrôle
de la validité de ces liens, corrigerait ceux qui sont orphelins du fait de l’absence d’articles cibles, préciserait
ceux qui doivent pointer vers un item ayant au moins un homographe et, éventuellement, spécifierait ceux
qui arrivent à des articles constitués de plusieurs subdivisions descriptives afin qu’ils conduisent à la subdivision pertinente.
128 C’est du moins ce qui apparaît à partir des deux dictionnaires scolaires électroniques disponibles, le Robert
des enfants et le Dictionnaire Auzou junior.
[273 Ð
129 Par exemple, s.v. actuellement, le Larousse des débutants fournit deux définitions qui distinguent deux présents relatifs (« 1. Actuellement signifie : en ce moment. […] 2. Actuellement signifie : à notre époque. »),
alors que le Larousse junior et le Dictionnaire du français au collège négligent de signaler cette distinction
(« En ce moment. » / « Dans la période présente, en ce moment »).
130 La progression de complexité sans remise en cause des fondements pourrait susciter l’attente d’articles “gigognes”, comme c’est le cas entre l’article addition du Larousse des débutants, qui fournit la définition « L’addition est l’opération qui permet d’ajouter des nombres à d’autres nombres. » et celui du Dictionnaire du
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
833
Ces limites sont principalement induites par le réemploi d’anciens textes et l’absence
de refonte qui conduiraient en outre à ne pas mieux exploiter les potentialités du support électronique que cela s’est fait jusqu’ici. Si ce projet était néanmoins jugé viable,
sa réalisation retarderait le moment où l’éditeur qui l’engagerait créerait un produit
électronique vraiment innovant (cf. n. 98 et § 2.4.).
3.2. Un dictionnaire polymorphe et plurifonctionnel
Une option plus stimulante, mais beaucoup plus lourde, consisterait à concevoir un
nouveau dictionnaire pour l’ensemble de la scolarité primaire et du collège. Ce dictionnaire aurait une fonction pédagogique à remplir dans la mesure où il devrait initier
les jeunes lecteurs à la consultation d’articles de répertoires métalinguistiques en leur
montrant les bénéfices qu’ils peuvent tirer de ces outils, ce qui pourrait se faire en explicitant d’une part les étapes d’une recherche d’aide pour la compréhension ou l’expression et d’autre part la nature et l’utilité des informations fournies par chaque segment
de texte présenté. Outre cette attention portée à l’explicitation des méthodes de consultation et d’utilisation des informations, ce dictionnaire devrait faire varier les indications fournies et les manières de les présenter en fonction des circonstances de consultation (la finalité – aide à la compréhension ou à l’expression – et la modalité – consultation directe ou hyperappel 131) et des compétences et désirs des lecteurs, ce qui impli[274
|
querait que certains Ðélé ments d’information fassent l’objet de plusieurs rédactions,
chacune s’insérant dans des combinaisons de modules textuels différents 132 affichables
alternativement 133. Selon leurs compétences effectives et leur motif de consultation,
les élèves pourraient alors bénéficier de sélections d’informations et de manières rédactionnelles qui leur soient adaptées au sein d’un dictionnaire scolaire évolutif qui paraîtrait se reformuler et s’enrichir au fur et à mesure qu’ils grandissent.
français au collège, qui en fournit trois, dont une qui précise celle du dictionnaire précédent (« 2. Opération
arithmétique consistant à ajouter un nombre à un autre ») et dont l’affichage pourrait matérialiser son lien
avec celle-ci. Tous les articles réunis pour un même item n’entretiendraient cependant pas des relations d’inclusion, cf. n. 129.
131 La consultation directe comme l’hyperappel doivent pouvoir se faire à partir de la forme lemmatisée (celle qui
est employée comme adresse d’article) ou d’une autre forme de l’item et avec une orthographe valide ou approximative (susceptible d’être corrigée par le système d’interrogation, cf. n. 146).
[274 Ð
132 Il est vraisemblable que certaines reformulations devraient être rédigées, mais un sous-ensemble d’entre elles
pourraient être générées automatiquement. C’est le cas des informations relatives à l’orthographe d’usage,
pour lesquelles un texte neutre pourrait être établi (par exemple, « addition s’écrit avec deux d ») et inséré
dans différents contextes selon que sa lecture est motivée par un défaut de compréhension du mot ou par un
doute lors de son emploi et selon l’âge des usagers : pour des élèves du cycle 2, « As-tu observé que le mot
addition s’écrit avec deux d ? » vs « Attention à l’orthographe de ce mot : addition s’écrit avec deux d. ».
133 Parmi les affichages proposés, la sélection de celui jugé pertinent pourrait être décidée par ceux qui initient
les élèves à la consultation du dictionnaire (les enseignants des plus jeunes lecteurs ou tous les éducateurs,
parents et personnels variés qui assurent du suivi ou du soutien scolaire), puis, de manière autonome, par
les élèves, ce qui impliquerait qu’un paramétrage de l’affichage puisse être défini et déclaré comme préférentiel à un moment et être redéfini ultérieurement.
834
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
3.2.1. Soutenir les consultations visant la compréhension d’un item
Bien qu’usuelle, la consultation du dictionnaire motivée par un problème de compréhension d’une unité linguistique pourrait être rendue plus aisée et plus profitable
en adjoignant quelques fonctionnalités et indications à ce qui est déjà proposé.
3.2.1.1. Mettre en place un hyperappel efficace
Parallèlement à la consultation directe, l’insertion du dictionnaire dans un environnement numérique de travail permet de mettre en place son hyperappel à partir de
textes lus à l’écran 134 (lectures et exercices de français, de matières d’éveil ou de mathématiques, textes variés consultés sur des pages web, etc. 135) ou en cours de rédaction
(dans un traitement de texte ou les interfaces de saisie des exercices), afin que chaque
mot perçu comme difficile à comprendre ou à orthographier et à insérer harmonieusement dans un contexte puisse être décodé ou employé en fonction des conseils du dictionnaire (cf. § 3.2.2. pour le deuxième point).
[275 Ð
L’hyperappel implique que la nomenclature du dictionnaire ne soit pas limitée à
6 000, 20 000 ou 25 000 items, comme celles des volumes imprimés 136, mais qu’elle
couvre effectivement tout le vocabulaire que peuvent rencontrer ou utiliser les élèves
dans leurs activités scolaires ou périscolaires 137.
Pour que cet hyperappel aide les élèves les plus en difficulté, il faudrait par ailleurs
que le système d’interrogation soit doté d’un module d’analyse morphosyntaxique et
syntaxico-sémantique du contexte d’emploi motivant la consultation, ce qui présenterait
deux avantages pour les lecteurs :
134 Certains dictionnaires disposent déjà d’hyperappels, mais leurs performances sont plus réduites que celles
envisagées ici. Larousse, par exemple, collabore depuis 2004 avec Babylon, « fournisseur de solutions d’accès à
l’information en un clic » (cf. http://www.babylon.com/display.php?id=86&tree=7&level=3&show_id=1757).
135 Cet hyperappel permettrait que chaque mot lu et mal compris puisse être décodé grâce au dictionnaire, et
que les élèves soient entraînés à la détection des mots qu’ils sont susceptibles de mal comprendre par la mise
en place d’exercices comme, dans le manuel À portée de mots CE1 (cf. n. 116), l’exercice 5, p. 119.
[275 Ð
136 Pour expliquer cette limitation, il est souvent indiqué qu’introduire plus d’items à la nomenclature submergerait les élèves avec trop d’informations. Cependant, la consultation se faisant article par article, la présence
d’un grand nombre d’articles ne semble pas poser de problème autre que ceux liés au transport dans les cartables puis à la manipulation d’un livre trop volumineux et au repérage de l’item cherché dans la nomenclature abondante, ce qui est résolu avec une version électronique, qui ne pèse rien, qui se consulte de la même
manière quelle que soit la quantité d’items décrits et où le lecteur ne voit que ce qu’il a demandé à consulter.
137 Les principes de sélection pourraient être plus accueillants qu’enclins à l’exclusion. L’évaluation des besoins
effectifs passerait par le relevé du vocabulaire de manuels scolaires électroniques et imprimés, d’œuvres de
littérature de jeunesse, de textes scientifiques et techniques, etc. Les contraintes de place ayant disparu, il
ne s’agirait plus d’écarter des items, mais d’offrir une description de chacun, y compris de ceux qui sont réputés être interprétables à partir de leur forme morphologique (les dérivés et composés), qui donneraient
lieu à des explications des règles de construction qui ont permis leur existence, pour lesquelles les régularités et divergences de comportements linguistiques observables entre mots construits sur la même règle ou
entre mots construits et bases de construction seraient expliquées. Ces observations seraient d’autant plus
importantes que, même si la nomenclature était beaucoup plus consistante, elle ne pourrait pas être exhaustive et que la richesse des descriptions présentes contribuerait à forger chez les élèves la compétence lexicale
qui leur permettrait de comprendre (en analysant leur construction) les mots construits non décrits.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
835
– celui d’accéder à une description du mot problématique sans avoir à spécifier euxmêmes quels sont le lemme et la catégorie grammaticale de l’item cherché, quand la
forme d’appel peut entrer dans le paradigme des formes de deux verbes, comme recouvre,
ou dans celui d’un verbe ou d’un nom, comme rencontre ;
– et celui d’être directement orientés, au sein de la description du mot cherché, vers les
indications qui leur seraient utiles.
L’association de chacun des deux types d’analyseurs au système d’hyperappel du
dictionnaire ne poserait pas des difficultés techniques de même nature :
– Les analyseurs morphosyntaxiques sont des outils fondamentaux en traitement automatique des langues (TAL) 138 et assez performants 139. L’interfaçage de l’un d’eux né[276 Ð
cessiterait de l’adapter afin
que les codes affectés par lui à chaque item analysé en
contexte soient compatibles avec les catégories associées aux items du dictionnaire à
consulter 140.
– À la différence de ceux-ci, les analyseurs syntaxico-sémantiques sont très dépendants
de la nature des tâches qu’ils documentent 141. Pour en adjoindre un à un hyperappel
138 Une large gamme des applications de TAL s’appuie sur leurs résultats : exploration de corpus, recherche d’information, résumé automatique, correction orthographique et grammaticale, etc.
139 Paroubek & Rajman (2000 : 143) évoquent des taux compris entre 90 et 99% , que ne corrige pas un texte
[276 Ð
http://
de vulgarisation rédigé par Patrick Paroubek en 2006 dans le cadre des projets Technolangue (
|
www.technolangue.net/article.php3?id_ article=296) en se fondant sur ce qui s’est dégagé de la campagne
d’évaluation Grace (http://www.limsi.fr/TLP/grace). L’évaluation des performances est cependant dépendante
de multiples paramètres, dont la richesse du jeu d’étiquettes utilisé, les critères de segmentation des unités
à étiqueter, la proportion d’items ambigus et la nature de leur contexte (cf. Paroubek & Rajman (2000 : 143-147)).
La chaîne de traitement intégrant l’analyseur a aussi son importance. Ici elle permettrait d’obtenir une analyse morphosyntaxique d’autant moins fautive qu’elle profiterait de la rétroaction de l’analyse syntaxicosémantique pour les items ambigus.
140 Si, quand l’analyseur morphosyntaxique traite un nom commun dans une phrase, il lui associe un lemme et le
code utilisé pour ce type de noms enrichi d’une indication de genre et de nombre, il doit ensuite les mettre en
relation, dans le dictionnaire, avec un lemme en adresse associé à la catégorisation compatible. Le rapprochement des codes de participes passés employés comme adjectifs avec les verbes ou adjectifs décrits peut être
plus délicat à gérer. Pour limiter les difficultés il convient d’harmoniser les codes utilisés dans le dictionnaire
et par l’analyseur et d’entraîner celui-ci sur un corpus bien étiqueté s’il fonctionne avec des statistiques.
141 Pour ce qui concerne les analyseurs syntaxico-sémantiques, les besoins spécifiques des divers terrains d’application (cf. n. 138) ne permettent pas aisément de conjoindre les efforts de recherche comme cela a été fait pour
les analyseurs morphosyntaxiques. Dans le cadre d’un hyperappel de dictionnaire, l’analyseur syntaxicosémantique utile serait proche de ceux qui sont développés pour la correction orthographique et grammaticale.
Dans ce domaine, la définition de la valeur syntaxico-sémantique d’un mot polysémique en fonction de son
contexte d’emploi est cruciale pour améliorer les détections de fautes. Pour corriger une forme comme croit
apparemment bien orthographiée mais employée à mauvais escient dans la phrase L’abstention croit à chaque
scrutin, le système doit repérer le sujet, qui détermine l’accord du verbe, et les éventuels compléments régis
par ce dernier, puis typer sémantiquement chaque tête lexicale, afin d’établir quelle est le forme verbale
valide (croit ou croît) dans le contexte. La réunion de ces indications permet en outre de repérer dans une
phrase quelconque l’absence d’un complément obligatoire, l’emploi d’une préposition invalide à l’initiale d’un
complément, etc. Développer un analyseur syntaxico-sémantique qui fonctionne avec des statistiques mais
aussi avec des règles linguistiques impose de disposer de descriptions syntaxiques et sémantiques fines pour
chaque item, or leur élaboration est longue à réaliser et coûteuse. Pour les mener à bien, les développeurs
de correcteurs pourraient souhaiter que leurs linguistes collaborent avec des lexicographes externes. Ces
derniers ne disposeraient a priori pas, avant cette association, de descriptions syntaxico-sémantiques prêtes à
être intégrées dans un analyseur, mais leur expérience d’analystes des comportements linguistiques ferait
836
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
du dictionnaire, il faudrait que chaque analyse accomplie permette de conduire l’usager vers l’une des descriptions syntaxico-sémantiques disponibles dans le dictionnaire
pour l’item motivant la recherche. Ce contexte applicatif pourrait constituer un élément
déterminant du développement de l’analyseur à interfacer avec le dictionnaire puisque,
comme il faudrait que les critères de décision de l’analyseur soient corrélés aux informations syntaxiques et sémantiques formulées dans le dictionnaire, le travail de des[277 Ð
|
cription lexicographique pourrait être
ac compli à la fois dans une perspective dictionnairique 142 et taliste (pour ce qui serait formalisé et exploité par l’analyseur) 143.
La prise en compte de l’analyse (morphosyntaxique et syntaxico-sémantique) du con[278
texte d’hyperappel pour orienter les lecteurs vers Ðla description dictionnairique perque certains d’entre eux seraient à même d’en élaborer en prenant en compte les contraintes particulières de
ce contexte applicatif.
[277 Ð
142 Pour élaborer des descriptions consultables au sein d’un dictionnaire électronique appelé par un hyperappel
couplé à un analyseur syntaxico-sémantique, si les lexicographes devaient choisir les textes dictionnairiques
antérieurement publiés qui les documenteraient le mieux, ils auraient intérêt à retenir ceux qui offrent le
plus haut degré de décomposition syntaxique et sémantique et qui les aideraient le mieux à forger de nouvelles analyses finement découpées. Cette précision permettrait en outre qu’une partie de la matière descriptive soit formalisée et fournie à l’analyseur afin que celui-ci soit capable d’établir les propriétés du contexte
d’emploi puis de les mettre en correspondance avec la subdivision pertinente dans le dictionnaire. Si un lecteur clique sur permettrait lorsqu’il lit Les élèves espéraient que le maître leur permettrait de jouer au ballon
durant la récréation de l’étude, l’hyperappel le conduit vers l’une des descriptions du verbe permettre. Si
celles-ci ont été élaborées à partir du Dictionnaire du français contemporain de 1966 plutôt qu’à partir du
Dictionnaire du français au collège de 2000 (qui dérive du premier, cf. Corbin & Gasiglia (2009b : 45)), l’information fournie au lecteur est plus précise. Le premier, en effet, structure finement sa description, en regroupant les patrons de construction qui diffèrent par la nature syntaxique d’un complément (comme en I.1. ou
I.2.) ou qui ne partagent qu’une propriété (la construction pronominale en I.3.), mais dans lesquels le verbe
s’interprète de la même manière :
– I.1. (« Permettre une chose, que (et le subj.) ») : N0 = SN+ hum ‘agent’, N1 = SN− hum ou que P ‘thème’ ;
– I.2. (« Permettre à quelqu’un quelque chose, de (et l’infin.) ») : N0 = SN+ hum ‘agent’, N1 = SN− hum ou V-inf ‘thème’, à
N2 = SN+ hum ‘bénéficiaire’ ;
– I.3. (« Permettez ») : N0 = SN+ hum ‘agent’ [non réalisé], N1 optionnel = SN− hum ou que P ‘thème’, ou N1 = SN− hum
ou V-inf ‘thème’ et à N2 = SN+ hum ‘bénéficiaire’ ;
– II.1. (« Permettre quelque chose à quelqu’un ») : N0 = SN− hum ‘agent’, N1 = SN− hum ‘thème’, à N2 = SN+ hum
‘bénéficiaire’ ;
– II.2. (« Permettre quelque chose ») : N0 = SN− hum ‘agent’, N1 = SN− hum ‘thème’ ;
–  (« se permettre ») : N0 = SN+ hum ‘agent’, s’ = ‘bénéficiaire’ coréférent au référent du N0, N1 = SN− hum ou
V-inf ‘thème’ [les indications relatives au N1 n’étant pas explicites].
Le second dictionnaire, en revanche, réunit sous 1. les informations des anciennes subdivisions I.1., I.2. et
II. 1. et sous 2. ce qui correspondait à la subdivision II.2. (cf. Corbin & Gasiglia (2009b, § 3. et 2009c, § 2.)).
Dans le contexte d’emploi ci-dessus, la description utile du Dictionnaire du français contemporain est celle
de la subdivision I.2., dont le patron présente une alternative concernant le complément direct (SN ou V-inf )
et dont la double glose est éclairée par le patron (« lui donner la liberté d’en user, de le faire » = lui donner
la liberté d’user du référent du SN, lui donner la liberté de faire l’action dénotée par V-inf ). Elle serait plus
aisément associable aux contextes qui suscitent l’hyperappel et constituerait une réponse mieux exploitable
que celle du Dictionnaire du français au collège, qui décrit sous 1. le sens du verbe au moyen de cinq expressions susceptibles de lui être sémantiquement équivalentes (« lui laisser, lui donner la liberté, la possibilité, le
moyen de le faire, lui en donner l’occasion »), alors que seules les deux premières sont plausiblement valides
dans ce contexte. Du point de vue technique, interfacer l’analyseur syntaxico-sémantique et le dictionnaire
imposerait que le balisage des descriptions contienne un codage des natures syntaxique et sémantique et
des rôles des sujets et compléments qui soit compatible avec les codes gérés par l’analyseur.
143 Les descriptions élaborées lors de la rédaction du dictionnaire Encarta français devaient aussi être exploitables pour les applications développées par Microsoft.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
837
tinente 144 aurait par ailleurs une incidence sur la rédaction du texte lexicographique
puisqu’elle imposerait la prise en compte du fait que les descriptions pourraient ne plus
être toutes consultées, ce qui implique de les autonomiser 145.
3.2.1.2. Aider à identifier une forme graphique
La mauvaise compréhension d’un mot lu peut être induite par la non-identification
d’une forme fléchie 146, ou par un problème de déchiffrement (non-reconnaissance de
la graphie d’un mot connu à l’oral 147), ou encore par une incapacité à relier l’item lu à
[279 Ð
d’autres
mots qui partagent avec lui une parenté étymologique ou une propriété de
construction morphologique dont la connaissance permettrait de faire des hypothèses
réalistes sur son sens.
Si l’identification synchronique d’un item peut être faite dans des termes compréhensibles par tous, l’initiation à l’établissement de familles étymologiques et à l’histoire
[278 Ð
144 Afin d’inciter les élèves à élargir leur vocabulaire en lisant le dictionnaire au-delà de ce qui répond strictement
à une question ponctuelle, il ne serait pas pertinent de ne présenter que la description utile, mais elle pourrait
être affichée avec une mise en valeur alors que d’autres, utiles pour une meilleure connaissance du mot cherché mais pas directement dans le contexte d’hyperappel, seraient présentées de manière neutre voire sous
forme condensée.
145 Il ne faudrait en aucun cas qu’une description s’appuie implicitement sur celle de la subdivision qui la précède, ainsi qu’on peut l’observer par exemple s.v. permettre dans le Grand Robert de la langue française :
« 1 (Sujet n. de personne ou de chose signifiant une volonté humaine). Laisser faire (qqch.), ne pas empêcher. […
1 er losange] ♦ Permettre que (suivi du subj.). [… 2 e losange] ♦ (Suivi de l’indic. ou du cond.). [… 3 e losange]
♦ (1572). | Permettre qqch. à qqn. [… 7 e losange] ♦ Spécialt. (En parlant de prescriptions médicales). | Son médecin lui permet le tabac. », où ce qui est introduit après le deuxième losange ne peut être compris qu’à partir
de ce qui est sous le premier et où ce qui est sous le septième correspond à un emploi spécialisé de ce qui est
présenté sous le troisième.
146 Afin que les élèves prennent l’habitude de mettre en correspondance les diverses formes d’emploi des mots
et leur lemme, les affichages de descriptions lexicales pourraient débuter par une rubrique d’identification
de la forme à partir de laquelle la consultation a été engagée qui présenterait cette forme, les informations
morphosyntaxiques pertinentes pour elle et le lemme correspondant. Si cette forme est écrite fautivement
(cf. n. 131), il conviendrait de signaler explicitement l’intervention du correcteur orthographique. En outre,
si la forme saisie ou corrigée automatiquement ne correspond pas à ce que souhaitait l’utilisateur, qu’il s’agisse d’une erreur de flexion ou d’une confusion lexicale, il faudrait lui proposer des procédures de recherche
de la forme correcte : présentation des autres formes fléchies correspondant au lemme et accompagnées de
leur code morphosyntaxique (paradigme de conjugaison ou de flexion en genre et en nombre) ou d’autres
lemmes de formes phonétiquement ou graphiquement proches du motif de recherche (à partir desquels un
accès aux graphies de leurs formes fléchies serait prévu). Enfin, en cas de consultation par hyperappel à
partir d’une forme fautive faisant accéder à l’article décrivant l’item après correction à l’entrée du dictionnaire, si le texte depuis lequel s’effectue l’appel est en cours de rédaction (plutôt qu’en “lecture seule”), il
pourrait être souhaitable d’y répercuter ensuite la correction automatique ou celle que l’usager a sélectionnée (ce qui pourrait idéalement s’accompagner du contrôle de la pertinence de celle-ci et des accords en genre
et nombre par une correction orthographique et grammaticale automatique du contexte d’emploi).
147 Les versions électroniques de dictionnaires ont la possibilité de fournir des indications de prononciation audibles, ce qui est un gage d’exploitabilité par ceux qui ne savent pas bien décoder les transcriptions en Alphabet Phonétique International. En conséquence, un dictionnaire scolaire pourrait utilement proposer la lecture
[279 Ð
|
flé chies, voire celui des items
de chaque lemme, mais il devrait aussi proposer le décodage des formes
en contexte (pour illustrer les variations induites par les liaisons et autres phénomènes absents quand les
mots sont lus isolément).
838
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
des mots doit tenir compte de la maturité des usagers et de leur capacité à tirer profit
des informations fournies 148, et la décomposition morphologique des items (construits
en français, ou analysables comme tels bien qu’hérités, ou empruntés 149) doit être présentée de manière à ce que chaque constituant puisse être lié à sa description et, le cas
échéant, à l’explication de la règle qui a permis la construction de l’item 150. La systématisation de ces indications permettrait aux lecteurs de tirer un profit immédiat (savoir quelle est la famille étymologique ou la décomposition de l’item dont ils consultent
la description) et un profit plus indirect (apprendre à repérer seuls les constituants
dont ils ont déjà lu les présentations dans des mots pour lesquels ils ne devront plus
systématiquement consulter leur dictionnaire 151 ou qu’ils n’y trouvent pas). 152
[280 Ð
3.2.1.3. Aider à identifier le patron de construction correspondant à un contexte d’emploi
Dans les répertoires actuels, quand un item fait l’objet de plusieurs descriptions, le
lecteur doit identifier celle qui décrit le sens du mot dans le contexte où il l’a rencontré
et où il lui fait difficulté. Cette identification peut être difficile, voire hasardeuse, chez
les élèves les moins avancés.
Pour les aider à repérer les éléments contextuels qui vont déterminer le choix de la
subdivision de description pertinente, il serait utile que les patrons syntaxico-séman-
148 Les lecteurs débutants auront plus de mal que leurs aînés à comprendre des notices étymologiques et historiques richement documentées, faute d’avoir acquis les repères temporels utiles. La coprésence de différentes
sélections d’informations au sein du dictionnaire permettrait que, pour les plus jeunes, l’affichage des composants étymologiques soit limité aux items dont les propriétés phonographiques diffèrent de celles qui sont
habituellement respectées en français, et que ce comportement remarquable et l’origine étrangère sommairement décrite soient articulés (par exemple par un symbole placé entre les deux renseignements), tandis que
celui destiné aux écoliers plus âgés s’enrichirait d’indications pour tous les mots empruntés à des langues
étrangères (en n’articulant cette information avec celle portant sur la prononciation que si c’est pertinent)
et que celui pour les collégiens étendrait l’information aux mots hérités du latin. Cette progression devrait
cependant être contournable par un élève qui voudrait avoir accès à des étymologies que son interface ne
présente pas et qui demanderait alors l’affichage d’un texte prévu pour des lecteurs plus âgés.
149 Des mots comme abolition, dynamisation et aseptisation sont analysables comme procédant de la même opération dérivationnelle bien que le premier soit hérité du latin, le second emprunté à l’anglais et le troisième
construit en français.
150 La filiation dérivationnelle (réelle ou reconstruite) peut impliquer plusieurs items (abolir t abolition ; dynamique t dynamiser t dynamisation ; asepsie t aseptique t aseptiser t aseptisation) qu’il conviendrait de
présenter en explicitant la nature des opérations morphologiques, ce sur quoi elles opèrent (leur sélection
catégorielle et sémantique), ce qu’elles produisent (en fonction de leur instruction sémantique) et avec quels
ajustements (allomorphie s / t par analogie avec l’étymon grec pour asepsie t aseptique).
151 Si le suffixe -tion a été signalé dans les descriptions déjà consultées d’abolition, dynamisation et aseptisation
(cf. nn. 149 et 150), il pourra être identifié dans nationalisation. Quand les élèves liront ce mot (par exemple
dans l’énoncé La nationalisation de la société Renault a eu lieu après la mort de Louis Renault ), ils pourront faire l’hypothèse que la nationalisation correspond au fait de nationaliser l’entreprise nommée, de la
rendre nationale, propriété de la nation.
152 Les indications fournies localement pour chaque item pourraient utilement être liées à des textes de cadrage
[280 Ð
partie de ces informations serait également à présenétymologique, historique et morphologique. Une
ter pour l’aide à l’expression (cf. § 3.2.2.), puisqu’elles fourniraient des matériaux pour dire la même chose
autrement.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
839
tiques soient systématiquement exploités 153, mais, comme souvent leur mention seule
ne serait pas suffisante, il pourrait être judicieux de graduer la complexité de leur emploi. Pour les plus jeunes lecteurs, pour lesquels un patron n’est pas interprétable, il
conviendrait de poser des questions relatives à la nature syntaxique et sémantique des
éléments du contexte (pour un verbe, par exemple, celle du sujet et des compléments 154),
sans les nommer puisque les analyses grammaticales de phrases ne sont introduites
qu’en fin de cycle 2, mais en induisant leur identification par le repérage d’unités lexicales (comme les conjonctions ou les prépositions), de la nature des référents et de leur
rôle actanciel. Il pourrait être utile, pour aider les élèves à déterminer si le sujet réfère
à un humain, si le premier complément est une complétive, etc., de fournir, pour chaque
prise de décision, deux contextualisations, présentant ou non la propriété en question,
accompagnées de l’explicitation de ce qu’elles montrent. 155
Si la consultation du dictionnaire se faisait par hyperappel et dans l’hypothèse où
un analyseur syntaxico-sémantique aurait permis d’identifier automatiquement les
[281 Ð
|
éléments discriminants du
con texte source, le lecteur aurait eu un accès rapide à
la définition qui pourrait l’éclairer mais il n’aurait pas bénéficié des vertus pédagogiques
de l’analyse de ce contexte. Afin de lui permettre de voir quels sont les éléments qui motivent le choix d’une description plutôt que d’une autre, il serait utile de lui présenter
une copie du contexte source au sein duquel les indices seraient matérialisés et à côté
duquel les étapes de prise de décision seraient décrites. 156
3.2.1.4. Aider à évaluer si le sens décrit est celui qui est cherché
L’explication des sens des mots se fait usuellement au moyen de définitions illustrées
par des contextualisations ou, éventuellement, et plutôt pour les plus jeunes élèves, au
moyen de contextualisations glosées (cf. n. 56). Cette seconde solution serait peu per153 Ce qui n’est pas le cas : s.v. permettre dans le Larousse des débutants, par exemple, un patron partiel introduit la première description sémantique (« 1. Permettre à une personne de faire quelque chose, c’est lui
donner l’autorisation, le droit de le faire. »), mais aucune indication de construction n’est fournie pour la
seconde (« 2. Permettre, c’est rendre possible. »).
154 Pour permettre, par exemple : « Est-ce une ou plusieurs personnes qui font l’action de permettre ? » ; puis,
si la première réponse est négative, « Est-ce une loi, un règlement ou quelque chose à quoi on doit obéir qui
fait l’action de permettre ? » ; puis « Est-ce que le verbe permettre est suivi de que et d’une sorte de phrase
qui explique ce qui est permis et à qui cela est permis ? », etc.
155 Que l’identification de la nature du sujet de permettre se fasse en répondant à une question comparable à
celle présentée dans la note 154 ou par la sélection de la valeur + hum ou − hum dans un formulaire plus
codé, des contextualisations illustreraient l’alternative : pour des écoliers du cycle 2, par exemple, Le maître
permet que les élèves jouent au ballon (associée à l’indication « Le nom maître désigne une personne qui a le
droit de décider ce qu’on peut ou doit faire. ») s’opposerait à Le règlement de l’école permet que les élèves jouent
au ballon (associée à « Le nom règlement désigne un texte qui indique ce qu’on peut ou doit faire. ») et à Un
grillage permet que le ballon ne sorte pas de la cour de récréation (associée à « Le nom grillage désigne un
objet qui est utilisé pour faire quelque chose. »).
[281 Ð
156 Si un élève consulte son dictionnaire par hyperappel à partir de permettre dans la phrase de la note 142, l’affichage obtenu devrait matérialiser que le contexte pertinent se limite à la complétive complément d’espérer
(que le maître leur permettrait de jouer au ballon durant la récréation de l’étude) et qu’au sein de celle-ci il
a fallu repérer un ‘agent’ ( N0 = SN+ hum ), un ‘bénéficiaire’ (à N2 = SN+ hum pronominalisé et en position préverbale) et un ‘thème’ (N1 = de V-inf ).
840
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
tinente dans le cadre d’un dictionnaire électronique susceptible, en cas d’hyperappel,
de prendre en compte le contexte d’emploi qui motive la consultation. Les descriptions
seraient donc à établir selon un modèle classique. 157 Cependant, s’il est admis que la
lecture des définitions et des contextualisations associées doit permettre de comprendre
ce que signifie le mot cherché, les jeunes lecteurs ne perçoivent pas toujours si la description lue éclaire le sens dans le contexte problématique. Pour les aider, il peut parfois
leur être proposé de remplacer le mot cherché par sa définition, mais systématiser ce
principe n’est pas possible. Un soutien alternatif consisterait, quand c’est faisable, à
[282Ð
|
associer aux définitions des synonymes (aussi peu
poly sémiques que possible) substituables à l’item cherché (préférentiellement sans ajustement à opérer au sein du
contexte). En présentant ces substitutions lexicales dans les contextualisations 158 (et
éventuellement dans la copie du contexte source en cas d’hyperappel, cf. n. 156), le dictionnaire inciterait les lecteurs à expérimenter eux-mêmes la recherche du sens pertinent d’un mot au moyen de son remplacement par un autre de sens supposé connu.
3.2.1.5. Réflexions conclusives sur la conception d’une interface d’aide à la compréhension
Les dictionnaires actuellement destinés aux écoliers et collégiens ont tous vocation
à permettre le décodage des mots, mais ils le font parfois en présupposant des connaissances préalables que tous les élèves n’ont pas et, du fait de différentes contraintes,
ils le font souvent sans donner les moyens de vérifier si ce qu’ils fournissent est opératoire dans le cadre d’une recherche. Les quelques propositions précédentes visent à
rendre les consultations plus efficaces et à permettre aux dictionnaires de mieux jouer
leur rôle.
157 L’affichage pour le cycle 2 pourrait proposer des définitions et des contextualisations exprimées en termes
simples, quand ceux pour le cycle 3 puis pour le collège raffineraient les découpages opérés (sans revenir cependant sur ceux déjà effectués, cf. n. 130) et enrichiraient le vocabulaire et la syntaxe employés. Pour les contextualisations, il serait utile de concevoir un affichage qui associerait à chacune l’indication de ce qu’elle
donne à voir (ce qui est déjà suggéré en note 155 pour celles présentées au cours de la recherche de la description syntaxico-sémantique pertinente). Pour une sélection de contextualisations destinées aux élèves du
cycle 2 comme celles ci-après, extraites du Larousse des débutants, il pourrait être envisagé d’expliciter que
« As-tu mis de l’ail dans la salade ? » (s.v. ail) réfère à un contexte de la vie courante alors que « J’ai acheté
un cornet de frites et un cornet de glace. » (s.v. cornet) décrit une action peu plausible, que « Monsieur Bertin
rembourse ses dettes petit à petit. » (s.v. dette) dépeint un comportement connoté positivement mais pas
« Adrien gâche du papier quand il dessine. » (s.v. gâcher), que « Les marmottes hibernent dans un terrier. »
(s.v. marmotte) énonce une propriété de ces animaux, que « Le géant Gulliver regardait l’armée de Lilliput
défiler entre ses jambes. » (s.v. géant ↵ géante) évoque une histoire réputée connue, etc. (cf. Lehmann (1993,
§ 2.1.) ou Hausmann (2005)). Ces mentions supposeraient que la nature des différentes données présentées
dans les contextualisations fasse l’objet d’un typage préétabli et soit codée dans leur balisage.
[282 Ð
158 Un menu déroulant pourrait matérialiser la capacité des items à se substituer les uns aux autres sans ajustement syntaxique : positionné sur permet dans la phrase Le maître permet de jouer au ballon, le menu proposerait donne la permission et donne le droit. Voir aussi Corbin & Gasiglia (2009c : 63-64).
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
841
3.2.2. Encourager les consultations visant à améliorer l’expression
Les dictionnaires peuvent être de précieux partenaires dans une démarche d’acquisition d’une expression précise, riche et normée 159. Outre le vocabulaire qu’ils fournissent, certains donnent des indications pour la normalisation et la diversification
des énoncés. Il est cependant peu probable que les élèves de l’école élémentaire et du
collège soient assez rompus au décodage de l’implicite des articles pour profiter de ces
indications, qui sont irrégulièrement présentes et inégalement valorisées. Là encore
un nouveau dictionnaire électronique pourrait apporter un meilleur soutien.
3.2.2.1. Exploiter chaque mot comme un accès à des rubriques thématiques et à des
réseaux lexicaux
Les élèves sont souvent incités en classe à améliorer la qualité de leurs écrits en
enrichissant leur lexique et en diversifiant son emploi, mais au moment où ils rédigent
ils ne disposent que de leur vocabulaire actif pour exprimer leurs idées. De ce constat
découlent deux orientations, qui ont déjà été mises en œuvre dans quelques produits
[283 Ð
|
lexicographiques et qui tireraient un plein profit d’un
sup port électronique : d’une
part un traitement onomasiologique donnant accès à une pluralité de modes d’expression d’une même idée ou notion et d’autre part un réseau analogique explicitant les relations existant entre les mots liés (relations sémantiques entre les items ou relations
référentielles entre ce qu’ils dénomment).
Les traitements onomasiologiques sont absents de nos répertoires monolingues généraux, mais ils ont été adoptés pour des dictionnaires d’anglais dédiés aux allophones
comme le Longman Language Activator 160 et le Longman Essential Activator 161, qui
permettent de confronter commodément les valeurs relatives des mots et expressions
réunis au sein d’une même rubrique thématique et de trouver ainsi ce qui est le mieux
adapté à chaque contexte d’emploi.
Sans renoncer au classement alphabétique, qui semble être préféré par les éditeurs
français (peut-être parce qu’il sécuriserait les utilisateurs), il serait possible de concevoir que chaque mot soit traité comme un élément d’un index lexical et qu’il renvoie aux
subdivisions thématiques qui fournissent des indications pour l’expression de l’un de
ses sens. Lors d’une consultation pour une aide à la rédaction, les élèves n’accéderaient
pas à un article décrivant un item (dans toutes ses acceptions) mais à une liste de no-
[283 Ð
159 Les instructions officielles du cycle 3 valorisent ce type d’aide (cf. n. 115).
160 Dans ce dictionnaire pour apprenants avancés, les unités linguistiques anglaises qui, comme le verbe français
permettre pour l’une de ses acceptions, expriment ce qui est lié à la notion de permission y sont décrites au
sein de la rubrique « LET/ ALLOW », qui domine douze subdivisions en 1993 et neuf en 2002. Le principe
onomasiologique y implique un dégroupement homonymique pour la description des items polysémiques :
le verbe allow est objet de traitement dans six subdivisions en 1993 et trois en 2002, isolément ou combiné
(be allowed ; allow somebody complete freedom, en 1993 seulement).
161 Le nombre de subdivisions enchâssées sous « LET » est réduit à cinq dans ce volume destiné aux allophones
de niveau intermédiaire (en 1997 comme en 2006). Deux subdivisions traitent le verbe allow isolément et
une troisième be allowed.
842
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
tions associées à cet item, chacune ouvrant sur un affichage des articles de diverses
unités linguistiques qui peuvent l’exprimer, inspiré des deux dictionnaires Longman
[284 Ð
|
évoqués. 162 Au sein de ces sélections
d’ar ticles, au moins deux types d’exemples
d’emplois pourraient être mobilisés (en fonction de la maturité des utilisateurs) afin de
montrer la diversité des usages : des contextualisations forgées pour présenter certaines
propriétés explicitement décrites 163, et des contextes d’emploi attestés dans un corpus
de textes pédagogiques ou réputés lus par les élèves (documents divers et littérature
de jeunesse), ce qui impliquerait de les analyser et de les annoter afin de les introduire
strictement là où leur insertion est pertinente 164.
Outre le fait que les items serviraient de mots-clés pour atteindre des rubriques notionnelles, ils donneraient accès à des réseaux lexicaux qui fourniraient ce qui fait la
richesse des renvois analogiques des dictionnaires Robert (en particulier ceux du Grand
[285 Ð
|
Robert de la langue française 165). 166 La mise en œuvre de ce réseau en
dif férerait
162 Opter pour un affichage de l’aide à l’expression tout à fait distinct de celui de l’aide à la compréhension induit une interrogation relative à la réutilisabilité des textes descriptifs d’une interface à l’autre. Une hypothèse optimiste consiste à poser que, s’il a été prévu que les mêmes textes soient affichés lors des deux types
de consultations (avec des sélections et un affichage distincts pour chaque contexte, voire des reformulations
générées automatiquement à partir d’un texte, cf. n. 132), les rubriques pourraient n’être que virtuelles : il
s’agirait de mises en correspondance d’items et d’unités de description, chaque paire étant associée à un identificateur de rubrique thématique (remplacé pour l’affichage par l’intitulé complet associé à la mention des
unités linguistiques incluses dans la rubrique). Le travail des lexicographes consisterait alors à établir les
paires d’identificateurs d’items et de descriptions pertinentes, mais celles utiles pour l’expression pourraient
éventuellement être plus nombreuses et riches que celles qui suffiraient pour la compréhension. Pour permettre, elles devraient en particulier intégrer la description d’expressions comme Il est permis à tout le monde
de se tromper !, où le décalage de sens d’“autoriser” vers “ tolérer” est probablement intuitivement compréhensible et qui correspond à une revendication de droit à l’erreur au même titre que les deux tournures Tout le
[284 Ð
présenter associées à la première pour
monde peut se tromper ! et L’erreur est humaine !, qu’il faudrait
offrir une variété de formulations idiomatiques (cf. Corbin & Gasiglia (2009c : 64-65)). Pour évaluer la validité de cette démarche, la mise en chantier d’un échantillon test pourrait débuter par l’élaboration des matériaux descriptifs nécessaires pour l’aide à la rédaction (ceux qui sont supposés être les plus diversifiés en
même temps que les plus nouveaux) et se poursuivre par une évaluation de leur réemployabilité dans l’autre
contexte. Selon l’outillage documentaire à la disposition des rédacteurs, la recherche de formulations alternatives pourrait être plus ou moins aisée. En l’absence d’une base documentaire du type de celles envisagées
aux §§ 1.2. à 1.4., la consultation de ressources dictionnairiques spécialisées fournirait des listes de synonymes et de contraires. Pour étendre la sélection à des expressions, la capacité du lexicographe à mobiliser
ce qui est utile serait probablement l’adjuvant le plus efficace : la consultation de corpus pourrait peut-être
fournir quelques éléments (en extrayant des contextes identiques à un syntagme près par exemple), mais
ces recherches risquent d’être aussi coûteuses que peu rentables.
163 Cf. nn. 155, 157 et 173 à 177.
164 Présenter des contextes d’apparition des différentes formes graphiques associées au lemme d’un mot sans
tri en fonction de la nature grammaticale de l’item ni de son sens ne pourrait qu’induire de la confusion chez
de jeunes élèves insécures. Si ce choix a été fait pour le DAFLES, qui propose d’extraire automatiquement
des phrases du journal Le Monde en colligeant celles où figure une des formes de l’item cherché (même si
cette forme correspond en contexte à celle d’un autre mot), c’est probablement parce que le public cible a
été jugé mieux à même de trier les réponses pertinentes et celles qui ne le sont pas.
165 S.v. café 1, par exemple, le Grand Robert de la langue française liste des séquences en italiques dont certaines
servent d’ancrages textuels à des renvois vers d’autres items. Selon les cas, ce sont des noms polylexicaux
usuels (« café soluble » ou « café décaféiné »), des cooccurrences privilégiées (« torréfier du café ») ou simplement des descripteurs de sens d’un item cible (« Principe aromatique du café ») : « Plantation (cit. 3), plant
de café. Î Caféier. | Balle de café. Î Farde. | Sortes de café : bourbon, martinique, moka; arabica, colombie,
robusta. | Grain de café en coque, en cerise*. | Pellicule de café (Î Écalure). | Propriétés stimulantes du
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
843
cependant dans la mesure où, pour être pleinement informatif, chaque lien expliciterait la nature de la relation existant entre les items ou les référents qu’ils nomment,
ce qui serait certainement très appréciable, par exemple, pour trouver des noms de
parties constituantes des référents nommés (à partir de café, cf. n. 165 : écalure pour
l’enveloppe dure de la graine fraîche, caféone pour l’huile essentielle aromatique qui
se développe durant la torréfaction), pour accéder à du vocabulaire technique à partir
de mots courants (lyophiliser, torréfaction) ou encore pour situer les référents dans
des classes d’objets du monde 167 (un express “est un” café pour l’acception de ce nom
hyponyme de boisson alors que l’arabica “est un” café pour son acception dans une
taxinomie botanique).
Mettre en place un réseau analogique de ce type demanderait d’enrichir, du point de
vue des connaissances linguistiques et encyclopédiques, les descriptions lexicales destinées aux publics scolaires, ce qui accompagnerait avec cohérence l’augmentation de
la nomenclature (cf. n. 137). Mais cette densification de l’information impliquerait d’une
part un typage très fin des relations présentées (entre items ou entre référents nommés) 168 et son explicitation dans l’affichage, ce qui serait nouveau, et d’autre part une
redondance éventuelle des informations fournies par les réseaux lexicaux et les rubriques
thématiques précédemment présentées : si torréfaction est un nom de procédé de transformation accessible à partir du réseau lexical de café, considéré dans son acception de
nom de graine, il devrait l’être aussi dans une rubrique thématique liée à café et spécialisée dans les manières d’exprimer que des graines sont transformées (brûlées). Ces
accès multiples à des éléments d’information identiques présentés dans une pluralité
d’affichages devraient faire l’objet de stratégies explicites élaborées par les lexicographes.
Ceux-ci pourraient par exemple décider de traiter différemment les relations posées
entre le nom d’un objet et celui d’une transformation qu’il subit et celles établies entre
synonymes et antonymes 169. Pour les premières, comme celle existant entre café et
torréfaction, ils pourraient considérer que la relation entre les noms n’est pas évidente
et qu’elle doit être présentée selon différentes modalités (ce qui induirait son intégration dans le réseau lexical et dans la rubrique thématique dédiée à l’expression des
166
167
168
169
café dues à un alcaloïde (Î Caféine). | Café soluble* (Î Nescafé, marque), lyophilisé (Î Lyophiliser). | Café
décaféiné*. | Principe aromatique du café. Î Caféone. | Parfumer une crème, une glace avec de l’essence de
café. — Préparation du café. Î Macération, torréfaction ou grillage. | Café vert : café non grillé. | Griller,
brûler, torréfier du café (Î Brûloir, torréfacteur). ».
Proposer conjointement un traitement onomasiologique et des réseaux lexicaux impliquerait de réfléchir à
la présentation des données de ces deux ordres. Serait-il plus opportun de présenter les réseaux lexicaux avec
[285 Ð
disles liens vers les rubriques thématiques, ou de les insérer au sein de chacune d’elles, ou encore de les
tribuer à différents niveaux en fonction des relations prises en compte ? Il faudrait en tout cas réussir à allier
richesse et clarté de présentation afin de ne pas submerger les lecteurs et de leur permettre de savoir où est
chaque information.
Il serait souhaitable qu’à partir de chacune de ces classes les utilisateurs accèdent aux noms des éléments
qui la constituent et inversement : c’est ce que fait en partie le Robert junior électronique pour les regroupements d’images et de sons qu’il propose, mais sa couverture est limitée (cf. F. Corbin (2009, I, § 3.)).
Leur dénomination doit sans ambiguïté permettre leur identification.
Pour les relations antonymiques, une attention particulière pourrait être portée aux cas où l’insertion d’une
négation ne crée pas une expression de sens contraire : ne pas permettre, ce peut être soit “ne pas donner la
permission”, interdire (antonyme de permettre usuellement mentionné), soit “laisser faire sans formuler de
permission”, tolérer (plutôt considéré comme un synonyme de permettre).
844
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
Ð
traitements de graines
par la chaleur 170), alors que pour les secondes, comme celle
existant entre grillage et torréfaction, la coprésence des deux items au sein des rubriques thématiques rendrait le listage des synonymes dans le réseau lexical trop
redondant.
[286
3.2.2.2. Aider à reformuler en opérant des ajustements syntaxiques
La présentation de rubriques thématiques et de réseaux lexicaux a pour vocation
première de diversifier l’expression en enrichissant le vocabulaire des élèves, mais une
aide à l’expression efficace doit également rendre perceptibles les contraintes syntaxiques
et sémantiques en œuvre au sein de chaque formulation proposée.
L’identification du patron de construction du contexte où est employé un mot non
interprétable est utile pour chercher son sens dans le dictionnaire (cf. § 3.2.1.3.), mais
cette démarche est tout aussi nécessaire lors de la recherche d’une formulation adaptée
à ce qui doit être énoncé. Imaginons qu’un élève ait forgé une première formulation qui
contient déjà la mention des actants impliqués et qu’il consulte son dictionnaire 171 :
celui-ci devrait l’aider à percevoir la construction de ce qu’il a rédigé et lui montrer les
recouvrements de sens et de constructions susceptibles d’exister avec d’autres formulations. Quand un dictionnaire imprimé présente différents patrons pour une description
sémantique d’un mot, les lecteurs doivent pouvoir sentir que ces constructions sont au
moins en partie alternatives 172. L’espace dédié à ces indications dans les volumes imprimés est contingenté, ce qui fait qu’elles peuvent être à la fois très codifiées et malaisées à corréler avec ce qui est réalisé dans les contextualisations. Pour que les patrons
soient pleinement compréhensibles et exploitables par les élèves pour diversifier leur
[287 Ð
expression, il serait opportun de les lier explicitement aux définitions et aux
contextualisations, dans lesquelles ce qui correspond à chaque élément des constructions
devrait pouvoir être identifié 173. Mais au-delà de ces indications minimales, ce sont
[286 Ð
170 Les modalités de cette double intégration dépendent des dispositions adoptées pour l’articulation des rubriques
thématiques et des réseaux lexicaux, cf. n. 166.
171 Cette fois encore la consultation du dictionnaire pourrait se faire au moyen d’un hyperappel (cf. § 3.2.1.1.)
déclenché à partir d’une phrase en cours de rédaction dans un traitement de texte ou directement, en saisissant le mot sur lequel porterait la recherche dans l’interface d’accès au dictionnaire. Dans le premier cas,
des analyses morphosyntaxique et syntaxico-sémantique pourraient être effectuées sur la phrase ébauchée,
ce qui constitue une similitude de traitement du contexte avec ce qui est envisagé pour les consultations
orientées vers la compréhension, mais, dans la situation présente, les analyses seraient plus difficiles du fait
du caractère non achevé de la rédaction. Les analyseurs pourraient devoir ne pas tenir compte d’incomplétudes de l’énoncé ou de fautes d’orthographe d’usage ou grammaticale, et donc fonctionner à la manière de
ceux qui sont utilisés dans les correcteurs orthographiques et grammaticaux, à ceci près que leurs produits
ne seraient pas utilisés pour la détection de fautes mais pour la mise en relation du contexte de l’item faisant
l’objet de l’hyperappel avec des patrons syntaxico-sémantiques, puis, à partir d’eux, avec la sélection des
rubriques thématiques présentant les manières d’exprimer ce que signifie l’item dans son contexte source.
172 Cf. le patron complexe proposé pour le verbe permettre dans le Dictionnaire du français au collège (voir n.
142) qu’analysent Corbin & Gasiglia (2009c, § 4.3.1.).
[287 Ð
173 Par exemple, pour Le maître permet aux élèves de jouer au ballon, il conviendrait de fournir, formulé avec le
degré de codification idoine, le patron Qqn permet à qqn de V-inf associé à l’indication du fait que le premier
humain détient une autorité à laquelle les seconds se soumettent et que ces derniers bénéficient d’une per-
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
845
les similitudes et différences entre formulations alternatives qui seraient à signaler et
à expliquer. Pour ce faire, il faudrait que les rubriques thématiques, qui ont vocation
à faire une large place aux synonymes lexicaux (de même distribution ou imposant des
remodelages syntaxiques de leurs contextes d’emploi 174) et aux expressions alternatives 175 mais accueilleraient aussi les mots morphosémantiquement liés (comme les
dérivés nominaux de verbes à employer dans une construction à verbe support 176) et
le même item employé au sein de constructions différentes 177, présentent chaque pos[288
sibilité au sein du même Ðensemble de contextualisations afin de rendre les contraintes
des choix lexicaux opérés immédiatement perceptibles. 178
174
175
176
177
[288 Ð
178
mission accordée par le premier dont le thème est exprimé par l’infinitive. Il pourrait également être envisagé d’accompagner chaque contextualisation d’une reformulation présentant les arguments verbaux pronominalisés ( Il le leur permet) et de l’explication du fait que le correspond à un complément direct et leur à
un indirect en à. Pour que les constituants syntaxiques de chaque phrase soient affichés de manière différenciée, il conviendrait que les rédacteurs les enchâssent dans des éléments porteurs, en attributs, des
valeurs des propriétés syntaxico-sémantiques pertinentes pour la gestion globale des affichages. Ce mode
de présentation innovant imposerait de permettre la confrontation des indications du dictionnaire avec les
explications des manuels scolaires ou les usages de la classe, ce qui impliquerait que les codes (encadrements
et soulignements ci-dessus) soient paramétrables par chaque utilisateur (par une option d’adaptation de la
feuille de styles, cf. § 2.3.1.2.).
Dans une rubrique dédiée à l’expression de la permission donnée à une personne par quelqu’un qui a autorité
sur elle (comme les premières des Longman Language Activator et Essential Activator (cf. nn. 160 et 161),
« 1 to allow someone to do something » dans l’édition de 1993 du premier / « 1 to let someone do something »
dans l’édition de 2002 du premier et dans le second), si les articles des verbes permettre et autoriser étaient
coprésents, les lecteurs tireraient profit, s.v. autoriser, d’une reprise des actants de la contextualisation
exploitée dans la note 173 ( Le maître permet aux élèves de jouer au ballon t Le maître autorise les élèves
à jouer au ballon), qui rendrait d’autant mieux perceptibles les différences de construction existant entre
ces verbes que les contextualisations de chacun des deux seraient accompagnées des mêmes indications :
patron expliqué et reformulation pronominalisée ( Qqn autorise qqn à V-inf ; Qqn les y autorise).
Dans la rubrique envisagée en note 174 pourraient aussi figurer des formulations comme Le maître dit aux
ÉLÈVES qu’ILS (peuvent + ont le droit de) jouer au ballon, où le fait de donner la permission est exprimé par
la conjonction du verbe dire et de l’expression de la permission proprement dite. Ces formulations seraient
associées aux mêmes informations que celles de la note 173 ( Qqn dit à qqn que P ; Il le leur dit) et à l’indication du fait que le sujet de la complétive coréfère avec les destinataires du message prononcé (matérialisée
par les petites capitales ci-dessus).
Deux analyses de surface sont alors possibles : Le maître donne la permission aux élèves de jouer au ballon, où
l’expression verbale donner la permission a deux compléments, comme permettre en note 173, vs Le maître
donne aux élèves la permission de jouer au ballon, où le verbe donner a deux compléments et où l’infinitive
est complément du nom permission (ce qui n’est pas matérialisable ici).
Pour permettre, dans la même rubrique thématique, trois patrons – Qqn permet (qqch à qqn + à qqn de Vinf + que P) – devraient être illustrés :
Le maître permet aux élèves les jeux de ballon ( Il les leur permet)
Le maître permet aux élèves de jouer au ballon ( Il le leur permet)
Le maître permet que les élèves jouent au ballon ( Il le permet)
Il conviendrait aussi de leur présenter de manière comparable les équivalents à la voix passive ainsi que d’autres
reformulations qui changent l’orientation du procès : Les jeux de ballons sont autorisés ; Les élèves ont (le droit
+ la permission) de jouer au ballon. (cf. nn. 175 et 176) ; etc.
Si les lexicographes décidaient de présenter les formulations alternatives dans des contextualisations comparables, ces reprises des actants seraient grandement facilitées par l’élaboration d’un outil d’aide à la rédaction de descriptions lexicales capable de propager les contextualisations d’un article à l’autre d’une série lexicale. Cette génération exploiterait les indications des patrons de construction et du balisage analytique (cf.
n. 173) de la ou des contextualisation(s) du premier article rédigé. Ainsi, si s.v. autoriser le patron intégrant
une infinitive était illustré, comme en note 174, par Le maître autorise les élèves à jouer au ballon, le sys-
846
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
3.2.2.3. Réflexions conclusives sur la conception d’une interface d’aide à l’expression
Jusqu’à présent, les dictionnaires imprimés et leurs dérivés électroniques assurent
leur fonction d’aide à l’expression au moyen d’un traitement onomasiologique (pour les
Longman Language Activator et Essential Activator) ou, dans le cadre sémasiologique
(adopté par les monolingues français), par la mise en place d’un réseau analogique ou
au moins synonymique et antonymique, et, plus implicitement, par la mention d’indications de construction ou de descriptions de sens susceptibles d’induire des associations
lexicales et par la présentation de contextualisations qui donnent à voir les propriétés
importantes pour réemployer à bon escient et convenablement les items décrits 179.
Tous ces produits s’appuient sur les compétences des élèves, qui doivent utiliser ce
qu’ils savent pour faire dire aux descriptions ce qu’elles montrent. Les écoliers et les
collégiens constituent un public particulier qui apprend tout à la fois à accéder aux
informations écrites, à enrichir intensivement son vocabulaire, à intégrer les règles
[289 Ð
|
d’une expression normée et créative. Ces
apprentis sages simultanés suscitent
chez certains une insécurité, une difficulté à réexploiter ce qui est tout juste appris.
Un dictionnaire destiné à ce public ne doit donc pas être un texte qui donne à voir à
qui saura regarder mais un recueil aussi explicite que possible dans tous les domaines.
Les pistes qui viennent d’être évoquées concernant l’aide à l’expression revisitent les
principes d’un traitement onomasiologique et d’un réseau lexical en leur adjoignant
diverses modalités d’explicitation de ce qui est présenté. L’élaboration d’un outil de
cette envergure nécessiterait un important travail préparatoire afin d’établir quels
peuvent être les meilleurs moyens pour permettre que les usagers mettent en relation
ce qu’ils veulent dire avec ce que le dictionnaire propose. Cette réflexion reposerait sur
– la définition des modalités de travail les plus efficaces pour regrouper les unités lexicales à présenter : lister les unités linguistiques à intégrer dans les rubriques thématiques s’apparenterait à une tâche de sélection de nomenclature macrostructurelle, mais
il s’agirait ici de constituer une entrée par sens pour chaque mot inventorié et de lister
les expressions, qui sont souvent relativement peu nombreuses et traitées microstructurellement ;
– la méthodologie élaborée pour articuler les descriptions présentées dans les interfaces
d’aide à l’expression et d’aide à la compréhension : qu’il s’agisse du réemploi des mêmes
textes ou de l’exploitation d’autres développements (qui devraient présenter une cohérence totale pour ne pas induire de trouble), il conviendrait d’en définir strictement les
modalités de rédaction et de sélection pour les différents affichages ;
tème proposerait Le maître permet de jouer au ballon à les élèves s.v. permettre. Les limites de ce qui serait
faisable automatiquement impliqueraient que les contextualisations générées soient révisées par les lexicographes en particulier pour ce qui concerne les amalgames (à les t aux) et les placements stylistiques des
constituants au sein des phrases. Si la contextualisation générée n’était pas retenue ou était révisée (avec
remplacement d’un actant par exemple), cette intervention serait signalée en retour aux rédacteurs dans
l’article autoriser. Cet outil ne pourrait cependant fonctionner qu’en disposant des patrons déclarés pour
chaque item, ce qui impliquerait une rédaction en deux temps (patrons et définitions, puis contextualisations
balisées analytiquement les illustrant).
179 Van de Velde (2009, § 1.3.), dans ce volume, défend l’idée qu’il est souhaitable de réduire la part du métalangage et de montrer les propriétés linguistiques pertinentes dans les contextualisations. Ceci suppose
que les lecteurs aient un bagage suffisant pour qu’ils puissent repérer ces propriétés de manière autonome.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
847
– la créativité ergonomique, dont dépend la maniabilité du produit et qui constitue un
terrain où les éditeurs de dictionnaires n’ont pas nécessairement encore de compétence.
3.3. Réflexions conclusives sur l’élaboration d’un dictionnaire scolaire électronique
L’espace créatif offert par la présentation des textes dictionnairiques sur un support
électronique ouvre de larges perspectives pour l’enrichissement des informations et l’accroissement de leur lisibilité. Les orientations éditoriales présentées ci-dessus n’épuisent
pas les champs d’investigation et ne prétendent pas fournir de solutions clé en main,
elles suggèrent des pistes de recherche que les éditeurs pourraient ou non reprendre
à leur compte s’ils entreprenaient de concevoir un produit qui aiderait mieux le public
scolaire dans son appropriation des codes linguistiques, ce qui serait susceptible de donner conjointement une impulsion bénéfique à l’édition électronique et à l’éducation au
maniement spontané de dictionnaires 180.
[290 Ð
4.
Conclusions
Les réflexions présentées dans cette contribution ont été nourries par les témoignages
des professionnels intervenant dans la formation de lexicographes (cf. n. 1) que j’anime
depuis dix ans avec P. Corbin (cf. Corbin & Gasiglia (2009b, n. 4)). Ma position de témoin
extérieur associée à la posture d’enseignant-chercheur à l’affût des changements de
tendances susceptibles de motiver un infléchissement des programmes du master me
conduit à souhaiter remercier nos partenaires en leur livrant un état prospectif qui,
s’ils viennent à le lire, saura peut-être en retour stimuler leur réflexion : c’est en tous
cas mon souhait.
L’étude qui se termine fait ressortir que les évolutions informatiques déjà engagées
ont transformé les modes d’élaboration des dictionnaires sans modifier la représentation que les lexicographes ont de leurs produits et que, couplées avec des contraintes
de rentabilisation, elles ont changé les relations existant entre équipes de rédaction
et d’informatique éditoriale, les secondes pouvant assister le travail des premières en
œuvrant à leur côté, de la conception du projet à la composition du texte saisi et structuré, ou éventuellement exploiter seules celui antérieurement réalisé par les premières
pour fabriquer de nouveaux produits éditoriaux.
[289 Ð
180 Cette entreprise donnerait corps, à sa manière, au projet d’Atkins (2002a [1996] : 2) : « It is up to us to take
up the real challenge of the computer age, by asking not how the computer can help us to produce old-style
dictionaries better, but how it can help us to create something new: to look at the needs of dictionary users
of every language, and every walk of life, users as diverse as people themselves, and give them the kind of
information they need for whatever they are using the dictionary for, and not simply the popular selection
of facts that will pack semi-legibly inside book covers. I respect and admire the achievements of our great
predecessors. But if they were here today, I put it to you that they would not be simply reproducing the achievements of their elders, or revising the great works of the past: they would be rooting for a new kind of
dictionary, one in which the computer plays its rightful, creative role. ».
848
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
Les éléments les plus spéculatifs qui ont été présentés pourraient être considérés par
nos partenaires comme étant trop peu réalistes et ce jugement serait mérité dans le
contexte actuel : l’élaboration d’une ressource documentaire enrichie régulièrement
constituerait un travail minutieux à confier à des linguistes chevronnés préposés stablement à ces tâches, ce qui va à l’encontre d’une politique de recrutement qui privilégie les missions ponctuelles ; l’élaboration d’un dictionnaire électronique renouvelant
les modes de consultation impliquerait un enrichissement des descriptions de chaque
item et l’introduction de fonctionnalités absentes des interfaces actuelles, ce qui aurait
un coût de conception et de production important.
Sans méconnaître une partie au moins des entraves des éditeurs, je les ai sciemment
ignorées, préférant, pour cette prospective, inscrire mon propos dans une optique résolument optimiste en prenant le parti de faire comme si la crise de création que traverse
l’édition lexicographique ne pouvait pas durer sans être dommageable pour l’activité
elle-même, ce que les éditeurs seraient susceptibles de tenter de prévenir en cherchant
[291
de nouveaux moyens d’investir ou des Ðressources externes (subventions, par exemple
du ministère de l’Éducation nationale, pour des développements particuliers, contrats
financés pour des collaborations universitaires, etc.).
Il est malaisé de dire si et quand les éditeurs pourront sortir de la période de gestion
drastique des catalogues qu’ils traversent actuellement (cf. F. & P. Corbin (2008) et
P. Corbin (2008)), mais si les spéculations que je suis en mesure d’élaborer aujourd’hui
stimulaient l’imagination de nos partenaires en leur offrant de la matière à partir de
laquelle réagir, et qu’elle contribue, à sa modeste mesure, à ce qu’ils sortent de cette
crise avec des projets innovants, j’aurais le sentiment que la collaboration que nous
entretenons aura été tout à fait fructueuse pour chacun de nous.
Bibliographie
Dictionnaires et encyclopédies
Alpha. Encyclopédie alphabétique Hachette, 26 vol., Paris, Le Livre de Paris / Hachette, 1995.
Base lexicale du français, http://ilt.kuleuven.be/blf/.
Bibliorom Larousse, CD-ROM PC, Paris, Liris Interactive / Larousse / Microsoft Corporation,
1996 ; Bibliorom Larousse 2.0, Havas Interactive / Larousse / Microsoft Corporation, 1998.
Dictionnaire Auzou débutant, Paris, Auzou, 2008.
Dictionnaire Auzou junior, Paris, Éditions Philippe Auzou, 2006 ; nouv. éd., avec CD-ROM
PC / Mac OS, 2008.
Dictionnaire compact français-allemand / allemand-français, Paris, Larousse - SEJER,
2004 ; nouv. éd., Dictionnaire maxipoche plus français-allemand / allemand-français,
Larousse, 2008.
Dictionnaire compact français-anglais / anglais-français, Paris, Larousse - SEJER, 2004 ;
nouv. éd., Dictionnaire maxipoche plus français-anglais / anglais-français, Larousse,
2008.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
849
Dictionnaire compact français-espagnol / espagnol-français, Paris, Larousse - SEJER, 2004 ;
nouv. éd., Dictionnaire maxipoche plus français-espagnol / espagnol-français, Larousse,
2008.
Dictionnaire compact français-italien / italien-français, Paris, Larousse - SEJER, 2004 ;
nouv. éd., Dictionnaire maxipoche plus français-italien / italien-français, Larousse, 2008.
Dictionnaire d’apprentissage du français langue étrangère ou seconde [DAFLES ] : voir Base
lexicale du français.
Dictionnaire de l’Académie française, 9 e éd., 2 vol. parus (A-Enz, Éoc-Map), Paris, Imprimerie Nationale Éditions, 1992-2000 ; éd. en ligne : http://atilf.atilf.fr/academie9.htm.
[292 Ð
Dictionnaire des anglicismes, Paris, Librairie Larousse, 1982.
Dictionnaire des citations françaises et étrangères, Paris, Larousse, 1995.
Dictionnaire des combinaisons de mots, Paris, Le Robert, 2007.
Dictionnaire du français au collège, Paris, Larousse, 2000.
Dictionnaire du français contemporain, Paris, Librairie Larousse, 1966.
Dictionnaire français Hachette électronique, Paris, Hachette Multimédia / Hachette Livre,
2001 ; nouv. pressage, 2004.
Dictionnaire Hachette benjamin, Paris, Hachette Éducation, 1996.
Dictionnaire Hachette encyclopédique de poche, Paris, Hachette, 2001.
Dictionnaire Hachette junior, Paris, Hachette Éducation, 1998 ; nouv. éd., 2006.
Dictionnaire Hachette langue française, Paris, Hachette, 2001.
Dictionnaire Hachette multimédia. Le grand dictionnaire encyclopédique multimédia, CDROM PC, Paris, Hachette Multimédia, 1993 ; Mac, 1995 ; nouv. éds, 1996, 1998, 1999,
2000, 2001, 2002, 2005.
Dictionnaire Hachette-Oxford = Le dictionnaire Hachette-Oxford français- anglais / anglaisfrançais, Oxford - New York - Toronto, Oxford University Press / Paris, Hachette Livre,
1994. Version électronique : CD-ROM PC, Hachette Multimédia, 1997.
Dictionnaire pratique du français, Paris, Hachette, 1987.
Encarta = Encarta collection 2003, 4 CD-ROM PC, Redmond, Microsoft Corporation, 2002.
Encyclopédie Hachette multimédia, millésime 1999, 2 CD-ROM PC / Mac OS, Paris, Hachette
Multimédia, 1998. Nouv. éds : millésime 2001, 2000 ; millésime 2003, 2002 ; millésime
2004, 2003 ; PC / Mac OS / Linux, millésime 2005, 2004 ; millésime 2007, 2006.
Grand dictionnaire des synonymes et contraires, Paris, Larousse, 2004.
Grand Larousse de la langue française en sept volumes, Paris, Librairie Larousse, 1971-1978.
Grand Larousse en 5 volumes, Paris, Larousse, 1987.
Grand Larousse italien, Paris, Larousse / Milano, Sansoni, 2006 ; éd. italienne, Il Larousse
francese. Dizionario français-italien italiano-francese, avec CD-ROM PC / Mac OS / Linux,
Milano, Rizzoli / Paris, Larousse, 2006.
Grand Robert de la langue française = Le Grand Robert de la langue française. Dictionnaire
alphabétique et analogique de la langue française, 2 e éd. entièrement revue et enrichie,
9 vol., Paris, Le Robert, 1985 ; nouv. éd. augmentée, 6 vol., 2001.
Grand Robert de la langue française électronique = Le Robert électronique, CD-ROM DOS
+ guide d’utilisation, Paris, Dictionnaires Le Robert / Bruxelles, Bureau van Dijk, 1989 ;
850
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
Mac, 1992 ; PC, version 1.4, 1994 ; version 2.0, Le Grand Robert de la langue française,
Paris, Le Robert - SEJER / Bureau van Dijk, 2005 ; Mac OS, version 2.1, 2008.
Grand Robert & Collins électronique = Le Grand Robert-Collins électronique, CD-ROM PC,
version 1.0, Paris, Dictionnaires Le Robert - VUEF / Bruxelles, Bureau van Dijk, 2003 ;
DVD-ROM PC / Mac, version 2.0, Le Grand Robert & Collins, Paris, Dictionnaires Le
Robert / Glasgow, HarperCollins Publishers / Bruxelles, Bureau van Dijk, 2008.
Grand usuel larousse. Dictionnaire encyclopédique, 5 vol., Paris, Larousse, 1997.
[293 Ð
Larousse Chambers = Grand dictionnaire Larousse Chambers français-anglais / EnglishFrench, Paris, Larousse, 1999 ; nouv. éd., Larousse Chambers. Dictionnaire françaisanglais / English-French, Larousse - VUEF, 2003. Versions électroniques : CD-ROM
PC, version 1, Larousse / Havas Interactive, 1999 ; version 2, Larousse / Mysoft, 2007.
Larousse des débutants, Paris, Larousse, 2005.
Larousse des noms communs, Paris, Larousse, 2008.
Larousse expression. Le multidictionnaire du français au quotidien, CD-ROM PC, Paris,
Larousse - VUEF, 2002. Nouv. diffus. : Larousse multidico, Emme, 2004 ; La GarenneColombes, Avanquest, 2006 ; Larousse illico multidico, 2007 ; Larousse multidico, 2008.
Larousse français-espagnol. Dictionnaire français-espagnol / español-francés, CD-ROM PC,
Paris, Larousse / Emme, 2004 ; nouv. diffus., Mysoft, 2007.
Larousse illico dictionnaire bilingue français-allemand allemand-français, CD-ROM PC,
Paris, Larousse / Babylon / Emme, 2005 ; nouv. diffus., La Garenne-Colombes, Avanquest,
2007.
Larousse illico dictionnaire bilingue français-anglais anglais-français, CD-ROM PC, Paris,
Larousse / Babylon / Emme, 2005 ; nouv. diffus., La Garenne-Colombes, Avanquest, 2007.
Larousse illico dictionnaire bilingue français-espagnol espagnol-français, CD-ROM PC, Paris,
Larousse / Babylon / Emme, 2005 ; nouv. diffus., La Garenne-Colombes, Avanquest, 2007.
Larousse illico dictionnaire bilingue français-italien italien-français, CD-ROM PC, Paris,
Larousse / Babylon / Emme, 2005 ; nouv. diffus., La Garenne-Colombes, Avanquest, 2007.
Larousse illico dictionnaire multilingue français-anglais anglais-français – français-espagnol
espagnol-français – français-allemand allemand-français, CD-ROM PC, Paris, Larousse /
Babylon / Emme, 2005 ; nouv. diffus., La Garenne-Colombes, Avanquest, 2007.
Larousse illico multidictionnaire français, CD-ROM PC, Paris, Larousse / Babylon / Emme,
2005 ; nouv. diffus., La Garenne-Colombes, Avanquest, 2007.
Larousse illico multidictionnaire français – français-anglais anglais-français – français-espagnol espagnol-français, CD-ROM PC, Paris, Larousse - Babylon / La Garenne-Colombes,
Avanquest, 2007.
Larousse junior, Paris, Larousse, 2003 ; nouv. éd., Dictionnaire junior, 2008.
Larousse multilingue, CD-ROM PC, Paris, Larousse / Emme, 2004 ; nouv. diffus., La GarenneColombes, Avanquest, 2007.
Larousse pratique. Dictionnaire du français au quotidien, Paris, Larousse, 2003 ; nouv. éd.,
Dictionnaire compact, 2008.
Lexis. Dictionnaire de la langue française, Paris, Librairie Larousse, 1975 ; éd. revue et corrigée, Larousse, 2002 ; nouv. tir., Le Lexis. Le dictionnaire érudit de la langue française,
2009.
Longman Essential Activator. Put your ideas into words, Harlow, Longman, 1997 ; 2 e éd.,
avec CD-ROM PC, 2006.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
851
Longman Language Activator. The world’s first production dictionary, Harlow, Longman,
1993 ; 2 e éd., Longman Language Activator. Helps you write and speak natural English,
2002.
Macmillan English Dictionary for Advanced Learners, avec CD-ROM PC, version 1.4, Oxford,
Macmillan, 2002.
Mediadico, http://www.mediadico.com/.
[294 Ð
Mon premier dictionnaire avec Martine, Paris, Delagrave / Tournai, Casterman, 2003.
Nouveau Petit Robert = Le Nouveau Petit Robert. Dictionnaire alphabétique et analogique
de la langue française, Paris, Dictionnaires Le Robert, 1993. Nouv. éds : millésime 2006,
Dictionnaires Le Robert - SEJER, 2005 ; millésime 2007, 2006 ; millésime 2008, 2007 ;
millésime 2009, avec ou sans CD-ROM PC / Mac, 2008.
Nouveau Petit Robert électronique : voir Petit Robert électronique.
Petit Larousse électronique 1997, Paris, Larousse / Liris Interactive, 1996.
Petit Larousse illustré 2003, avec ou sans CD-ROM PC, Paris, Larousse - VUEF, 2002 ; millésime 2004, 2003 ; Larousse, millésime 2005, 2004 ; millésime 2006, 2005 ; millésime
2007, 2006 ; millésime 2008, 2007 ; millésime 2009, 2008.
Petit Larousse illustré 2008 grand format, Paris, Larousse, 2007 ; millésime 2009, 2008.
Petit Robert électronique = Le Petit Robert. Dictionnaire de la langue française, CD-ROM
PC, Paris, Liris Interactive / Dictionnaires Le Robert / van Dijk, 1996 ; PC / Mac, version
2.0, Le Nouveau Petit Robert de la langue française. Dictionnaire alphabétique et analogique de la langue française, Dictionnaires Le Robert - VUEF / Bureau van Dijk, 2001 ;
millésime 2007, version 3.0, Dictionnaires Le Robert - SEJER / Bureau van Dijk, 2006 ;
millésime 2008, version 3.1, 2007 ; millésime 2009, version 3.2, 2008.
Robert des enfants : voir Robert junior électronique.
Robert & Collins compact plus = Le Robert & Collins compact plus. Dictionnaire françaisanglais anglais-français, 6e éd., Glasgow, HarperCollins Publishers / Paris, Dictionnaires
Le Robert - SEJER, 2006.
Robert & Collins senior = Le Robert & Collins senior. Dictionnaire français-anglais anglaisfrançais, 6 e éd., Glasgow, HarperCollins Publishers / Paris, Dictionnaires Le Robert SEJER, 2002 ; 8 e éd., Le Robert & Collins. Dictionnaire français-anglais anglais-français, 2006.
Robert & Collins super senior = Le Robert & Collins super senior. Grand dictionnaire français-anglais / anglais-français, 2 e éd., 2 vol., Glasgow, HarperCollins Publishers / Paris,
Dictionnaires Le Robert - SEJER, 2000 ; 3e éd., Le Grand Robert & Collins. Dictionnaire
français-anglais anglais-français, 2008.
Robert junior = Le Robert junior illustré, Paris, Dictionnaires Le Robert, 1993 ; nouv. éds
entièrement revues et enrichies, 1999, 2005.
Robert junior électronique = Le Robert junior, CD-ROM PC, version 1.0, Paris, Dictionnaires
Le Robert - Havas Interactive / Bruxelles, Bureau van Dijk, 1998 ; version 1.1, PC / Mac,
1999 ; nouv. pressage, 2003 ; version 1.2, Le Robert des enfants, Dictionnaires Le Robert SEJER / Bureau van Dijk, 2006.
Thésaurus = Thésaurus Larousse. Des idées aux mots, des mots aux idées, Paris, Larousse,
1991.
852
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
Trésor de la langue française. Dictionnaire de la langue du XIX e et du XX e siècle (1789-1960),
16 vol., Paris, Éditions du Centre National de la Recherche Scientifique (tt. 1-10) /
Gallimard (tt. 11-16), 1971-1994.
Trésor de la langue française informatisé, version 4, 2002, http://atilf.atilf.fr/tlfv3.htm ;
CD-ROM PC / Mac OS + livre d’accompagnement, Paris, CNRS Éditions, 2004.
[295 Ð
Autres références
ALTMAN J. & POLGUÈRE A. (2003), « La BDéf : base de définitions dérivée du Dictionnaire
explicatif et combinatoire », in S. Kahane & A. Nasr éds, Actes de la première conférence
internationale de théorie Sens-Texte (MTT’2003, Paris, 16-18 juin 2003), Paris, École
Normale Supérieure, pp. 43-54.
À portée de mots pour le CE1 = LECLEC’H-LUCAS J., LUCAS J.-C. & MEUNIER R., Français
CE1 cycle 2 niveau 3. À portée de mots, Paris, Hachette Éducation, 2003.
À portée de mots pour le CE2 = LECLEC’H-LUCAS J., LUCAS J.-C. & MEUNIER R., Français
CE2 cycle 3 niveau 1. À portée de mots, Paris, Hachette Éducation, 2005.
À portée de mots pour le CM1 = LECLEC’H-LUCAS J., LUCAS J.-C. & MEUNIER R., Français
CM1 cycle 3 niveau 2. À portée de mots, Paris, Hachette Éducation, 2007.
ATKINS B.T.S. (1995), « Analysing the verbs of seeing: a frame semantics approach to corpus
lexicography », in S. Gahl, C. Johnson & A. Dolbey eds, Proceedings of the Twentieth
Annual Meeting of the Berkeley Linguistics Society (1994), Berkeley, Berkeley Linguistics
Society, University of California at Berkeley, pp. 42-56.
ATKINS B.T.S. (2002a), « Bilingual dictionaries: past, present and future », in Corréard M.-H.
éd., pp. 1-29 ; 1e éd. in M. Gellerstam, J. Järborg, S.-G. Malmgren, K. Norén, L. Rogström
& C. Röder Papmehl eds, Euralex’96 Proceedings, Göteborg, Göteborg University, 1996,
pp. 515-546.
ATKINS B.T.S. (2002b), « Then and now: competence and performance in 35 years of lexicography », in A. Braasch & C. Povlsen eds, Proceedings of the Tenth EURALEX International Congress, EURALEX 2002. Copenhagen, Denmark, August 13-17, 2002, vol. 1,
Copenhagen, Center for Sprogteknologi, pp. 1-28.
ATKINS B.T.S. & RUNDELL M. (2008), The Oxford Guide to Practical Lexicography, Oxford,
Oxford University Press.
ATKINS B.T.S., FILLMORE C. & JOHNSON C. (2003), « Lexicographic relevance: selecting information from corpus evidence », International Journal of Lexicography 16.3, pp. 251-280.
ATKINS B.T.S., RUNDELL M. & SATO H. (2003), « The contribution of FrameNet to practical
lexicography », International Journal of Lexicography 16.3, pp. 333-357.
BÉJOINT H. (2007), « Informatique et lexicographie de corpus : les nouveaux dictionnaires »,
Revue française de linguistique appliquée XII.1, pp. 7-23.
BÉJOINT H. (2009), « Lexicographie et linguistique : quelques réflexions sur le domaine anglais », Lexique 19, pp. 117-158.
BLUMENTHAL P. & HAUSMANN F.J. (2006), « Présentation : collocations, corpus, dictionnaires »,
Langue française 150, pp. 3-13.
BRAASCH A. (2004), « A health corpus selected and downloaded from the web - Is it healthy
enough? », in G. Williams & S. Vessier eds, vol. 1, pp. 71-78.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
853
CITRON S. & WIDMANN T. (2006), « A bilingual corpus for lexicographers », in E. Corino, C.
Marello & C. Onesti eds, Atti del XII Congresso Internazionale di Lessicografia, Torino,
6-9 settembre 2006, 2 vol., Alessandria, Edizioni dell’Orso, pp. 251-255.
[296 Ð
CORBIN D. (1990), « Homonymie structurelle et définition des mots construits. Vers un “dictionnaire dérivationnel” », in Centre d’études du lexique, J. Chaurand & F. Mazière éds,
La définition, Paris, Larousse, pp. 175-192.
CORBIN D. (à paraître), Le lexique construit. Méthodologie d’analyse.
CORBIN D. & CORBIN P. (1991a), « Un traitement unifié du suffixe -ier(e) », Lexique 10, pp.
61-145.
CORBIN D. & CORBIN P. (1991b), « Vers le Dictionnaire dérivationnel du français », Lexique
10, pp. 147-161.
CORBIN F. (2009), « L’iconographie du Robert junior (1993-2004) », Lexique 19, pp. 69-115.
CORBIN F. & CORBIN P. (2008), « Les dictionnaires sont des voitures comme les autres », in
F. Maniez & P. Dury éds, Lexicographie et terminologie : histoire de mots. Hommage à
Henri Béjoint, Travaux du CRTT, Gap, Louis Jean Imprimeur, pp. 47-65.
CORBIN P. (1998), « La lexicographie française est-elle en panne ? », in Cicle de conferències
96-97. Lèxic, corpus i diccionaris, Barcelona, Institut Universitari de Lingüística Aplicada,
Universitat Pompeu Fabra, pp. 83-112.
CORBIN P. (2002), « Lexicographie et linguistique : une articulation difficile. L’exemple du
domaine français », in F. Melka & M.C. Augusto eds, De la lexicologie à la lexicographie / From Lexicology to Lexicography, Utrecht, Utrecht Institute of Linguistics OTS,
pp. 8-37 ; en ligne : http://www-uilots.let.uu.nl/research/Publications/Melka_Augusto.pdf,
pp. 9-38.
CORBIN P. (2004), « Théorie et pratique de la formation professionnelle de lexicographes :
treize ans d’expérience lilloise », in G. Williams & S. Vessier eds, vol. 1, pp. 13-35 [éd.
fautive] ; rééd. conforme au texte original in P. Corbin (2006), vol. 3, pp. 1161-1186.
CORBIN P. (2006), Avec des dictionnaires pour compagnons, habilitation à diriger des recherches, 3 vol., Université Charles de Gaulle - Lille 3 / L’Atelier C.
CORBIN P. (2008), « Quel avenir pour la lexicographie française ? », in J. Durand, B. Habert
& B. Laks resp., Congrès mondial de linguistique française. Paris, 9-12 juillet 2008, Paris, Institut de Linguistique Française / EDP Sciences, http://www. linguistiquefrancaise.
org/, pp. 1227-1250.
CORBIN P. & GASIGLIA N. (2004), « Lire les dictionnaires (2). Une DTD pour le Robert &
Collins junior bilingue : spéculations métalexicographiques », Cahiers de lexicologie 84,
pp. 135-194.
CORBIN P. & GASIGLIA N. (2009a), « Approche des métaphores dans le lexique afférent à la
lexicographie », in P. Dury, F. Maniez, N. Arlin & C. Rougemont dir., La métaphore en
langues de spécialité, Travaux du CRTT, Grenoble, Presses Universitaires de Grenoble,
pp. 83-116.
CORBIN P. & GASIGLIA N. (2009b), « Changer les dictionnaires ? Une pluralité d’approches »,
Lexique 19, pp. 7-38.
CORBIN P. & GASIGLIA N. (2009c), « Le monde étrange des dictionnaires (9). La quadrature
du cercle des dictionnaires monolingues imprimés pour l’expression : le cas du Dictionnaire du français au collège », Lexique 19, pp. 41-68.
854
Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia
CORRÉARD M.-H. ed. (2002), Lexicography and Natural Language Processing. A festschrift
in honour of B.T.S. Atkins, EURALEX.
[297 Ð
DAL G. & NAMER F. (2000), « Génération et analyse automatiques de ressources lexicales
construites utilisables en recherche d’information », Traitement automatique des langues
41.2, pp. 423-446.
DURAND J., HABERT B. & LAKS B. resp. (2008), Congrès mondial de linguistique française.
Paris, 9-12 juillet 2008, Paris, Institut de Linguistique Française / EDP Sciences,
disque et éd. en ligne : http://www.linguistiquefrancaise.org/index.php?option=toc&url
=/articles/cmlf/abs/2008/01/contents/contents.html&Itemid=287&lang=fr.
FILLMORE C. & ATKINS B.T.S. (1992), « Towards a frame-based organization of the lexicon:
the semantics of RISK and its neighbors », in A. Lehrer & E. Kittay eds, Frames, Fields
and Contrast: New essays in semantic and lexical organization, Hillsdale, Lawrence
Erlbaum Associates, pp. 75-102.
FILLMORE C. & ATKINS B.T.S. (1994), « Starting where the dictionaries stop: the challenge
for computational lexicography », in B.T.S. Atkins & A. Zampolli eds, Computational
Approaches to the Lexicon, Oxford / New York, Oxford University Press, pp. 349-393.
FILLMORE C. & ATKINS B.T.S. (1998), « FrameNet and lexicographic relevance », in A. Rubio,
N. Gallardo, R. Castro & A. Tejado eds, Proceedings of the First International Conference on Language Resources and Evaluation (Granada, Spain, 28-30 May 1998), EC DG
XIII and Fundacion Banco Central-Hispanica, pp. 417-423 ; en ligne : http://framenet.
icsi.berkeley.edu/papers/lexrel.pdf.
FILLMORE C. & ATKINS B.T.S. (2000), « Describing polysemy: the case of crawl », in Y. Ravin
& C. Leacock eds, Polysemy. Theoretical and computational approaches, Oxford, Oxford
University Press, pp. 91-110.
FONTENELLE T. (2009), « Sémantique des cadres et lexicographie », Lexique 19, pp. 161-179.
FONTENELLE T. ed. (2008), Practical Lexicography. A reader, Oxford, Oxford University
Press.
GASIGLIA N. (2008a), « Le traitement des emprunts dans les dictionnaires d’apprentissage
français : options descriptives et choix rédactionnels », in J. Pruvost dir., Les Journées
des dictionnaires de Cergy. Dictionnaires et mots voyageurs. Les 40 ans du Petit Robert.
De Paul Robert à Alain Rey, Éragny-sur-Oise, Éditions des Silves, pp. 153-212.
GASIGLIA N. (2008b), « Le traitement des “identifications diachroniques” dans des dictionnaires scolaires français : évaluation de pratiques et proposition de principes de rédaction alternatifs », in J. Durand, B. Habert & B. Laks resp., pp. 1117-1136 du disque ; éd.
en ligne : http://www.linguistiquefrancaise.org/articles/cmlf/pdf/2008/01/cmlf08236.pdf,
pp. 1129-1148.
HANKS P. (2004), « Corpus pattern analysis », in G. Williams & S. Vessier eds, vol. 1, pp. 87-97.
HAUSMANN F.J. (2003), « Beaucoup de splendeurs, peu de misères : bilan sur les dictionnaires
Le Robert », in M.-C. Cormier, A. Francoeur & J.-C. Boulanger dir., Les dictionnaires
Le Robert. Genèse et évolution, Montréal, Les Presses de l’Université de Montréal, pp.
246-262.
HAUSMANN F.J. (2005), « Isotopie, scénario, collocation et exemple lexicographique », in M.
Heinz éd., L’exemple lexicographique dans les dictionnaires français contemporains. Actes
des “Premières journées allemandes des dictionnaires” (Klingenberg am Main, 25-27 juin
2004), Tübingen, Max Niemeyer Verlag, pp. 283-292.
T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger
[298 Ð
855
JACQUET-PFAU C. (2005), « Pour un nouveau dictionnaire informatisé », Études de linguistique
appliquée 137, pp. 51-71.
KILGARRIFF & al. (2004) = KILGARRIFF A., RYCHLY P., SMRZ P. & TUGWELL D., « The Sketch
Engine », in G. Williams & S. Vessier eds, vol. 1, pp. 105-115.
KILGARRIFF A. & GREFENSTETTE G. (2003), « Introduction to the special issue on the web as
corpus », Computational Linguistics 29.3, pp. 333-348 ; nouv. éd. in T. Fontenelle ed.
(2008), pp. 89-101.
KILGARRIFF A. & TUGWELL D. (2002), « Sketching words », in M.-H. Corréard ed., pp. 125-137.
LAUFER B. (1992), « Corpus-based versus lexicographer examples in comprehension and production of new words », in H. Tommola, K. Varantola, T. Salmi-Tolonen & J. Schopp eds,
EURALEX 1992 Proceedings, Tampere, University of Tampere, pp. 71-76 ; nouv. éd., in
T. Fontenelle ed. (2008), pp. 213-218.
LEHMANN A. (1993), « L’exemple et la définition dans les dictionnaires pour enfants », Repères
8, nouvelle série, pp. 63-78.
MACRON R. (1999), « L’école et le dictionnaire », Études de linguistique appliquée 116, pp.
441-451.
MEL’ČUK I., CLAS A. & POLGUÈRE A. (1995), Introduction à la lexicologie explicative et combinatoire, Louvain-la-Neuve, Duculot.
NAMER F. (2003), « Productivité morphologique, représentativité et complexité de la base :
le système MoQuête », Langue française 140, pp. 79-101.
PAROUBEK P. & RAJMAN M. (2000), « Étiquetage morpho-syntaxique », in J.-M. Pierrel dir.,
Ingénierie des langues, Paris, Hermès Science Publications, chap. 5, pp. 131-150.
PIERREL J.-M. (2008), « De la nécessité et de l’intérêt d’une mutualisation informatique des
connaissances sur le lexique de notre langue », in J. Durand, B. Habert & B. Laks
resp., pp. 1245-1264 du disque ; éd. en ligne : http://www.linguistiquefrancaise.org/
articles/cmlf/pdf/2008/01/cmlf08330.pdf, pp. 1257-1276.
REY-DEBOVE J. (1988), « Préface », in Le Petit Robert des enfants. Dictionnaire de la langue
française, Paris, Dictionnaires Le Robert, pp. IX-XVIII.
RUNDELL M. (2002), « Introduction », in Macmillan English Dictionary for Advanced Learners,
p. x.
VAN DE VELDE D. (2009), « Sémantique lexicale et lexicographie : le cas des verbes », Lexique
19, pp. 181-214.
VERLINDE S., SELVA T. & BINON J. (2009), « Les bases de données au service d’un dictionnaire d’(auto-)apprentissage pour allophones », Lexique 19, pp. 217-233.
WILLIAMS G. & VESSIER S. eds (2004), Proceedings of the Eleventh EURALEX International
Congress, EURALEX 2004, Lorient, France, July 6-10, 2004, 3 vol., Lorient, Université
de Bretagne-Sud.