PDF du texte dans la version HDR
Transcription
PDF du texte dans la version HDR
T17 Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 1 Résumé L’outillage informatique occupe une place grandissante dans les travaux des éditeurs français de dictionnaires commerciaux. Cette étude met en perspective les effets perceptibles de la mutation engagée depuis plus de dix ans et explore prospectivement ce qui pourrait advenir : si les modes de conception et de rédaction et les interactions entre la lexicographie et l’informatique éditoriale ont très significativement été modifiés, le changement engagé pourrait aussi permettre de concevoir de puissants environnements documentaires, constitués de ressources éditoriales et d’extraits d’études linguistiques, et des produits neufs, créés pour l’édition électronique, comme un dictionnaire qui, pour mieux aider les écoliers et collégiens à comprendre tous les énoncés et à diversifier et normaliser leur expression, fournirait des sélections d’informations ciblées et explicites dans des affichages variés. [235 Ð 0. Introduction La présente contribution 2 cherche à évaluer quelles sont les pratiques observées ou qui pourraient émerger du fait de la place grandissante des outils informatiques dans l’édition commerciale de dictionnaires. L’intérêt pour cette activité professionnelle est motivé par le fait qu’elle a des contraintes différentes de celles de la lexicographie publique ou collaborative, qu’elle fournit les répertoires les plus communément employés et qu’elle ne peut pas se contenter de publier des ébauches de dictionnaires, même quand elle cherche de nouvelles formules 3. Cet intérêt a en outre été aiguisé par les [235 Ð 1 2 3 Merci à Pierre Corbin pour son soutien constant, aux intervenants professionnels (cf. Corbin & Gasiglia (2009b, n. 5), dans ce volume) du Master 2 e année “ Lexicographie, Terminographie et Traitement Automatique des Corpus” (université Lille 3, http://stl.recherche.univ-lille3.fr/siteheberges/LTTAC/Interventions.htm) pour la richesse de leurs témoignages, à Nicolas Arbouin, Martin Demontigny et Wanda Rzewuski pour leurs réponses concernant les correcteurs orthographiques (cf. n. 64), à Luc Audrain pour son aide documentaire et à Alise Lehmann pour sa relecture. Les contenus accessibles à partir des URL mentionnées dans cet article ont été visités et contrôlés pour la dernière fois le 10 avril 2009. Dans le domaine encyclopédique, toutefois, les éditions Larousse offrent à la consultation un texte en évolution au moins partielle, celui de l’Encyclopédie contributive Larousse (http://www.larousse.fr/encyclopedie/ : « Dé- 2009d, Lexique 19 (« Changer les dictionnaires ? », Pierre Corbin & Nathalie Gasiglia dir.), pp. 224-298. [Article dans une revue internationale avec comité de lecture ; rédigé en 2008-2009 ; 225 306 caractères] 800 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia témoignages annuels 4 de lexicographes décrivant l’évolution de leur pratique et d’informaticiens présentant une partie de la veille technologique qui constitue leur quotidien. Conséquemment, bien qu’également inspiré par des réalisations du monde universitaire, le propos se limitera à des orientations compatibles avec les exigences particulières des entreprises privées, qu’il s’agisse de contraintes de rentabilité ou de gestion de très gros volumes de données (correspondant à un nombre croissant de produits commercialisés synchroniquement ou au fil du temps). [236 Ð Le travail d’investigation mené couvre plusieurs compartiments de la lexicographie éditoriale. Il vise à présenter ce qui est stable, ce qui vient de se mettre en place et ce qui pourrait encore changer du fait d’évolutions informatiques influant sur cette activité, en adoptant un ordre de présentation chronologique 5, assez comparable à celui retenu par Atkins & Rundell (2008) : de la documentation préalable à toute rédaction, qui alimente la culture linguistique des lexicographes, aux produits éditoriaux mis sur le marché. Dans ce cadre, les tâches qui constituent l’activité la plus centrale (conception, documentation ciblée, rédaction, révision, édition) occupent logiquement la place médiane de cette étude. Un centrage alternatif du propos sur les changements effectifs n’aurait accordé de place qu’à ces tâches, qui sont en mutation depuis plus de dix ans (ce qui a très significativement modifié les activités de l’informatique éditoriale) et qui seraient certainement susceptibles de tirer un meilleur profit encore des évolutions techniques qu’elles connaissent, en particulier en offrant un nouvel environnement documentaire aux lexicographes (de plus en plus souvent externes et/ou temporaires) afin de consolider la qualité linguistique des produits et en mobilisant de nouveaux 4 [236 Ð 5 couvrez une encyclopédie totalement inédite qui vous permettra de consulter à la fois les articles Larousse (en orange) et les articles écrits par les internautes contributeurs (en violet). »). Dans le cadre du master LTTAC (cf. n. 1), lors des interventions de professionnels et des suivis de stages, nous avons de multiples contacts avec différents éditeurs qui ont une activité dictionnairique identitaire ou significative. Cette chronologie, comme le découpage de l’activité des lexicographes proposé par P. Corbin (2004), ne reflète pas la segmentation effective des activités mais constitue une conceptualisation des types de tâches exploitée pour évoquer les changements méthodologiques induits par l’amplification de la place des outils informatiques, qui actuellement n’affecte pas sensiblement les produits, mais qui pourrait encore être accrue pour mieux aider les lexicographes. Trois strates sont décrites par P. Corbin et reprises dans cette étude : 1) La strate métalinguistique subsume deux phases : – d’une part la documentation qui couvre ce qui relève de la prise de connaissance des savoirs établis dans les divers domaines linguistiques (lexicologie dans toutes ses composantes, sociolinguistique, etc.), du repérage des types d’informations insérables dans les futures descriptions lexicales et de la recherche des propriétés de chaque item, tâches qui font l’objet d’une attention inégale chez les éditeurs et qui pourraient significativement évoluer chez ceux qui consacreraient des moyens à l’intégration rationnelle d’outils documentaires informatisés ; – d’autre part, lors de l’élaboration d’un projet, l’identification des types d’informations linguistiques à fournir pour chaque item, puis la sélection de nomenclature. Les évolutions méthodologiques motivées par la disponibilité de nouvelles solutions informatiques et qui concernent la première phase sont développées au § 1., le § 2.1. se concentrant sur les aspects documentaires synchrones avec les tâches de conception de projet et de rédaction. 2) La strate discursive correspond à la rédaction effective des articles : la manière de textualiser les informations fournies tient compte du projet, du public destinataire et des structures d’articles prévues (cf. § 2.2.). 3) La strate de posttraitement réunit ce qui donne aux dictionnaires leur personnalité visuelle (dont dépend leur lisibilité), et ce qui les dote de fonctions de consultation avancées s’il s’agit d’une version électronique (cf. §§ 2.3. et 3.). T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 801 savoir-faire (comme ceux de développeurs d’applications informatiques) afin de créer des produits réellement conçus pour l’édition électronique, qui pourraient en premier lieu cibler les plus jeunes utilisateurs (initiés à l’informatique dès l’école primaire et le collège). [237 Ð Certaines des orientations défendues ci-après semblent pouvoir être mises en œuvre dans les entreprises, alors que d’autres ont une probabilité de réalisation plus réduite, du fait qu’elles impliqueraient des investissements difficilement assumables actuellement par les éditeurs commerciaux. La présentation de celles-ci dans le contexte d’une publication spéculative est motivée par une recherche des mutations théoriquement envisageables, qui évalue leur profit possible mais ne prend volontairement pas en compte les contraintes économiques avec lesquelles les éditeurs doivent composer. Débuter cette réflexion par la documentation métalinguistique 6 conçue comme une activité nécessaire pour les lexicographes, qui doivent rester de fins observateurs de la ou des langue(s) qu’ils décrivent tout en diversifiant leurs compétences, conduit à convoquer les corpus et les outils qui permettent de les explorer, mais, outre ces ressources (mieux installées dans les pratiques britanniques que françaises et qui ne semblent pas avoir beaucoup d’avenir en France (cf. Corbin & Gasiglia (2009b, § 5.), introduisant ce volume)), ce sont la veille documentaire et la compilation de données dictionnairiques qui sont évoquées, afin d’envisager comment il serait pertinent de leur donner une place plus consistante. Bien qu’apparemment peu utile en cette période de gestion de catalogues par changements de couvertures, métissages ou dérivations de répertoires existants sans création textuelle, il se peut que la structuration en base documentaire d’une sélection d’archives présente une certaine urgence dans la mesure où les équipes de rédacteurs comptent encore des lexicographes d’expérience qui ont fait leur carrière chez un éditeur dont ils connaissent les usages et les produits antérieurs, mais qui, bientôt retraités, n’auront guère été en situation de transmettre leur savoir autrement qu’en contribuant à faciliter les exploitations futures du fonds éditorial. Terminer cette étude par des orientations pour un dictionnaire électronique pour l’école et le collège ne consiste pas à présenter le cahier des charges d’un produit, mais plutôt, avec modestie et sans que ce soit dans le cadre d’une collaboration avec un éditeur, à suggérer sur quels types de pistes pourraient s’engager des recherches en vue de l’élaboration d’un produit électronique novateur susceptible de contribuer à éduquer le jeune public à l’analyse de la langue dont il apprend le maniement, et ainsi de lui donner l’envie de consulter un bon dictionnaire plutôt qu’une ressource aléatoire dont il peut ne tirer qu’un profit relatif. La conception de descriptions lexicales de qualité, explicites, valorisant les propriétés linguistiques en jouant sur des affichages variés, rendant la richesse des indications réunies perceptible et répondant à de multiples [238 Ð besoins constitue un projet complexe, ambitieux et important pour que le secteur de la référence puisse trouver une meilleure place auprès d’un public appelé à rédiger [237 Ð 6 L’étude est focalisée sur les données métalinguistiques, mais l’élaboration des contenus non linguistiques des dictionnaires dits “encyclopédiques” pourrait bénéficier de méthodes de documentation comparables à celles présentées aux §§ 1.2. à 1.4. (pour autant que ce type de documentation ne serait pas pris en charge à titre individuel par des experts externes). 802 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia et lire beaucoup de documents électroniques dans les environnements scolaires et personnels puis professionnels. 1. Changer les modes de documentation Les dictionnaires pris en compte dans cette étude sont tous des répertoires qui fournissent une sélection d’informations discursives, linguistiques et métalinguistiques 7, en accordant une place plus ou moins importante à chacune de celles qui sont formulables à propos de chaque unité linguistique décrite. Avant de définir la manière rédactionnelle de chacune et son mode de présentation, les concepteurs de projets doivent donc sélectionner les types de données à présenter, ce qui implique qu’ils aient à la fois une intuition fine du potentiel informationnel des dictionnaires et une bonne perception des types de savoirs à fournir pour documenter au mieux les futurs utilisateurs des ouvrages en gestation. Simultanément ils doivent prévoir les interactions susceptibles d’exister entre les informations qui seront fournies afin de les distribuer stratégiquement dans les différents composants d’articles. Afin que la rédaction d’un nouveau dictionnaire débute, les chefs de projets doivent en outre expliquer aux rédacteurs les choix opérés et leur indiquer comment se documenter et sélectionner les informations pour ne pas en omettre d’importantes. Pour cela, les sources documentaires peuvent être de quatre ordres : des “corpus”, une compilation structurée de ressources dictionnairiques de chaque éditeur 8, une collecte de produits d’études lexicologiques ou une ressource métalinguistique unique. Ci-après, l’ordre de présentation de chacune reflète l’accroissement de leurs ambitions documentaires et des investissements qu’elles impliqueraient. Il reflète donc également la réduction de leur probabilité de réalisation. 1.1. Corpus Les “corpus”, que le terme ait été employé pour désigner une collection de documents [239 primaires, constituée avec un objectif précis Ðinfluant sur leur sélection et éventuellement sur leur échantillonnage, une compilation plus opportuniste (des archives de presse en particulier) ou l’accès commode à des textes (comme ceux disponibles sur le web), ont mobilisé beaucoup d’auteurs qui ont défendu (ou non) leur emploi en lexicographie. Concernant ce type de ressource, les préoccupations des lexicographes ont croisé celles des linguistes et des informaticiens, qui ont d’autant plus investi qu’ils en attendaient beaucoup. Il en résulte une production foisonnante d’études de faisabilité [238 Ð 7 8 Si les dictionnaires dits “de langue”, qui sont des répertoires métalinguistiques éventuellement enrichis de citations (littéraires en particulier), ont vocation à soutenir autant la compréhension que l’expression riche et normée, les dictionnaires dits “encyclopédiques”, en tant que répertoires métalinguistiques qui fournissent aussi des informations sur les objets du monde que les items lexicaux nomment, sont plutôt destinés à servir la seule compréhension. La structure de cette compilation devrait faciliter la réexploitation des textes qui constituent le patrimoine intellectuel de l’entreprise. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 803 ou de plus-values et de projets de développement de ressources et d’outils d’exploration. Ces travaux, motivés par l’espoir d’accéder au fonctionnement “réel” de chaque langue, ont permis que l’exploration de corpus soit assez bien connue dans son principe à défaut d’être utilisée massivement chez les éditeurs privés français. 9 Un premier constat est que les corpus de langue française sont souvent constitués pour la recherche et sont donc très rarement disponibles pour les éditeurs 10, ce qui, après une phase de spéculations, les a incités à pallier la pénurie. Dans ce contexte, deux ressources ont été exploitées : des archives de presse 11, qui ont été diversement [240 appréciées, certains seulement en ayant tiré un profit jugé positif Ðau regard du temps consacré au dépouillement, et le web, exploré en parcourant du regard des textes sélectionnés par les moteurs de recherche puis par les rédacteurs (à partir des “snippets” 12) ou en ne posttraitant que les snippets, qui fournissent des contextes d’emploi souvent partiels mais retravaillables afin d’obtenir des exemples interprétables, informatifs et apparemment “authentiques”. 13 [239 Ð 9 10 11 [240 Ð 12 13 Les auteurs qui se sont exprimés à propos du recours aux corpus en lexicographie ont relaté leur expérience, que celle-ci touche un corpus d’éditeur (comme Citron & Widmann (2006)) ou l’emploi de données du web (comme Kilgarriff & Grefenstette (2003) et Braasch (2004)), ou évalué l’apport des données attestées à propos d’objets particuliers (comme les descriptions de “mots nouveaux” pour Laufer (1992), les patrons de constructions pour Hanks (2004)) ou de manière plus transversale (comme Béjoint (2007) et Atkins & Rundell (2008, § 3.)), etc. Le nombre de contributions impliquant des corpus dans les actes des colloques EURALEX, par exemple, témoigne de leur importance pour les chercheurs. Il n’est cependant pas certain qu’en France l’ensemble de ceux qui œuvrent à la rédaction des dictionnaires aient les moyens d’avoir un avis documenté les concernant : rares probablement sont les lexicographes qui ont eu la possibilité d’expérimenter comparativement leur emploi et leur non-emploi pour un même type de tâches (cf. n. 18). Les éditeurs pourraient ne pas être les plus démunis pour constituer des compilations de textes publiés par eux-mêmes ou par certains de leurs partenaires – qu’il s’agisse de textes littéraires ou techniques, d’œuvres ou de manuels – et exploitables comme corpus. La disponibilité des textes en versions électroniques explorables par leurs concordanciers pourrait permettre aux lexicographes d’évaluer les propriétés des items attestées dans ces données et d’y sélectionner le cas échéant des contextes à citer qui illustrent remarquablement certains emplois ou qui sont à valoriser pour la notoriété de leur auteur ou de l’œuvre source, pour la technicité de bon aloi des énoncés, pour la cohérence de l’environnement fictionnel de référence (en particulier pour des dictionnaires destinés à un jeune public comme Mon premier dictionnaire avec Martine, ancré dans l’univers de cette héroïne de littérature de jeunesse), etc. Les concordanciers, qu’ils soient autonomes ou intégrés dans les interfaces de consultation de ces archives conçues pour de la recherche documentaire thématique (par mots-clés, par dates, etc.), ne fournissent pas des relevés des propriétés syntaxiques et sémantiques attestées qui soient directement utilisables : la part de postanalyse des contextes extraits est souvent très importante et la qualité des informations fournies est dépendante des règles linguistiques et/ou des méthodes statistiques implémentées dans ces outils, quand ils ne se limitent pas à présenter des listes de contextes de chaque chaîne de caractères cherchée. Les snippets sont les courts extraits de contextes fournis dans les listes de résultats retournés par les moteurs de recherche en réponse à une requête. Le web pourrait utilement compléter le travail de ceux qui traquent les “mots nouveaux” en vue de l’enrichissement des répertoires produits. Il s’agirait alors d’y évaluer la diffusion des néologismes déjà repérés et d’y tester l’usage effectif des mots jugés possibles mais supposés non attestés ou rares (cf., dans le monde universitaire, Dal & Namer (2000), qui créent des mots possibles et en cherchent des attestations, ou Namer (2003), qui propose une chaîne de traitement qui va de l’extraction de textes sur Internet à l’analyse morphologique des mots qu’ils contiennent). L’actualité et la diversité des textes ainsi explorables feraient du web un corpus pertinent dans ce cadre. Il ne semble cependant pas être exploité de cette manière chez les éditeurs. Seules paraissent avoir été menées des expériences de collecte de toutes les formes graphiques non répertoriées, mais la grande quantité de fautes de frappe et d’écritures “atypiques” bruite trop le produit de cette exploration pour qu’elle soit effectivement exploitable. 804 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia Depuis quelques années, Adam Kilgarriff et différents collaborateurs promeuvent auprès des lexicographes l’emploi de “portraits” 14 pour connaître le fonctionnement des items lexicaux (cf. Kilgarriff & Tugwell (2002) ou Kilgarriff & al. (2004)). Ces portraits sont élaborés en explorant de très gros corpus et ils correspondent à des listes de cooccurrents réguliers d’un item classés selon les relations syntaxiques qu’ils semblent entretenir avec ce dernier (cf. Béjoint (2009, § 3.3.7.), dans ce volume, pour un exemple relatif à l’item bank). 15 Ces portraits n’ont pas, dans les maisons d’édition françaises, un accueil commensurable à celui qu’ils semblent recevoir dans le monde britannique 16. Ce décalage peut être à corréler avec le fait que les lexicographes qui travaillent sur le français accorderaient aux descriptions de collocations et de cooccurrences une place [241 Ð moindre que leurs homologues qui travaillent sur la langue anglaise 17, que cette différence soit imputable aux traditions lexicographiques, aux modèles de dictionnaires ou au fonctionnement des langues. Mais cette différence d’accueil peut aussi être induite par le processus d’élaboration des portraits : – Dans la mesure où il s’agit de repérer les comportements lexicaux les plus réguliers, des résultats probants ne peuvent être fournis qu’en explorant une très grande quantité de données. En conséquence, les promoteurs du Sketch Engine ont préconisé l’exploitation du web comme corpus, ce qui peut être handicapant pour une communauté linguistique qui perçoit sans doute plus souvent le web comme une ressource de piètre qualité que comme un gros et fiable stock de données reflétant le “bon usage” de la langue française. – Par ailleurs, le repérage des régularités s’opère en estompant les disparités non significatives, ce qui peut faire craindre des approximations descriptives, et notamment le masquage de propriétés rarement attestées mais pertinentes pour une description minutieuse. 14 15 16 [241 Ð 17 Ces portraits (“word sketches”) sont générés par un outil, Sketch Engine, développé par Lexical Computing Ltd. (dirigé par A. Kilgarriff ). Selon le site présentant cet outil (http://www.sketchengine.co.uk/), il est employé pour effectuer de la désambiguïsation sémantique notamment en lexicographie : « Word Sketches were first used in the Macmillan English Dictionary for Advanced Learners (2002, Edited by Michael Rundell). […] The SkE is in use for lexicography at Oxford University Press, FrameNet, Collins, Chambers Harrap, Macmillan and elsewhere. ». Les relations syntaxiques sont repérées automatiquement, à partir de l’ordre de surface des constituants de chaque phrase ou proposition, ce qui n’exclut pas un certain nombre d’analyses fausses que la grande quantité de données est censée rendre non perceptibles en les masquant avec de gros volumes d’analyses valides. Les propos de Rundell (2002) dans la préface du Macmillan English Dictionary for Advanced Learners sont très positifs : « Intelligent data-extraction software enables us to get maximum value from the corpus, and we have benefited from a collaboration with the University of Brighton’s Information Technology Research Institute. The resulting ‘Word Sketches’, which provide a rich account of the collocational and syntactic behaviour of the core vocabulary of English, have enabled us to describe these features in greater depth than ever before. ». Corbin & Gasiglia (2009b : 17-19), en écho à Blumenthal & Hausmann (2006 : 7), nuancent ce point en rappelant la présence d’une rubrique combinatoire spécifique dans le Trésor de la langue française et en pointant la publication récente du Dictionnaire des combinaisons de mots du Robert (2007). T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 805 Des risques spéculés qui viennent d’être invoqués, aucune conclusion ne peut être tirée : ils n’épuisent probablement pas les raisons qui pourraient expliquer la non-pénétration à ce jour des portraits dans les travaux lexicographiques français 18. Statuer sur ce qui fait que les corpus n’ont pas pleinement trouvé leur place dans les maisons d’édition françaises alors qu’ils ont constitué un objet d’intérêt pour une partie des lexicographes est tout aussi incertain. Est-ce dû à la lourdeur perçue des posttraitements, qu’une amélioration des performances d’analyse des outils d’exploration pourrait réduire ? Est-ce lié à l’indétermination de ce qui est pris en compte quand le web est utilisé comme corpus et au manque de ressources mieux adaptées aux différents projets dictionnairiques ? Est-ce encore, chez certains, une question de méthode de travail, plus respectueuse des traditions que friande de pratiques novatrices ? Les pistes de réflexion sont diverses et il est probablement trop tôt encore pour déterminer ce qui pèse le plus. Il semble cependant clair que ce ne sont pas les corpus qui constitueront prochainement les meilleures sources d’information chez les éditeurs français. 1.2. Compilation structurée de ressources dictionnairiques Alternativement, les éditeurs pourraient exploiter leur propre production plus systématiquement encore qu’ils ne semblent le faire. En effet, les produits lexicographiques [242 | étant de plus en plus Ðsou vent rédigés dans des environnements structurés (éditeurs de documents XML 19 ou éventuellement bases de données SQL 20), les constituants des articles produits sont de plus en plus aisément extractibles sélectivement afin de documenter la rédaction de répertoires inédits. 21 Le réemploi de données n’est pas nouveau, mais il est généralement conçu dans une perspective de réécriture à partir d’anciens textes : dérivation d’un texte à partir d’une source unique ou de la fusion de plusieurs 22, ou reprise ciblée ne concernant que certains éléments pertinents puisés dans différentes ressources du fonds éditorial. Or ce réemploi pourrait aussi être envisagé autrement, de manière à permettre à ceux qui devront écrire de nouveaux textes de se documenter à partir de toute la richesse des précédents, et ainsi se limiter à la 18 [242 Ð 19 20 21 22 En France, il semble qu’un seul éditeur ait adopté Sketch Engine, et encore l’a-t-il fait à date trop récente pour que les améliorations descriptives susceptibles d’être apportées par cet outil soient observables dans ses publications. eXtensible Markup Language. Structured Query Language. D’autres ouvrages, rédigés avant l’emploi de structurations informatiques mais jugés comme étant de première importance pour la dérivation de nouveaux produits, peuvent être rétroconvertis (souvent à partir des données des imprimeurs, parfois en ressaisissant le texte). Quand un dictionnaire (D1) est utilisé pour en produire un nouveau (DN ) par dérivation mais que la nomenclature de l’ouvrage DN est augmentée par rapport à celle de D1, il est possible de puiser dans un autre dictionnaire du fonds (D2) pour en extraire les articles qui y décrivaient les items à ajouter à la nomenclature du nouveau répertoire. Les rédacteurs n’ont ensuite qu’à réécrire les articles issus de D2 pour qu’ils s’harmonisent avec ceux de D1 révisés pour DN. La comparaison de nomenclature, la fusion et éventuellement la restructuration “ mécanique” des articles sont généralement faites par l’informatique éditoriale en fonction des recommandations du chef de projet, mais la sélection de nomenclature ajoutée et les réécritures fines restent à la charge de ce dernier ou de ses collaborateurs. 806 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia compilation des productions novatrices antérieures 23 ou, mieux, constituer une valorisation de ce patrimoine. À cette fin, le fait que les natures des informations présentes dans les textes déjà rédigés puissent être repérées, pour chaque segment de texte qui les exprime, indépendamment des délimitations des composants d’articles où elles sont formulées 24 et le fait que certaines de ces informations puissent être marquées comme [243 Ð | ayant été traitées avec une minutie particulière dans certains ouvrages per mettent d’envisager des extractions sélectives des descriptions déjà effectuées les plus proches de ce qui doit être produit, afin de ne mettre à la disposition des rédacteurs que ce qui leur procurerait le meilleur rendement documentaire. Le type de compilation envisagé ici 25 pourrait être une réaction doublement adaptée aux évolutions des pratiques professionnelles actuellement observables : (i) les besoins, à première vue peu compatibles, d’améliorer la qualité descriptive des ouvrages de référence publiés et de consacrer le moins de temps possible à la documentation préalable à la rédaction afin d’augmenter les cadences de production de chaque rédacteur 26, et (ii) le souhait de donner aux produits une marque “maison”, qui signe leur appartenance au catalogue d’un éditeur, alors qu’il est de plus en plus fréquent que les équipes comptent une proportion non négligeable de rédacteurs externes, recrutés pour l’élaboration d’un produit mais peu ou pas formés sur le terrain par les lexicographes les plus aguerris des entreprises, qui restent seuls à connaître les richesses des autres ouvrages des catalogues. 27 23 24 [243 Ð 25 26 27 Il ne servirait à rien de stocker plusieurs fois un même segment de texte exploité dans différents produits éditoriaux. Actuellement, quand des données sont reprises, elles le sont par articles ou par composants d’articles. La seconde option permettrait de mieux cibler ce qui serait repris, mais il semble qu’il serait alors impératif de tenir compte du fait que certaines informations sont susceptibles de figurer dans différents composants (par exemple, un synonyme dans le composant de synonymie ou dans la définition, une indication orthographique en adresse, dans une remarque ou dans une contextualisation), ce qui peut être textuellement motivé dans un dictionnaire mais qui ne le serait plus nécessairement dans un autre. La souplesse distributionnelle des types d’informations fournis dans les composants d’articles est une caractéristique des dictionnaires assez bien partagée. Elle ne doit cependant pas induire de silences dans une compilation éditoriale dont l’objet est de documenter au mieux les rédacteurs. Pour que des textes dictionnairiques soient correctement intégrables à la compilation et que chaque information puisse bien être repérée quelle que soit sa localisation dans le texte d’origine, il serait par conséquent utile d’y insérer un codage des types d’informations en plus des délimitations de constituants. La réalisation d’une compilation documentaire de ce type ne poserait pas de problème technique, même dans l’hypothèse d’une restructuration partielle des textes qui y sont intégrés (cf. n. 24). P. Corbin seul (1998 et 2008) ou avec F. Corbin (2008) a exprimé des inquiétudes fondées sur des faits d’observation qui montrent bien que la recherche des réductions de temps de production ne s’accompagne pas naturellement d’une amélioration des produits (cf. aussi Béjoint (2009 : 127-128)). Il n’en demeure pas moins que, dans le cadre d’une réflexion portant sur la rationalisation positive des méthodes de travail, les gestionnaires pourraient décider de chercher à gagner sur les deux terrains. Profitant de leur expérience interne, les lexicographes pourraient contribuer au rayonnement du patrimoine d’une entreprise en définissant, avec l’équipe d’informatique éditoriale, les éléments des dictionnaires qui mériteraient d’entrer dans la base parce qu’ils documenteraient validement les rédacteurs des futurs projets. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 807 1.3. Collecte des produits d’études lexicologiques Les lexicographes sont supposés être de bons observateurs des usages langagiers et de leurs évolutions, certains ont même une culture et une sensibilité linguistiques remarquables, mais l’évolution de leurs conditions de travail fait qu’ils doivent élargir leurs compétences et que cette polyvalence peut induire une moindre disponibilité sur le terrain métalinguistique. Par ailleurs, de nombreuses études (produites le plus souvent dans le monde universitaire) pourraient utilement les documenter, mais ils ne les connaissent pas nécessairement 28, n’y ont pas aisément accès ou n’ont pas le temps d’en tirer un plein profit. [244 Ð Afin de soutenir les lexicographes dans l’appropriation des études lexicologiques pertinentes 29, il serait souhaitable que les services de documentation des maisons d’édition indexent les productions les plus directement utilisables et les leur rendent aisément consultables. Ceci pourrait faire porter la charge de la veille documentaire sur un petit effectif de personnes 30 et permettrait aux rédacteurs de ne consulter que ce qui est le plus utile pour leur culture générale ou pour un projet particulier, ce qui nécessiterait de définir des critères de sélection des documents qui répondent à des besoins au-delà des projets en cours. Dans ce cadre, il pourrait être particulièrement intéressant d’indexer les exemples fournis dans une sélection de publications linguistiques. S’agissant par exemple d’études de morphologie, ce dispositif permettrait aux lexicographes qui décriraient les constructions d’items dérivés d’accéder aux analyses déjà produites pour chacun 31. Mais il impliquerait de repérer les items en mention dans les publications scientifiques et de savoir retrouver dans leur contexte les indications utiles pour une compréhension rapide des critères d’analyse, ce dernier point constituant la difficulté majeure de cette entreprise. Conjointement à la mise en place de protocoles de veille documentaire chez les éditeurs, il serait souhaitable de sensibiliser les linguistes qui s’engagent dans des études dont les produits pourraient être utiles pour documenter des descriptions lexicographiques et de les inciter à formuler leurs résultats en veillant à favoriser leur réemploi (cf. P. Corbin (1998, § 4. et 2002, § 3.1.)). Le Dictionnaire constructionnel du français mis en chantier par D. Corbin avait clairement cette ambition 32, son initiatrice prin- 28 [244 Ð 29 30 31 32 Concernant la baisse d’influence de la linguistique sur la lexicographie française, cf. P. Corbin (1998 : 9091, 2002 : 9-10 et § 1.2., et 2008, § 2.3.) et Corbin & Gasiglia (2009b : 21-22). La lexicographie profitera certainement mieux de recherches stabilisées que de modèles aussi en vogue qu’éphémères, cf. Corbin & Gasiglia (2009b : 22). Envisager l’effectuation de cette tâche de manière collaborative permettrait à tous les lexicographes d’être impliqués, ce qui pourrait les mobiliser positivement, mais aussi induire une dispersion des recherches ou des disparités de traitement des études prises en compte. Tous les mots construits n’ayant pas fait l’objet d’une analyse dans un cadre théorique donné, il resterait un travail de complémentation descriptive (cf. n. 39). D. & P. Corbin (1991b : 157-158) évoquaient une « mise en forme lexicographique formalisée d’une théorie du lexique construit, […] un recueil de données exploitables électroniquement », ce que D. Corbin (à paraître, chap. 2, § 1.5.5.2.) reprend en destinant ce recueil aux lexicographes : « le Dictionnaire constructionnel du français, métadictionnaire fondé sur une théorie linguistique dans lequel les lexicographes pourraient puiser en fonction de leurs besoins propres. ». 808 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia cipale ayant pour projet de fournir aux lexicographes des relevés de propriétés morphologiques reformulables dans leurs ouvrages. 33 Certains travaux de linguistes, produits plutôt dans des cadres théoriques enclins à formaliser leurs résultats, présentent des caractéristiques intéressantes pour la documentation des lexicographes et ont déjà été exploités. C’est le cas par exemple de la [245 sémantique Ðdes cadres de Charles Fillmore, dont Beryl T. Sue Atkins a prôné l’exploitation 34, ou de la théorie Sens-Texte, qui donne lieu à l’élaboration de différentes pro[246 Ð ductions lexicographiques 35 proposant des analyses formalisées 36 dont une partie 33 [245 Ð 34 35 Cf. D. Corbin (à paraître, chap. 2, § 1.6.) : « L’ensemble des propriétés […] constitue la fiche identitaire des individus lexicaux, qu’un dictionnaire “idéal” (un métadictionnaire) devrait remplir pour chacun de ces individus, et dont les dictionnaires “réels” ne donnent qu’un reflet nécessairement partiel et déformé. ». De 1992 à 2003, seule, avec C. Fillmore ou avec d’autres coauteurs, elle a produit huit publications concernant de possibles articulations entre des travaux lexicographiques et la sémantique des cadres : Atkins (1995 et 2002b), Atkins, Fillmore & Johnson (2003), Atkins, Rundell & Sato (2003), Fillmore & Atkins (1992, 1994, 1998 et 2000) (cf. Fontenelle (2009) et Béjoint (2009, § 4.1.), dans ce volume). Plus encore peut-être que le cadre théorique qui guide la description linguistique et qui paraît transposable au français, ce qui motive cet engouement pour les travaux de C. Fillmore et de ses collaborateurs semble être lié à la disponibilité de descriptions lexicales et d’un corpus annoté dans lesquels les lexicographes peuvent respectivement puiser la matière de leurs propres descriptions et des contextes d’emploi attestés. Selon ce qu’indique le site de l’Observatoire de linguistique Sens-Texte sur la page dédiée aux projets de linguistique (http://idefix.ling.umontreal.ca/recherche/linguistique/), trois productions lexicographiques sont ancrées sur la recherche et une a des visés explicitement didactiques : – le DECFC (Dictionnaire explicatif et combinatoire du français contemporain), élaboré à partir des principes de la lexicographie explicative et combinatoire (Mel’čuk, Clas & Polguère (1995)) : « Pour chaque lexie à décrire, il s’agit de donner la définition, d’indiquer les connotations, de spécifier la cooccurrence syntaxique (c’est-à-dire, les données du régime syntaxique avec tous les détails des conditions d’utilisation contextuelles), de recenser la cooccurrence lexicale restreinte au moyen des fonctions lexicales, sans oublier les indications sur la flexion, les marques d’usage ainsi que les spécifications orthographiques, prosodiques, pragmaticoculturelles et même encyclopédiques. » (http://idefix.ling.umontreal.ca/recherche/linguistique/dec/lang-pref/ fr/) ; – la base de données BDéf, qui reprend en les formalisant les définitions lexicographiques des volumes du DECFC (Altman & Polguère (2003)) : « La finalité de la Bdéf est double. Il s’agit, d’une part, de rendre disponible pour la recherche en sémantique computationnelle un ensemble représentatif de définitions lexicales Sens-Texte. D’autre part, le travail de construction de la BDéf permet de mener une recherche sur la structure interne des sens lexicaux et sur la façon dont celle-ci doit être modélisée. Il s’agit donc d’élaborer un métalangage formel de définition. » (http://idefix.ling.umontreal.ca/recherche/linguistique/base-bdef/langpref/fr/) ; – la base de données lexicales du français DiCo (Dictionnaire de combinatoire, en ligne sous le nom de DiCouèbe (http://olst.ling.umontreal.ca/dicouebe/)), qui se focalise sur les relations sémantiques et les collocations et qui veut servir la recherche (en générant à partir d’elle des lexiques pour le TAL) et constituer un soubassement pour la rédaction d’un dictionnaire destiné au grand public (le LAF ) : « La finalité première de cette base est de décrire chaque lexie apparaissant dans la nomenclature du DiCo selon deux axes : les dérivations sémantiques (relations sémantiques fortes) qui la lient à d’autres lexies de la langue et les collocations (expressions semi-idiomatiques) qu’elle contrôle. Cette description s’accompagne d’une modélisation des structures syntaxiques régies par la lexie et d’une modélisation de son sens, sous forme d’étiquetage sémantique. » (http://idefix.ling.umontreal.ca/recherche/linguistique/dico/lang-pref/fr/) ; – le LAF (Lexique actif du français), manuel suivi d’un dictionnaire dérivé du DiCo : « La première partie, Lexicologie et apprentissage du vocabulaire, présente de façon condensée un ensemble de notions de base qui sont au cœur du fonctionnement du lexique. Elle offre aux enseignants et aux apprenants de la langue des méthodes pour explorer et mieux comprendre les phénomènes lexicaux, à partir des descriptions données dans la seconde partie. La seconde partie, Lexique actif, est le LAF proprement dit : la description lexicogra[246 Ð | contrô lées par un ensemble représentatif de mots français. » (http:// phique fine des relations lexicales olst.ling.umontreal.ca/laf/le-laf/). T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 809 ont vocation à servir pour la dérivation de descriptions lexicales destinées à des applications informatiques ou réécrites pour le grand public (cf. n. 35). 37 Les études de linguistique donnent par ailleurs souvent lieu à des dépouillements et des recensements préliminaires qui pourraient être utiles aux lexicographes : l’étude d’un affixe, par exemple, implique le listage des items lexicaux qui l’intègrent, son repérage en leur sein et sa glose. Ce matériau préparatoire a peu de chances de figurer in extenso dans une publication 38, à moins d’y être en annexe, mais s’il était rendu disponible pour les lexicographes, ils pourraient y reprendre les descriptions des items de leurs nomenclatures et utiliser la publication pour appréhender les principes d’analyse en s’appuyant sur les exemples qui les illustrent. 39 Pour que la part de description linguistique présente dans les dictionnaires soit actuelle, il conviendrait que des procédures de veille documentaire soient mises en place, ce qui impliquerait que des moyens humains soient dédiés à la recherche de publications pertinentes et que des moyens informatiques relaient les premiers pour les procédures d’indexation. Cet effort interne pourrait utilement être doublé d’une prise de contacts avec des linguistes qui produisent des études exploitables en lexicographie afin de susciter chez eux l’envie d’élaborer des descriptions systématiques 40. Que les efforts documentaires envisagés exploitent des produits existants ou qu’ils impliquent la création de nouvelles productions linguistiques, ils nécessiteraient, de la part des éditeurs, un engagement de longue durée, qui pourrait se traduire par l’intégration de linguistes – au sein du personnel permanent ou comme collaborateurs externes –, et un effort plus ponctuel, qui permettrait aux lexicographes, aux linguistes et aux informaticiens de se concerter afin de mettre en place une méthodologie et des outils de veille linguistique adaptés aux besoins particuliers de l’entreprise. [247 Ð 1.4. Ressource métalinguistique unique Les deux ressources précédentes et une sélection de données extraites de corpus pourraient également être réunies dans une ressource documentaire unique. 41 Cette 36 37 38 39 40 [247 Ð 41 Les paratextes de ces productions et les publications qui les présentent explicitent les formalisations utilisées, ce qui devrait permettre aux lexicographes de s’imprégner de leurs codifications et de pleinement comprendre leurs descriptions. Cf. Corbin & Gasiglia (2009b : 22-24). D. & P. Corbin (1991a), par exemple, n’ont fourni qu’une sélection d’items en -ier analysés. Pour les items de la nomenclature qui intégreraient bien l’affixe mais ne figureraient pas dans la liste, l’analyse resterait à la charge des lexicographes. Le projet de Dictionnaire constructionnel du français (cf. nn. 32 et 33), qui a été présenté par D. Corbin en 1990, approximativement au moment de la création de la formation lilloise de lexicographie (1991), ne s’inscrivait pas dans une collaboration avec un éditeur (cf. D. & P. Corbin (1991b)). Mais, dans la logique de projet dans laquelle les chercheurs sont actuellement invités à trouver leur place, il pourrait tout à fait être envisageable de réunir des linguistes (universitaires ou membres du C.N.R.S.) et des éditeurs au sein de programmes de recherche financés, qui, à défaut d’assurer une collaboration suivie, pourraient permettre de fonder des méthodes de partage de compétences dont il faudrait ensuite établir les modalités de pérennisation. Pierrel (2008, § 2.2.) plaide pour la création d’une ressource documentaire partagée. Pourrait-il s’agir d’un projet réunissant des acteurs, linguistes et lexicographes, du privé et du public ? Si c’était le cas, il implique- 810 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia base de données permettrait d’enregistrer, afin de les présenter aux rédacteurs, les différentes informations disponibles pour chaque item indépendamment de la structure et du mode rédactionnel des futurs dictionnaires. Conçue comme un environnement de prise de notes dont le contenu (des données et leurs métadonnées) s’enrichirait au fil de la veille documentaire, la base accueillerait notamment – le typage de la nature de chaque information et éventuellement une spécification relative à son exploitabilité par les rédacteurs (énoncé extrait de corpus, rédaction déjà exploitée dans un ouvrage d’un type donné pour un public déterminé, description de linguiste directement exploitable ou présente à titre documentaire) ; – le référencement des sources documentaires (corpus, dictionnaires du catalogue ou non, publications linguistiques, etc.) et la localisation en leur sein de ce qui en a été extrait ; – l’enrichissement des énoncés extraits de corpus au moyen d’étiquetages syntaxiques et sémantiques et d’annotations (comme les codifications des structures argumentales qui pourraient être exploitées pour la sélection et la présentation des contextualisations reprises ou inspirées de ces extraits, cf. § 3.2.2.2.) 42 ; – le marquage comme telles des données incompatibles 43 (issues de cadres théoriques ou d’états de connaissance différents) et la mise en relation des textes de synthèse avec les informations enregistrées, afin qu’un retour aux exposés théoriques dont dépendent les éléments de description soit possible, ce qui pourrait faciliter les choix à effectuer entre ces données ; – l’établissement de liens entre les informations (de natures distinctes le plus souvent) qui sont interdépendantes (comme une information étymologique ou morphologique et [248 Ð | une description séman tique 44 ou de prononciation (cf. n. 148)), afin de faciliter le cas échéant, lors de la rédaction d’un ouvrage, la vérification de la coprésence de ces informations et du rendu de leur mise en relation ; – la hiérarchisation de l’importance de chaque élément informationnel afin de faciliter ensuite des sélections cohérentes (pouvant aller de la réunion de données minimales 42 43 [248 Ð 44 rait que chacun accepte de mettre le produit de son travail à la disposition des différents partenaires (dont certains sont aussi des concurrents sur le plan commercial) et il devrait respecter les standards de structuration des données (qui ne sont pas nécessairement observés quand ces acteurs travaillent sans perspective collaborative). La base envisagée ici est d’ambition plus modeste puisqu’elle ne prétend pas fédérer des efforts d’entités de production concurrentes. Ceci pourrait être inspiré par le corpus annoté de FrameNet, cf. n. 34. La coprésence d’informations présentant des divergences ou des contradictions pourrait être bienvenue dans une base documentaire richement dotée, qui aurait pour ambition de fournir à la fois des données exploitables et une culture linguistique plus large. Elle imposerait cependant un marquage fin des informations pour éliminer les risques de sélections non cohérentes destinées à un même dictionnaire (voire entre deux ouvrages d’un éditeur, si le défaut de cohérence n’est pas motivé). Par exemple, le nom arène a un sens sorti de l’usage et trois sens en français moderne, qui correspondent à quatre étymologies différentes, dont trois dérivent de celle qui a donné le sens sorti de l’usage. Que l’on se fixe un programme d’information étymologique complet ou non, il convient de bien articuler la ou les étymologie(s) fournie(s) et le ou les sens décrit(s) (ce qui mériterait d’être mieux fait que dans certains dictionnaires scolaires, cf. Gasiglia (2008b, § 3.2.)). T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 811 pour la rédaction d’un dictionnaire de faible envergure à celle de données plus complètes privilégiant ce qui peut contribuer à améliorer les compétences en compréhension ou en expression) 45 et des choix tributaires de différents critères de compatibilité (entre informations ou avec un point de vue théorique) ou de disponibilité (pour toute la nomenclature ou un sous-ensemble pertinent). Conçue conjointement comme une compilation des textes publiés antérieurement (cf. § 1.2.), la base devrait permettre aussi – le repérage des relations d’inclusion pouvant exister entre données de même nature portant sur un même item (comme une définition correspondant à d’autres, plus précises sur certains points 46) ; [249 Ð – et la mise à disposition de formulations alternatives pour certaines informations dont les modes d’exposé sont indexés fortement sur les types d’ouvrages ou les publics cibles 47. Le bénéfice à attendre d’un tel outil documentaire pourrait être très appréciable : elle permettrait aux lexicographes de disposer pour chaque item à décrire de données de bonne tenue, provenant de sources variées, référées à des cadres théoriques le cas échéant et présentant une certaine diversité de nature et de formulation, ce qui les ren- 45 46 [249 Ð 47 Par exemple, pour le nom canyon (ou cañon), les informations relatives à son étymologie et à son histoire méritent une attention particulière : il pourrait être utile d’enregistrer le parcours complet de ce nom emprunté à l’espagnol via l’anglo-américain et d’y repérer les étapes importantes (la première langue et la langue intermédiaire), ce qui permettrait ensuite de ne retenir que la première langue pour un ouvrage (comme le Larousse pratique ou le Petit Larousse illustré 2009) et de retenir toutes les langues avec valorisation de la dernière dans un autre (par exemple le Dictionnaire des anglicismes du même éditeur). Disposer des mêmes informations pour tous les items permettrait d’éviter que les deux premiers dictionnaires ne changent de programme d’information comme ils semblent le faire (ils mentionnent la langue d’origine et la langue intermédiaire pour bungalow, pyjama ou encore shampooing), à moins que cette variation apparente ne soit motivée et que les rédacteurs ne la rendent compréhensible aux lecteurs. Par exemple, le nom permutation pourrait se voir associer trois définitions issues de textes du fonds Hachette de 2001 : – la première traduirait simplement la relation morphologique liant le nom au verbe dont il dérive (« Action de permuter ») : c’est ce qui est proposé par le Dictionnaire Hachette encyclopédique de poche et qui constitue le premier membre de la première description de sens du Dictionnaire français Hachette électronique ; – et les deux autres se focaliseraient sur les entités impliquées par l’action (des personnes ou des choses) : c’est ce qui est indiqué dans les deuxième et troisième membres de la première description de sens du Dictionnaire français Hachette électronique (« échange d’emploi, de poste, d’heures de service. » ; « Par ext. Transposition effectuée entre deux choses. »). La valeur sémantique présentée dans la description qui valorise la relation morphologique inclut les deux valeurs distinguées par les entités impliquées. Si les trois descriptions étaient enregistrées dans la ressource documentaire, cette relation d’inclusion sémantique devrait être marquée. Les propriétés phonographiques d’un item pourront avoir fait l’objet d’une remarque autonome ou coprésente avec une transcription phonétique à laquelle elle peut être textuellement articulée ou non. Concernant pouls, la remarque du Larousse des débutants, destiné aux jeunes lecteurs, ne diffère pas sensiblement de celle proposée à un large public adulte par le Larousse pratique (qui fournit en outre une transcription phonétique) : « Ce mot se termine par un l et un s qu’on ne prononce pas. » / « Attention à l’orthographe : ce mot se termine par -ls, qui ne se prononce pas. ». Concernant accueil, le Larousse des débutants comporte en revanche une remarque qui est beaucoup moins consistante que celle du Larousse pratique : « Il y a un u après les deux c. » / « Attention à l’orthographe de tous les mots de cette famille : accuei-, l’u suit immédiatement les deux c, pour former le son [k]. »). La compilation devant être faite en veillant bien à enregistrer chaque remarque, sans doublon ni perte d’information, le stockage des deux formulations pourrait être inutile dans le premier cas, mais souhaitable dans le second. 812 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia drait propices à la documentation comme au réemploi direct. Malgré l’intérêt de cette ressource, le travail rendu nécessaire par sa conception puis par son enrichissement régulier, diversifié et cohérent hypothèque très fortement sa mise en place. Il est plus probable que, si des services de documentation se consacraient à la collecte de données pour les lexicographes, ils utiliseraient bien des bases de données qui fourniraient des informations structurées et enrichies de métadonnées (comme les références des sources documentaires), mais que celles-ci seraient de portée plus limitée que celle envisagée ci-dessus et qu’elles se focaliseraient sur des sélections d’informations qui auraient été triées afin d’être aussi cohérentes et prêtes à l’emploi que possible. Si la perspective d’une grande base compilant toute la documentation ne semble pas devoir avoir d’écho dans les maisons d’édition, elle constitue cependant un objet spéculatif intéressant dans la mesure où elle stimule une réflexion sur les besoins documentaires, sur les méthodes de collecte et de valorisation des données et sur les modalités de leur mise à disposition, réflexions qui seront réexploitables pour des bases plus modestes. 1.5. Réflexions conclusives sur la documentation métalinguistique Alors que les maisons d’édition tendent à employer plus souvent des lexicographes externes, missionnés pour des projets et parfois principalement en situation de télétravail, elles vont avoir besoin, plus que par le passé probablement, de veiller à ce que cha[250 Ð cun puisse accéder dans les meilleures conditions à une documentation qui garantisse le maintien de la qualité des ouvrages, voire son amélioration, en même temps que la cohérence du catalogue. Ce qui pouvait être transmis du fait des collaborations internes, et qui constituait en quelque sorte un apprentissage, va maintenant devoir être rendu accessible à un grand nombre de collaborateurs ponctuels qui échangeront des fichiers de données plus souvent qu’ils n’auront d’interactions susceptibles d’infléchir leurs méthodes de travail ou leur culture linguistique. Les progrès informatiques accomplis laissent certes entrevoir un moyen de pallier les manques induits par la précarisation et l’externalisation du travail, mais encore faut-il évaluer si le coût de tâches de documentation telles que celles envisagées précédemment serait assumable par les entreprises (ce qui supposerait un investissement initial mais aussi le maintien d’une équipe stable et qualifiée pour alimenter la ou les base(s)) et si elles ne s’en tiendront pas à faire confiance à des lexicographes qui devront gérer isolément leur documentation. Si les moyens informatiques actuellement disponibles permettent de concevoir des outils de documentation qui soutiendraient une rationalisation positive des méthodes de travail, il reste à espérer que les éditeurs français pourront faire ces choix. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 2. 813 Changer les modes d’élaboration Une longue tradition de production de répertoires métalinguistiques conçus pour être consultés par articles 48 et, au sein de ceux-ci, par séquences d’informations a précédé l’avènement de l’informatique et, durant les premières années de la diffusion des ordinateurs personnels, les produits lexicographiques sur support électronique n’ont pas fondamentalement modifié cette conception des dictionnaires. Les manières de travailler des lexicographes, elles, ont cependant déjà beaucoup changé et peuvent encore évoluer, ce qui motive que ce paragraphe, qui couvre les trois strates de l’activité lexicographique (cf. n. 5), décrive ce qu’il est possible de connaître de la situation actuelle et d’imaginer pour le futur proche. 2.1. Strate métalinguistique Les évolutions informatiques les plus perceptibles pour les lexicographes touchent les environnements de rédaction, mais elles ont eu des corrélats sur l’ensemble des mé[251 Ð thodes de travail : dès la phase de conception des nouveaux projets, les informaticiens du service d’informatique éditoriale sont devenus des interlocuteurs directs des lexicographes et en particulier des chefs de projets. Certes, pour préparer un nouveau projet et évaluer s’il peut être jugé suffisamment rentable pour que les contrôleurs de gestion décident de sa mise en chantier 49, ses concepteurs, comme autrefois, établissent une sélection des types d’informations qu’ils souhaitent offrir à la consultation et les distribuent sur les différents constituants des futurs articles, en spécifiant comment chacun sera rédigé afin d’être pleinement accessible à un public déterminé, de respecter des traditions internes ou des filiations d’ouvrages, de faire écho à des évolutions terminologiques (en grammaire par exemple) ou pédagogiques (pour les dictionnaires scolaires ou pour ceux destinés aux allophones en particulier), etc. Mais ce qui a changé, c’est que les lexicographes font ce travail avec les informaticiens afin de concevoir des patrons de rédaction qui tirent le meilleur parti des structurations informatiques, qui, le cas échéant, rendront possible l’intégration de segments de textes issus de précédents ouvrages 50, et qui permettront de satisfaire aux modalités d’affichage définies avec les maquettistes en fonction du ou des support(s) prévu(s). Le produit de cette phase de mise en projet est formalisé par un patron, associé à des directives de rédaction (le “cahier des charges”) et un échantillon d’articles. Selon l’environnement de rédaction prévu, le patron peut prendre différentes formes : si la [250 Ð 48 [251 Ð 49 50 Même si la consultation d’un article peut, via les renvois, conduire à celle d’autres articles ou de sous-parties de certains d’entre eux, que cette circulation se fasse manuellement ou par un lien hypertextuel, il n’en demeure pas moins que les articles n’ont pas vocation à être lus page après page, dans l’ordre alphabétique de leurs adresses. Cette estimation est faite sur la base d’une appréciation de la viabilité du projet tel qu’il est présenté par les lexicographes et de différentes données chiffrées (coûts de fabrication, prévisions de vente établies avec le service marketing, etc.). Symétriquement le réemploi, au sein de futurs produits, de segments de textes rédigés dans le cadre du projet actuel peut être envisagé (cf. § 2.3.3.). 814 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia rédaction doit s’effectuer dans un traitement de texte de suite bureautique, parce qu’il a été jugé opportun de faire travailler les rédacteurs dans un environnement qui leur est familier et que la structure du futur ouvrage est assez simple pour que l’emploi systématique de styles suffise pour convertir a posteriori le texte en XML 51, c’est un modèle de document 52 qui est fourni ; si le texte doit être directement structuré en XML et donc rédigé dans un éditeur dédié (ce qui est de plus en plus souvent le cas), [252 Ð le patron prend la forme d’une DTD (voire d’un schéma) 53 ; si la rédaction doit se faire dans un environnement structuré de type base de données SQL 54, le patron se concrétise par le schéma de relations des tables et le formulaire de saisie. Le partenariat des informaticiens et des lexicographes, lors de la conception des projets, a permis aux premiers de mieux percevoir la finesse du découpage structurel des articles dont ils assurent le posttraitement et aux seconds de concevoir leurs textes comme des emboîtements de composants dont l’ordre d’apparition et la constitution interne sont mieux descriptibles qu’auparavant. Ce regard renouvelé porté sur les textes dictionnairiques a probablement modifié le rapport des lexicographes aux programmes métalinguistiques de leurs ouvrages, mais il est trop tôt pour en mesurer les effets. Que ce soit une conséquence de ces collaborations ou une coïncidence, le passage à des rédactions structurées s’est fait parallèlement à la diffusion de l’idée que les textes des dictionnaires étaient souvent trop compliqués à lire du fait de leur haut degré de codification et de leur complexité structurelle. La révision des codifications, très nombreuses et d’autant plus difficiles à décoder qu’elles sont abrégées dans les textes imprimés 55, dépend pour partie de décisions prises au niveau discursif et pour partie de 51 52 [252 Ð 53 54 55 Les logiciels de traitement de texte comme Microsoft Word ou OpenOffice.org Writer (qui semble peu utilisé dans le monde de l’édition) permettent d’affecter des styles aux paragraphes et, au sein de ceux-ci, à des chaînes de caractères. Chaque segment de texte porteur d’un style peut ensuite être converti en contenu d’un élément XML, ce qui permet de générer des documents XML à deux niveaux d’enchâssement, ou plus par posttraitement si des séquences d’éléments peuvent être automatiquement réunies dans un élément enchâssant. Ces conversions s’avèrent donc d’autant moins complexes que les articles rédigés ont une structure peu profonde. Selon l’aide de Microsoft Word 2000, « [u]n modèle détermine la structure de base d’un document et contient les paramètres du document tels que les insertions automatiques, les polices, […] la mise en page, les mises en forme spéciales et les styles. ». Pour décrire la structure des documents XML qui s’y conforment, une DTD (Définition de Type de Document) est codée pratiquement comme elle l’était déjà pour les documents SGML (Standard Generalized Markup Language), alors qu’un schéma est écrit en XML (des éléments prédéfinis servant à déclarer les nouveaux éléments et attributs et leur grammaire) et type les contenus des éléments et les valeurs des attributs, mais ne permet pas de définir d’entités (cf. n. 61). Bien que ce soit un choix techniquement valide et mis en œuvre pour le dictionnaire Encarta, il semble ne pas être privilégié en France dans l’édition privée. Les bases de données relationnelles SQL semblent plutôt y être utilisées pour stocker des données à insérer dans les textes (bases de transcriptions phonétiques, d’étymologies, etc.) ou à usage documentaire (bases de collecte de néologismes). Les volumes imprimés doivent compter un nombre de pages important pour qu’ils puissent accueillir tout le texte, mais suffisamment réduit pour qu’ils restent manipulables et, avant cela, pour qu’ils puissent être reliés. Il est possible de jouer sur le grammage du papier, qui doit cependant rester assez épais pour qu’il ne se froisse pas, et sur son opacité, qui doit toutefois demeurer suffisante pour qu’un recto de page imprimée ne perturbe pas la lecture du verso. Le Petit Larousse illustré 2009 grand format, par exemple, a ainsi gagné des pages par rapport au millésime 2008 (1 889 pages de texte dictionnairique et d’annexes contre 1 874 ; 124 pages de paratextes contre 113) tout en perdant en épaisseur (5 cm contre 6,2) et en poids (3,030 kg T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 815 décisions de posttraitement liées au support de présentation des articles. Les changements envisageables sur le plan discursif ne pouvaient pas être engagés sans une révision structurelle des articles. Les binômes de concepteurs (lexicographes et informaticiens) ont alors profité de la lisibilité qu’offrent les patrons formalisés pour en concevoir qui soient susceptibles de présenter une meilleure correspondance entre types d’informations et composants d’articles. Cette évolution étant engagée, il reste à veiller à ce [253 Ð | qu’elle n’induise pas un appauvris sement du contenu linguistique. Là encore, le recul actuel n’est pas suffisant : les dictionnaires scolaires imprimés semblent avoir globalement gagné en lisibilité, mais ce n’est peut-être pas seulement un effet de ces changements 56 ; le Larousse pratique (2003) et le Larousse des noms communs (2008), dictionnaires de milieu de gamme 57, offrent un programme métalinguistique modeste ; et aucun grand dictionnaire n’a été mis en chantier assez récemment pour offrir une structure rédactionnelle moderne à des contenus d’une richesse comparable à ceux du Grand Larousse de la langue française, du Grand Robert de la langue française ou du Trésor de la langue française. 2.2. Strate discursive Décider du passage à une rédaction structurée informatiquement devait se faire en prenant en compte les habitudes de travail des rédacteurs et en les accompagnant dans cette mutation : dans un premier temps, selon les équipes de rédaction, il pouvait être fonctionnel de faire structurer manuellement a posteriori les textes ou de les faire saisir dans les traitements de texte qui étaient déjà en usage, mais en imposant l’emploi de styles (ce qui permettait une conversion de ceux-ci en structuration explicite, cf. n. 51). Actuellement, une part importante des lexicographes ne travaillent plus que dans des éditeurs XML, que ceux-ci disposent d’interfaces qui masquent le balisage pour n’offrir que des zones de saisie correspondant aux différents éléments et attributs (ce qui peut faire disparaître la textualité des articles et ainsi induire une gêne), ou qu’ils laissent voir tout le balisage (ce qui peut noyer le texte saisi dans une grande quantité de caractères de structuration et gêner également), ou encore qu’ils n’affichent la structure que de manière semi-codifiée, les balises étant remplacées par des délimitateurs moins [253 Ð 56 57 contre 3,740) grâce à l’utilisation d’un papier moins épais, afin d’accueillir le texte jugé utile en gardant un volume dont l’épaisseur n’avait pas d’incidence sur le choix du relieur. La prédominance, depuis la fin des années 1990, des structures où les définitions sont illustrées par un ou plusieurs exemples est concomitante avec l’introduction du balisage dans les articles (cf. P. Corbin (2006, vol. 1 : 180)), mais elle pourrait en partie aussi être induite par les critiques exprimées à propos des exemples glosés à la mode auparavant (cf. notamment Rey-Debove (1988 : X) ou Lehmann (1993)). Le Larousse pratique appartient au milieu de gamme avec ses « 40 000 mots » (quatrième de couverture). Le Larousse des noms communs pourrait appartenir au segment de marché supérieur par sa nomenclature (« 85 000 mots et locutions » (quatrième de couverture)), mais son programme d’information n’est pas très différent de celui du Larousse pratique, avec lequel il est en filiation textuelle partielle. 816 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia visibles et les valeurs d’attributs intégrées au texte partiellement mis en forme 58 (ce qui semble être la présentation la plus appréciée). [254 Ð Les éditeurs XML, bien qu’une partie seulement de leurs potentialités semble être exploitée, peuvent, mieux que les traitements de texte, être configurés pour soutenir le travail de rédaction : – pour l’élaboration des descriptions, par l’affichage de la structure des articles et d’aides contextuelles (infobulles pour des consignes ponctuelles ou fenêtres pour des extraits du cahier des charges) ; – pour la fusion de données élaborées antérieurement, par l’automatisation de leur import en bonne place (que celui-ci soit systématique ou conditionné par une propriété des items et que les textes insérés soient repris en l’état ou qu’ils fassent l’objet d’une réécriture automatique ou manuelle 59) ; 60 – pour la saisie, par l’insertion automatique des indicateurs de structuration (ordonnateurs alphanumériques, diacritiques) et la mise en place de menus déroulants, de notations abrégées (entités XML) ou d’une fonction de complétion pour les informations qui doivent être rédigées de manière régulière (marques d’usage, remarques formulées pour tous les items d’une famille lexicale, etc.) et pour les renvois (vers des tableaux de conjugaisons, des planches, etc.) ; 61 58 [254 Ð 59 60 61 Cette mise en forme ne correspond pas à celle du texte publié, mais à une codification symbolique basée sur des variations plus contrastées des polices ainsi que des couleurs de caractères et de trames de fond, en plus des habituelles variations d’inclinaison, de graisse, de corps et de casse. L1. Dans Corbin & Gasiglia (2004, § 2.2.2.3.2., (iii)), nous avions proposé que les textes à insérer soient stockés dans une base de données spécialisée comme il y en a par exemple pour les transcriptions phonétiques (cf. n. 54), mais il pourrait également s’agir d’une base comparable à celles introduites aux §§ 1.2. et 1.4. Les insertions envisagées peuvent par exemple concerner le réemploi direct des transcriptions phonétiques, le réemploi ou la reformulation automatique de la catégorisation (un code comme “n.m.” pouvant être inséré à l’identique ou sous la forme “nom masculin”, la réécriture pouvant également relever des posttraitements, cf. § 2.3.), l’insertion conditionnelle d’informations diverses (un identificateur de modèle de conjugaison, pour les verbes qui se conforment à l’un de ceux présentés dans le paratexte ; une remarque, pour les items qui partagent une propriété (comme, dans le Larousse des débutants, pour les noms en -tie, comme acrobatie : « On écrit tie mais on prononce [si]. »)), ou encore l’intégration d’autres éléments informationnels à textualiser (pour les étymologies, par exemple, un étymon, sa langue et son équivalent en français importés pourraient devoir être insérés manuellement dans un texte pleinement interprétable par les publics ciblés). Ces imports automatiques sont déjà réalisés au moins dans une certaine mesure, mais s’ils connaissaient une plus grande extension, ils seraient exploitables par un outil de contrôle de qualité puisque, les propriétés à énoncer étant fournies aux rédacteurs, ceux-ci ne risqueraient plus d’oublier de les mobiliser et de les mentionner et que, s’ils décidaient d’en supprimer l’expression pour un item, cette décision pourrait être notifiée dans le fichier de rédaction et éventuellement signalée automatiquement dans les articles des items qui partagent la propriété qui motive ce choix. Cette aide se révélerait également utile dans les cas où deux propriétés interdépendantes doivent être présentées conjointement (prononciation ou sens et origine étrangère par exemple, cf. nn. 44 et 148). Pour les segments de texte qui sont strictement identiques dans une sélection d’articles mais qui n’ont pas fait l’objet d’une insertion automatique comme celle décrite en note 59, des entités XML permettent de ne saisir que le nom de l’entité là où le texte doit figurer (pour les noms en -tie, comme acrobatie, dans le Larousse des débutants, si N_Xtie par exemple est une entité déclarée comme devant être remplacée par « On écrit tie mais on prononce [si]. », chaque fois que &N_Xtie; figurera dans le corps du document, le parseur XML remplacera cette référence à entité par le texte associé). Pour les textes qui ne sont que partiellement iden[255 Ð par un l et un s tiques (comme, dans le Larousse des débutants, s.v. pouls et iris : « Ce mot se termine qu’on ne prononce pas. » (cf. n. 47) / « Ce mot se termine par un s qu’on prononce. »), il semble plus opportun T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger [255 Ð 817 – pour la recherche des formulations les mieux adaptées, par l’interfaçage d’un dictionnaire de synonymes ou, pour la lexicographie bilingue, d’un système de mémoire de traduction 62 ; – pour le contrôle orthographique (lors de la saisie et en relecture-correction), par l’intégration d’un correcteur orthographique et grammatical capable d’adapter sa recherche de fautes à la langue de chaque segment de texte balisé (ce qui serait précieux pour les dictionnaires bilingues, mais qui pourrait aussi être utile pour les descriptions étymologiques des monolingues) 63 ; 64 62 63 64 de prévoir un système de complétion capable de mémoriser les segments textuels déjà saisis et de les exploiter pour proposer aux rédacteurs de choisir la fin pertinente ou la plus approchante de la saisie en cours. Ces fonctionnalités, en partie déjà intégrées aux éditeurs XML, ne modifient pas fondamentalement le travail de rédaction, mais elles contribuent à accroître la régularité des textes et à réduire le temps de saisie. Les mémoires de traduction proposent des paires de segments de textes (de simples chaînes de caractères ou des constituants délimités sur des bases linguistiques) mis en équivalence dans un corpus constitué pour leur “entraînement”. Employer l’un de ces outils (en plus des données du fonds éditorial, cf. §§ 1.2. et 1.4.) pour les contextualisations ou les expressions et collocations permettrait aux lexicographes d’accéder à des formulations employées par des traducteurs qui ont travaillé sur des contextes d’emplois diversifiés, ce qui serait susceptible d’enrichir la palette des équivalences traductionnelles proposées et d’illustrer mieux la variété des usages. L’élaboration d’un dictionnaire bilingue électronique au sein duquel les indications métalinguistiques (sélecteurs de sens, explications traductionnelles, remarques, etc.) seraient formulées dans la langue de l’item en adresse dans une interface dédiée à l’expression et dans l’autre langue dans une interface dédiée à la compréhension pourrait également tirer profit d’une mémoire de traduction, mais, compte tenu de la spécificité de ces textes, elle devrait avoir été entraînée avec un corpus d’écrits métalinguistiques. Un attribut @xml:lang ayant comme valeur un code de langue doit pour cela être déclaré dans la DTD. Il peut avoir une valeur fixe déclarée elle aussi dans la DTD pour les éléments dont le contenu est toujours dans la même langue, ou des valeurs variées insérées dans le balisage pour ceux dont le contenu peut être dans différentes langues, comme les étymons. Certains éditeurs XML offrent un correcteur orthographique interne qui repère au cours de la frappe des mots (chaînes de caractères délimitées par des espaces ou des ponctuations) qui n’appartiennent pas à une liste de formes (les graphies des items les plus courants de chaque langue). Les fonctions de correction grammaticale, elles, ne sont généralement pas disponibles et il faut envisager l’intégration d’un correcteur externe. Sur leur site web, les éditeurs des trois principaux logiciels externes de correction orthographique et grammaticale pour le français – Antidote (Druide Informatique), Cordial (Synapse Développement) et ProLexis (Éditions Diagonal) – n’évoquent pas d’éditeur XML (comme Arbortext’s Epic Editor, Altova XMLSpy ou <oXygen/>) dans les éditeurs de textes compatibles. Interrogés, les services commerciaux des éditeurs de ces correcteurs ont apporté des réponses contrastées : soit sans perspective pour les lexicographes (pas de compatibilité pour Cordial ; pas non plus pour Antidote, qui propose cependant une solution alternative, même si celle-ci n’est envisageable que pour de petits volumes de textes : il s’agit de copier-coller le texte saisi de l’éditeur XML dans l’éditeur du correcteur, où il est possible de bénéficier d’un système “d’évitement de balises”, c’est-àdire de non-correction des caractères situés entre les chevrons des balises), soit encourageante (ProLexis a été intégré dans Arbortext’s Epic Editor par la société de service en ingénierie informatique 4d Concept (c’est [256 Ð cette intégration n’est pas mentionnée sur le site des Éditions Diagonal) ; l’éditeur juridique pourquoi LexisNexis utilise ProLexis et Epic depuis quelques années et les Éditions Francis Lefebvre devraient le faire prochainement). Les lexicographes de Larousse, qui travaillent avec Epic, pourraient donc, comme les rédacteurs de textes de référence juridiques, bénéficier de l’intégration de ProLexis sans avoir besoin de changer d’environnement. Par ailleurs, les sites des trois éditeurs de correcteurs mentionnent des outils développés par Adobe (InDesign, inclus dans la Creative Suite (CS), et FrameMaker) qui sont utilisés pour le posttraitement de dictionnaires imprimés (cf n. 100) : InDesign CS2 pour Cordial 2009 (http://www.synapse-fr.com/ produits/IntegrationCordial.htm) ; CS2 à CS4 pour Antidote RX version 7 (http://www.druide.com/a_spec. html) ; CS4 (depuis février 2009) et FrameMaker pour Prolexis (http://www.prolexis.com/actualites/index. php?id=62). Selon les informations fournies par les Éditions Diagonal, dans les logiciels d’Adobe, ProLexis peut accéder au texte brut, en négligeant les balises, parce qu’il sait communiquer avec les API (interfaces 818 [256 Ð Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia – pour la fusion d’éléments élaborés parallèlement, par l’incorporation des composants encyclopédiques ou des illustrations (confiés à des experts ou des illustrateurs externes) au fil de leur réalisation, ce qui permettrait à ces prestataires de voir précisément comment leurs contributions s’intègrent dans le texte d’accueil et, si besoin, d’envisager avec le chef de projet la rectification de l’élément inséré ou du texte 65 ; – pour le contrôle de la rédaction, par l’analyse de conformité des informations saisies (comme les tests de présence de chiffres dans les éléments de datation) 66 ; – pour le contrôle du volume, par le calibrage des zones de saisie et l’évaluation au fil de la rédaction du poids effectif de ce qui est déjà rédigé afin de signaler les dépassements et/ou de limiter la taille des développements restants ; – et pour la gestion du projet, par le dénombrement des occurrences de chaque constituant d’article 67, ce qui peut permettre de charger les rédacteurs en fonction d’une évaluation fine du travail de création ou d’adaptation textuelle nécessité par chaque lot d’articles 68. [257 Ð Bien que tout ce qui vient d’être évoqué ne soit pas (encore) mis en place, les changements déjà observés ont modifié en profondeur la manière de travailler des rédacteurs. Ils ne semblent cependant pas avoir véritablement bouleversé leur conception de leur tâche et, si les nouveaux environnements informatiques peuvent susciter des observations relatives aux fonctionnalités disponibles ou à l’ergonomie de l’interface de travail, ils finissent par être bien acceptés, voire appréciés. Au cours de cette mutation, le contenu du texte dictionnairique s’est dissocié de sa mise en forme 69, ce qui induira probablement des rétroactions, mais, pour l’heure, ce sont des textes d’articles qui restent élaborés et, s’il est devenu banal de poser qu’un article électronique n’a pas la même 65 66 67 68 69 de programmation applicative) éditées par Adobe. Si c’était vérifié pour Antidote et Cordial, ceci expliquerait que les trois correcteurs proposent une correction de textes balisés dans les éditeurs d’Adobe. Pour l’heure les textes et les iconographies sont élaborés de manière apparemment indépendante, ce qui produit des discordances auxquelles il pourrait être remédié aisément (dans le Larousse des débutants par exemple, s.v. rejoindre, la personne rejointe change de sexe sans bénéfice apparent entre la contextualisation et la légende d’iconographie : « J’ai couru pour rejoindre mon frère. » / « Lucas court pour rejoindre sa sœur. »). Il semble que ces contrôles ne concernent que des classes de caractères ou de séquences de caractères et qu’en conséquence ils soient très limités. Ceci permet également de fournir des données quantitatives au service marketing qui élabore les textes de promotion des ouvrages. Si ces chiffres se révèlent inférieurs à ceux évalués pour des éditions précédentes et indiqués dans les paratextes des ouvrages ou sur les supports publicitaires, ils posent d’ailleurs des cas de conscience : une nouvelle édition ne peut pas aisément afficher qu’elle contient, par exemple, moins de mots traités que celle à laquelle elle succède (même si c’est le cas pour le Grand Robert & Collins électronique, cf. n. 72). Pour les composants optionnels ou répétables des articles en création (comme les contextualisations, dont l’absence ou la répétition ne dépendent pas mécaniquement des propriétés des items), seule une estimation résul[257 Ð avec d’autres ouvrages pourrait être faite. Fournir une évaluation prévisionnelle tant de la comparaison est par contre plus aisé quand un texte de base existe. Outre la charge de travail, c’est le salaire des rédacteurs externes payés “au signe” (en fonction du nombre de caractères saisis) qui pourrait être en jeu ici : d’une part, l’insertion automatique de certains segments de texte allège le travail de saisie et donc le nombre de signes à payer et, d’autre part, la valeur des signes pourrait être pondérée en fonction de l’effort qu’a nécessité leur insertion (lors d’une refonte, les caractères d’une nouvelle séquence définition - exemple pourraient être mieux cotés que ceux d’une conversion d’exemple glosé (cf. n. 56)). Il semble qu’aucun éditeur n’ait pris jusqu’à présent de mesure dans ce sens. On parle communément d’une dissociation “du fond et de la forme”. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 819 présentation qu’un article imprimé, il est encore naturel de considérer qu’il s’agit d’un article imprimé par ailleurs et posttraité de manière différente en vue d’une édition électronique considérée comme seconde. 2.3. Strate de posttraitement Toutes les actions qui visent à faire passer le texte dictionnairique tel qu’il est en fin de rédaction à ce qu’il est lors d’une consultation ainsi que celles qui concernent ses éventuels réemplois pour dériver un nouveau texte relèvent des posttraitements. Pour les volumes imprimés, le passage du texte rédigé au texte à consulter mobilise traditionnellement les maquettistes de conception, qui créent l’identité visuelle du produit, les maquettistes d’exécution, qui mettent en forme l’intégralité du texte, puis les techniciens qui participent à la fabrication effective du livre. Pour les éditions électroniques, les derniers sont remplacés par des informaticiens développeurs d’interfaces de consultation et, le cas échéant, des fabricants de disques. Les contraintes de chacun influent sur l’élaboration des ouvrages dès leur conception, ce qui suppose de mettre en synergie toutes les compétences utiles dès que possible. 2.3.1. De l’imprimé à l’électronique Le souhait de pouvoir redoubler les versions imprimées par des versions électroniques [258 Ð a profité de la dynamique de structuration des textes et l’a motivée tout à la fois. Il devenait certes nécessaire de créer deux maquettes et de prévoir deux procédures de mise en forme, mais le même texte pouvait trouver deux publics ou les mêmes usagers dans des situations distinctes. 2.3.1.1. Quelques textes publiés sur plusieurs supports Bien que les potentialités de double publication aient fait espérer des bénéfices, il faut constater aujourd’hui que le nombre de dictionnaires monolingues français commerciaux 70 décrivant des états de langue actuels et disponibles en versions imprimée et électronique 71 est modeste 72 : [258 Ð 70 71 72 Seuls sont considérés ici les dictionnaires vendus directement à leurs utilisateurs et, pour les versions électroniques, ceux qui peuvent être consultés indépendamment d’une autre application. Les dictionnaires proposés en consultation gratuite, intégrés à des portails commerciaux ou à des sites financés par la publicité, ne sont pas pris en compte en première intention, mais peuvent l’être en cas de multidiffusion, pour partie payante (imprimée, sur disque ou en ligne) et pour partie gratuite (en ligne seulement), cf. nn. 72, 74 et 87. Le Trésor de la langue française et le Dictionnaire de l’Académie française sont exclus de cet inventaire au double motif que, bien qu’accessibles en ligne gratuitement, ils ne le sont plus ou pas intégralement en version imprimée et que, produits respectivement par le C.N.R.S. et l’Académie française, ils n’ont pas un caractère commercial. La double édition concerne aussi des bilingues : – Le disque du Dictionnaire Hachette-Oxford de 1994 est sorti en 1997. 820 [259 Ð Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia – le Petit Larousse illustré imprimé est vendu avec son disque au moins depuis le millésime 2003, mais la version électronique était déjà vendue isolément depuis 1996 ; 73 – le Larousse pratique de 2003 constitue depuis 2005 l’un des modules du multidictionnaire Larousse illico (cf. n. 72) 74 ; – le Grand Robert de la langue française électronique, dérivé de la version imprimée publiée en 2001, est disponible depuis 2005 75 alors que les six volumes sources ne le sont plus que dans un tirage spécial de Britannica France 76 ; 73 74 75 76 – Chez Larousse, les dictionnaires sont publiés isolément ou dans des compilations : (i) les dérivés du Larousse Chambers et de deux Dictionnaire compact (français / allemand et espagnol) sont réunis depuis 2004 dans le Larousse multilingue, sur disque achetable ou en édition en ligne consultable sur abonnement (via le Kiosque Numérique de l’Éducation (http://www.kiosque-edu.com/CATALOGUE_KNE_2008_2009.pdf) en France et via De Marque (http://larousse.demarque.com/fr/ca/dictionnaire-anglais-en-ligne/larousse-multilingue/) au Canada), et les disques du Larousse Chambers et du Dictionnaire compact français / espagnol sont vendus individuellement, le premier sous le même nom, le second sous celui de Larousse français-espagnol ; (ii) les quatre volumes intitulés Dictionnaire compact (français / allemand, anglais, espagnol et italien) sont inclus dans le Larousse illico, multidictionnaire modulaire qui existe depuis 2005, qui a été réédité en 2007, et qui peut intégrer les quatre bilingues dérivés des Dictionnaire compact et un monolingue (le Larousse illico multidictionnaire français dérivé du Larousse pratique, cf. n. 74) ou un sous-ensemble de ces ressources (ces produits étant achetables séparément ou dans deux compilations : le Larousse illico dictionnaire multilingue, qui réunit les trois premiers bilingues, et le Larousse illico multidictionnaire, qui regroupe les bilingues anglais et espagnol et le monolingue français) ; (iii) les quatre mêmes volumes bilingues sont annoncés, sur le site Larousse (http://www.larousse.fr/), comme prochainement disponibles sur abonnement alors qu’ils sont déjà consultables gratuitement mais malcommodément (soit sans interface de sélection de langues et de saisie du mot cherché, en indiquant dans l’URL les codes de langues (fra ; all ; ang ; esp ; ita) et le mot cherché (par exemple, pour dictionnaire dans le texte français-allemand : http://www.larousse.fr/ref/bilingues/fraall/dictionnaire.htm), ce qui semble être une mise en ligne accidentelle, soit à partir d’une page de sélection des paires de langues (http://www.larousse.fr/ref/IndexBilingues.htm) qui donne accès à la liste des items [259Ð être une interface de test), et ils sont actuellement adresses d’articles et par eux aux articles, ce qui paraît publiés imprimés sous l’intitulé Dictionnaire maxipoche plus ; (iv) le Grand Larousse italien, bilingue français / italien imprimé de 2006, vendu en Italie avec son disque sous le titre Il Larousse francese, est consultable gratuitement sur le site du journal Corriere della Sera (http://dizionari.corriere.it/dizionario_italiano_ francese.shtml). – Le Grand Robert & Collins électronique fusionne les textes du Robert & Collins senior et du Robert & Collins super senior. Les éditions imprimées précédant l’édition électronique de 2003 dataient respectivement de 2002 et 2000. Les correspondants imprimés de la version 2 (2008), rebaptisés Robert & Collins et Grand Robert & Collins, datent de 2006 et 2008. L’édition électronique est consultable en ligne (cf. n. 78). En 2003 le dos du boîtier annonçait « 500 000 mots et expressions », alors que celui de 2008 mentionne « 425 000 mots et expressions » sans que rien n’indique si la différence de 75 000 items est motivée par une sélection de nomenclature plus drastique ou un dénombrement plus fiable (cf. n. 67). Le disque de chaque millésime propose des options de consultation partiellement différentes. Le Petit Larousse imprimé peut toujours être acheté sans disque. Une version gratuite est consultable sur le site TheFreeDictionary (http://fr.thefreedictionary.com/). Chaque article du « Larousse Pratique. © 2005 Editions Larousse » y est suivi de celui du Grand dictionnaire des synonymes et contraires (« Larousse Le Grand Dictionnaire des Synonymes et Contraires. © 2004 Editions Larousse ») quand les deux existent. Le texte du Larousse pratique est actuellement commercialisé en version imprimée en tant que Dictionnaire compact. Le Grand Robert de la langue française est vendu sur disque et accessible par abonnement à partir du site du Canal Numérique des Savoirs (http://gr.bvdep.com/), de celui du Robert et de celui de De Marque (cf. n. 78). Les premières versions électroniques de cet ouvrage, qui ont été publiées sur disque de 1989 à 1994 (version DOS en 1989, puis version Mac en 1992 et version Windows en 1994), correspondaient à l’édition imprimée en neuf volumes de 1985. Cf. http://www.britannica.fr/viewPrd.asp?idproduct=25. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 821 – le (Nouveau) Petit Robert existe dans les deux versions de manière asynchrone depuis 1996 et de manière synchrone depuis le millésime 2007 77 ; 78 [260 Ð – le Robert junior a deux versions asynchrones depuis 1998 79 ; – le Dictionnaire Auzou junior inclut un disque dans le volume imprimé depuis 2008 80. Le nombre de dictionnaires commercialisés en version électronique seulement est encore plus réduit. Quatre l’ont été par deux des éditeurs présents par ailleurs sur le marché des dictionnaires imprimés et un par un éditeur de logiciels : – Hachette a publié dès 1993 le Dictionnaire Hachette multimédia, répertoire encyclopédique qui incluait un dictionnaire de langue française 81 et qui a été réédité jusqu’en 2005 au moins, et, en 1998, l’Encyclopédie Hachette multimédia, qui intégrait un autre dictionnaire de langue française 82 et qui est régulièrement rééditée 83 ; – Larousse a produit deux compilations notables : en 1996, le Bibliorom Larousse 84 (réédité en 1998) et, en 2002, le Larousse expression 85 (rebaptisé Larousse multidico depuis 2004 86) ; 77 78 [260 Ð 79 80 81 82 83 84 85 86 Le disque de 1996 correspondait à l’édition imprimée de 1993. Les volumes imprimés sont millésimés depuis 2005 (millésime 2006) et les disques depuis 2006 (millésime 2007). En 2008, le volume imprimé et le disque du millésime 2009 pouvaient être achetés conjointement pour un prix inférieur à la somme de celui de ces produits achetés indépendamment. Pour les établissements scolaires, des licences sont aussi achetables en nombre via le site du Canal Numérique des Savoirs (http://www.cns-edu.com/ressource-15---le-nouveaupetit-robert-2.html). Le Nouveau Petit Robert, le Grand Robert de la langue française et le Grand Robert & Collins sont également consultables sur abonnements. Ces derniers peuvent être souscrits sur le site de l’éditeur (http://www.lerobert. com/espace-numerique.html, respectivement dans les versions 3.2, 2.1 et 2.0 en avril 2009) ou, pour les organismes et institutions canadiens, sur le site de De Marque (http://lerobert.demarque.com/fr/ca/dictionnaire -en-ligne/, dans des versions qui semblent être les mêmes). Les disques de 1998, 1999 et 2003, puis 2006 sous le nom de Robert des enfants, correspondent à l’édition imprimée de 1993 (rééditée jusqu’en 1998) enrichie de médias (cf. F. Corbin (2009), dans ce volume). La refonte de 2005 n’est disponible qu’en version imprimée. Pour les établissements scolaires, des licences sont achetables en nombre via le site du Canal Numérique des Savoirs (http://www.cns-edu.com/ressource-16---le-robertjunior.html). Cette version n’a intégré les médias qu’en janvier 2008 (cf. http://junior.bvdep.com/demo/infos. htm). Comme les trois ouvrages mentionnés en note 78, le Robert des enfants est proposé par De Marque (http://lerobert.demarque.com/fr/ca/dictionnaire-enfants-en-ligne/robert-junior/), mais il ne l’est pas (ou pas encore) par Le Robert. En 2006, à son entrée sur le marché, seule la version imprimée était disponible. Il dérive du Dictionnaire pratique du français (de 1987) du même éditeur, qui a connu diverses éditions imprimées sous différents titres jusqu’en 2001 (où il paraissait comme Dictionnaire Hachette langue française) et qui a aussi été publié comme Dictionnaire français Hachette électronique de 2001 à 2004 au moins. Le texte du dictionnaire de langue présente une très forte parenté avec Alpha. Encyclopédie alphabétique Hachette. Une consultation sur abonnement est proposée sur les sites d’Hachette Multimédia (http://www.ehmelhm. hachette-multimedia.fr/infos/accueil) et du Kiosque Numérique de l’Éducation (http://www.kiosque-edu.com/ CATALOGUE_KNE_2008_2009.pdf) en France, et de De Marque (http://hachette.demarque.com/) au Canada. Le Bibliorom Larousse réunissait le Petit Larousse, le Thésaurus, le Dictionnaire des citations françaises et étrangères et trois bilingues “compact ” (français / allemand, anglais et espagnol). Toutes ces versions électroniques portaient un copyright 1996 et seul le Petit Larousse était vendu de manière autonome (cf. n. 73). Le Larousse expression intégrait en particulier le Grand usuel Larousse (version brochée désiconographiée du Grand Larousse en 5 volumes). Le Larousse multidico est vendu sur disques et est accessible en ligne sur abonnement via le Kiosque Numérique de l’Éducation (http://www.kiosque-edu.com/CATALOGUE_KNE_2008_2009.pdf) en France et De 822 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia – Microsoft a créé en 2002 un dictionnaire pour l’édition française de l’encyclopédie Encarta commercialisée sur disque et en ligne 87. [261 Ð Plusieurs explications sont avancées par les professionnels pour justifier le nombre relativement faible de versions électroniques : il semble que les disques isolés se vendent mal 88, que ceux inclus dans les volumes imprimés posent un problème de calcul de TVA et qu’ils soient aisément abîmés ou volés chez les revendeurs, et enfin que les consultations en ligne 89 et les téléchargements n’aient pas trouvé leur formule commerciale. 90 87 88 89 90 Marque (http://larousse.demarque.com/fr/ca/dictionnaire-francais-ligne/larousse-multidico/) au Canada. En 2007, il a été réédité sous le nom de Larousse illico multidico. Il partage ainsi une partie de son titre avec le multidictionnaire modulaire présenté en note 72, mais n’est pas intégrable dans ce dernier (contrairement au Larousse illico français, cf. n. 74). Le dictionnaire Encarta français est maintenant consultable gratuitement (http://fr.encarta.msn.com/encnet/ [261Ð | dif férentes versions d’Encarta sont en sursis, Microsoft features/dictionary/dictionaryhome.aspx), mais les ayant annoncé (cf. http://fr.encarta.msn.com/guide_page_FAQ/FAQ.html) la fin de la vente de tous les produits de la gamme Encarta en juin 2009 et la fermeture de son portail international MSN Encarta en octobre 2009 (décembre pour le site japonais). Est-ce une question de prix, de relative inconnaissabilité de ce que contient un disque à partir de son emballage, d’incompatibilités informatiques redoutées entre différents produits installés simultanément sur un ordinateur (ce qui pouvait effectivement poser des problèmes il y a quelques années), de mauvaise perception de ce qu’un dictionnaire électronique acheté apporterait de plus qu’une ressource consultée gratuitement en ligne (question qui peut se poser légitimement pour ceux qui sont doublement accessibles, cf. nn. 72, 74 et 87), ou autre chose encore ? Pour les métalexicographes, ces produits seraient susceptibles de poser d’insurmontables difficultés d’identification (de quel texte s’agit-il ? dans quelle filiation textuelle s’inscrit-il ?) et de référenciation (les versions en ligne pouvant être actualisées selon un calendrier non nécessairement communiqué par l’éditeur, ce qui aura été lu ou copié un jour pourra avoir disparu le lendemain, rendant les analyses métalexicographiques infalsifiables). Jacquet-Pfau (2005 : 70) s’inquiétait de savoir « [c]omment le chercheur aura […] accès, dès le moyen terme, aux différentes versions d’un dictionnaire » et concluait en indiquant que « [c]’est un débat sur lequel il n’est plus possible de faire l’impasse ». Le problème est réel pour les chercheurs, mais cela n’infléchira vraisemblablement pas les politiques éditoriales. Même si, pour que son nom soit présent sur le web, un éditeur fait le choix d’offrir gratuitement certains de ses produits, il est confronté à un dilemme pour les autres : d’un côté, il constate que des concurrents gratuits existent, même s’ils n’ont pas le même projet éditorial et que, de fait, ils ne fournissent pas les mêmes informations ou la même qualité ou densité informationnelle, et d’un autre côté il ne perçoit pas les internautes comme étant suffisamment critiques pour que leurs choix de consultation se portent sur des ouvrages payants, même si ces derniers leur rendraient de meilleurs services que certains de ceux qui sont consultables gratuitement. Il semble cependant que l’offre de versions en ligne (sur abonnement ou en consultation libre) soit relativement consistante (cf. nn. 72, 74, 75, 77, 78, 79, 83, 86 et 87). Malgré la probable incomplétude de cet inventaire, il apparaît que les trois éditeurs majeurs de dictionnaires semblent avoir choisi des fournisseurs de ressources pour les établissements scolaires partiellement différents (le Kiosque Numérique de l’Éducation pour Larousse et Hachette ; le Canal Numérique des Savoirs pour Le Robert ; De Marque pour les trois) mais aussi des stratégies divergentes (la déclinaison multiple des sources textuelles et la consultation libre en ligne parallèle à la vente pour Larousse ; des produits bien identifiés mais peu nombreux pour Hachette et Le Robert). Des téléchargements (non inventoriés ici) sont également proposés. Ils semblent cependant limités à quelques dictionnaires édités chez Larousse et Hachette. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 823 2.3.1.2. Quelques adaptations liées à la publication électronique En cas de copublication de versions imprimée et électronique, le même texte subit [262 deux mises en forme distinctes. Mais alors que le Ðvisuel d’une version imprimée est défini une fois pour toutes, celui d’une version électronique est susceptible d’être plus polymorphe, l’interface de consultation pouvant être personnalisable afin de l’accommoder aux goûts de chaque lecteur 91 ou de permettre une lecture adaptée à certains handicaps visuels 92. Ces changements d’affichage peuvent n’affecter que la feuille de styles qui régit la présentation du texte dictionnairique (taille, forme, couleurs, etc. des caractères et des zones d’affichage) et se limiter à un choix de configurations proposées aux utilisateurs. Ils peuvent cependant aussi exploiter des transformations textuelles, automatiques ou non, comme (i) le remplacement des abréviations par les formes développées correspondantes, ce qui non seulement apporterait un meilleur confort de lecture à tous les usagers mais s’avérerait capital pour les malvoyants qui utilisent un système de synthèse vocale pour percevoir ce qui est affiché à l’écran 93, ou (ii) la présentation d’affichages partiels 94, le texte d’un ou plusieurs composant(s) des articles n’étant par défaut pas présenté mais représenté par un condensé ou un bouton à partir duquel un lien donnerait accès au texte complet (ce qui nécessiterait un contrôle de la source textuelle concernant la compréhensibilité des textes condensés et de leur relation avec [263 Ð | les textes développés qui leur sont liés, la coprésence d’indica tions interdépendantes dans les segments sélectionnés pour chaque affichage et la vérification de la cohérence des sélections d’informations entre articles comparables). Ces potentialités (parmi d’autres, cf. § 3.) ne semblent pas avoir inspiré la majorité des éditeurs 95, peut-être [262 Ð 91 92 93 94 [263 Ð 95 Le Trésor de la langue française informatisé offre ce type de fonctionnalité avec une gamme d’options réduites. Seuls des grossissements de caractères sont généralement proposés, mais il serait possible de permettre de changer les couleurs du fond pour améliorer le confort visuel de ceux qui ne supportent pas la luminosité de l’écran, et celles des caractères pour rendre les contrastes mieux perceptibles. Jaws, « l’un des rares logiciels permettant aux non-voyants d’accéder à l’informatique » (http://www.01net. com/editorial/352298/linformatique-sans-la-vue/), est un outil de synthèse vocale et de conversion en braille (cf. http://www.freedomscientific.com/products/fs/jaws-product-page.asp). D’après le site de Larousse (http:// www.encyclopedie-larousse.fr/actualites.htm), « [l]’encyclopédie Larousse en ligne est compatible avec Jaws », mais rien n’explique en quoi elle l’est plus qu’une autre et rien de tel ne paraît indiqué pour d’autres produits de cet éditeur ou de ses concurrents. Les dictionnaires Robert sont déjà assez bien dotés en affichages partiels. Au sein des articles pour lesquels c’est pertinent, le Petit Robert de 2001 propose un « Plan » et un « Explorateur » (« Plan » et « Explorateur f Plan de l’article » à partir de 2006) qui, comme l’« Explorateur (plan) » du Grand Robert de la langue française de 2005, extraient ce qui correspond aux textes par lesquels débutent les subdivisions majeures des articles. À partir de ces dernières versions, les deux produits proposent un « Explorateur (locutions) » que le Nouveau Petit Robert appelle « Explorateur f Expressions, locutions et proverbes » et auquel il adjoint un « Explorateur f Termes et composés ». D’autres visualisations sont en outre proposées : (i) déjà dans le Grand Robert de 1994, l’article « Abrégé » (moins filtré que l’« Explorateur (plan) » de 2005) et « Détaillé », l’« Étymologie », les « Citations », les corrélats (« Syn. / Ana. »), et les homonymes, dérivés, contraires et composés (« Hom. / Dér. ») ; (ii) dans les deux ouvrages à partir de 2001, l’« Article complet » (présenté mais non nommé dans le Petit Robert de 2001), l’« Étymologie », les « Renvois et contraires », les « Exemples et expressions », les « Citations » et les « Homonymes » ; et (iii) dans le Grand Robert depuis 2005, les précédentes plus l’« Article sans les citations » en 2005 (version 2.0) ou « Abrégé » depuis 2008 (version 2.1), les « Citations étendu[es] » et les « Dérivés et composés ». Les dictionnaires Robert se démarquent de leurs concurrents (cf. nn. 94 et 96). 824 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia parce qu’elles ont été jugées trop peu rentables 96, même pour ce qui ne concerne que les adaptations qui permettraient aux déficients visuels d’accéder aux contenus dictionnairiques 97. Du point de vue des contenus, les éditions électroniques sont souvent des reproductions, enrichies d’hyperliens, des articles prévus pour les éditions imprimées ou, au mieux, des compilations réunissant plusieurs textes d’un éditeur, comme le Larousse expression (cf. n. 85). Selon les commentaires déposés sur les sites de vente de dictionnaires, ce dernier produit a reçu un écho favorable chez certains utilisateurs, séduits par la possibilité de trouver au sein d’un seul dictionnaire des informations jugées trop souvent disséminées. Si ces assemblages ont ouvert la voie, ils montrent leurs limites, comme les rétroconversions et les copublications, pour l’élaboration de nouvelles fonctionnalités (en dépit des efforts qui ont été faits, cf. nn. 94 et 96) et incitent à penser que seules seront vraiment opératoires les descriptions qui seront conçues pour le support électronique, parce qu’elles seront élaborées en tenant compte des affichages at[264 Ð tendus, avec des sélections d’informations encore inhabituelles. 98 Si les maisons d’édition avaient les moyens d’affecter une partie du temps de travail des lexicographes et des informaticiens à la recherche et au développement, il leur incomberait d’imaginer des ébauches de produits dont la finalité serait de dégager et de tester des pistes de réflexion pour de futures productions électroniques conçues, elles, pour être viables. 96 97 [264 Ð 98 Peut-être est-ce aussi ce qui motive qu’il y ait des fonctionnalités qui disparaissent. Le Petit Robert de 2001 offrait une fonction, très utile pour les linguistes et les pédagogues au moins, de constitution de listes exportables d’adresses (lemmes et flexions) accompagnées de leur(s) catégorie(s) qui soit représentaient des items partageant une propriété identifiée au moyen de différents critères proposés au sein des onglets de recherches avancées (chaîne de caractères intégrant des jokers, prononciation approchée, catégorie grammaticale et flexionnelle, appartenance à une série morphologique, étymologie (langue ou groupe de langues et datation), présence dans les citations d’un auteur), soit introduisaient des articles contenant des mots ou des séquences de mots recherchés, combinés ou en disjonction et graphiés intégralement ou avec caractère joker final, dans le texte intégral, le plan, les exemples et expressions ou les renvois et contraires. Le Nouveau Petit Robert (à partir de 2006) et le Grand Robert de la langue française n’offrent pas l’export des listes de résultats mais proposent différentes options de recherche : alors que le Grand Robert de 1994 permettait des recherches puissantes, avec caractères jokers en toutes positions dans la nomenclature, et avec jokers et opérateurs booléens dans les citations et leurs références, celui de 2005 sur disque (version 2.0) n’autorise que la recherche d’un mot dans l’intégralité du texte ou dans les citations (sans caractère joker ni opérateurs booléens), tandis que le Nouveau Petit Robert sur disque et en ligne (cf. n. 78) et le Grand Robert de 2008 et en ligne (version 2.1) proposent les mêmes options de recherche que le Petit Robert de 2001, sauf concernant celles en plein texte, qui explorent maintenant aussi les définitions et les marques d’usage et de domaines, mais qui n’offrent plus ni caractère joker ni opérateurs booléens, et celles dans les étymologies, non proposées par le Grand Robert. En revanche Mediadico, dictionnaire gratuit en ligne, propose des articles assez textualisés pour en fournir une version oralisée (cf. Corbin & Gasiglia (2009a, n. 10)), qui est tout à fait compréhensible quoique la courbe intonative soit très plate. Selon Hausmann (2003 : 261-262), « [c]omme aucun autre, le texte lexicographique a vocation à profiter des nouvelles possibilités médiales. […] l’avenir n’est pas le dictionnaire informatisé après coup, mais le dictionnaire électronique conçu comme tel et exploitant à fond ses potentialités hypertextuelles. C’est là le défi à relever […]. ». S’il est effectif que les liens joueraient un rôle crucial dans un dictionnaire électronique “ natif ”, il est malaisé d’imaginer dépasser le stade de cohabitation textuelle hypertextualisée des produits compilatoires (les plus novateurs aujourd’hui) sans que la conception des articles en tant que texte soit réformée elle aussi (cf. Verlinde, Selva & Binon (2009, § 3.), dans ce volume, et § 3.2. ci-après). T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 825 Pour l’heure, c’est la recherche publique qui innove 99, mais ses acteurs n’ont pas vocation à concevoir plus que des prototypes et n’ont qu’une influence très indirecte sur les projets éditoriaux. 2.3.2. Une diversification des posttraitements induisant un changement de métier pour l’informatique éditoriale Alors que l’édition électronique n’a pas (encore) véritablement pris son essor et par conséquent pas pleinement profité de la structuration des textes de dictionnaires, c’est l’édition imprimée qui semble en tirer le meilleur profit à date récente. En effet, un transfert de compétences très marquant a été opéré chez certains éditeurs, qui ont décidé de ne plus faire appel systématiquement à des compositeurs externes et de traiter eux-mêmes une partie de la mise en page. Ce choix a été rendu possible par le fait que [265 Ð le logiciel InDesign 100 traite des “flux XML” 101, données structurées dont la mise en forme peut être effectuée selon des règles établies par les équipes internes d’informatique éditoriale, et que sa manipulation n’est pas très complexe concernant des tâches de correction de composition à réaliser manuellement sur certaines pages, ce qui permet de les confier à des lexicographes formés à son maniement en plus des relecturescorrections du texte qu’ils assuraient déjà 102. L’internalisation de cette tâche a été motivée en partie par la possibilité de produire des versions partielles stylées à tout moment de la rédaction, ce qui semble permettre de mieux contrôler l’élaboration du texte, et en partie par la réduction du temps de traitement, puisque au lieu d’envoyer les fichiers XML au compositeur pour traitement et envoi en retour de fichiers PDF 99 Par exemple en concevant des projets comme le Dictionnaire d’apprentissage du français langue étrangère ou seconde (DAFLES ) intégré dans la Base lexicale du français (cf. Verlinde, Selva & Binon (2009)). 100 Le logiciel de mise en page Adobe InDesign a concurrencé Quark Xpress, très bien implanté chez les compositeurs et les imprimeurs. Cela tient au fait qu’InDesign a intégré le traitement de documents XML dans sa version CS2, dès 2005, alors que Quark Xpress ne l’a fait que plus tard (en 2006, pour sa version 7, par l’adjonction de XML QuarkXTensions software 7.02) et, semble-t-il, avec un succès moindre. Chez les compositeurs, pour les textes dont la composition est très régulière (comme les dictionnaires non illustrés), InDesign n’a pas remplacé Adobe FrameMaker, plus adapté pour de la mise en page automatisée. 101 Ce traitement consiste à associer des “styles paragraphes” et des “styles caractères” aux contenus des éléments XML. Il nécessite donc que chaque document soit structuré de manière compatible avec cette double articulation des styles, alors qu’un document XML peut avoir une profondeur d’enchâssement des éléments bien supérieure à deux niveaux. Il implique aussi que le contenu textuel de chaque document XML contienne strictement les espaces et sauts de lignes qui devront figurer dans le texte mis en forme, ce qui requiert un prétraitement minutieux (en particulier si, comme c’est parfois le cas, l’éditeur XML indente les éléments enchâssés afin d’améliorer la lecture structurelle du document). [265 Ð 102 Ces ajustements peuvent être faits lors de l’une des relectures du texte s’ils sont assez peu nombreux pour ne pas déconcentrer de la relecture de fond. 826 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia un lexicographe peut maintenant générer instantanément un PDF 103 composé automatiquement 104. 105 Indépendamment de ce transfert de compétences, la structuration des textes a permis à l’informatique éditoriale de participer plus activement encore à la conception des nouveaux projets et de proposer que, dès sa conception, un texte ne soit pas celui d’un dictionnaire mais de plusieurs : les versions imprimée et électronique, de multiples dérivés (dont la nouveauté peut ne consister qu’en un changement de maquette ou qui se distinguent de leur source par les suppressions ou déplacements d’éléments textuels 106 qui y ont été opérés 107) et des textes nouveaux créés par métissage 108, ce qui implique une assez bonne connaissance du fonds pour y sélectionner, avec les lexicographes, les sources les plus pertinentes pour chaque projet en plus de la capacité, attendue chez un informaticien éditorial, à fusionner des segments de textes (éventuellement à réviser) ou à élaborer des interfaces de travail présentant simultanément les éléments perti[266 nents de toutes les sources choisies afin de laisser les Ðlexicographes opter pour celles qui conviennent le mieux pour chaque article. Autrefois interfaces entre les lexicographes et les compositeurs externes, les équipes d’informatique éditoriale ont vu leur champ d’intervention s’élargir. Leurs rapports avec les compositeurs ont évolué avec l’internalisation d’une partie de leur tâche et donc des partages de savoir-faire, mais c’est sur le terrain de la conception de projet que leur investissement a fait le plus évoluer leur métier. D’accompagnatrices, elles sont devenues coresponsables voire porteuses autonomes de projets (exploitant des textes antérieurement rédigés) et influentes dans les prises de décisions des gestionnaires. 2.4. Réflexions conclusives sur les modes d’élaboration Tant que les dictionnaires ont été des ouvrages imprimés dont le contenu comme la présentation étaient figés jusqu’à la publication suivante, l’interdépendance du texte et de sa mise en forme n’était pas remise en cause. Le besoin de réemployer des élé103 Selon les expériences relatées par des partenaires professionnels (cf. n. 1), vingt-quatre heures pouvaient s’écouler entre l’envoi du XML et la réception du PDF. L’instantanéité qui est valorisée ne tient pas compte du temps qu’il a fallu aux informaticiens pour élaborer les règles de mise en forme utilisées par InDesign, mais ce temps était antérieurement rétribué au compositeur qui assurait ce travail. 104 Ce qui est généré automatiquement doit être révisé avant publication, mais c’est une ébauche suffisamment aboutie pour permettre de procéder aux relectures. 105 Gabino Alonso, directeur de l’informatique éditoriale chez Larousse, décrit cette internalisation (http://www. adobe.com/fr/showcase/pdfs/200701_larousse.pdf). 106 Ces manipulations de textes impliquent directement les lexicographes, qui doivent veiller à ce que ces suppressions et déplacements ne nuisent pas à la compréhension du reste de l’article, mais elles peuvent être engagées par des informaticiens qui ont acquis une bonne connaissance de la structure des articles. 107 Ces remodelages structurels de documents XML se font avec des “feuilles de styles” XSLT (langage XML de transformation dédié à la création de nouveaux documents XML, HTML ou TXT à partir d’un document XML) ou de scripts Perl (langage de programmation polyvalent qui traite des chaînes de caractères et dont des bibliothèques offrent des modules spécialisés : XML::Parser, XML::Dom, etc.). 108 Le Larousse pratique, par exemple, a plusieurs dérivés (cf. nn. 74 et 72, et F. & P. Corbin (2008, § 4.2.)) et il est un des parents de textes plus métissés comme le Larousse des noms communs, cf. n. 57. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 827 ments textuels afin d’en dériver d’autres était cependant avéré et c’est pour mieux y répondre que les efforts de structuration ont été engagés avec d’une part la rétroconversion des textes antérieurement publiés jugés importants pour les dérivations à venir et d’autre part la rédaction structurée des nouveaux produits. Cette évolution a eu des incidences sur le travail accompli au sein des trois strates, et elle a induit des transferts de compétences qui ont principalement touché les équipes d’informatique éditoriale, mais elle n’a remis en cause ni le fait que la textualité des articles trouve parfois des accommodements avec le principe de répartition des informations dans les composants qui les subdivisent (cf. n. 24), ni l’idée répandue qu’un dictionnaire répond à des besoins en fournissant un texte qui associe des descriptions de propriétés linguistiques à des adresses lexicales. Cette conception des produits et des services qu’ils doivent rendre fonde les méthodes actuelles de l’activité lexicographique. L’adéquation supposée entre les besoins informationnels éprouvés par des personnes et les réponses fournies par les dictionnaires peut être évaluée de deux manières différentes par les éditeurs : soit il existe un segment de marché bien établi avec des utilisateurs ciblés identifiés et des besoins auxquels des éditeurs concurrents ont déjà tenté d’apporter une réponse, soit il s’agit d’un besoin perçu par les éditeurs mais pas nécessairement par le public et à propos duquel il faut développer des arguments de vente consistants afin que les potentiels acquéreurs s’identifient, perçoivent les services que le nouveau dictionnaire est susceptible de leur rendre et se muent en acheteurs effectifs. 109 Pour un éditeur, l’appréciation de l’adé[267 Ð | quation d’un projet dictionnairique et d’un besoin correspond donc large ment à une prévision de vente : capacité de l’ouvrage à trouver sa place à côté de concurrents sur un segment de marché repéré ou capacité du public à souscrire à une offre commerciale répondant à un “nouveau” besoin. Ce mode d’évaluation, qui est cohérent avec une logique de constitution de catalogue et de diversification des services rendus aux lecteurs du fait de la diversité des ouvrages mis à leur disposition, ne semble pas avoir notablement évolué avec les changements informatiques, ces dernières années étant plutôt caractérisées par un repli sur des produits de facture éprouvée et dont la rentabilité est supposée assurée (cf. P. Corbin (2008, § 3.)). Pourrait-on imaginer que ce soit à l’informatique éditoriale qu’il revienne de bouleverser les principes actuels de gestion des catalogues ? Serait-il envisageable, pour un éditeur, de proposer un dictionnaire électronique qui contiendrait “ toutes” les informations susceptibles d’être utiles 110 et qui disposerait d’une interface dont la lisibilité permettrait aux utilisateurs de s’orienter aisément vers la sélection d’informations pertinentes pour répondre à ce qui motiverait chaque consultation ? Cette révolution dictionnairique a été en partie imaginée par Atkins (2002a [1996] : 12-13 111) à propos de descriptions combinables (selon des [266 Ð 109 Pour les métalexicographes, cette adéquation s’apprécie à partir d’une analyse qualitative d’un produit publié et d’une évaluation théorisée des besoins. [267 Ð 110 S’il n’est pas aisé d’imaginer comment les présenter toutes, il est au moins possible d’envisager d’en fournir un certain nombre qui sont actuellement distribuées dans différents produits ou qui ne sont que rarement sélectionnées, faute peut-être de bien savoir à qui, pourquoi et comment les énoncer. 111 « 2.2.1. Real databases, real links and virtual dictionaries » (p. 12) ; « (b) The dictionaries These will be of at least three types: monolingual, bilingual and multilingual, and indeed when enough dictionaries have been 828 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia liens établis entre elles) afin de constituer des dictionnaires mono- ou plurilingues proposant différents niveaux d’informations pour répondre mieux que les ouvrages sélectifs actuels à tous les besoins des usagers. Cette idée constitue une base de réflexion stimulante, dont s’est inspirée la spéculation présentée au § 3., qui limite sa portée à la description du français et au public d’âge scolaire, celui qui, conjointement, acquiert la pleine maîtrise de sa langue, apprend à se documenter et apprécie souvent les outils électroniques. 3. Changer les produits : le cas des dictionnaires scolaires Les mutations informatiques ne concernent pas que les milieux professionnels. Les foyers sont de plus en plus souvent équipés en micro-ordinateurs 112 et les enfants sont [268 Ð initiés à leur manipulation dès le cours préparatoire 113. Outre ces évolutions, trois paramètres pourraient conduire à produire de nouveaux dictionnaires électroniques polymorphes destinés aux écoliers et collégiens 114 : – les programmes scolaires 115 prévoient que les enseignants initient au maniement des [269 Ð dictionnaires 116, ce qui autorise à penser que ces derniers apparaissent comme des 112 113 114 115 compiled the user will be able to switch dictionary types at will. Each type of dictionary will offer the user various levels of information, from brief and simple to long and complex. » (p. 13). Selon une enquête de l’institut d’études de marketing Gfk, « le taux d’équipement français en micro-ordinateurs personnels (PC de bureau et portables) s’élevait en 2007 à 60% , soit 15,5 millions de foyers » (« deux [268Ð Si ce taux reste faible chez les plus de 65 ans, « il est de 80% chez les 25-34 ans. » fois plus qu’en 2000 »). (cf. http://www.commentcamarche.net/actualites/les-francais-ont-achete-pres-de-5-millions-de-pc-en-20074742551-actualite.php3). Les programmes du cycle 2 (limité aux cours préparatoire et élémentaire 1 e année : http://www.education. gouv.fr/bo/2008/hs3/programme_CP_CE1.htm) mentionnent l’usage des ordinateurs dans deux contextes : en « Français » (« Lecture, écriture »), les élèves « sont amenés à utiliser l’ordinateur : écriture au clavier, utilisation d’un dictionnaire électronique. », et, au titre de la « Découverte du monde », ils « commencent à acquérir les compétences constitutives du brevet informatique et internet (B2i). Ils découvrent et utilisent les fonctions de base de l’ordinateur. ». Certaines écoles maternelles proposent aussi des initiations à la manipulation d’ordinateurs, mais ce n’est pas inscrit dans les programmes officiels. Cette limitation au collège correspond aux limites actuelles de l’offre des éditeurs. Les lycéens peuvent être inclus dans les destinataires des dictionnaires généraux (c’est le cas pour le Lexis Larousse), mais leur établissement n’est pas mentionné comme l’est le collège dans le titre des ouvrages (cf. Corbin & Gasiglia (2009c, § 2.), dans ce volume) : tout au plus peut-on faire état de la mention du lycée sur la couverture d’un dictionnaire bilingue, le Robert & Collins compact plus. Entre 2002 et 2008, la place faite aux dictionnaires a progressé dans les instructions officielles pour l’école primaire. En 2002, celles pour le cycle 2 n’en faisaient pas mention (http://www.education.gouv.fr/bo/2002/ hs1/cycle2.htm), alors que celles de 2008 mentionnent l’usage du dictionnaire électronique (cf. n. 113). En 2002, celles pour le cycle 3, invitaient à « consolider l’usage du dictionnaire » sans autre précision (http://www. education.gouv.fr/bo/2002/hs1/cycle3.htm), alors qu’en 2008 elles le mobilisent pour la « rédaction » (les élèves « sont entraînés à rédiger, à corriger, et à améliorer leurs productions, en utilisant le vocabulaire acquis, leurs connaissances grammaticales et orthographiques ainsi que les outils mis à disposition (manuels, dictionnaires, répertoires etc.). ») et lors des séances de « vocabulaire » (« L’usage du dictionnaire, sous une forme papier ou numérique, est régulière. »). De manière surprenante, selon les textes de cadrage de 2006 (http://www. education.gouv.fr/cid81/les-programmes.html#francais), les dictionnaires ne sont à mobiliser au collège que pour la vérification orthographique (« maîtriser les principales règles d’orthographe grammaticale et lexicale ; avoir recours spontanément et efficacement aux outils de vérification (dictionnaire, correcteur d’orthographe). »). Ce cantonnement n’est pas cohérent avec la mention en introduction des « deux objectifs indissociables : la T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 829 ouvrages trop codifiés pour être abordés par les élèves seuls. Cependant, la grande majorité des entraînements prévus dans les manuels sont destinés aux plus jeunes lecteurs, ce qui ne semble pouvoir être motivé ni par le fait que les dictionnaires sont perçus comme plus abordables quand leur programme d’information s’enrichit, car ce serait paradoxal, ni par le fait que les élèves de fin d’école primaire et de collège sont considérés comme des lecteurs rompus à leur consultation, même en ce qui concerne les indications les plus complexes, car cela témoignerait d’un optimisme excessif (cf. Corbin & Gasiglia (2009c, § 4.3.) ou Macron (1999, §§ 2.2. et 2.3.)) ; – l’offre actuelle en matière de dictionnaires scolaires 117, en faisant l’hypothèse qu’elle reflète bien les besoins pédagogiques, semble indiquer que, durant les premières années de la scolarité, les élèves doivent pouvoir accéder à une proportion croissante d’informations formulées dans des termes adaptés à leur maturité intellectuelle ; – les environnements numériques de travail (appelés métaphoriquement “cartables électroniques” 118) semblent destinés à être déployés dans les écoles primaires et les collèges, et dès à présent une part non négligeable des enfants d’âge scolaire pourrait consulter un dictionnaire sur un ordinateur familial, ce qui serait susceptible de faire maîtrise de la langue et l’acquisition des repères culturels et esthétiques », auxquels les dictionnaires peuvent contribuer. 116 Les enseignants sont aidés par les manuels qui proposent des entraînements à la manipulation des dictionnaires. Certains de ces exercices portent sur des pages de répertoires reproduites dans le manuel (par exemple, dans la série À portée de mots, le Dictionnaire Hachette benjamin de 1996 pour le manuel du CE1 (pp. 114115 et 118), le Dictionnaire Hachette junior de 1998 pour celui du CE2 (pp. 120-121)) et son édition de 2006 pour celui du CM1 (pp. 140 et 142), d’autres sont d’autant plus faciles à réaliser en classe que tous les enfants disposent d’un même dictionnaire (dans le précédent manuel pour le CE1 : « Cherche ces mots dans ton dictionnaire et écris les mots repères qui sont en haut de chaque page » (exercices 5 et 6, p. 116), « Dans ton dictionnaire, retrouve et écris le mot qui est juste avant chacun de ces mots » (exercices 10 et 11, p. 117) ou « Dans ton dictionnaire, retrouve et écris le mot qui est juste après chacun de ces mots » (exercices 12 et 13, [269Ð mots ? », « À l’aide p. 117), « Dans ton dictionnaire, combien de définitions trouves-tu pour chacun de ces de ton dictionnaire, recherche et recopie les bonnes définitions des mots en gras. » (exercices 4 et 5, p. 119)). Par ailleurs, certains éditeurs proposent des fiches pédagogiques à télécharger. C’est le cas par exemple pour Le Robert (http://www.lerobert.com/home-enseignants-documentalistes-2.html), qui fournit une fiche pour le cycle 2, quatre pour le cycle 3, huit pour le collège (qui bénéficie en outre d’un document de synthèse, « Comment utiliser le dictionnaire en classe ? », et de trois fiches dédiées à l’étude de différents genres littéraires), quand Larousse offre quarante fiches pour le seul cycle 2 (http://www.editions-larousse.fr/Actualites/ larousse_debutants/fiches_larousse_debutants.pdf ) mais rien pour les élèves plus âgés. 117 Cf. Gasiglia (2008a, tab. 1) pour une présentation généalogique des dictionnaires scolaires et périscolaires, qui donne une bonne idée de l’offre pour les cycles 2 et 3 en 2007, mais qui n’est plus tout à fait à jour (le Dictionnaire Auzou débutant n’était pas encore publié, le Dictionnaire Auzou junior était vendu sans disque et le Larousse junior n’avait pas encore été refondu). Cf. Corbin & Gasiglia (2009c, § 2.) pour l’offre faite aux collégiens. 118 Selon le site officiel EducNet (http://www.educnet.education.fr/dossier/manuel/notions/ent-cartable-numerique), cartable électronique est une marque qui a été déposée en 1999 par l’université de Savoie. Il s’agissait à l’origine d’un projet de plate-forme de travail et de collaboration. La notion a été reprise sous différentes dénominations (cartable numérique, e-cartable, manuel électronique, manuel numérique, e-manuel, etc.) pour parler soit d’un équipement informatique mobile dont seraient équipés les élèves dans l’enceinte de leur établissement et dans leurs foyers, soit d’un environnement numérique de travail, un portail Internet, auquel les élèves pourraient se connecter à partir de leur établissement ou de leur foyer. 830 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia évoluer rapidement une offre qui est actuellement principalement constituée de volumes imprimés 119. [270 Ð Cette évolution induit ci-après une analyse de ce qui pourrait constituer une offre adaptée à ce public, qui va massivement avoir besoin d’outils électroniques. Cette réflexion prolonge d’autres développements relatifs aux dictionnaires considérés comme des outils d’accès à l’autonomie (cf. P. Corbin (2008, § 4.) ou Corbin & Gasiglia (2009c, § 1.)) en insistant sur le fait que, afin que les locuteurs soient en mesure de profiter pleinement des services que peuvent rendre les dictionnaires, il faut leur apprendre dès leur plus jeune âge à les apprécier comme sources documentaires, ce qui implique d’entraîner les élèves à les consulter efficacement et à en percevoir la richesse et la qualité informationnelles qui les distinguent d’autres sources plus aléatoires. 120 Deux produits sont envisagés ci-après : le premier hériterait strictement des dictionnaires scolaires actuels, dont il compilerait les textes en leur adjoignant des fonctionnalités propres au support électronique ; le second, le plus novateur et le mieux à même d’aider les élèves, nécessiterait de concevoir des modalités d’accès et des textes assez substantiellement renouvelés. Outre leur support, ces dictionnaires partageraient quatre orientations éditoriales originales (rappelées localement aux §§ 3.1. et 3.2.) : – La coprésence de textes concurrents pour décrire certaines propriétés des items permettrait d’y combiner des sélections d’informations adaptées aux compétences croissantes et aux besoins variés des élèves des écoles et collèges. – En rendant accessibles des descriptions exclues des dictionnaires des élèves des cycles 2 et 3 mais présentes dans ceux destinés à leurs aînés, ils pallieraient l’une des limites des ouvrages imprimés en réduisant, pour les écoliers, le nombre de recherches d’unités linguistiques ou de sens infructueuses et, de ce fait, démotivantes. – En garantissant le maintien de points de repères stables quel que soit l’accroissement de la richesse des informations fournies, ce qui fait actuellement défaut dans les volumes imprimés, ils sécuriseraient les élèves 121. Sur ce point trois objets au moins méritent une attention particulière : (i) la lisibilité pourrait être augmentée par exemple en rem[271 Ð plaçant systématiquement les abréviations par les formes développées correspon119 Cf. nn. 79 et 80 concernant les versions électroniques du Robert junior de 1993 et du Dictionnaire Auzou junior de 2008. Pour l’heure, les exercices faits en classe semblent encore n’entraîner qu’à la manipulation de volumes imprimés. La recherche de l’article dédié à un mot dans l’un de ces volumes implique de savoir lem[270 Ð suite alphabétique des matiser l’item puis de repérer la position relative du lemme en adresse dans la autres adresses, ce qui nécessite un entraînement et qui semble difficile et fastidieux aux débutants. Il pourrait paraître plus aisé aux élèves de chercher un article électronique par hyperappel (comme le Petit Robert le permet à un autre public) ou copie de la forme de l’item motivant la recherche (cf. nn. 131 et 146). 120 L’éducation des lecteurs augmenterait l’impact des améliorations de la lisibilité des dictionnaires (celle de leur structure (cf. p. 252), des informations qu’ils fournissent (cf. p. 272) et de la présentation du texte (cf. n. 5 et pp. 267 et 270-271)). 121 Les dictionnaires imprimés marquent leur appartenance à un segment de marché et valorisent les progrès présumés des utilisateurs. Les dictionnaires électroniques pourraient ne suivre que partiellement cet usage et proposer des visuels évolutifs, adaptés à chaque âge afin de refléter les compétences croissantes des élèves, mais le faire en offrant des repères textuels stables qui soutiendraient les efforts de décodage des contenus informationnels, ce qui est d’autant plus nécessaire que, alors que la quantité et l’abstraction des informations fournies augmentent, certains utilisateurs restent des lecteurs hésitants. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 831 dantes (cf. § 2.3.2.) et en ajoutant des infobulles associées à chaque élément de métalangue ; (ii) les données d’un même type pourraient avoir la même mise en forme, de sorte que les élèves perçoivent que des informations exprimées de manière différente sont en fait de même nature même si elles se complexifient ; (iii) certaines informations, complexes en elles-mêmes pour des élèves qui sont en train d’acquérir les notions grammaticales qui permettent de comprendre les indications du dictionnaire, pourraient recevoir des formulations adaptées aux compétences croissantes du public cible (cf. § 3.2.1.3.). – Enfin, enrichis d’exercices de manipulation comparables à ceux présents dans les manuels scolaires 122 et de jeux motivant des recherches d’informations au sein des articles 123, ils pourraient être des outils au maniement desquels les élèves seraient en mesure de s’entraîner de manière ludique et autonome. Malgré leurs points communs, un dictionnaire compilant d’anciens textes et un autre neuf et conçu pour le support électronique ne pourraient pas mettre en œuvre similairement les orientations éditoriales précédentes : en fonction de leur mode d’élaboration chacun des produits envisagés ne constituerait une ressource innovante qu’à la hauteur des investissements qui lui seraient consacrés. Selon des modalités différentes, ils assureraient aux élèves de trouver des informations utiles pour le décodage d’une unité linguistique en contexte et la vérification orthographique (les deux principaux motifs de consultation des articles), mais, les répertoires actuels n’étant que mal exploitables pour l’aide à l’expression, seul le plus novateur pourrait constituer un outil efficace sur ce terrain et permettre de dépasser les limites présentes en matière d’usage des dictionnaires (cf. Corbin & Gasiglia (2009c, § 5.)). 3.1. Un dictionnaire produit par compilation et posttraitements Une manière économique, pour un éditeur, d’élaborer un dictionnaire électronique pour l’école primaire et le collège, fourni dans les diverses formes d’environnements numériques de travail ou installé sur les ordinateurs scolaires ou familiaux, consisterait [272 Ð à prévoir un réemploi compilatoire 124 de textes déjà publiés, avec accès prioritaire à ceux destinés au niveau scolaire dans lequel est inséré chaque élève, et à la demande aux autres. Pour les textes structurés 125, ceci pourrait être fait en choisissant de ne pas investir dans une refonte de contenu, mais seulement dans la création d’une ma[271 Ð 122 Une partie de ceux évoqués à la note 116, qui visent à permettre aux élèves de se repérer dans le volume imprimé puis dans la page, n’auraient plus de pertinence pour l’entraînement à la consultation d’une version électronique, mais celle-ci nécessite d’autres automatismes, en particulier si des fonctions de recherche comparables à celles des dictionnaires Robert électroniques sont mises à disposition (cf. nn. 94 et 96 et l’« Aide » du Robert junior puis du Robert des enfants). 123 Les matériaux existant dans différents produits scolaires et parascolaires des éditeurs pourraient permettre aux lexicographes, aux informaticiens (ceux de l’informatique éditoriale et ceux qui développent l’interface de consultation) et aux pédagogues de concevoir conjointement ces enrichissements. 124 Les deux compilations déjà publiées par Larousse (cf. nn. 84 et 85) ne ciblaient pas particulièrement les élèves. [272 Ð 125 La plupart des éditeurs semblent avoir structuré leurs dictionnaires destinés aux élèves des cycles 2 et 3, mais ils ne paraissent pas l’avoir fait aussi systématiquement pour les volumes destinés aux collégiens. 832 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia quette adaptée et l’élaboration de transformations informatiques réalisant le nouveau posttraitement des données. 126 Comme c’est généralement le cas dans les versions électroniques, les articles de ce dictionnaire pourraient être enrichis de liens, en particulier depuis les synonymes et contraires listés vers les articles décrivant ces corrélats 127, ce qui faciliterait la circulation dans le texte dictionnairique pour les jeunes lecteurs (cf. n. 119). Un dictionnaire élaboré selon ces principes permettrait assurément de répondre rapidement et à moindre coût à une demande qui risque de devenir pressante. Il pourrait néanmoins ne pas être très satisfaisant : – La modestie relative des textes sources pourrait conduire à s’interroger sur l’opportunité de proposer ceux de certains articles pour le cycle 2, qui, une fois à l’écran, risqueraient de paraître très peu consistants alors que la lisibilité de ceux destinés aux élèves du cycle 3 semble assez bonne même pour des lecteurs débutants. 128 – La progression de la densité informationnelle des articles coprésents n’est pas nécessairement avérée et ceux destinés aux lecteurs les plus confirmés pourraient, pour certains items, ne rien contenir de plus que ceux destinés aux plus novices, voire fournir [273 | moins Ðd’in dications en présupposant chez les premiers une compétence linguistique et une connaissance des objets du monde supérieures. 129 – Le point fort théorique que constitue l’accès à des descriptions plus complexes pourrait par ailleurs devenir un facteur de trouble si certains items étaient décrits de manière non compatible dans des dictionnaires échelonnés dans une progression qui laisse attendre une cohérence entre eux. 130 126 Un enfant qui grandit change, mais ses progrès ne sont pas strictement en phase avec ses changements de classes, ce que l’offre de dictionnaires imprimés ne prend pas en compte autrement qu’en laissant à chacun le choix de consulter l’ouvrage qui lui convient le mieux. Il n’est pas certain qu’un dictionnaire électronique compilant d’anciens textes imprimés puisse aller plus loin dans l’accompagnement des élèves, mais, en rendant tous les articles accessibles à chacun, il leur permettrait au moins d’atteindre aisément ceux qui leur conviennent le mieux lors de chaque consultation. Il serait ainsi possible d’envisager qu’un élève de cours moyen 1 e année accède directement aux articles prévus pour le cycle 3, mais que des boutons lui proposent l’affichage d’une description plus simple (celle normalement destinée aux élèves du cycle 2) s’il trouve la première trop complexe, ou de tout ou partie d’une description plus consistante (destinée aux élèves à la jonction du cycle 3 et du collège ou aux collégiens) s’il n’a pas trouvé de réponse à l’interrogation qui motivait sa recherche ou qu’il est désireux d’en apprendre plus. 127 La mise en place de ces liens impliquerait une révision du texte structuré : un script associerait à chaque corrélat un lien vers un article ayant une adresse de même forme, puis un lexicographe effectuerait le contrôle de la validité de ces liens, corrigerait ceux qui sont orphelins du fait de l’absence d’articles cibles, préciserait ceux qui doivent pointer vers un item ayant au moins un homographe et, éventuellement, spécifierait ceux qui arrivent à des articles constitués de plusieurs subdivisions descriptives afin qu’ils conduisent à la subdivision pertinente. 128 C’est du moins ce qui apparaît à partir des deux dictionnaires scolaires électroniques disponibles, le Robert des enfants et le Dictionnaire Auzou junior. [273 Ð 129 Par exemple, s.v. actuellement, le Larousse des débutants fournit deux définitions qui distinguent deux présents relatifs (« 1. Actuellement signifie : en ce moment. […] 2. Actuellement signifie : à notre époque. »), alors que le Larousse junior et le Dictionnaire du français au collège négligent de signaler cette distinction (« En ce moment. » / « Dans la période présente, en ce moment »). 130 La progression de complexité sans remise en cause des fondements pourrait susciter l’attente d’articles “gigognes”, comme c’est le cas entre l’article addition du Larousse des débutants, qui fournit la définition « L’addition est l’opération qui permet d’ajouter des nombres à d’autres nombres. » et celui du Dictionnaire du T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 833 Ces limites sont principalement induites par le réemploi d’anciens textes et l’absence de refonte qui conduiraient en outre à ne pas mieux exploiter les potentialités du support électronique que cela s’est fait jusqu’ici. Si ce projet était néanmoins jugé viable, sa réalisation retarderait le moment où l’éditeur qui l’engagerait créerait un produit électronique vraiment innovant (cf. n. 98 et § 2.4.). 3.2. Un dictionnaire polymorphe et plurifonctionnel Une option plus stimulante, mais beaucoup plus lourde, consisterait à concevoir un nouveau dictionnaire pour l’ensemble de la scolarité primaire et du collège. Ce dictionnaire aurait une fonction pédagogique à remplir dans la mesure où il devrait initier les jeunes lecteurs à la consultation d’articles de répertoires métalinguistiques en leur montrant les bénéfices qu’ils peuvent tirer de ces outils, ce qui pourrait se faire en explicitant d’une part les étapes d’une recherche d’aide pour la compréhension ou l’expression et d’autre part la nature et l’utilité des informations fournies par chaque segment de texte présenté. Outre cette attention portée à l’explicitation des méthodes de consultation et d’utilisation des informations, ce dictionnaire devrait faire varier les indications fournies et les manières de les présenter en fonction des circonstances de consultation (la finalité – aide à la compréhension ou à l’expression – et la modalité – consultation directe ou hyperappel 131) et des compétences et désirs des lecteurs, ce qui impli[274 | querait que certains Ðélé ments d’information fassent l’objet de plusieurs rédactions, chacune s’insérant dans des combinaisons de modules textuels différents 132 affichables alternativement 133. Selon leurs compétences effectives et leur motif de consultation, les élèves pourraient alors bénéficier de sélections d’informations et de manières rédactionnelles qui leur soient adaptées au sein d’un dictionnaire scolaire évolutif qui paraîtrait se reformuler et s’enrichir au fur et à mesure qu’ils grandissent. français au collège, qui en fournit trois, dont une qui précise celle du dictionnaire précédent (« 2. Opération arithmétique consistant à ajouter un nombre à un autre ») et dont l’affichage pourrait matérialiser son lien avec celle-ci. Tous les articles réunis pour un même item n’entretiendraient cependant pas des relations d’inclusion, cf. n. 129. 131 La consultation directe comme l’hyperappel doivent pouvoir se faire à partir de la forme lemmatisée (celle qui est employée comme adresse d’article) ou d’une autre forme de l’item et avec une orthographe valide ou approximative (susceptible d’être corrigée par le système d’interrogation, cf. n. 146). [274 Ð 132 Il est vraisemblable que certaines reformulations devraient être rédigées, mais un sous-ensemble d’entre elles pourraient être générées automatiquement. C’est le cas des informations relatives à l’orthographe d’usage, pour lesquelles un texte neutre pourrait être établi (par exemple, « addition s’écrit avec deux d ») et inséré dans différents contextes selon que sa lecture est motivée par un défaut de compréhension du mot ou par un doute lors de son emploi et selon l’âge des usagers : pour des élèves du cycle 2, « As-tu observé que le mot addition s’écrit avec deux d ? » vs « Attention à l’orthographe de ce mot : addition s’écrit avec deux d. ». 133 Parmi les affichages proposés, la sélection de celui jugé pertinent pourrait être décidée par ceux qui initient les élèves à la consultation du dictionnaire (les enseignants des plus jeunes lecteurs ou tous les éducateurs, parents et personnels variés qui assurent du suivi ou du soutien scolaire), puis, de manière autonome, par les élèves, ce qui impliquerait qu’un paramétrage de l’affichage puisse être défini et déclaré comme préférentiel à un moment et être redéfini ultérieurement. 834 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia 3.2.1. Soutenir les consultations visant la compréhension d’un item Bien qu’usuelle, la consultation du dictionnaire motivée par un problème de compréhension d’une unité linguistique pourrait être rendue plus aisée et plus profitable en adjoignant quelques fonctionnalités et indications à ce qui est déjà proposé. 3.2.1.1. Mettre en place un hyperappel efficace Parallèlement à la consultation directe, l’insertion du dictionnaire dans un environnement numérique de travail permet de mettre en place son hyperappel à partir de textes lus à l’écran 134 (lectures et exercices de français, de matières d’éveil ou de mathématiques, textes variés consultés sur des pages web, etc. 135) ou en cours de rédaction (dans un traitement de texte ou les interfaces de saisie des exercices), afin que chaque mot perçu comme difficile à comprendre ou à orthographier et à insérer harmonieusement dans un contexte puisse être décodé ou employé en fonction des conseils du dictionnaire (cf. § 3.2.2. pour le deuxième point). [275 Ð L’hyperappel implique que la nomenclature du dictionnaire ne soit pas limitée à 6 000, 20 000 ou 25 000 items, comme celles des volumes imprimés 136, mais qu’elle couvre effectivement tout le vocabulaire que peuvent rencontrer ou utiliser les élèves dans leurs activités scolaires ou périscolaires 137. Pour que cet hyperappel aide les élèves les plus en difficulté, il faudrait par ailleurs que le système d’interrogation soit doté d’un module d’analyse morphosyntaxique et syntaxico-sémantique du contexte d’emploi motivant la consultation, ce qui présenterait deux avantages pour les lecteurs : 134 Certains dictionnaires disposent déjà d’hyperappels, mais leurs performances sont plus réduites que celles envisagées ici. Larousse, par exemple, collabore depuis 2004 avec Babylon, « fournisseur de solutions d’accès à l’information en un clic » (cf. http://www.babylon.com/display.php?id=86&tree=7&level=3&show_id=1757). 135 Cet hyperappel permettrait que chaque mot lu et mal compris puisse être décodé grâce au dictionnaire, et que les élèves soient entraînés à la détection des mots qu’ils sont susceptibles de mal comprendre par la mise en place d’exercices comme, dans le manuel À portée de mots CE1 (cf. n. 116), l’exercice 5, p. 119. [275 Ð 136 Pour expliquer cette limitation, il est souvent indiqué qu’introduire plus d’items à la nomenclature submergerait les élèves avec trop d’informations. Cependant, la consultation se faisant article par article, la présence d’un grand nombre d’articles ne semble pas poser de problème autre que ceux liés au transport dans les cartables puis à la manipulation d’un livre trop volumineux et au repérage de l’item cherché dans la nomenclature abondante, ce qui est résolu avec une version électronique, qui ne pèse rien, qui se consulte de la même manière quelle que soit la quantité d’items décrits et où le lecteur ne voit que ce qu’il a demandé à consulter. 137 Les principes de sélection pourraient être plus accueillants qu’enclins à l’exclusion. L’évaluation des besoins effectifs passerait par le relevé du vocabulaire de manuels scolaires électroniques et imprimés, d’œuvres de littérature de jeunesse, de textes scientifiques et techniques, etc. Les contraintes de place ayant disparu, il ne s’agirait plus d’écarter des items, mais d’offrir une description de chacun, y compris de ceux qui sont réputés être interprétables à partir de leur forme morphologique (les dérivés et composés), qui donneraient lieu à des explications des règles de construction qui ont permis leur existence, pour lesquelles les régularités et divergences de comportements linguistiques observables entre mots construits sur la même règle ou entre mots construits et bases de construction seraient expliquées. Ces observations seraient d’autant plus importantes que, même si la nomenclature était beaucoup plus consistante, elle ne pourrait pas être exhaustive et que la richesse des descriptions présentes contribuerait à forger chez les élèves la compétence lexicale qui leur permettrait de comprendre (en analysant leur construction) les mots construits non décrits. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 835 – celui d’accéder à une description du mot problématique sans avoir à spécifier euxmêmes quels sont le lemme et la catégorie grammaticale de l’item cherché, quand la forme d’appel peut entrer dans le paradigme des formes de deux verbes, comme recouvre, ou dans celui d’un verbe ou d’un nom, comme rencontre ; – et celui d’être directement orientés, au sein de la description du mot cherché, vers les indications qui leur seraient utiles. L’association de chacun des deux types d’analyseurs au système d’hyperappel du dictionnaire ne poserait pas des difficultés techniques de même nature : – Les analyseurs morphosyntaxiques sont des outils fondamentaux en traitement automatique des langues (TAL) 138 et assez performants 139. L’interfaçage de l’un d’eux né[276 Ð cessiterait de l’adapter afin que les codes affectés par lui à chaque item analysé en contexte soient compatibles avec les catégories associées aux items du dictionnaire à consulter 140. – À la différence de ceux-ci, les analyseurs syntaxico-sémantiques sont très dépendants de la nature des tâches qu’ils documentent 141. Pour en adjoindre un à un hyperappel 138 Une large gamme des applications de TAL s’appuie sur leurs résultats : exploration de corpus, recherche d’information, résumé automatique, correction orthographique et grammaticale, etc. 139 Paroubek & Rajman (2000 : 143) évoquent des taux compris entre 90 et 99% , que ne corrige pas un texte [276 Ð http:// de vulgarisation rédigé par Patrick Paroubek en 2006 dans le cadre des projets Technolangue ( | www.technolangue.net/article.php3?id_ article=296) en se fondant sur ce qui s’est dégagé de la campagne d’évaluation Grace (http://www.limsi.fr/TLP/grace). L’évaluation des performances est cependant dépendante de multiples paramètres, dont la richesse du jeu d’étiquettes utilisé, les critères de segmentation des unités à étiqueter, la proportion d’items ambigus et la nature de leur contexte (cf. Paroubek & Rajman (2000 : 143-147)). La chaîne de traitement intégrant l’analyseur a aussi son importance. Ici elle permettrait d’obtenir une analyse morphosyntaxique d’autant moins fautive qu’elle profiterait de la rétroaction de l’analyse syntaxicosémantique pour les items ambigus. 140 Si, quand l’analyseur morphosyntaxique traite un nom commun dans une phrase, il lui associe un lemme et le code utilisé pour ce type de noms enrichi d’une indication de genre et de nombre, il doit ensuite les mettre en relation, dans le dictionnaire, avec un lemme en adresse associé à la catégorisation compatible. Le rapprochement des codes de participes passés employés comme adjectifs avec les verbes ou adjectifs décrits peut être plus délicat à gérer. Pour limiter les difficultés il convient d’harmoniser les codes utilisés dans le dictionnaire et par l’analyseur et d’entraîner celui-ci sur un corpus bien étiqueté s’il fonctionne avec des statistiques. 141 Pour ce qui concerne les analyseurs syntaxico-sémantiques, les besoins spécifiques des divers terrains d’application (cf. n. 138) ne permettent pas aisément de conjoindre les efforts de recherche comme cela a été fait pour les analyseurs morphosyntaxiques. Dans le cadre d’un hyperappel de dictionnaire, l’analyseur syntaxicosémantique utile serait proche de ceux qui sont développés pour la correction orthographique et grammaticale. Dans ce domaine, la définition de la valeur syntaxico-sémantique d’un mot polysémique en fonction de son contexte d’emploi est cruciale pour améliorer les détections de fautes. Pour corriger une forme comme croit apparemment bien orthographiée mais employée à mauvais escient dans la phrase L’abstention croit à chaque scrutin, le système doit repérer le sujet, qui détermine l’accord du verbe, et les éventuels compléments régis par ce dernier, puis typer sémantiquement chaque tête lexicale, afin d’établir quelle est le forme verbale valide (croit ou croît) dans le contexte. La réunion de ces indications permet en outre de repérer dans une phrase quelconque l’absence d’un complément obligatoire, l’emploi d’une préposition invalide à l’initiale d’un complément, etc. Développer un analyseur syntaxico-sémantique qui fonctionne avec des statistiques mais aussi avec des règles linguistiques impose de disposer de descriptions syntaxiques et sémantiques fines pour chaque item, or leur élaboration est longue à réaliser et coûteuse. Pour les mener à bien, les développeurs de correcteurs pourraient souhaiter que leurs linguistes collaborent avec des lexicographes externes. Ces derniers ne disposeraient a priori pas, avant cette association, de descriptions syntaxico-sémantiques prêtes à être intégrées dans un analyseur, mais leur expérience d’analystes des comportements linguistiques ferait 836 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia du dictionnaire, il faudrait que chaque analyse accomplie permette de conduire l’usager vers l’une des descriptions syntaxico-sémantiques disponibles dans le dictionnaire pour l’item motivant la recherche. Ce contexte applicatif pourrait constituer un élément déterminant du développement de l’analyseur à interfacer avec le dictionnaire puisque, comme il faudrait que les critères de décision de l’analyseur soient corrélés aux informations syntaxiques et sémantiques formulées dans le dictionnaire, le travail de des[277 Ð | cription lexicographique pourrait être ac compli à la fois dans une perspective dictionnairique 142 et taliste (pour ce qui serait formalisé et exploité par l’analyseur) 143. La prise en compte de l’analyse (morphosyntaxique et syntaxico-sémantique) du con[278 texte d’hyperappel pour orienter les lecteurs vers Ðla description dictionnairique perque certains d’entre eux seraient à même d’en élaborer en prenant en compte les contraintes particulières de ce contexte applicatif. [277 Ð 142 Pour élaborer des descriptions consultables au sein d’un dictionnaire électronique appelé par un hyperappel couplé à un analyseur syntaxico-sémantique, si les lexicographes devaient choisir les textes dictionnairiques antérieurement publiés qui les documenteraient le mieux, ils auraient intérêt à retenir ceux qui offrent le plus haut degré de décomposition syntaxique et sémantique et qui les aideraient le mieux à forger de nouvelles analyses finement découpées. Cette précision permettrait en outre qu’une partie de la matière descriptive soit formalisée et fournie à l’analyseur afin que celui-ci soit capable d’établir les propriétés du contexte d’emploi puis de les mettre en correspondance avec la subdivision pertinente dans le dictionnaire. Si un lecteur clique sur permettrait lorsqu’il lit Les élèves espéraient que le maître leur permettrait de jouer au ballon durant la récréation de l’étude, l’hyperappel le conduit vers l’une des descriptions du verbe permettre. Si celles-ci ont été élaborées à partir du Dictionnaire du français contemporain de 1966 plutôt qu’à partir du Dictionnaire du français au collège de 2000 (qui dérive du premier, cf. Corbin & Gasiglia (2009b : 45)), l’information fournie au lecteur est plus précise. Le premier, en effet, structure finement sa description, en regroupant les patrons de construction qui diffèrent par la nature syntaxique d’un complément (comme en I.1. ou I.2.) ou qui ne partagent qu’une propriété (la construction pronominale en I.3.), mais dans lesquels le verbe s’interprète de la même manière : – I.1. (« Permettre une chose, que (et le subj.) ») : N0 = SN+ hum ‘agent’, N1 = SN− hum ou que P ‘thème’ ; – I.2. (« Permettre à quelqu’un quelque chose, de (et l’infin.) ») : N0 = SN+ hum ‘agent’, N1 = SN− hum ou V-inf ‘thème’, à N2 = SN+ hum ‘bénéficiaire’ ; – I.3. (« Permettez ») : N0 = SN+ hum ‘agent’ [non réalisé], N1 optionnel = SN− hum ou que P ‘thème’, ou N1 = SN− hum ou V-inf ‘thème’ et à N2 = SN+ hum ‘bénéficiaire’ ; – II.1. (« Permettre quelque chose à quelqu’un ») : N0 = SN− hum ‘agent’, N1 = SN− hum ‘thème’, à N2 = SN+ hum ‘bénéficiaire’ ; – II.2. (« Permettre quelque chose ») : N0 = SN− hum ‘agent’, N1 = SN− hum ‘thème’ ; – (« se permettre ») : N0 = SN+ hum ‘agent’, s’ = ‘bénéficiaire’ coréférent au référent du N0, N1 = SN− hum ou V-inf ‘thème’ [les indications relatives au N1 n’étant pas explicites]. Le second dictionnaire, en revanche, réunit sous 1. les informations des anciennes subdivisions I.1., I.2. et II. 1. et sous 2. ce qui correspondait à la subdivision II.2. (cf. Corbin & Gasiglia (2009b, § 3. et 2009c, § 2.)). Dans le contexte d’emploi ci-dessus, la description utile du Dictionnaire du français contemporain est celle de la subdivision I.2., dont le patron présente une alternative concernant le complément direct (SN ou V-inf ) et dont la double glose est éclairée par le patron (« lui donner la liberté d’en user, de le faire » = lui donner la liberté d’user du référent du SN, lui donner la liberté de faire l’action dénotée par V-inf ). Elle serait plus aisément associable aux contextes qui suscitent l’hyperappel et constituerait une réponse mieux exploitable que celle du Dictionnaire du français au collège, qui décrit sous 1. le sens du verbe au moyen de cinq expressions susceptibles de lui être sémantiquement équivalentes (« lui laisser, lui donner la liberté, la possibilité, le moyen de le faire, lui en donner l’occasion »), alors que seules les deux premières sont plausiblement valides dans ce contexte. Du point de vue technique, interfacer l’analyseur syntaxico-sémantique et le dictionnaire imposerait que le balisage des descriptions contienne un codage des natures syntaxique et sémantique et des rôles des sujets et compléments qui soit compatible avec les codes gérés par l’analyseur. 143 Les descriptions élaborées lors de la rédaction du dictionnaire Encarta français devaient aussi être exploitables pour les applications développées par Microsoft. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 837 tinente 144 aurait par ailleurs une incidence sur la rédaction du texte lexicographique puisqu’elle imposerait la prise en compte du fait que les descriptions pourraient ne plus être toutes consultées, ce qui implique de les autonomiser 145. 3.2.1.2. Aider à identifier une forme graphique La mauvaise compréhension d’un mot lu peut être induite par la non-identification d’une forme fléchie 146, ou par un problème de déchiffrement (non-reconnaissance de la graphie d’un mot connu à l’oral 147), ou encore par une incapacité à relier l’item lu à [279 Ð d’autres mots qui partagent avec lui une parenté étymologique ou une propriété de construction morphologique dont la connaissance permettrait de faire des hypothèses réalistes sur son sens. Si l’identification synchronique d’un item peut être faite dans des termes compréhensibles par tous, l’initiation à l’établissement de familles étymologiques et à l’histoire [278 Ð 144 Afin d’inciter les élèves à élargir leur vocabulaire en lisant le dictionnaire au-delà de ce qui répond strictement à une question ponctuelle, il ne serait pas pertinent de ne présenter que la description utile, mais elle pourrait être affichée avec une mise en valeur alors que d’autres, utiles pour une meilleure connaissance du mot cherché mais pas directement dans le contexte d’hyperappel, seraient présentées de manière neutre voire sous forme condensée. 145 Il ne faudrait en aucun cas qu’une description s’appuie implicitement sur celle de la subdivision qui la précède, ainsi qu’on peut l’observer par exemple s.v. permettre dans le Grand Robert de la langue française : « 1 (Sujet n. de personne ou de chose signifiant une volonté humaine). Laisser faire (qqch.), ne pas empêcher. [… 1 er losange] ♦ Permettre que (suivi du subj.). [… 2 e losange] ♦ (Suivi de l’indic. ou du cond.). [… 3 e losange] ♦ (1572). | Permettre qqch. à qqn. [… 7 e losange] ♦ Spécialt. (En parlant de prescriptions médicales). | Son médecin lui permet le tabac. », où ce qui est introduit après le deuxième losange ne peut être compris qu’à partir de ce qui est sous le premier et où ce qui est sous le septième correspond à un emploi spécialisé de ce qui est présenté sous le troisième. 146 Afin que les élèves prennent l’habitude de mettre en correspondance les diverses formes d’emploi des mots et leur lemme, les affichages de descriptions lexicales pourraient débuter par une rubrique d’identification de la forme à partir de laquelle la consultation a été engagée qui présenterait cette forme, les informations morphosyntaxiques pertinentes pour elle et le lemme correspondant. Si cette forme est écrite fautivement (cf. n. 131), il conviendrait de signaler explicitement l’intervention du correcteur orthographique. En outre, si la forme saisie ou corrigée automatiquement ne correspond pas à ce que souhaitait l’utilisateur, qu’il s’agisse d’une erreur de flexion ou d’une confusion lexicale, il faudrait lui proposer des procédures de recherche de la forme correcte : présentation des autres formes fléchies correspondant au lemme et accompagnées de leur code morphosyntaxique (paradigme de conjugaison ou de flexion en genre et en nombre) ou d’autres lemmes de formes phonétiquement ou graphiquement proches du motif de recherche (à partir desquels un accès aux graphies de leurs formes fléchies serait prévu). Enfin, en cas de consultation par hyperappel à partir d’une forme fautive faisant accéder à l’article décrivant l’item après correction à l’entrée du dictionnaire, si le texte depuis lequel s’effectue l’appel est en cours de rédaction (plutôt qu’en “lecture seule”), il pourrait être souhaitable d’y répercuter ensuite la correction automatique ou celle que l’usager a sélectionnée (ce qui pourrait idéalement s’accompagner du contrôle de la pertinence de celle-ci et des accords en genre et nombre par une correction orthographique et grammaticale automatique du contexte d’emploi). 147 Les versions électroniques de dictionnaires ont la possibilité de fournir des indications de prononciation audibles, ce qui est un gage d’exploitabilité par ceux qui ne savent pas bien décoder les transcriptions en Alphabet Phonétique International. En conséquence, un dictionnaire scolaire pourrait utilement proposer la lecture [279 Ð | flé chies, voire celui des items de chaque lemme, mais il devrait aussi proposer le décodage des formes en contexte (pour illustrer les variations induites par les liaisons et autres phénomènes absents quand les mots sont lus isolément). 838 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia des mots doit tenir compte de la maturité des usagers et de leur capacité à tirer profit des informations fournies 148, et la décomposition morphologique des items (construits en français, ou analysables comme tels bien qu’hérités, ou empruntés 149) doit être présentée de manière à ce que chaque constituant puisse être lié à sa description et, le cas échéant, à l’explication de la règle qui a permis la construction de l’item 150. La systématisation de ces indications permettrait aux lecteurs de tirer un profit immédiat (savoir quelle est la famille étymologique ou la décomposition de l’item dont ils consultent la description) et un profit plus indirect (apprendre à repérer seuls les constituants dont ils ont déjà lu les présentations dans des mots pour lesquels ils ne devront plus systématiquement consulter leur dictionnaire 151 ou qu’ils n’y trouvent pas). 152 [280 Ð 3.2.1.3. Aider à identifier le patron de construction correspondant à un contexte d’emploi Dans les répertoires actuels, quand un item fait l’objet de plusieurs descriptions, le lecteur doit identifier celle qui décrit le sens du mot dans le contexte où il l’a rencontré et où il lui fait difficulté. Cette identification peut être difficile, voire hasardeuse, chez les élèves les moins avancés. Pour les aider à repérer les éléments contextuels qui vont déterminer le choix de la subdivision de description pertinente, il serait utile que les patrons syntaxico-séman- 148 Les lecteurs débutants auront plus de mal que leurs aînés à comprendre des notices étymologiques et historiques richement documentées, faute d’avoir acquis les repères temporels utiles. La coprésence de différentes sélections d’informations au sein du dictionnaire permettrait que, pour les plus jeunes, l’affichage des composants étymologiques soit limité aux items dont les propriétés phonographiques diffèrent de celles qui sont habituellement respectées en français, et que ce comportement remarquable et l’origine étrangère sommairement décrite soient articulés (par exemple par un symbole placé entre les deux renseignements), tandis que celui destiné aux écoliers plus âgés s’enrichirait d’indications pour tous les mots empruntés à des langues étrangères (en n’articulant cette information avec celle portant sur la prononciation que si c’est pertinent) et que celui pour les collégiens étendrait l’information aux mots hérités du latin. Cette progression devrait cependant être contournable par un élève qui voudrait avoir accès à des étymologies que son interface ne présente pas et qui demanderait alors l’affichage d’un texte prévu pour des lecteurs plus âgés. 149 Des mots comme abolition, dynamisation et aseptisation sont analysables comme procédant de la même opération dérivationnelle bien que le premier soit hérité du latin, le second emprunté à l’anglais et le troisième construit en français. 150 La filiation dérivationnelle (réelle ou reconstruite) peut impliquer plusieurs items (abolir t abolition ; dynamique t dynamiser t dynamisation ; asepsie t aseptique t aseptiser t aseptisation) qu’il conviendrait de présenter en explicitant la nature des opérations morphologiques, ce sur quoi elles opèrent (leur sélection catégorielle et sémantique), ce qu’elles produisent (en fonction de leur instruction sémantique) et avec quels ajustements (allomorphie s / t par analogie avec l’étymon grec pour asepsie t aseptique). 151 Si le suffixe -tion a été signalé dans les descriptions déjà consultées d’abolition, dynamisation et aseptisation (cf. nn. 149 et 150), il pourra être identifié dans nationalisation. Quand les élèves liront ce mot (par exemple dans l’énoncé La nationalisation de la société Renault a eu lieu après la mort de Louis Renault ), ils pourront faire l’hypothèse que la nationalisation correspond au fait de nationaliser l’entreprise nommée, de la rendre nationale, propriété de la nation. 152 Les indications fournies localement pour chaque item pourraient utilement être liées à des textes de cadrage [280 Ð partie de ces informations serait également à présenétymologique, historique et morphologique. Une ter pour l’aide à l’expression (cf. § 3.2.2.), puisqu’elles fourniraient des matériaux pour dire la même chose autrement. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 839 tiques soient systématiquement exploités 153, mais, comme souvent leur mention seule ne serait pas suffisante, il pourrait être judicieux de graduer la complexité de leur emploi. Pour les plus jeunes lecteurs, pour lesquels un patron n’est pas interprétable, il conviendrait de poser des questions relatives à la nature syntaxique et sémantique des éléments du contexte (pour un verbe, par exemple, celle du sujet et des compléments 154), sans les nommer puisque les analyses grammaticales de phrases ne sont introduites qu’en fin de cycle 2, mais en induisant leur identification par le repérage d’unités lexicales (comme les conjonctions ou les prépositions), de la nature des référents et de leur rôle actanciel. Il pourrait être utile, pour aider les élèves à déterminer si le sujet réfère à un humain, si le premier complément est une complétive, etc., de fournir, pour chaque prise de décision, deux contextualisations, présentant ou non la propriété en question, accompagnées de l’explicitation de ce qu’elles montrent. 155 Si la consultation du dictionnaire se faisait par hyperappel et dans l’hypothèse où un analyseur syntaxico-sémantique aurait permis d’identifier automatiquement les [281 Ð | éléments discriminants du con texte source, le lecteur aurait eu un accès rapide à la définition qui pourrait l’éclairer mais il n’aurait pas bénéficié des vertus pédagogiques de l’analyse de ce contexte. Afin de lui permettre de voir quels sont les éléments qui motivent le choix d’une description plutôt que d’une autre, il serait utile de lui présenter une copie du contexte source au sein duquel les indices seraient matérialisés et à côté duquel les étapes de prise de décision seraient décrites. 156 3.2.1.4. Aider à évaluer si le sens décrit est celui qui est cherché L’explication des sens des mots se fait usuellement au moyen de définitions illustrées par des contextualisations ou, éventuellement, et plutôt pour les plus jeunes élèves, au moyen de contextualisations glosées (cf. n. 56). Cette seconde solution serait peu per153 Ce qui n’est pas le cas : s.v. permettre dans le Larousse des débutants, par exemple, un patron partiel introduit la première description sémantique (« 1. Permettre à une personne de faire quelque chose, c’est lui donner l’autorisation, le droit de le faire. »), mais aucune indication de construction n’est fournie pour la seconde (« 2. Permettre, c’est rendre possible. »). 154 Pour permettre, par exemple : « Est-ce une ou plusieurs personnes qui font l’action de permettre ? » ; puis, si la première réponse est négative, « Est-ce une loi, un règlement ou quelque chose à quoi on doit obéir qui fait l’action de permettre ? » ; puis « Est-ce que le verbe permettre est suivi de que et d’une sorte de phrase qui explique ce qui est permis et à qui cela est permis ? », etc. 155 Que l’identification de la nature du sujet de permettre se fasse en répondant à une question comparable à celle présentée dans la note 154 ou par la sélection de la valeur + hum ou − hum dans un formulaire plus codé, des contextualisations illustreraient l’alternative : pour des écoliers du cycle 2, par exemple, Le maître permet que les élèves jouent au ballon (associée à l’indication « Le nom maître désigne une personne qui a le droit de décider ce qu’on peut ou doit faire. ») s’opposerait à Le règlement de l’école permet que les élèves jouent au ballon (associée à « Le nom règlement désigne un texte qui indique ce qu’on peut ou doit faire. ») et à Un grillage permet que le ballon ne sorte pas de la cour de récréation (associée à « Le nom grillage désigne un objet qui est utilisé pour faire quelque chose. »). [281 Ð 156 Si un élève consulte son dictionnaire par hyperappel à partir de permettre dans la phrase de la note 142, l’affichage obtenu devrait matérialiser que le contexte pertinent se limite à la complétive complément d’espérer (que le maître leur permettrait de jouer au ballon durant la récréation de l’étude) et qu’au sein de celle-ci il a fallu repérer un ‘agent’ ( N0 = SN+ hum ), un ‘bénéficiaire’ (à N2 = SN+ hum pronominalisé et en position préverbale) et un ‘thème’ (N1 = de V-inf ). 840 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia tinente dans le cadre d’un dictionnaire électronique susceptible, en cas d’hyperappel, de prendre en compte le contexte d’emploi qui motive la consultation. Les descriptions seraient donc à établir selon un modèle classique. 157 Cependant, s’il est admis que la lecture des définitions et des contextualisations associées doit permettre de comprendre ce que signifie le mot cherché, les jeunes lecteurs ne perçoivent pas toujours si la description lue éclaire le sens dans le contexte problématique. Pour les aider, il peut parfois leur être proposé de remplacer le mot cherché par sa définition, mais systématiser ce principe n’est pas possible. Un soutien alternatif consisterait, quand c’est faisable, à [282Ð | associer aux définitions des synonymes (aussi peu poly sémiques que possible) substituables à l’item cherché (préférentiellement sans ajustement à opérer au sein du contexte). En présentant ces substitutions lexicales dans les contextualisations 158 (et éventuellement dans la copie du contexte source en cas d’hyperappel, cf. n. 156), le dictionnaire inciterait les lecteurs à expérimenter eux-mêmes la recherche du sens pertinent d’un mot au moyen de son remplacement par un autre de sens supposé connu. 3.2.1.5. Réflexions conclusives sur la conception d’une interface d’aide à la compréhension Les dictionnaires actuellement destinés aux écoliers et collégiens ont tous vocation à permettre le décodage des mots, mais ils le font parfois en présupposant des connaissances préalables que tous les élèves n’ont pas et, du fait de différentes contraintes, ils le font souvent sans donner les moyens de vérifier si ce qu’ils fournissent est opératoire dans le cadre d’une recherche. Les quelques propositions précédentes visent à rendre les consultations plus efficaces et à permettre aux dictionnaires de mieux jouer leur rôle. 157 L’affichage pour le cycle 2 pourrait proposer des définitions et des contextualisations exprimées en termes simples, quand ceux pour le cycle 3 puis pour le collège raffineraient les découpages opérés (sans revenir cependant sur ceux déjà effectués, cf. n. 130) et enrichiraient le vocabulaire et la syntaxe employés. Pour les contextualisations, il serait utile de concevoir un affichage qui associerait à chacune l’indication de ce qu’elle donne à voir (ce qui est déjà suggéré en note 155 pour celles présentées au cours de la recherche de la description syntaxico-sémantique pertinente). Pour une sélection de contextualisations destinées aux élèves du cycle 2 comme celles ci-après, extraites du Larousse des débutants, il pourrait être envisagé d’expliciter que « As-tu mis de l’ail dans la salade ? » (s.v. ail) réfère à un contexte de la vie courante alors que « J’ai acheté un cornet de frites et un cornet de glace. » (s.v. cornet) décrit une action peu plausible, que « Monsieur Bertin rembourse ses dettes petit à petit. » (s.v. dette) dépeint un comportement connoté positivement mais pas « Adrien gâche du papier quand il dessine. » (s.v. gâcher), que « Les marmottes hibernent dans un terrier. » (s.v. marmotte) énonce une propriété de ces animaux, que « Le géant Gulliver regardait l’armée de Lilliput défiler entre ses jambes. » (s.v. géant ↵ géante) évoque une histoire réputée connue, etc. (cf. Lehmann (1993, § 2.1.) ou Hausmann (2005)). Ces mentions supposeraient que la nature des différentes données présentées dans les contextualisations fasse l’objet d’un typage préétabli et soit codée dans leur balisage. [282 Ð 158 Un menu déroulant pourrait matérialiser la capacité des items à se substituer les uns aux autres sans ajustement syntaxique : positionné sur permet dans la phrase Le maître permet de jouer au ballon, le menu proposerait donne la permission et donne le droit. Voir aussi Corbin & Gasiglia (2009c : 63-64). T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 841 3.2.2. Encourager les consultations visant à améliorer l’expression Les dictionnaires peuvent être de précieux partenaires dans une démarche d’acquisition d’une expression précise, riche et normée 159. Outre le vocabulaire qu’ils fournissent, certains donnent des indications pour la normalisation et la diversification des énoncés. Il est cependant peu probable que les élèves de l’école élémentaire et du collège soient assez rompus au décodage de l’implicite des articles pour profiter de ces indications, qui sont irrégulièrement présentes et inégalement valorisées. Là encore un nouveau dictionnaire électronique pourrait apporter un meilleur soutien. 3.2.2.1. Exploiter chaque mot comme un accès à des rubriques thématiques et à des réseaux lexicaux Les élèves sont souvent incités en classe à améliorer la qualité de leurs écrits en enrichissant leur lexique et en diversifiant son emploi, mais au moment où ils rédigent ils ne disposent que de leur vocabulaire actif pour exprimer leurs idées. De ce constat découlent deux orientations, qui ont déjà été mises en œuvre dans quelques produits [283 Ð | lexicographiques et qui tireraient un plein profit d’un sup port électronique : d’une part un traitement onomasiologique donnant accès à une pluralité de modes d’expression d’une même idée ou notion et d’autre part un réseau analogique explicitant les relations existant entre les mots liés (relations sémantiques entre les items ou relations référentielles entre ce qu’ils dénomment). Les traitements onomasiologiques sont absents de nos répertoires monolingues généraux, mais ils ont été adoptés pour des dictionnaires d’anglais dédiés aux allophones comme le Longman Language Activator 160 et le Longman Essential Activator 161, qui permettent de confronter commodément les valeurs relatives des mots et expressions réunis au sein d’une même rubrique thématique et de trouver ainsi ce qui est le mieux adapté à chaque contexte d’emploi. Sans renoncer au classement alphabétique, qui semble être préféré par les éditeurs français (peut-être parce qu’il sécuriserait les utilisateurs), il serait possible de concevoir que chaque mot soit traité comme un élément d’un index lexical et qu’il renvoie aux subdivisions thématiques qui fournissent des indications pour l’expression de l’un de ses sens. Lors d’une consultation pour une aide à la rédaction, les élèves n’accéderaient pas à un article décrivant un item (dans toutes ses acceptions) mais à une liste de no- [283 Ð 159 Les instructions officielles du cycle 3 valorisent ce type d’aide (cf. n. 115). 160 Dans ce dictionnaire pour apprenants avancés, les unités linguistiques anglaises qui, comme le verbe français permettre pour l’une de ses acceptions, expriment ce qui est lié à la notion de permission y sont décrites au sein de la rubrique « LET/ ALLOW », qui domine douze subdivisions en 1993 et neuf en 2002. Le principe onomasiologique y implique un dégroupement homonymique pour la description des items polysémiques : le verbe allow est objet de traitement dans six subdivisions en 1993 et trois en 2002, isolément ou combiné (be allowed ; allow somebody complete freedom, en 1993 seulement). 161 Le nombre de subdivisions enchâssées sous « LET » est réduit à cinq dans ce volume destiné aux allophones de niveau intermédiaire (en 1997 comme en 2006). Deux subdivisions traitent le verbe allow isolément et une troisième be allowed. 842 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia tions associées à cet item, chacune ouvrant sur un affichage des articles de diverses unités linguistiques qui peuvent l’exprimer, inspiré des deux dictionnaires Longman [284 Ð | évoqués. 162 Au sein de ces sélections d’ar ticles, au moins deux types d’exemples d’emplois pourraient être mobilisés (en fonction de la maturité des utilisateurs) afin de montrer la diversité des usages : des contextualisations forgées pour présenter certaines propriétés explicitement décrites 163, et des contextes d’emploi attestés dans un corpus de textes pédagogiques ou réputés lus par les élèves (documents divers et littérature de jeunesse), ce qui impliquerait de les analyser et de les annoter afin de les introduire strictement là où leur insertion est pertinente 164. Outre le fait que les items serviraient de mots-clés pour atteindre des rubriques notionnelles, ils donneraient accès à des réseaux lexicaux qui fourniraient ce qui fait la richesse des renvois analogiques des dictionnaires Robert (en particulier ceux du Grand [285 Ð | Robert de la langue française 165). 166 La mise en œuvre de ce réseau en dif férerait 162 Opter pour un affichage de l’aide à l’expression tout à fait distinct de celui de l’aide à la compréhension induit une interrogation relative à la réutilisabilité des textes descriptifs d’une interface à l’autre. Une hypothèse optimiste consiste à poser que, s’il a été prévu que les mêmes textes soient affichés lors des deux types de consultations (avec des sélections et un affichage distincts pour chaque contexte, voire des reformulations générées automatiquement à partir d’un texte, cf. n. 132), les rubriques pourraient n’être que virtuelles : il s’agirait de mises en correspondance d’items et d’unités de description, chaque paire étant associée à un identificateur de rubrique thématique (remplacé pour l’affichage par l’intitulé complet associé à la mention des unités linguistiques incluses dans la rubrique). Le travail des lexicographes consisterait alors à établir les paires d’identificateurs d’items et de descriptions pertinentes, mais celles utiles pour l’expression pourraient éventuellement être plus nombreuses et riches que celles qui suffiraient pour la compréhension. Pour permettre, elles devraient en particulier intégrer la description d’expressions comme Il est permis à tout le monde de se tromper !, où le décalage de sens d’“autoriser” vers “ tolérer” est probablement intuitivement compréhensible et qui correspond à une revendication de droit à l’erreur au même titre que les deux tournures Tout le [284 Ð présenter associées à la première pour monde peut se tromper ! et L’erreur est humaine !, qu’il faudrait offrir une variété de formulations idiomatiques (cf. Corbin & Gasiglia (2009c : 64-65)). Pour évaluer la validité de cette démarche, la mise en chantier d’un échantillon test pourrait débuter par l’élaboration des matériaux descriptifs nécessaires pour l’aide à la rédaction (ceux qui sont supposés être les plus diversifiés en même temps que les plus nouveaux) et se poursuivre par une évaluation de leur réemployabilité dans l’autre contexte. Selon l’outillage documentaire à la disposition des rédacteurs, la recherche de formulations alternatives pourrait être plus ou moins aisée. En l’absence d’une base documentaire du type de celles envisagées aux §§ 1.2. à 1.4., la consultation de ressources dictionnairiques spécialisées fournirait des listes de synonymes et de contraires. Pour étendre la sélection à des expressions, la capacité du lexicographe à mobiliser ce qui est utile serait probablement l’adjuvant le plus efficace : la consultation de corpus pourrait peut-être fournir quelques éléments (en extrayant des contextes identiques à un syntagme près par exemple), mais ces recherches risquent d’être aussi coûteuses que peu rentables. 163 Cf. nn. 155, 157 et 173 à 177. 164 Présenter des contextes d’apparition des différentes formes graphiques associées au lemme d’un mot sans tri en fonction de la nature grammaticale de l’item ni de son sens ne pourrait qu’induire de la confusion chez de jeunes élèves insécures. Si ce choix a été fait pour le DAFLES, qui propose d’extraire automatiquement des phrases du journal Le Monde en colligeant celles où figure une des formes de l’item cherché (même si cette forme correspond en contexte à celle d’un autre mot), c’est probablement parce que le public cible a été jugé mieux à même de trier les réponses pertinentes et celles qui ne le sont pas. 165 S.v. café 1, par exemple, le Grand Robert de la langue française liste des séquences en italiques dont certaines servent d’ancrages textuels à des renvois vers d’autres items. Selon les cas, ce sont des noms polylexicaux usuels (« café soluble » ou « café décaféiné »), des cooccurrences privilégiées (« torréfier du café ») ou simplement des descripteurs de sens d’un item cible (« Principe aromatique du café ») : « Plantation (cit. 3), plant de café. Î Caféier. | Balle de café. Î Farde. | Sortes de café : bourbon, martinique, moka; arabica, colombie, robusta. | Grain de café en coque, en cerise*. | Pellicule de café (Î Écalure). | Propriétés stimulantes du T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 843 cependant dans la mesure où, pour être pleinement informatif, chaque lien expliciterait la nature de la relation existant entre les items ou les référents qu’ils nomment, ce qui serait certainement très appréciable, par exemple, pour trouver des noms de parties constituantes des référents nommés (à partir de café, cf. n. 165 : écalure pour l’enveloppe dure de la graine fraîche, caféone pour l’huile essentielle aromatique qui se développe durant la torréfaction), pour accéder à du vocabulaire technique à partir de mots courants (lyophiliser, torréfaction) ou encore pour situer les référents dans des classes d’objets du monde 167 (un express “est un” café pour l’acception de ce nom hyponyme de boisson alors que l’arabica “est un” café pour son acception dans une taxinomie botanique). Mettre en place un réseau analogique de ce type demanderait d’enrichir, du point de vue des connaissances linguistiques et encyclopédiques, les descriptions lexicales destinées aux publics scolaires, ce qui accompagnerait avec cohérence l’augmentation de la nomenclature (cf. n. 137). Mais cette densification de l’information impliquerait d’une part un typage très fin des relations présentées (entre items ou entre référents nommés) 168 et son explicitation dans l’affichage, ce qui serait nouveau, et d’autre part une redondance éventuelle des informations fournies par les réseaux lexicaux et les rubriques thématiques précédemment présentées : si torréfaction est un nom de procédé de transformation accessible à partir du réseau lexical de café, considéré dans son acception de nom de graine, il devrait l’être aussi dans une rubrique thématique liée à café et spécialisée dans les manières d’exprimer que des graines sont transformées (brûlées). Ces accès multiples à des éléments d’information identiques présentés dans une pluralité d’affichages devraient faire l’objet de stratégies explicites élaborées par les lexicographes. Ceux-ci pourraient par exemple décider de traiter différemment les relations posées entre le nom d’un objet et celui d’une transformation qu’il subit et celles établies entre synonymes et antonymes 169. Pour les premières, comme celle existant entre café et torréfaction, ils pourraient considérer que la relation entre les noms n’est pas évidente et qu’elle doit être présentée selon différentes modalités (ce qui induirait son intégration dans le réseau lexical et dans la rubrique thématique dédiée à l’expression des 166 167 168 169 café dues à un alcaloïde (Î Caféine). | Café soluble* (Î Nescafé, marque), lyophilisé (Î Lyophiliser). | Café décaféiné*. | Principe aromatique du café. Î Caféone. | Parfumer une crème, une glace avec de l’essence de café. — Préparation du café. Î Macération, torréfaction ou grillage. | Café vert : café non grillé. | Griller, brûler, torréfier du café (Î Brûloir, torréfacteur). ». Proposer conjointement un traitement onomasiologique et des réseaux lexicaux impliquerait de réfléchir à la présentation des données de ces deux ordres. Serait-il plus opportun de présenter les réseaux lexicaux avec [285 Ð disles liens vers les rubriques thématiques, ou de les insérer au sein de chacune d’elles, ou encore de les tribuer à différents niveaux en fonction des relations prises en compte ? Il faudrait en tout cas réussir à allier richesse et clarté de présentation afin de ne pas submerger les lecteurs et de leur permettre de savoir où est chaque information. Il serait souhaitable qu’à partir de chacune de ces classes les utilisateurs accèdent aux noms des éléments qui la constituent et inversement : c’est ce que fait en partie le Robert junior électronique pour les regroupements d’images et de sons qu’il propose, mais sa couverture est limitée (cf. F. Corbin (2009, I, § 3.)). Leur dénomination doit sans ambiguïté permettre leur identification. Pour les relations antonymiques, une attention particulière pourrait être portée aux cas où l’insertion d’une négation ne crée pas une expression de sens contraire : ne pas permettre, ce peut être soit “ne pas donner la permission”, interdire (antonyme de permettre usuellement mentionné), soit “laisser faire sans formuler de permission”, tolérer (plutôt considéré comme un synonyme de permettre). 844 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia Ð traitements de graines par la chaleur 170), alors que pour les secondes, comme celle existant entre grillage et torréfaction, la coprésence des deux items au sein des rubriques thématiques rendrait le listage des synonymes dans le réseau lexical trop redondant. [286 3.2.2.2. Aider à reformuler en opérant des ajustements syntaxiques La présentation de rubriques thématiques et de réseaux lexicaux a pour vocation première de diversifier l’expression en enrichissant le vocabulaire des élèves, mais une aide à l’expression efficace doit également rendre perceptibles les contraintes syntaxiques et sémantiques en œuvre au sein de chaque formulation proposée. L’identification du patron de construction du contexte où est employé un mot non interprétable est utile pour chercher son sens dans le dictionnaire (cf. § 3.2.1.3.), mais cette démarche est tout aussi nécessaire lors de la recherche d’une formulation adaptée à ce qui doit être énoncé. Imaginons qu’un élève ait forgé une première formulation qui contient déjà la mention des actants impliqués et qu’il consulte son dictionnaire 171 : celui-ci devrait l’aider à percevoir la construction de ce qu’il a rédigé et lui montrer les recouvrements de sens et de constructions susceptibles d’exister avec d’autres formulations. Quand un dictionnaire imprimé présente différents patrons pour une description sémantique d’un mot, les lecteurs doivent pouvoir sentir que ces constructions sont au moins en partie alternatives 172. L’espace dédié à ces indications dans les volumes imprimés est contingenté, ce qui fait qu’elles peuvent être à la fois très codifiées et malaisées à corréler avec ce qui est réalisé dans les contextualisations. Pour que les patrons soient pleinement compréhensibles et exploitables par les élèves pour diversifier leur [287 Ð expression, il serait opportun de les lier explicitement aux définitions et aux contextualisations, dans lesquelles ce qui correspond à chaque élément des constructions devrait pouvoir être identifié 173. Mais au-delà de ces indications minimales, ce sont [286 Ð 170 Les modalités de cette double intégration dépendent des dispositions adoptées pour l’articulation des rubriques thématiques et des réseaux lexicaux, cf. n. 166. 171 Cette fois encore la consultation du dictionnaire pourrait se faire au moyen d’un hyperappel (cf. § 3.2.1.1.) déclenché à partir d’une phrase en cours de rédaction dans un traitement de texte ou directement, en saisissant le mot sur lequel porterait la recherche dans l’interface d’accès au dictionnaire. Dans le premier cas, des analyses morphosyntaxique et syntaxico-sémantique pourraient être effectuées sur la phrase ébauchée, ce qui constitue une similitude de traitement du contexte avec ce qui est envisagé pour les consultations orientées vers la compréhension, mais, dans la situation présente, les analyses seraient plus difficiles du fait du caractère non achevé de la rédaction. Les analyseurs pourraient devoir ne pas tenir compte d’incomplétudes de l’énoncé ou de fautes d’orthographe d’usage ou grammaticale, et donc fonctionner à la manière de ceux qui sont utilisés dans les correcteurs orthographiques et grammaticaux, à ceci près que leurs produits ne seraient pas utilisés pour la détection de fautes mais pour la mise en relation du contexte de l’item faisant l’objet de l’hyperappel avec des patrons syntaxico-sémantiques, puis, à partir d’eux, avec la sélection des rubriques thématiques présentant les manières d’exprimer ce que signifie l’item dans son contexte source. 172 Cf. le patron complexe proposé pour le verbe permettre dans le Dictionnaire du français au collège (voir n. 142) qu’analysent Corbin & Gasiglia (2009c, § 4.3.1.). [287 Ð 173 Par exemple, pour Le maître permet aux élèves de jouer au ballon, il conviendrait de fournir, formulé avec le degré de codification idoine, le patron Qqn permet à qqn de V-inf associé à l’indication du fait que le premier humain détient une autorité à laquelle les seconds se soumettent et que ces derniers bénéficient d’une per- T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 845 les similitudes et différences entre formulations alternatives qui seraient à signaler et à expliquer. Pour ce faire, il faudrait que les rubriques thématiques, qui ont vocation à faire une large place aux synonymes lexicaux (de même distribution ou imposant des remodelages syntaxiques de leurs contextes d’emploi 174) et aux expressions alternatives 175 mais accueilleraient aussi les mots morphosémantiquement liés (comme les dérivés nominaux de verbes à employer dans une construction à verbe support 176) et le même item employé au sein de constructions différentes 177, présentent chaque pos[288 sibilité au sein du même Ðensemble de contextualisations afin de rendre les contraintes des choix lexicaux opérés immédiatement perceptibles. 178 174 175 176 177 [288 Ð 178 mission accordée par le premier dont le thème est exprimé par l’infinitive. Il pourrait également être envisagé d’accompagner chaque contextualisation d’une reformulation présentant les arguments verbaux pronominalisés ( Il le leur permet) et de l’explication du fait que le correspond à un complément direct et leur à un indirect en à. Pour que les constituants syntaxiques de chaque phrase soient affichés de manière différenciée, il conviendrait que les rédacteurs les enchâssent dans des éléments porteurs, en attributs, des valeurs des propriétés syntaxico-sémantiques pertinentes pour la gestion globale des affichages. Ce mode de présentation innovant imposerait de permettre la confrontation des indications du dictionnaire avec les explications des manuels scolaires ou les usages de la classe, ce qui impliquerait que les codes (encadrements et soulignements ci-dessus) soient paramétrables par chaque utilisateur (par une option d’adaptation de la feuille de styles, cf. § 2.3.1.2.). Dans une rubrique dédiée à l’expression de la permission donnée à une personne par quelqu’un qui a autorité sur elle (comme les premières des Longman Language Activator et Essential Activator (cf. nn. 160 et 161), « 1 to allow someone to do something » dans l’édition de 1993 du premier / « 1 to let someone do something » dans l’édition de 2002 du premier et dans le second), si les articles des verbes permettre et autoriser étaient coprésents, les lecteurs tireraient profit, s.v. autoriser, d’une reprise des actants de la contextualisation exploitée dans la note 173 ( Le maître permet aux élèves de jouer au ballon t Le maître autorise les élèves à jouer au ballon), qui rendrait d’autant mieux perceptibles les différences de construction existant entre ces verbes que les contextualisations de chacun des deux seraient accompagnées des mêmes indications : patron expliqué et reformulation pronominalisée ( Qqn autorise qqn à V-inf ; Qqn les y autorise). Dans la rubrique envisagée en note 174 pourraient aussi figurer des formulations comme Le maître dit aux ÉLÈVES qu’ILS (peuvent + ont le droit de) jouer au ballon, où le fait de donner la permission est exprimé par la conjonction du verbe dire et de l’expression de la permission proprement dite. Ces formulations seraient associées aux mêmes informations que celles de la note 173 ( Qqn dit à qqn que P ; Il le leur dit) et à l’indication du fait que le sujet de la complétive coréfère avec les destinataires du message prononcé (matérialisée par les petites capitales ci-dessus). Deux analyses de surface sont alors possibles : Le maître donne la permission aux élèves de jouer au ballon, où l’expression verbale donner la permission a deux compléments, comme permettre en note 173, vs Le maître donne aux élèves la permission de jouer au ballon, où le verbe donner a deux compléments et où l’infinitive est complément du nom permission (ce qui n’est pas matérialisable ici). Pour permettre, dans la même rubrique thématique, trois patrons – Qqn permet (qqch à qqn + à qqn de Vinf + que P) – devraient être illustrés : Le maître permet aux élèves les jeux de ballon ( Il les leur permet) Le maître permet aux élèves de jouer au ballon ( Il le leur permet) Le maître permet que les élèves jouent au ballon ( Il le permet) Il conviendrait aussi de leur présenter de manière comparable les équivalents à la voix passive ainsi que d’autres reformulations qui changent l’orientation du procès : Les jeux de ballons sont autorisés ; Les élèves ont (le droit + la permission) de jouer au ballon. (cf. nn. 175 et 176) ; etc. Si les lexicographes décidaient de présenter les formulations alternatives dans des contextualisations comparables, ces reprises des actants seraient grandement facilitées par l’élaboration d’un outil d’aide à la rédaction de descriptions lexicales capable de propager les contextualisations d’un article à l’autre d’une série lexicale. Cette génération exploiterait les indications des patrons de construction et du balisage analytique (cf. n. 173) de la ou des contextualisation(s) du premier article rédigé. Ainsi, si s.v. autoriser le patron intégrant une infinitive était illustré, comme en note 174, par Le maître autorise les élèves à jouer au ballon, le sys- 846 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia 3.2.2.3. Réflexions conclusives sur la conception d’une interface d’aide à l’expression Jusqu’à présent, les dictionnaires imprimés et leurs dérivés électroniques assurent leur fonction d’aide à l’expression au moyen d’un traitement onomasiologique (pour les Longman Language Activator et Essential Activator) ou, dans le cadre sémasiologique (adopté par les monolingues français), par la mise en place d’un réseau analogique ou au moins synonymique et antonymique, et, plus implicitement, par la mention d’indications de construction ou de descriptions de sens susceptibles d’induire des associations lexicales et par la présentation de contextualisations qui donnent à voir les propriétés importantes pour réemployer à bon escient et convenablement les items décrits 179. Tous ces produits s’appuient sur les compétences des élèves, qui doivent utiliser ce qu’ils savent pour faire dire aux descriptions ce qu’elles montrent. Les écoliers et les collégiens constituent un public particulier qui apprend tout à la fois à accéder aux informations écrites, à enrichir intensivement son vocabulaire, à intégrer les règles [289 Ð | d’une expression normée et créative. Ces apprentis sages simultanés suscitent chez certains une insécurité, une difficulté à réexploiter ce qui est tout juste appris. Un dictionnaire destiné à ce public ne doit donc pas être un texte qui donne à voir à qui saura regarder mais un recueil aussi explicite que possible dans tous les domaines. Les pistes qui viennent d’être évoquées concernant l’aide à l’expression revisitent les principes d’un traitement onomasiologique et d’un réseau lexical en leur adjoignant diverses modalités d’explicitation de ce qui est présenté. L’élaboration d’un outil de cette envergure nécessiterait un important travail préparatoire afin d’établir quels peuvent être les meilleurs moyens pour permettre que les usagers mettent en relation ce qu’ils veulent dire avec ce que le dictionnaire propose. Cette réflexion reposerait sur – la définition des modalités de travail les plus efficaces pour regrouper les unités lexicales à présenter : lister les unités linguistiques à intégrer dans les rubriques thématiques s’apparenterait à une tâche de sélection de nomenclature macrostructurelle, mais il s’agirait ici de constituer une entrée par sens pour chaque mot inventorié et de lister les expressions, qui sont souvent relativement peu nombreuses et traitées microstructurellement ; – la méthodologie élaborée pour articuler les descriptions présentées dans les interfaces d’aide à l’expression et d’aide à la compréhension : qu’il s’agisse du réemploi des mêmes textes ou de l’exploitation d’autres développements (qui devraient présenter une cohérence totale pour ne pas induire de trouble), il conviendrait d’en définir strictement les modalités de rédaction et de sélection pour les différents affichages ; tème proposerait Le maître permet de jouer au ballon à les élèves s.v. permettre. Les limites de ce qui serait faisable automatiquement impliqueraient que les contextualisations générées soient révisées par les lexicographes en particulier pour ce qui concerne les amalgames (à les t aux) et les placements stylistiques des constituants au sein des phrases. Si la contextualisation générée n’était pas retenue ou était révisée (avec remplacement d’un actant par exemple), cette intervention serait signalée en retour aux rédacteurs dans l’article autoriser. Cet outil ne pourrait cependant fonctionner qu’en disposant des patrons déclarés pour chaque item, ce qui impliquerait une rédaction en deux temps (patrons et définitions, puis contextualisations balisées analytiquement les illustrant). 179 Van de Velde (2009, § 1.3.), dans ce volume, défend l’idée qu’il est souhaitable de réduire la part du métalangage et de montrer les propriétés linguistiques pertinentes dans les contextualisations. Ceci suppose que les lecteurs aient un bagage suffisant pour qu’ils puissent repérer ces propriétés de manière autonome. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 847 – la créativité ergonomique, dont dépend la maniabilité du produit et qui constitue un terrain où les éditeurs de dictionnaires n’ont pas nécessairement encore de compétence. 3.3. Réflexions conclusives sur l’élaboration d’un dictionnaire scolaire électronique L’espace créatif offert par la présentation des textes dictionnairiques sur un support électronique ouvre de larges perspectives pour l’enrichissement des informations et l’accroissement de leur lisibilité. Les orientations éditoriales présentées ci-dessus n’épuisent pas les champs d’investigation et ne prétendent pas fournir de solutions clé en main, elles suggèrent des pistes de recherche que les éditeurs pourraient ou non reprendre à leur compte s’ils entreprenaient de concevoir un produit qui aiderait mieux le public scolaire dans son appropriation des codes linguistiques, ce qui serait susceptible de donner conjointement une impulsion bénéfique à l’édition électronique et à l’éducation au maniement spontané de dictionnaires 180. [290 Ð 4. Conclusions Les réflexions présentées dans cette contribution ont été nourries par les témoignages des professionnels intervenant dans la formation de lexicographes (cf. n. 1) que j’anime depuis dix ans avec P. Corbin (cf. Corbin & Gasiglia (2009b, n. 4)). Ma position de témoin extérieur associée à la posture d’enseignant-chercheur à l’affût des changements de tendances susceptibles de motiver un infléchissement des programmes du master me conduit à souhaiter remercier nos partenaires en leur livrant un état prospectif qui, s’ils viennent à le lire, saura peut-être en retour stimuler leur réflexion : c’est en tous cas mon souhait. L’étude qui se termine fait ressortir que les évolutions informatiques déjà engagées ont transformé les modes d’élaboration des dictionnaires sans modifier la représentation que les lexicographes ont de leurs produits et que, couplées avec des contraintes de rentabilisation, elles ont changé les relations existant entre équipes de rédaction et d’informatique éditoriale, les secondes pouvant assister le travail des premières en œuvrant à leur côté, de la conception du projet à la composition du texte saisi et structuré, ou éventuellement exploiter seules celui antérieurement réalisé par les premières pour fabriquer de nouveaux produits éditoriaux. [289 Ð 180 Cette entreprise donnerait corps, à sa manière, au projet d’Atkins (2002a [1996] : 2) : « It is up to us to take up the real challenge of the computer age, by asking not how the computer can help us to produce old-style dictionaries better, but how it can help us to create something new: to look at the needs of dictionary users of every language, and every walk of life, users as diverse as people themselves, and give them the kind of information they need for whatever they are using the dictionary for, and not simply the popular selection of facts that will pack semi-legibly inside book covers. I respect and admire the achievements of our great predecessors. But if they were here today, I put it to you that they would not be simply reproducing the achievements of their elders, or revising the great works of the past: they would be rooting for a new kind of dictionary, one in which the computer plays its rightful, creative role. ». 848 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia Les éléments les plus spéculatifs qui ont été présentés pourraient être considérés par nos partenaires comme étant trop peu réalistes et ce jugement serait mérité dans le contexte actuel : l’élaboration d’une ressource documentaire enrichie régulièrement constituerait un travail minutieux à confier à des linguistes chevronnés préposés stablement à ces tâches, ce qui va à l’encontre d’une politique de recrutement qui privilégie les missions ponctuelles ; l’élaboration d’un dictionnaire électronique renouvelant les modes de consultation impliquerait un enrichissement des descriptions de chaque item et l’introduction de fonctionnalités absentes des interfaces actuelles, ce qui aurait un coût de conception et de production important. Sans méconnaître une partie au moins des entraves des éditeurs, je les ai sciemment ignorées, préférant, pour cette prospective, inscrire mon propos dans une optique résolument optimiste en prenant le parti de faire comme si la crise de création que traverse l’édition lexicographique ne pouvait pas durer sans être dommageable pour l’activité elle-même, ce que les éditeurs seraient susceptibles de tenter de prévenir en cherchant [291 de nouveaux moyens d’investir ou des Ðressources externes (subventions, par exemple du ministère de l’Éducation nationale, pour des développements particuliers, contrats financés pour des collaborations universitaires, etc.). Il est malaisé de dire si et quand les éditeurs pourront sortir de la période de gestion drastique des catalogues qu’ils traversent actuellement (cf. F. & P. Corbin (2008) et P. Corbin (2008)), mais si les spéculations que je suis en mesure d’élaborer aujourd’hui stimulaient l’imagination de nos partenaires en leur offrant de la matière à partir de laquelle réagir, et qu’elle contribue, à sa modeste mesure, à ce qu’ils sortent de cette crise avec des projets innovants, j’aurais le sentiment que la collaboration que nous entretenons aura été tout à fait fructueuse pour chacun de nous. Bibliographie Dictionnaires et encyclopédies Alpha. Encyclopédie alphabétique Hachette, 26 vol., Paris, Le Livre de Paris / Hachette, 1995. Base lexicale du français, http://ilt.kuleuven.be/blf/. Bibliorom Larousse, CD-ROM PC, Paris, Liris Interactive / Larousse / Microsoft Corporation, 1996 ; Bibliorom Larousse 2.0, Havas Interactive / Larousse / Microsoft Corporation, 1998. Dictionnaire Auzou débutant, Paris, Auzou, 2008. Dictionnaire Auzou junior, Paris, Éditions Philippe Auzou, 2006 ; nouv. éd., avec CD-ROM PC / Mac OS, 2008. Dictionnaire compact français-allemand / allemand-français, Paris, Larousse - SEJER, 2004 ; nouv. éd., Dictionnaire maxipoche plus français-allemand / allemand-français, Larousse, 2008. Dictionnaire compact français-anglais / anglais-français, Paris, Larousse - SEJER, 2004 ; nouv. éd., Dictionnaire maxipoche plus français-anglais / anglais-français, Larousse, 2008. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 849 Dictionnaire compact français-espagnol / espagnol-français, Paris, Larousse - SEJER, 2004 ; nouv. éd., Dictionnaire maxipoche plus français-espagnol / espagnol-français, Larousse, 2008. Dictionnaire compact français-italien / italien-français, Paris, Larousse - SEJER, 2004 ; nouv. éd., Dictionnaire maxipoche plus français-italien / italien-français, Larousse, 2008. Dictionnaire d’apprentissage du français langue étrangère ou seconde [DAFLES ] : voir Base lexicale du français. Dictionnaire de l’Académie française, 9 e éd., 2 vol. parus (A-Enz, Éoc-Map), Paris, Imprimerie Nationale Éditions, 1992-2000 ; éd. en ligne : http://atilf.atilf.fr/academie9.htm. [292 Ð Dictionnaire des anglicismes, Paris, Librairie Larousse, 1982. Dictionnaire des citations françaises et étrangères, Paris, Larousse, 1995. Dictionnaire des combinaisons de mots, Paris, Le Robert, 2007. Dictionnaire du français au collège, Paris, Larousse, 2000. Dictionnaire du français contemporain, Paris, Librairie Larousse, 1966. Dictionnaire français Hachette électronique, Paris, Hachette Multimédia / Hachette Livre, 2001 ; nouv. pressage, 2004. Dictionnaire Hachette benjamin, Paris, Hachette Éducation, 1996. Dictionnaire Hachette encyclopédique de poche, Paris, Hachette, 2001. Dictionnaire Hachette junior, Paris, Hachette Éducation, 1998 ; nouv. éd., 2006. Dictionnaire Hachette langue française, Paris, Hachette, 2001. Dictionnaire Hachette multimédia. Le grand dictionnaire encyclopédique multimédia, CDROM PC, Paris, Hachette Multimédia, 1993 ; Mac, 1995 ; nouv. éds, 1996, 1998, 1999, 2000, 2001, 2002, 2005. Dictionnaire Hachette-Oxford = Le dictionnaire Hachette-Oxford français- anglais / anglaisfrançais, Oxford - New York - Toronto, Oxford University Press / Paris, Hachette Livre, 1994. Version électronique : CD-ROM PC, Hachette Multimédia, 1997. Dictionnaire pratique du français, Paris, Hachette, 1987. Encarta = Encarta collection 2003, 4 CD-ROM PC, Redmond, Microsoft Corporation, 2002. Encyclopédie Hachette multimédia, millésime 1999, 2 CD-ROM PC / Mac OS, Paris, Hachette Multimédia, 1998. Nouv. éds : millésime 2001, 2000 ; millésime 2003, 2002 ; millésime 2004, 2003 ; PC / Mac OS / Linux, millésime 2005, 2004 ; millésime 2007, 2006. Grand dictionnaire des synonymes et contraires, Paris, Larousse, 2004. Grand Larousse de la langue française en sept volumes, Paris, Librairie Larousse, 1971-1978. Grand Larousse en 5 volumes, Paris, Larousse, 1987. Grand Larousse italien, Paris, Larousse / Milano, Sansoni, 2006 ; éd. italienne, Il Larousse francese. Dizionario français-italien italiano-francese, avec CD-ROM PC / Mac OS / Linux, Milano, Rizzoli / Paris, Larousse, 2006. Grand Robert de la langue française = Le Grand Robert de la langue française. Dictionnaire alphabétique et analogique de la langue française, 2 e éd. entièrement revue et enrichie, 9 vol., Paris, Le Robert, 1985 ; nouv. éd. augmentée, 6 vol., 2001. Grand Robert de la langue française électronique = Le Robert électronique, CD-ROM DOS + guide d’utilisation, Paris, Dictionnaires Le Robert / Bruxelles, Bureau van Dijk, 1989 ; 850 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia Mac, 1992 ; PC, version 1.4, 1994 ; version 2.0, Le Grand Robert de la langue française, Paris, Le Robert - SEJER / Bureau van Dijk, 2005 ; Mac OS, version 2.1, 2008. Grand Robert & Collins électronique = Le Grand Robert-Collins électronique, CD-ROM PC, version 1.0, Paris, Dictionnaires Le Robert - VUEF / Bruxelles, Bureau van Dijk, 2003 ; DVD-ROM PC / Mac, version 2.0, Le Grand Robert & Collins, Paris, Dictionnaires Le Robert / Glasgow, HarperCollins Publishers / Bruxelles, Bureau van Dijk, 2008. Grand usuel larousse. Dictionnaire encyclopédique, 5 vol., Paris, Larousse, 1997. [293 Ð Larousse Chambers = Grand dictionnaire Larousse Chambers français-anglais / EnglishFrench, Paris, Larousse, 1999 ; nouv. éd., Larousse Chambers. Dictionnaire françaisanglais / English-French, Larousse - VUEF, 2003. Versions électroniques : CD-ROM PC, version 1, Larousse / Havas Interactive, 1999 ; version 2, Larousse / Mysoft, 2007. Larousse des débutants, Paris, Larousse, 2005. Larousse des noms communs, Paris, Larousse, 2008. Larousse expression. Le multidictionnaire du français au quotidien, CD-ROM PC, Paris, Larousse - VUEF, 2002. Nouv. diffus. : Larousse multidico, Emme, 2004 ; La GarenneColombes, Avanquest, 2006 ; Larousse illico multidico, 2007 ; Larousse multidico, 2008. Larousse français-espagnol. Dictionnaire français-espagnol / español-francés, CD-ROM PC, Paris, Larousse / Emme, 2004 ; nouv. diffus., Mysoft, 2007. Larousse illico dictionnaire bilingue français-allemand allemand-français, CD-ROM PC, Paris, Larousse / Babylon / Emme, 2005 ; nouv. diffus., La Garenne-Colombes, Avanquest, 2007. Larousse illico dictionnaire bilingue français-anglais anglais-français, CD-ROM PC, Paris, Larousse / Babylon / Emme, 2005 ; nouv. diffus., La Garenne-Colombes, Avanquest, 2007. Larousse illico dictionnaire bilingue français-espagnol espagnol-français, CD-ROM PC, Paris, Larousse / Babylon / Emme, 2005 ; nouv. diffus., La Garenne-Colombes, Avanquest, 2007. Larousse illico dictionnaire bilingue français-italien italien-français, CD-ROM PC, Paris, Larousse / Babylon / Emme, 2005 ; nouv. diffus., La Garenne-Colombes, Avanquest, 2007. Larousse illico dictionnaire multilingue français-anglais anglais-français – français-espagnol espagnol-français – français-allemand allemand-français, CD-ROM PC, Paris, Larousse / Babylon / Emme, 2005 ; nouv. diffus., La Garenne-Colombes, Avanquest, 2007. Larousse illico multidictionnaire français, CD-ROM PC, Paris, Larousse / Babylon / Emme, 2005 ; nouv. diffus., La Garenne-Colombes, Avanquest, 2007. Larousse illico multidictionnaire français – français-anglais anglais-français – français-espagnol espagnol-français, CD-ROM PC, Paris, Larousse - Babylon / La Garenne-Colombes, Avanquest, 2007. Larousse junior, Paris, Larousse, 2003 ; nouv. éd., Dictionnaire junior, 2008. Larousse multilingue, CD-ROM PC, Paris, Larousse / Emme, 2004 ; nouv. diffus., La GarenneColombes, Avanquest, 2007. Larousse pratique. Dictionnaire du français au quotidien, Paris, Larousse, 2003 ; nouv. éd., Dictionnaire compact, 2008. Lexis. Dictionnaire de la langue française, Paris, Librairie Larousse, 1975 ; éd. revue et corrigée, Larousse, 2002 ; nouv. tir., Le Lexis. Le dictionnaire érudit de la langue française, 2009. Longman Essential Activator. Put your ideas into words, Harlow, Longman, 1997 ; 2 e éd., avec CD-ROM PC, 2006. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 851 Longman Language Activator. The world’s first production dictionary, Harlow, Longman, 1993 ; 2 e éd., Longman Language Activator. Helps you write and speak natural English, 2002. Macmillan English Dictionary for Advanced Learners, avec CD-ROM PC, version 1.4, Oxford, Macmillan, 2002. Mediadico, http://www.mediadico.com/. [294 Ð Mon premier dictionnaire avec Martine, Paris, Delagrave / Tournai, Casterman, 2003. Nouveau Petit Robert = Le Nouveau Petit Robert. Dictionnaire alphabétique et analogique de la langue française, Paris, Dictionnaires Le Robert, 1993. Nouv. éds : millésime 2006, Dictionnaires Le Robert - SEJER, 2005 ; millésime 2007, 2006 ; millésime 2008, 2007 ; millésime 2009, avec ou sans CD-ROM PC / Mac, 2008. Nouveau Petit Robert électronique : voir Petit Robert électronique. Petit Larousse électronique 1997, Paris, Larousse / Liris Interactive, 1996. Petit Larousse illustré 2003, avec ou sans CD-ROM PC, Paris, Larousse - VUEF, 2002 ; millésime 2004, 2003 ; Larousse, millésime 2005, 2004 ; millésime 2006, 2005 ; millésime 2007, 2006 ; millésime 2008, 2007 ; millésime 2009, 2008. Petit Larousse illustré 2008 grand format, Paris, Larousse, 2007 ; millésime 2009, 2008. Petit Robert électronique = Le Petit Robert. Dictionnaire de la langue française, CD-ROM PC, Paris, Liris Interactive / Dictionnaires Le Robert / van Dijk, 1996 ; PC / Mac, version 2.0, Le Nouveau Petit Robert de la langue française. Dictionnaire alphabétique et analogique de la langue française, Dictionnaires Le Robert - VUEF / Bureau van Dijk, 2001 ; millésime 2007, version 3.0, Dictionnaires Le Robert - SEJER / Bureau van Dijk, 2006 ; millésime 2008, version 3.1, 2007 ; millésime 2009, version 3.2, 2008. Robert des enfants : voir Robert junior électronique. Robert & Collins compact plus = Le Robert & Collins compact plus. Dictionnaire françaisanglais anglais-français, 6e éd., Glasgow, HarperCollins Publishers / Paris, Dictionnaires Le Robert - SEJER, 2006. Robert & Collins senior = Le Robert & Collins senior. Dictionnaire français-anglais anglaisfrançais, 6 e éd., Glasgow, HarperCollins Publishers / Paris, Dictionnaires Le Robert SEJER, 2002 ; 8 e éd., Le Robert & Collins. Dictionnaire français-anglais anglais-français, 2006. Robert & Collins super senior = Le Robert & Collins super senior. Grand dictionnaire français-anglais / anglais-français, 2 e éd., 2 vol., Glasgow, HarperCollins Publishers / Paris, Dictionnaires Le Robert - SEJER, 2000 ; 3e éd., Le Grand Robert & Collins. Dictionnaire français-anglais anglais-français, 2008. Robert junior = Le Robert junior illustré, Paris, Dictionnaires Le Robert, 1993 ; nouv. éds entièrement revues et enrichies, 1999, 2005. Robert junior électronique = Le Robert junior, CD-ROM PC, version 1.0, Paris, Dictionnaires Le Robert - Havas Interactive / Bruxelles, Bureau van Dijk, 1998 ; version 1.1, PC / Mac, 1999 ; nouv. pressage, 2003 ; version 1.2, Le Robert des enfants, Dictionnaires Le Robert SEJER / Bureau van Dijk, 2006. Thésaurus = Thésaurus Larousse. Des idées aux mots, des mots aux idées, Paris, Larousse, 1991. 852 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia Trésor de la langue française. Dictionnaire de la langue du XIX e et du XX e siècle (1789-1960), 16 vol., Paris, Éditions du Centre National de la Recherche Scientifique (tt. 1-10) / Gallimard (tt. 11-16), 1971-1994. Trésor de la langue française informatisé, version 4, 2002, http://atilf.atilf.fr/tlfv3.htm ; CD-ROM PC / Mac OS + livre d’accompagnement, Paris, CNRS Éditions, 2004. [295 Ð Autres références ALTMAN J. & POLGUÈRE A. (2003), « La BDéf : base de définitions dérivée du Dictionnaire explicatif et combinatoire », in S. Kahane & A. Nasr éds, Actes de la première conférence internationale de théorie Sens-Texte (MTT’2003, Paris, 16-18 juin 2003), Paris, École Normale Supérieure, pp. 43-54. À portée de mots pour le CE1 = LECLEC’H-LUCAS J., LUCAS J.-C. & MEUNIER R., Français CE1 cycle 2 niveau 3. À portée de mots, Paris, Hachette Éducation, 2003. À portée de mots pour le CE2 = LECLEC’H-LUCAS J., LUCAS J.-C. & MEUNIER R., Français CE2 cycle 3 niveau 1. À portée de mots, Paris, Hachette Éducation, 2005. À portée de mots pour le CM1 = LECLEC’H-LUCAS J., LUCAS J.-C. & MEUNIER R., Français CM1 cycle 3 niveau 2. À portée de mots, Paris, Hachette Éducation, 2007. ATKINS B.T.S. (1995), « Analysing the verbs of seeing: a frame semantics approach to corpus lexicography », in S. Gahl, C. Johnson & A. Dolbey eds, Proceedings of the Twentieth Annual Meeting of the Berkeley Linguistics Society (1994), Berkeley, Berkeley Linguistics Society, University of California at Berkeley, pp. 42-56. ATKINS B.T.S. (2002a), « Bilingual dictionaries: past, present and future », in Corréard M.-H. éd., pp. 1-29 ; 1e éd. in M. Gellerstam, J. Järborg, S.-G. Malmgren, K. Norén, L. Rogström & C. Röder Papmehl eds, Euralex’96 Proceedings, Göteborg, Göteborg University, 1996, pp. 515-546. ATKINS B.T.S. (2002b), « Then and now: competence and performance in 35 years of lexicography », in A. Braasch & C. Povlsen eds, Proceedings of the Tenth EURALEX International Congress, EURALEX 2002. Copenhagen, Denmark, August 13-17, 2002, vol. 1, Copenhagen, Center for Sprogteknologi, pp. 1-28. ATKINS B.T.S. & RUNDELL M. (2008), The Oxford Guide to Practical Lexicography, Oxford, Oxford University Press. ATKINS B.T.S., FILLMORE C. & JOHNSON C. (2003), « Lexicographic relevance: selecting information from corpus evidence », International Journal of Lexicography 16.3, pp. 251-280. ATKINS B.T.S., RUNDELL M. & SATO H. (2003), « The contribution of FrameNet to practical lexicography », International Journal of Lexicography 16.3, pp. 333-357. BÉJOINT H. (2007), « Informatique et lexicographie de corpus : les nouveaux dictionnaires », Revue française de linguistique appliquée XII.1, pp. 7-23. BÉJOINT H. (2009), « Lexicographie et linguistique : quelques réflexions sur le domaine anglais », Lexique 19, pp. 117-158. BLUMENTHAL P. & HAUSMANN F.J. (2006), « Présentation : collocations, corpus, dictionnaires », Langue française 150, pp. 3-13. BRAASCH A. (2004), « A health corpus selected and downloaded from the web - Is it healthy enough? », in G. Williams & S. Vessier eds, vol. 1, pp. 71-78. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger 853 CITRON S. & WIDMANN T. (2006), « A bilingual corpus for lexicographers », in E. Corino, C. Marello & C. Onesti eds, Atti del XII Congresso Internazionale di Lessicografia, Torino, 6-9 settembre 2006, 2 vol., Alessandria, Edizioni dell’Orso, pp. 251-255. [296 Ð CORBIN D. (1990), « Homonymie structurelle et définition des mots construits. Vers un “dictionnaire dérivationnel” », in Centre d’études du lexique, J. Chaurand & F. Mazière éds, La définition, Paris, Larousse, pp. 175-192. CORBIN D. (à paraître), Le lexique construit. Méthodologie d’analyse. CORBIN D. & CORBIN P. (1991a), « Un traitement unifié du suffixe -ier(e) », Lexique 10, pp. 61-145. CORBIN D. & CORBIN P. (1991b), « Vers le Dictionnaire dérivationnel du français », Lexique 10, pp. 147-161. CORBIN F. (2009), « L’iconographie du Robert junior (1993-2004) », Lexique 19, pp. 69-115. CORBIN F. & CORBIN P. (2008), « Les dictionnaires sont des voitures comme les autres », in F. Maniez & P. Dury éds, Lexicographie et terminologie : histoire de mots. Hommage à Henri Béjoint, Travaux du CRTT, Gap, Louis Jean Imprimeur, pp. 47-65. CORBIN P. (1998), « La lexicographie française est-elle en panne ? », in Cicle de conferències 96-97. Lèxic, corpus i diccionaris, Barcelona, Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra, pp. 83-112. CORBIN P. (2002), « Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français », in F. Melka & M.C. Augusto eds, De la lexicologie à la lexicographie / From Lexicology to Lexicography, Utrecht, Utrecht Institute of Linguistics OTS, pp. 8-37 ; en ligne : http://www-uilots.let.uu.nl/research/Publications/Melka_Augusto.pdf, pp. 9-38. CORBIN P. (2004), « Théorie et pratique de la formation professionnelle de lexicographes : treize ans d’expérience lilloise », in G. Williams & S. Vessier eds, vol. 1, pp. 13-35 [éd. fautive] ; rééd. conforme au texte original in P. Corbin (2006), vol. 3, pp. 1161-1186. CORBIN P. (2006), Avec des dictionnaires pour compagnons, habilitation à diriger des recherches, 3 vol., Université Charles de Gaulle - Lille 3 / L’Atelier C. CORBIN P. (2008), « Quel avenir pour la lexicographie française ? », in J. Durand, B. Habert & B. Laks resp., Congrès mondial de linguistique française. Paris, 9-12 juillet 2008, Paris, Institut de Linguistique Française / EDP Sciences, http://www. linguistiquefrancaise. org/, pp. 1227-1250. CORBIN P. & GASIGLIA N. (2004), « Lire les dictionnaires (2). Une DTD pour le Robert & Collins junior bilingue : spéculations métalexicographiques », Cahiers de lexicologie 84, pp. 135-194. CORBIN P. & GASIGLIA N. (2009a), « Approche des métaphores dans le lexique afférent à la lexicographie », in P. Dury, F. Maniez, N. Arlin & C. Rougemont dir., La métaphore en langues de spécialité, Travaux du CRTT, Grenoble, Presses Universitaires de Grenoble, pp. 83-116. CORBIN P. & GASIGLIA N. (2009b), « Changer les dictionnaires ? Une pluralité d’approches », Lexique 19, pp. 7-38. CORBIN P. & GASIGLIA N. (2009c), « Le monde étrange des dictionnaires (9). La quadrature du cercle des dictionnaires monolingues imprimés pour l’expression : le cas du Dictionnaire du français au collège », Lexique 19, pp. 41-68. 854 Des usages en corpus aux descriptions dictionnairiques : HDR – N. Gasiglia CORRÉARD M.-H. ed. (2002), Lexicography and Natural Language Processing. A festschrift in honour of B.T.S. Atkins, EURALEX. [297 Ð DAL G. & NAMER F. (2000), « Génération et analyse automatiques de ressources lexicales construites utilisables en recherche d’information », Traitement automatique des langues 41.2, pp. 423-446. DURAND J., HABERT B. & LAKS B. resp. (2008), Congrès mondial de linguistique française. Paris, 9-12 juillet 2008, Paris, Institut de Linguistique Française / EDP Sciences, disque et éd. en ligne : http://www.linguistiquefrancaise.org/index.php?option=toc&url =/articles/cmlf/abs/2008/01/contents/contents.html&Itemid=287&lang=fr. FILLMORE C. & ATKINS B.T.S. (1992), « Towards a frame-based organization of the lexicon: the semantics of RISK and its neighbors », in A. Lehrer & E. Kittay eds, Frames, Fields and Contrast: New essays in semantic and lexical organization, Hillsdale, Lawrence Erlbaum Associates, pp. 75-102. FILLMORE C. & ATKINS B.T.S. (1994), « Starting where the dictionaries stop: the challenge for computational lexicography », in B.T.S. Atkins & A. Zampolli eds, Computational Approaches to the Lexicon, Oxford / New York, Oxford University Press, pp. 349-393. FILLMORE C. & ATKINS B.T.S. (1998), « FrameNet and lexicographic relevance », in A. Rubio, N. Gallardo, R. Castro & A. Tejado eds, Proceedings of the First International Conference on Language Resources and Evaluation (Granada, Spain, 28-30 May 1998), EC DG XIII and Fundacion Banco Central-Hispanica, pp. 417-423 ; en ligne : http://framenet. icsi.berkeley.edu/papers/lexrel.pdf. FILLMORE C. & ATKINS B.T.S. (2000), « Describing polysemy: the case of crawl », in Y. Ravin & C. Leacock eds, Polysemy. Theoretical and computational approaches, Oxford, Oxford University Press, pp. 91-110. FONTENELLE T. (2009), « Sémantique des cadres et lexicographie », Lexique 19, pp. 161-179. FONTENELLE T. ed. (2008), Practical Lexicography. A reader, Oxford, Oxford University Press. GASIGLIA N. (2008a), « Le traitement des emprunts dans les dictionnaires d’apprentissage français : options descriptives et choix rédactionnels », in J. Pruvost dir., Les Journées des dictionnaires de Cergy. Dictionnaires et mots voyageurs. Les 40 ans du Petit Robert. De Paul Robert à Alain Rey, Éragny-sur-Oise, Éditions des Silves, pp. 153-212. GASIGLIA N. (2008b), « Le traitement des “identifications diachroniques” dans des dictionnaires scolaires français : évaluation de pratiques et proposition de principes de rédaction alternatifs », in J. Durand, B. Habert & B. Laks resp., pp. 1117-1136 du disque ; éd. en ligne : http://www.linguistiquefrancaise.org/articles/cmlf/pdf/2008/01/cmlf08236.pdf, pp. 1129-1148. HANKS P. (2004), « Corpus pattern analysis », in G. Williams & S. Vessier eds, vol. 1, pp. 87-97. HAUSMANN F.J. (2003), « Beaucoup de splendeurs, peu de misères : bilan sur les dictionnaires Le Robert », in M.-C. Cormier, A. Francoeur & J.-C. Boulanger dir., Les dictionnaires Le Robert. Genèse et évolution, Montréal, Les Presses de l’Université de Montréal, pp. 246-262. HAUSMANN F.J. (2005), « Isotopie, scénario, collocation et exemple lexicographique », in M. Heinz éd., L’exemple lexicographique dans les dictionnaires français contemporains. Actes des “Premières journées allemandes des dictionnaires” (Klingenberg am Main, 25-27 juin 2004), Tübingen, Max Niemeyer Verlag, pp. 283-292. T17 – Évolutions informatiques en lexicographie : ce qui a changé et ce qui pourrait émerger [298 Ð 855 JACQUET-PFAU C. (2005), « Pour un nouveau dictionnaire informatisé », Études de linguistique appliquée 137, pp. 51-71. KILGARRIFF & al. (2004) = KILGARRIFF A., RYCHLY P., SMRZ P. & TUGWELL D., « The Sketch Engine », in G. Williams & S. Vessier eds, vol. 1, pp. 105-115. KILGARRIFF A. & GREFENSTETTE G. (2003), « Introduction to the special issue on the web as corpus », Computational Linguistics 29.3, pp. 333-348 ; nouv. éd. in T. Fontenelle ed. (2008), pp. 89-101. KILGARRIFF A. & TUGWELL D. (2002), « Sketching words », in M.-H. Corréard ed., pp. 125-137. LAUFER B. (1992), « Corpus-based versus lexicographer examples in comprehension and production of new words », in H. Tommola, K. Varantola, T. Salmi-Tolonen & J. Schopp eds, EURALEX 1992 Proceedings, Tampere, University of Tampere, pp. 71-76 ; nouv. éd., in T. Fontenelle ed. (2008), pp. 213-218. LEHMANN A. (1993), « L’exemple et la définition dans les dictionnaires pour enfants », Repères 8, nouvelle série, pp. 63-78. MACRON R. (1999), « L’école et le dictionnaire », Études de linguistique appliquée 116, pp. 441-451. MEL’ČUK I., CLAS A. & POLGUÈRE A. (1995), Introduction à la lexicologie explicative et combinatoire, Louvain-la-Neuve, Duculot. NAMER F. (2003), « Productivité morphologique, représentativité et complexité de la base : le système MoQuête », Langue française 140, pp. 79-101. PAROUBEK P. & RAJMAN M. (2000), « Étiquetage morpho-syntaxique », in J.-M. Pierrel dir., Ingénierie des langues, Paris, Hermès Science Publications, chap. 5, pp. 131-150. PIERREL J.-M. (2008), « De la nécessité et de l’intérêt d’une mutualisation informatique des connaissances sur le lexique de notre langue », in J. Durand, B. Habert & B. Laks resp., pp. 1245-1264 du disque ; éd. en ligne : http://www.linguistiquefrancaise.org/ articles/cmlf/pdf/2008/01/cmlf08330.pdf, pp. 1257-1276. REY-DEBOVE J. (1988), « Préface », in Le Petit Robert des enfants. Dictionnaire de la langue française, Paris, Dictionnaires Le Robert, pp. IX-XVIII. RUNDELL M. (2002), « Introduction », in Macmillan English Dictionary for Advanced Learners, p. x. VAN DE VELDE D. (2009), « Sémantique lexicale et lexicographie : le cas des verbes », Lexique 19, pp. 181-214. VERLINDE S., SELVA T. & BINON J. (2009), « Les bases de données au service d’un dictionnaire d’(auto-)apprentissage pour allophones », Lexique 19, pp. 217-233. WILLIAMS G. & VESSIER S. eds (2004), Proceedings of the Eleventh EURALEX International Congress, EURALEX 2004, Lorient, France, July 6-10, 2004, 3 vol., Lorient, Université de Bretagne-Sud.