De la Lexicologie à la Lexicographie

Transcription

De la Lexicologie à la Lexicographie
De la Lexicologie à la Lexicographie /
From Lexicology to Lexicography
Francine Melka & M. Celeste Augusto (eds.)
Utrecht, juin / june 2002
Utrecht University
Utrecht Institute of Linguistics OTS
Trans 10
3512 JK Utrecht
Phone: +31-(0)30-253 6006
Fax: +31-(0)30-253 6000
Email: [email protected]
De la Lexicologie à la Lexicographie /
From Lexicology to Lexicography
Francine Melka & M. Celeste Augusto (eds.)
Table des matières / Table of content
Francine Melka & M. Celeste Augusto
Préface
Introduction
4
7
Pierre Corbin
Lexicographie et linguistique : une articulation difficile. L'exemple
du domaine français
9
Maria Fernanda Bacelar do Nascimento
Associations lexicales: du corpus aux dictionnaires
39
Willy Martin
Lexicography, Lexicology, Linking and the Hub-and-Spoke Model
55
M. Celeste Augusto
Le dictionnaire comme outil d'apprentissage
73
Jan Schroten
Light Verb Constructions in Bilingual Dictionaries
87
Francine Melka
La création morphologique dans le dictionnaire
100
Liste des auteurs / Authors list
126
De la Lexicologie à la Lexicographie
Préface
(Départements de langues française et portugaise/UiL-OTS Université d’Utrecht)
C’est à l’Université d’Utrecht que s’est tenu, le 18 juin 1999, le colloque intitulé
« De la lexicologie à la lexicographie » et dont nous vous présentons ici six
contributions. Cette journée d’études et d’échanges a été organisée par les
départements de Français et de Portugais de l’Université d’Utrecht et a été rendue
possible grâce à l’appui financier de l’Institut Camões de Lisbonne et de l’Institut
de Recherche de Linguistique, UiL-OTS, de l’Université d’Utrecht.
Les buts de ce colloque étaient d’examiner dans quelle mesure les deux notions de
« lexicologie » et de « lexicographie » s’appuient l’une sur l’autre, s’utilisent
mutuellement, se soutiennent, chacune avec ses idiosyncrasies, et aussi de revoir
nos idées conventionnellement admises que la lexicologie s’élève au rang de
science alors que la lexicographie n’est qu’un « bricolage » plus ou moins réussi.
Ce projet reflète une longue collaboration des départements de portugais, de
français et d’espagnol de l’Université d’Utrecht, tant du point de vue de la
recherche que de celui de l’enseignement : diverses publications communes,
séminaire commun, collaboration à et rédaction de dictionnaires bilingues
(Espagnol/Néerlandais et Néerlandais/Espagnol,
Français/Néerlandais et
Néerlandais/Français). Last but not least, l’entreprise la plus récente, commencée
en 1998 et qui s’achèvera en 2003, concerne le projet de dictionnaire bilingue
Portugais/Néerlandais, Néerlandais/Portugais, dirigé par M. Celeste Augusto. Ce
projet, qui touche à sa fin, met en pratique l’utilisation d’un instrument
manipulateur permettant la réversibilité des bases de données dans l’élaboration
de dictionnaires bilingues (voir la contribution de Willy Martin dans ce même
volume).
Les contributions réunies dans ce volume discutent divers aspects des rapports
entre la lexicologie et la lexicographie en général et plus particulièrement en
français, en portugais, en anglais et en espagnol.
La première contribution, celle de Pierre Corbin, « Lexicographie et linguistique :
une articulation difficile. L’exemple du domaine français », s’inscrit, comme son
titre l’indique, dans un cadre de production de dictionnaires français monolingues
et examine les apports réels et potentiels de la linguistique à la lexicographie ; les
apports de la lexicographie à la lexicologie ne seront pas envisagés ici, bien
qu’une telle étude ne soit pas dépourvue d’intérêt. L’auteur, qui s’occupe de la
formation de lexicographes dans le cadre du D.E.S.S. de lexicographie à Lille, et
cela depuis de nombreuses années, déplore que les tensions entre les deux
disciplines ne soient pas toujours positives et invoquent des raisons
principalement économiques et techniques : le « rentabilisme » ne laisse que peu
de place à la créativité et à l’innovation. Puis, Pierre Corbin analyse en détails le
rôle que la lexicologie pourrait avoir dans le domaine de la lexicographie ; il
décrit, entre autres, les apports potentiels de la sémantique lexicale (à la
Wierzbicka) à la définition lexicographique.
Dans la deuxième contribution, «Associations lexicales : du corpus aux
dictionnaires », Fernanda Bacelar do Nascimento nous propose une nouvelle
façon d’envisager la lexicographie portugaise en utilisant des bases de données
électroniques. L’auteur donne une série d’exemples, dans laquelle elle montre
comment les informations sont collectées et vérifiées. Cette façon nouvelle
d’envisager la production des dictionnaires portugais monolingues ouvre la porte
à toutes sortes de possibilités.
Willy Martin, dans la troisième contribution, «Lexicology, Lexicography, Linking
and the Hub-and-Spoke Model», décrit le modèle « Hub-and-Spoke » utilisé pour
la fabrication de dictionnaires bilingues et qui est notamment à la base du
dictionnaire bilingue portugais-néerlandais et néerlandais-portugais, en cours de
confection à Utrecht et dont il a été question plus haut. L’essentiel de ce modèle
consiste à rendre l’un des volumes du dictionnaire bilingue profitable à l’autre
volume. Dans ce modèle, les concepts sont organisés de telle façon que leurs
expressions lexicales dans les diverses langues peuvent être facilement retrouvées
et contrôlées. Ainsi les deux volumes du dictionnaire bilingue sont-ils préparés de
manière uniforme et cohérente : ce modèle permet d’éviter les oublis et surtout les
disparités entre les deux volumes et il offre en plus une information claire et
systématique.
La quatrième contribution, « Le dictionnaire comme outil d’apprentissage » de
M.Celeste Augusto, montre que le traitement lexicographique de l’information
contextuelle en ce qui concerne les items lexicaux pourrait aider l’apprenant
d’une Langue 1 ou 2. L’auteur insiste sur la nécessité et les avantages de baser
toutes les descriptions lexicographiques sur des notions lexicales appropriées, ceci
pouvant s’appliquer aussi bien à la production de dictionnaires monolingues qu’à
celle des dictionnaires bilingues. Concrètement, l’auteur analyse un certain
nombre d’entrées choisies dans des dictionnaires portugais monolingues et aussi
dans le dictionnaire néerlandais-portugais en cours d’élaboration, dans lequel
l’emploi des segments contextualisés est fréquent.
La cinquième contribution, «Light Verb Constructions in Bilingual Dictionaries»,
porte sur les collocations, c’est-à-dire les expressions composées d’un verbesupport et d’un nom complément d’objet direct. L’auteur, Jan Schroten, discute
leur traitement dans les dictionnaires monolingues et bilingues espagnols, anglais
et néerlandais. A la question de savoir quel verbe-support est suivi de quel nom
dans quelle langue, la réponse n’est pas aisée à trouver dans les dictionnaires. On
ne peut en blâmer les lexicographes, qui ont besoin pour résoudre ces problèmes
de l’aide des linguistes, lexicologues et sémanticiens, qui, à leur tour, sont
incapables de produire des réponses définitives. Les lexicographes doivent, donc,
se contenter de solutions pragmatiques et très pratiques.
Dans la sixième et dernière contribution, « La création morphologique dans le
dictionnaire », Francine Melka présente les résultats d’une étude sur la
5
productivité morphologique en français moderne et sur l’éventuelle influence de
la langue anglaise sur la structure morphologique du français actuel (formations
des dérivés et des composés). La comparaison de deux éditions de dictionnaires
français monolingues de 1970 et 1993, qui est le point de départ de cette étude,
montre aussi que la lexicographie peut fournir des données pas forcément
complètes, mais intéressantes à la lexicologie.
Avant de clore cette introduction, nous voudrions remercier les instances qui nous
ont permis la publication de ce volume : l’Université d’Utrecht et plus
particulièrement l’Institut de Recherche de Linguistique de cette université, UiLOTS et son secrétariat.
Bova Marina
Utrecht
6
From Lexicology to Lexicography
Introduction
Francine Melka & M. Celeste Augusto
(Departments of French and Portuguese Language /UiL-OTS Utrecht University)
The workshop “De la lexicologie à la lexicographie” (“From Lexicology
to Lexicography”), organized by the French and Portuguese Departments of
Utrecht University, was held in Utrecht, on June 18, 1999. Six contributions to
this workshop are included in this volume and are introduced here. Financial
support for this workshop was given by the “Instituto Camões” of Lisbon, and by
the Utrecht Institute of Linguistics OTS.
The six contributions discuss how lexicology and lexicography are related
and how they influence and support each other. This project is the result of a long
collaboration between the Spanish, French and Portuguese Departments at Utrecht
University as far as research and teaching are concerned (diverse publications,
collaboration in bilingual dictionaries, etc.). The last project concerns the
publication of a bilingual dictionary Portuguese-Dutch and Dutch-Portuguese,
which should be finished in 2003, under the direction of M. Celeste Augusto.
The contributors to this volume discussed lexicographic and lexicological
work on a few languages: English, Dutch, French, Portuguese and Spanish.
In the first contribution, “Lexicographie et linguistique: une articulation
difficile. L’exemple du domaine français”, Pierre Corbin examines which real and
potential contributions linguistics brings to lexicography, in the context of French
monolingual dictionaries. (The contribution of lexicography to lexicology will not
be discussed here, not by lack of interest). The author, who started (and still
directs) a program offering a degree of Lexicography at the University of Lille
some 8 years ago, regrets that the two disciplines (lexicography and linguistics)
do not support each other in a positive way. The reasons put forward are mainly
economical and technical: innovation and creativity are expansive, and the
making of a dictionary should be profitable. Corbin analyses also the role which
lexicology could have and should have in lexicography, specially what lexical
semantics could bring to the lexicographic definition.
In the second contribution, “Associations lexicales: du corpus aux
dictionnaires”, Fernanda Bacelar do Nascimento gives an example of a novel way
of doing Portuguese lexicography, by using electronic databases. Giving some
sets of examples, the author shows how Portuguese lexicographic information can
be gathered and checked. In this way, new and better Portuguese monolingual
(and bilingual) dictionaries can be launched in the future.
In the third contribution, “Lexicography, Lexicology, Linking and the
Hub-and-Spoke Model”, Willy Martin describes the Hub-and-Spoke model for the
production of multilingual dictionaries, which is at the basis of the PortugueseDutch / Dutch-Portuguese dictionary project. The main question is how one
volume of a bilingual dictionary can be made beneficial to the other volume.
Using a lexicological model in which concepts are organized in a systematic
fashion, their lexical expression in different languages can be worked out and
checked. In this way, the two volumes of a bilingual dictionary can be prepared in
a uniform and coherent way. The benefits of this model are that mismatches in
the two volumes are avoided, and that the information is given in a clear and
systematic way.
In the fourth contribution, “Le dictionnaire comme outil d’apprentissage”,
M. Celeste Augusto shows how a careful treatment of contextual information on
lexical items will help the language learner. She stresses the necessity of basing
all lexicographic descriptions on suitable lexical notions, and points out the
benefits of this approach. This method should be used in the production of both
monolingual and bilingual dictionaries. In order to exemplify her aims the author
analyzes some series of entries found in monolingual Portuguese dictionaries and
also some entries of the Dutch-Portuguese dictionary in progress, where the
benefits of frequent use of contextualized examples are shown.
In the fifth contribution, “Light Verb Constructions in Bilingual
Dictionaries”, Jan Schroten deals with collocations, that is, expressions composed
of a direct object and a support verb. He discusses how they are treated in
monolingual and bilingual Spanish, English and Dutch dictionaries. The answer to
the question which support verb accompanies which direct object nouns in which
language turns out to be difficult to find in dictionaries. Lexicographers are not to
blame: they need the help of linguists, lexicologists and semanticists, to solve the
problems. The experts, in turn, are unable to give final answers. For the time
being, lexicographers have to find pragmatic and practical solutions.
In the sixth contribution, “La création morphologique dans le
dictionnaire”, Francine Melka presents the results of a study on morphological
productivity in modern French and discusses the possible influence of English
language on the morphological structure of French (items formed by derivation
and composition). The comparison of two editions of a French monolingual
dictionary, one published in 1970 and the other one in 1993, shows, among other
things, that lexicography can also contribute to lexicology, even if the data is far
from being complete.
We would like to thank Utrecht University and specially UiL-OTS and its
secretarial staff for making this publication possible.
Utrecht
Bova Marina
8
Lexicographie et linguistique : une articulation difficile. L’exemple du
domaine français 1
Pierre Corbin
Université Charles de Gaulle - Lille III (France)
Dans le domaine français, les relations entre lexicographie et linguistique
semblent aujourd’hui suffisamment distendues et, pour le futur proche,
compromises pour que leur problématique puisse apparaître actuellement presque
comme une question d’école, sans réelle portée pratique ni perspectives évidentes
d’évolution à court terme, pour des raisons qui seront exposées. Cet état de fait
n’interdit pas, cependant, de continuer à réfléchir de façon prospective à ce que
pourraient être des relations interactives plus satisfaisantes entre les deux
domaines. C’est ce à quoi s’emploiera cette contribution, qui s’inscrit dans un
triple contexte :
– celui d’un débat international qui s’est développé dans le courant des années
quatre-vingt, autour notamment de la formation des lexicographes et de la place
qu’il convient de faire à la linguistique au sein de celle-ci 2 ;
– celui d’une série de textes que j’ai publiés, seul ou avec Danielle Corbin, soit
sur cette question 3, soit sur l’état du marché dictionnairique français 4, et qui
développent certains des points qui ne seront qu’effleurés ici ;
– celui d’une dizaine d’années d’expérience lilloise de formation de lexicographes
dans le cadre du Diplôme Européen de Lexicographie, devenu en 1999 le D.E.S.S.
“Lexicographie et Terminographie”, lui-même redéployé en DESS
“Lexicographie, Terminographie et Traitement automatique de corpus” à partir de
la rentrée universitaire 2002 5.
Il ne sera question ici que de lexicographie générale monolingue et,
conformément à une pratique très commune dont la Journée d’étude dans laquelle
s’inscrit cette contribution (cf. supra n. 1) fournit une nouvelle occurrence, que
des apports réels ou potentiels de la linguistique à la lexicographie : sans doute
1
Toute ma reconnaissance va à Francine Melka, qui, alors qu’il ne m’était pas possible de le
prononcer moi-même, eut l’obligeance de lire de façon impromptue, lors de la Journée d’étude
« De la lexicologie à la lexicographie » du 18 juin 1999 à l’Université d’Utrecht, le texte de la
communication de laquelle procède le présent article, qu’elle eut encore la patience d’attendre bien
longuement. Durant toute cette période, mon épouse Danielle était malade, et elle est décédée peu
avant que je n’achève la version prédéfinitive du présent texte, qui se ressent nécessairement du
contexte particulier de son élaboration, mais que j’ai eu à cœur de permettre à Francine Melka
d’éditer quand même, en remerciement pour son soutien plein d’humanité. Merci aussi à mon fils
François d’avoir pris le relais de sa mère comme relecteur privilégié.
2
Dans l’ordre chronologique, les contributions les plus marquantes sont celles de Gates (1979),
Sinclair (1984), Ilson ed. (1986) – qui inclut notamment Gates (1986), Hartmann (1986), Hausmann
(1986) et Rey (1986) –, Gates (1989), Landau (1989), Battenburg (1991), Frawley ed. (1993) – qui
inclut notamment Atkins (1993) et Zgusta (1993) –, Pascual Ferrando (1994).
3
Dans l’ordre chronologique, P. Corbin (1984), Cabré Castellví (1994), P. Corbin (1995).
4
P. Corbin (1985, 1991 et 1998).
5
On trouvera toutes les informations concernant cette formation sur le site Web de l’Université
Charles de Gaulle - Lille III (http://www.univ-lille3.fr/www/Recherche/silex/index.html).
Pierre Corbin
faut-il voir dans cette orientation coutumière de la connexion entre les deux
disciplines le cheminement qui est supposé mener de la théorie à la pratique, ou
de la science à la technique6.
L’exposé s’articulera en trois moments. Le premier donnera la mesure de
l’actuelle désaffection de la lexicographie française pour la linguistique au regard
de l’intérêt qu’elle lui porta naguère. Seront ensuite circonscrites les conditions
dans lesquelles la lexicographie pourrait légitimement faire appel à la linguistique,
puis examinées les potentialités d’apport de celle-ci à la lexicographie.
1. Splendeur et déshérence de l’usage de la linguistique dans la lexicographie
générale monolingue française contemporaine
Cela fait plus de quinze ans qu’il n’est pas paru en France de dictionnaire
général monolingue qui donne une forme lexicographique consistante à des
contributions descriptives et/ou théoriques émanant du champ de la linguistique 7.
Cette récession venant après deux décennies durant lesquelles la linguistique avait
abondamment investi la production dictionnairique nationale, la réaction première
peut être de déplorer ce nouvel état de fait, et l’analyse de l’évolution des
conditions économiques, technologiques, humaines et culturelles de production
des dictionnaires concomitante à ce changement de cap éditorial ne peut que
conforter le sentiment que celui-ci constitue une régression. L’interprétation de ce
phénomène à la lumière de facteurs uniquement externes risque cependant d’avoir
un caractère réducteur : dans la longue histoire de la lexicographie française, ces
quelques années de flambée linguistique pourraient aussi être considérées comme
une parenthèse conjoncturelle dans une tradition pratique qui a constitué de façon
autonome ses canons d’approche utilitaire du lexique, surtout si l’on s’accordait à
6
Pour autant, il ne serait dépourvu ni d’intérêt ni de pertinence d’envisager les relations entre les
deux disciplines en inversant leur orientation. Il y aurait en effet à dire sur les rapports inégalement
experts que les linguistes entretiennent (ou n’entretiennent pas) avec les dictionnaires en tant que
sources documentaires, et qui s’échelonnent entre l’ignorance et l’excès de confiance :
– à l’un des pôles, on trouverait des travaux, dont l’inventaire reste à établir, qui, aussi étonnant
que cela puisse paraître, traitent de matières lexicales sans s’appuyer sur une consultation
significative des dictionnaires ;
– l’autre pôle regrouperait des études qui, pour diverses raisons, sont indexées trop étroitement sur
les données fournies par tel dictionnaire particulier, et qui, de ce fait, identifient ainsi de façon
hasardeuse le lexique français à cette représentation dictionnairique spécifique ; on peut songer ici,
en première analyse, à Dubois (1962) ou, à un moindre degré, à Zwanenburg (1983) : le premier
appuie sa description de l’évolution de la suffixation en français de 1900 à 1961 (p. 8) sur la
comparaison des éditions de 1906 et 1961 du Petit Larousse (p. 10) ; le second étudie la
préfixation des suffixes « savants » et « non savants » dans les noms en -age, -ment et -ion à partir
de la nomenclature du Dictionnaire du français contemporain en assumant les inconvénients de sa
démarche, qu’il s’efforce de pondérer par des incursions ponctuelles dans d’autres recueils (pp. 78). D’autres exemples pourraient être évoqués.
7
La chronologie prise en compte n’envisage, pour les dictionnaires multivolumes à parution
échelonnée, que la date de mise sur le marché du premier volume : par exemple, pour le Trésor de
la langue française, 1971 (et non 1994, date de parution du dernier volume).
10
Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français
reconnaître que tout n’était pas impérissable dans les “apports” de nos
expérimentations de lexicographie linguistique.
Le dossier est donc complexe, et on ne l’épuisera pas ici : il intéresse
conjointement l’histoire de la lexicographie, de la linguistique, de la didactique et
de l’édition. Je m’en tiendrai à un premier cadrage factuel, assorti de quelques
pistes interprétatives.
1.1. Panorama de la lexicographie générale monolingue française contemporaine
d’inspiration linguistique
Un nombre relativement important de dictionnaires français monolingues
notoires de l’après-guerre portent la trace de la pénétration, sous diverses formes,
de la linguistique contemporaine dans la pratique lexicographique. En gros,
l’arrivée de ces dictionnaires sur le marché s’échelonne sur une petite vingtaine
d’années, du milieu des années soixante au début des années quatre-vingt, ce qui
coïncide avec l’essor de la linguistique comme discipline académique et avec sa
diffusion dans le domaine de la didactique. On peut, par commodité, les présenter
groupés en deux ensembles :
– les dictionnaires Larousse de Jean Dubois et de sa mouvance ;
– les autres dictionnaires.
1.1.1. Les dictionnaires Larousse de Jean Dubois et de sa mouvance
– Le coup d’envoi, qui est aussi le point de départ d’une série de dictionnaires
Larousse français et anglais dont Jean Dubois est le pivot et qui mobilisent de
façon récurrente un petit ensemble de rédacteurs, est donné en 1966 par le
Dictionnaire du français contemporain 8, destiné à l’enseignement du français à
un niveau avancé et comme tel restreint à 25 000 « termes » 9, dont la
démultiplication des adresses homomorphes et les regroupements en blocs-articles
de mots apparentés par leur structure morphologique et leurs propriétés
sémantiques et syntaxiques témoignent d’influences distributionnelles (intérêt
8
Rédaction : Jean Dubois, René Lagane, Georges Niobey, Didier Casalis, Jacqueline Casalis,
Henri Meschonnic.
9
« Avant-propos », p. III. La réédition augmentée de 1980 (Dictionnaire du français
contemporain illustré) fera monter la nomenclature à « 33 000 mots » (« Avant-propos », p. V).
11
Pierre Corbin
marqué pour les contraintes rectionnelles 10) et transformationnelles (conception
des faits d’affixation comme matérialisant des relations entre phrases 11) 12.
– En 1975, le Lexis 13, dictionnaire de référence de grande envergure (« plus de
70 000 termes » 14), se voit appliquer les mêmes principes distributionnels 15 et
transformationnels 16, ce qui ne va pas sans paradoxe concernant le mode de
structuration de la nomenclature adopté pour un dictionnaire de cette nature 17.
– Deux ans plus tard, la mise en œuvre de principes comparables débouche sur la
publication d’un dictionnaire d’apprentissage initial du français, le Larousse de
base (1977) 18, qui reprend la maquette d’un Dictionnaire d’anglais. Niveau 1
paru en 1975 19, et dont les « 2 581 mots » fondamentaux permettent d’accéder à
un lexique de « 7 700 termes » 20 par le moyen de relations transformationnelles
10
À titre d’exemple, les deux blocs-articles associés à la forme verbale déporter donnent un
aperçu des effets de l’application des options adoptées dans ce dictionnaire :
– le premier bloc regroupe l’adresse verbale déporter, suivie d’un nom de personne, dans
l’acception politique de cet item (« Déporter quelqu’un, l’emmener de force hors de sa résidence
pour des raisons politiques (souvent au passif) : Des millions de personnes ont été déportées par
les régimes totalitaires dans des camps de concentration. ») et les adresses nominales déportation
et déporté, e ;
– le deuxième bloc regroupe l’adresse verbale déporter, avec un sujet ’non humain’, dans
l’acception physique de cet item (« (sujet nom de chose) Déporter quelque chose, quelqu’un, le
déplacer, le faire dévier de sa trajectoire : Un avion déporté par un fort vent latéral. Le choc a
déporté la voiture dans le virage. ») et l’adresse nominale déportement.
11
« Les possibilités qu’offrent les systèmes de suffixation et de préfixation pour passer d’une
construction de phrase à une autre construction, d’un verbe à un substantif, d’un substantif à un
adjectif, etc., ont été mises en évidence dans cet ouvrage par des regroupements autour des termes
de base ; » (« Avant-propos », p. III). L’annexe « Suffixes et préfixes » (pp. XIX-XXII) décline et
exemplifie une sélection de paradigmes transformationnels de cet ordre.
12
Les principes linguistiques mis en application dans le Dictionnaire du français contemporain
et la généalogie de dictionnaires qu’il ouvre sont ceux dont la théorie s’expose de 1965 à 1971,
chez le même éditeur (Larousse), dans les grammaires françaises et anglaises de Jean Dubois et de
Françoise Dubois-Charlier, qui adaptent certains apports du structuralisme et la mouture
transformationnelle du modèle génératif (Dubois 1965, 1967 et 1969, Dubois & Dubois-Charlier
1970, Dubois-Charlier 1970 et 1971).
13
Direction : Jean Dubois ; rédaction : Jean-Pierre Mével, Geneviève Chauveau, Sylvie Hudelot,
Claude Sobotka-Kannas, Dorine Morel.
14
« Préface », p. VII.
15
Le traitement de la forme verbale déporter et des mots apparentés se fait selon des modalités
similaires à celles observées dans le Dictionnaire du français contemporain (cf. supra n. 10).
16
Cette fois, c’est l’article « Dérivation » (pp. XXXIX-XLII) du « Dictionnaire grammatical »
inséré en annexe (pp. XIII-LXXI) qui accueille une sélection amplifiée de « transformations »
affixales dérivées de celles du Dictionnaire du français contemporain.
17
Sur le caractère surprenant du choix d’appliquer à un dictionnaire de consultation étoffé un
dispositif d’adressage que les perturbations de l’ordre alphabétique qu’il induit qualifient
davantage pour un dictionnaire d’apprentissage comme le Dictionnaire du français contemporain,
cf. P. Corbin (1998, n. 32).
18
Direction : Jean Dubois, avec la collaboration de Françoise Dubois-Charlier ; rédaction :
Christine Eyrolles, Sylvie Hudelot, Danielle Leeman, Jean-Pierre Mével, Claude Sobotka-Kannas.
19
Rédaction : Françoise Dubois-Charlier, Jacqueline Blériot, Éliane Koskas.
20
« Préface », p. III.
12
Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français
intégrées dans la rubrique « commentaire lexical » (codée « L. » 21) 22. Enrichi de
dessins humoristiques imprégnés de stéréotypes culturels 23, ce dictionnaire est
republié en 1978 sans changements significatifs sous le titre Dictionnaire du
français langue étrangère. Niveau 1 24, et relayé en 1979 par un Niveau 2, élaboré
selon les mêmes principes et qui fait état d’« environ 10 000 termes » distribués
sur « 5 000 entrées » 25. 26
– Dans la mouvance des dictionnaires de Jean Dubois, on peut encore évoquer
deux réalisations lexicographiques éditées par Larousse durant les années
soixante-dix :
• le Grand Larousse de la langue française en 7 volumes (1971-1978) 27,
dictionnaire “de langue” de référence de l’éditeur, dont le texte proprement
lexicographique est de facture conventionnelle, mais dont le paratexte inclut un
abondant traité « De la formation des unités lexicales » (pp. IX-LXXXI) dû à
Louis Guilbert 28, qui, dans sa partie synchronique (pp. XXXII-LXXXI), donne
son plein développement au traitement transformationnel de la formation de
mots construits 29 ;
21
« Préface », p. IV.
Exemple : « L. maternel, elle (adj.) L’amour d’une mère pour son enfant → l’amour
maternel. » (s.v. mère).
23
Cf. P. Corbin (1985, § 1., nn. 12-14).
24
Sur le changement d’affichage matérialisé par cette renomination, cf. P. Corbin (1985, § 1.).
25
« Préface », p. IX.
26
L’équivalent du Niveau 2 pour l’anglais paraît l’année suivante (1980), sous le titre
Dictionnaire de l’anglais contemporain. Direction : Françoise Dubois-Charlier ; rédaction :
Françoise Dubois-Charlier, Richard Wakely, Jacqueline Blériot, avec la collaboration de David
Jones, Jacques Durand, James Thorne, George Blue. La nomenclature de ce dictionnaire est de
« 15 000 mots anglais » (« Préface », p. V).
27
Direction : Louis Guilbert, René Lagane, Georges Niobey, avec le concours d’Henri Bonnard,
Louis Casati, Alain Lerond.
28
Écho lointain au « Traité de la formation de la langue française » qui précédait, au tournant du
XXe siècle, le Dictionnaire général de la langue française d’Hatzfeld, Darmesteter & Thomas
(1890-1900).
29
L’extrait ci-dessous, qui concerne la formation de noms sur bases nominales au moyen du
suffixe -iste, permet de se construire une représentation de ce modèle de formation des mots
construits et de prendre la mesure de son caractère largement contre-intuitif :
« I. G. LA RELATION NOM → NOM
1. G. 1. Nom → nom d’animé ou de non-animé.
Si le terme de base de la transformation est un nom de non-animé, et le résultat de cette
transformation un nom d’animé, la transformation implique une phrase sous-jacente qui rend
compte du passage de la classe des non-animés à la classe des animés. Cette phrase de base est
de forme factitive : le N (= animé) fait que le N (= objet non animé) est. La séquence le N fait
que rend compte de la catégorie “animé”, et la séquence que le N (non-animé) est, de la
relation établie entre le non-animé et l’animé : Il fait que le chapeau est → le chapelier.
[...]
1. G. 1. 3. DERIVATION PAR LE SUFFIXE -iste.
La transformation est réalisée à partir de la même phrase sous-jacente : Il fait que le piano est
(fonctionne) → le pianiste. Il fait que la grève est → le gréviste.
Les termes résultant de la transformation peuvent fonctionner syntaxiquement comme noms
et comme adjectifs (il est affichiste) :
22
13
Pierre Corbin
• et le Nouveau Larousse des débutants (1977) 30, dictionnaire d’« environ
16 000 mots » 31 qui propose aux élèves de l’école élémentaire une version
adoucie des principes de regroupement d’adresses en blocs-articles inaugurés
dans le Dictionnaire du français contemporain.
1.1.2. Autres dictionnaires
En dehors de cette famille étendue de dictionnaires Larousse, trois ouvrages
méritent encore d’être mentionnés au titre d’imprégnations diverses par des
théories linguistiques :
– le Trésor de la langue française, grand dictionnaire de corpus piloté par le
C.N.R.S. et couvrant deux siècles de documentation textuelle à forte dominante
littéraire, qui, au fil des articles de ses 16 volumes parus entre 1971 et 1994, porte
la trace d’influences linguistiques composites, notamment dans ceux qui sont
consacrés à des mots grammaticaux, où la marque de Robert Martin se fait
particulièrement sentir 32 ;
– le Robert méthodique (1982), conçu par Josette Rey-Debove pour
l’enseignement du français à un niveau avancé (comme le Dictionnaire du
français contemporain), et qui présente la particularité d’associer à sa
nomenclature de « 34 290 mots » les « 1 730 éléments » de formation des mots
construits qui y figurent 33, isolés selon une méthodologie de segmentation qui se
réclame des principes distributionnels d’Eugene Nida 34 ;
anesthésie → anesthésiste
bagage → bagagiste
congrès → congressiste
dent → dentiste
essai → essayiste
finale → finaliste
garage → garagiste.
Le syntagme verbal le N est peut représenter des réalisations diverses : bagagiste = “que
les bagages sont transportés” ; congressiste = “que le congrès a lieu” ; dentiste = “que la dent
est soignée” » (p. XL).
Pour un commentaire interprétatif et critique approfondi de cette conception du lexique
construit, cf. D. Corbin (à paraître, chap.1, § 3.2.2.1.).
30
Direction : René Lagane ; rédaction : Jean-Pierre Mével, Micheline Daumas, Christine
Eyrolles.
31
« Préface », p. IV.
32
Le début de l’article consacré à l’article défini le, la, les suffit à mettre en évidence la
technicité des caractérisations du fonctionnement sémantique des mots à sens instructionnel (cf.
infra n. 56) qui constitue en ce domaine l’originalité du Trésor de la langue française par rapport à
l’ensemble de la production dictionnairique contemporaine :
« I. – Emplois spécifiques. [Le locuteur présume que le contenu du subst. suffit à
l’interlocuteur pour identifier ce dont il s’agit ; le subst. qui suit a un référent repérable par
rapport à un savoir donné, par rapport à l’espace construit par le discours ou par rapport à la
situation énonciative] »
33
« Présentation », p. VII.
34
« Cette description du lexique se veut structurale, distributionnelle et morphologique ; elle
espère retrouver dans le vocabulaire actuel toutes les régularités qui permettent de l’expliciter et de
le mémoriser.
14
Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français
– le Grand dictionnaire encyclopédique Larousse (1982-1985), dictionnaire
“encyclopédique” de référence (15 volumes et 191 147 articles) dirigé par Claude
Dubois, qui présente l’originalité, inattendue pour un dictionnaire de ce type,
d’adapter, par le relais de Jean Dubois, les descriptions des rections verbales
produites par le Laboratoire d’Automatique Documentaire et Linguistique
(L.A.D.L.) de Maurice Gross 35. Jusqu’à nouvel ordre, cet ouvrage est le dernier
dictionnaire général monolingue français publié à mettre à profit avec
systématicité des savoirs élaborés dans le champ de la linguistique.
Il faut remarquer que, d’une façon générale – c’est-à-dire à l’exception du
Grand dictionnaire encyclopédique Larousse –, l’utilisation d’apports de théories
et de descriptions linguistiques contemporaines dans les dictionnaires répertoriés
ne se fait pas sur la base d’une collaboration paritaire entre des lexicographes et
des linguistes, mais que les maîtres d’œuvre sont des linguistes, qu’il s’agisse
d’universitaires passés à la lexicographie comme Jean Dubois et Louis Guilbert
chez Larousse, ou Paul Imbs et Bernard Quemada pour le Trésor de la langue
française, ou bien d’une lexicographe devenue docteur en linguistique, ce qui est
le cas de Josette Rey-Debove chez Robert. Ceci n’est pas sans signification pour
la désimplication de la linguistique dans la production dictionnairique ultérieure,
en raison du fait que cet ensemble remarquable d’ouvrages parus sur une durée
assez courte apparaît comme le produit de l’action volontariste d’individualités
fortes qui ont exploité lexicographiquement certaines conceptions et pratiques
linguistiques, et non comme la résultante d’une coopération institutionnalisée
entre deux corporations, dont la tradition n’existe pas en France : même dans le
cas du Grand dictionnaire encyclopédique Larousse, la collaboration avec des
linguistes du L.A.D.L. passe par la médiation de Jean Dubois.
Le principe adopté est celui du linguiste Eugene Nida* : pour un lexique quantitativement
déterminé (ici 34 290 mots), on recherche les mots qui ont des morphèmes liés communs, chaque
morphème devant figurer dans deux mots au moins avec un entourage différent (par ex. USU- est
dégagé de USUFRUIT et USUFRUCTAIRE, non de USUFRUIT et USUFRUITIER). Par ailleurs, on ne peut
identifier un morphème que si les “restes” sont également des morphèmes (par ex. USU- est repéré
parce que FRUCT- et -AIRE existent chacun dans deux mots au moins).
-------* Eugene NIDA, Morphology. The Descriptive Analysis of Words, 1946. » (« Note sur les
fondements théoriques et la méthode », p. XVI)
35
Quatre membres de ce laboratoire (Maurice Gross, Jean-Paul Boons, Alain Guillet et Christian
Leclère) sont crédités dans la liste des « Principaux collaborateurs » (pp. XXXVI-XLVII). Le
traitement du verbe souhaiter est représentatif du dispositif descriptif adopté :
« SOUHAITER v. t. (lat. pop. *subtushaitare, du lat. class. subtus, sous, et du frq. *haitan,
ordonner, promettre) [conj. 4]. 1. Souhaiter qqch, souhaiter + inf., que + subj., désirer qqch, en
former le vœu, le souhait : Je souhaite pouvoir vous aider, que tout aille bien. Souhaiter la fin
de la guerre. — 2. Souhaiter qqch, de + inf. à qqn, le désirer, l’espérer pour lui, en former le
vœu, à son intention : Je vous souhaite bien du bonheur. Je leur souhaite de réussir. —
3. S’emploie dans des formules de politesse, de présentation de vœux : Je vous souhaite une
bonne nuit. Souhaiter la bonne année à ses amis, la bienvenue à des visiteurs. — 4. Souhaiter
sa fête, son anniversaire à qqn, lui témoigner de la sympathie à l’occasion de sa fête, de son
anniversaire. — 5. Je lui en souhaite, je lui (vous, etc.) souhaite bien du plaisir, vœu ironique à
l’adresse de qqn qui s’expose à des ennuis (fam.). »
15
Pierre Corbin
Le tableau qui précède ne serait cependant pas complet sans la mention d’un
frémissement actuel sous la forme (informatisée) de l’élaboration en cours du
Dictionnaire d’apprentissage du français langue étrangère et seconde (DAFLES)
coordonné par Jean Binon, Serge Verlinde & Thierry Selva 36, qui reprend les
principes d’un dictionnaire spécialisé, le Dictionnaire d’apprentissage du français
des affaires (DAFA), réalisé précédemment (2000) par la même équipe selon des
principes comparables, et qui adapte sous une forme accessible les fonctions
lexicales mel’čukiennes. Il ne semble pas complètement fortuit que cette
réactualisation de l’injection de linguistique dans un produit dictionnairique
ressortissant à la lexicographie générale soit le fait d’universitaires
extrahexagonaux (ils sont enseignants à l’université de Leuven) impliqués dans
des pratiques de didactique des langues, et non d’entreprises lexicographiques
privées nationales à but lucratif37.
1.2. Quelques éléments d’explication de la désaffection actuelle de la
lexicographie française monolingue pour la linguistique
Plusieurs facteurs, d’importance variable mais dont les effets convergent,
peuvent être invoqués à la fois comme indices et comme causes du coup d’arrêt
donné aux ouvertures des décennies précédentes et de la désaffection pour la
linguistique qu’on peut observer actuellement dans la lexicographie monolingue
française :
1.2.1. Facteurs économiques
Les dictionnaires coûtent cher à produire, et leur rentabilité est à la fois
incertaine et, en tout état de cause, inférieure à celle d’autres secteurs de l’édition
(par exemple la littérature générale). Ces risques inhérents à l’édition
dictionnairique ont fragilisé, au début des années quatre-vingt, les maisons
familiales qu’étaient Larousse et Robert, et précipité leur rachat par un grand
groupe éditorial, le Groupe de la Cité 38. Ce groupe, après avoir été absorbé par
Havas en 1997, est lui-même passé, en 1998, sous le contrôle du nouveau groupe
Vivendi (ex-Générale des Eaux), géant mondial de la distribution d’eau 39
redéployé dans la communication 40. La date de la disparition de Larousse et de
Robert en tant qu’entreprises indépendantes (autour de 1985) 41 coïncide avec
celle de la désaffection de la lexicographie française pour la linguistique, et cette
coïncidence semble tout sauf fortuite.
36
Projet consultable sur le site www.kuleuven.ac.be/alfalex.
Peut-être le Dictionnaire du français usuel de Jacqueline Picoche & Jean-Claude Rolland, paru
en Belgique, participe-t-il aussi de ce renouveau, mais le caractère tout récent de cet ouvrage
(2002) au moment où s’achève la rédaction du présent article ne m’a pas permis de mener les
investigations souhaitables à son sujet.
38
Cf. P. Corbin (1991, § 1.1. et 1998, § 1.1.1.).
39
Cf. par exemple l’offre publique de vente d’actions parue dans L’Express 2499, 27 mai-2 juin
1999, pp. 60-61.
40
Cf. par exemple Challenges 145, mars 2000, p. 41, et Première 281, été 2000, pp. 21-22.
41
Cf. P. Corbin (1998, § 1.1.1.).
37
16
Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français
Désormais concentrée, pour l’essentiel, dans deux grands groupes industriels,
Vivendi (pour Larousse-Bordas et Robert) et Lagardère (pour Hachette), l’édition
dictionnairique française est entrée dans l’ère du rentabilisme, caractérisé par un
ensemble de dispositions dont aucune ne va dans le sens de la créativité, de
l’innovation et de la prise de risques :
– précarisation des conditions de travail, par le développement des emplois
temporaires (contrats à durée déterminée, free lance) au détriment des emplois
stables 42 ;
– rentabilisation de la production des ouvrages, par l’intensification de la
dérivation de nouveaux dictionnaires à partir de dictionnaires existants, qui
permet de diversifier les catalogues en réduisant les coûts et les délais de
fabrication : la lexicographie française actuelle s’étiole dans l’accommodement
des restes et le déficit de projets originaux d’envergure 43 ;
– gestion standardisatrice des catalogues, par la suppression, le reformatage ou le
défaut de maintenance de dictionnaires souvent innovateurs mais qui ne passent
pas tous pour des succès commerciaux − la stratégie des producteurs se calquant,
ici comme ailleurs, sur le comportement des acheteurs : disparition du
Dictionnaire du français langue étrangère (cf. supra § 1.1.1.) et du Robert oralécrit (1989, « environ 17 000 mots » 44), dont la nomenclature principale était
constituée d’adresses transcrites dans une codification phonétique spécifique ;
défaut de service de suite pour le Grand Larousse de la langue française (cf.
supra § 1.1.1.), retiré du marché, et pour le Lexis (ibid.), commercialisé depuis un
quart de siècle sans modifications significatives (avec les incidences que l’on
imagine en matière de non-actualisation des terminologies, en informatique par
exemple) ; remise en ordre alphabétique strict, dans le Dictionnaire du français au
collège (1986), de la nomenclature de la refonte du Dictionnaire du français
contemporain de 1980 (cf. supra § 1.1.1.) ; remplacement de l’original Petit
Robert des enfants (1988, « environ 16 500 mots » 45, format 20 × 25 cm) par le
Robert junior (1993, « 20 000 mots » 46, format 14,5 × 19,5 cm), plus conforme
aux standards des ouvrages concurrents (Maxi-débutants Larousse (« 20 000
mots » 47), Dictionnaire Hachette juniors (« 18 500 entrées » 48), Le tour du mot
Bordas (« 16 000 entrées » 49) : tous de format 14,5 × 19,5 cm) et reciblé vers les
élèves des dernières classes de l’école élémentaire dans le cadre d’une évolution
éditoriale d’ensemble qui a vu ensuite concurrence et standardisation se porter
aussi sur le créneau plus récent des classes axées sur l’apprentissage de la
lecture 50, 51.
42
Cf. P. Corbin (1998, § 1.1.1.).
Cf. P. Corbin (1998, § 2., notamment pp. 93 sqq.).
44
« Préface », p. XII.
45
« Préface » de l’édition sous le titre Le Robert des jeunes (1991), p. X.
46
Première et quatrième de couverture.
47
Première et quatrième de couverture de l’édition de 1991.
48
Quatrième de couverture de l’édition de 1990.
49
Quatrième de couverture de l’édition de 1988.
50
Le monopole du Mini débutants Larousse (1985, « 5 400 mots » (quatrième de couverture)),
premier dictionnaire de ce type, est rompu par la parution, en 1996, du Dictionnaire Hachette
43
17
Pierre Corbin
1.2.2. Facteurs techniques
Le développement de la lexicographie assistée par ordinateur et de la
commercialisation de dictionnaires sur CD-ROM et les perspectives de la
lexicographie en ligne ont amené les éditeurs à concentrer une part importante de
leurs efforts sur l’informatisation de dictionnaires figurant à leurs catalogues dans
des versions imprimées. Divers ouvrages plus ou moins importants ont maintenant
été adaptés à ce nouveau support, quelquefois dans plusieurs versions 52. Une
conséquence de la mise en œuvre de ce transfert technologique est qu’il
s’effectue, au moins pour un temps, au détriment de la réflexion foncière sur le
contenu linguistique des dictionnaires et de l’investissement dans des projets
nouveaux53.
1.2.3. Facteurs humains
La génération des linguistes-lexicographes-métalexicographes qui pendant
quelques décennies ont fait la richesse et l’originalité de la lexicographie française
et qui ont établi les fondements de l’analyse historique et technique des
dictionnaires (Jean Dubois, Alain Rey, Josette Rey-Debove, Bernard Quemada)
termine sa carrière sans être remplacée. Les lexicographes français d’aujourd’hui
ne sont pas des linguistes, mais simplement des techniciens de la lexicographie,
qui n’interviennent pas dans le champ de la métalexicographie.
1.2.4. Facteurs culturels
La diffusion restreinte et erratique, dans le grand public, des savoirs émanant
du champ de la linguistique ne paraît pas prédisposer les utilisateurs de
dictionnaires, dans leur grande masse, à faire le succès commercial de répertoires
trop innovants en matière de traitement linguistique du lexique (cf. infra § 2.1.),
ce qui ne peut que conforter la circonspection des éditeurs en la matière (cf. supra
n. 51).
benjamin (« plus de 6 000 mots » (première de couverture)), vite rejoint par le Robert benjamin
(1997, « 6 000 mots » (première et quatrième de couverture)), d’apparence extérieure très
similaire, et par le Petit Fleurus (1998, « plus de 5 000 mots » (quatrième de couverture)) ; cette
concurrence débouche, en 1999, sur la refonte du Mini débutants, rebaptisé Dictionnaire Mini
débutants (« 6 200 mots » (première et quatrième de couverture)).
51
L’évolution économique de l’édition dictionnairique caractérisée par les facteurs qui viennent
d’être évoqués va de pair avec celle de l’édition savante en linguistique, qui subit elle aussi les
effets des concentrations industrielles et est de plus en plus axée sur la production de manuels
plutôt que d’ouvrages fondamentaux (cf. infra § 1.2.4.).
52
Par exemple pour le Petit Larousse, en compilation avec d’autres dictionnaires dans les deux
éditions du Bibliorom Larousse de 1996 et 1998 (version 2.0), et commercialisé à plusieurs
reprises de façon indépendante depuis 1997 (version 1.01).
53
En outre, certains professionnels décrivent comme non florissant le marché des CD-ROM,
parlant même à leur propos de support dépassé, et s’interrogent sur la stratégie qu’il convient
d’adopter concernant Internet, ce qui ramène aux contraintes économiques bloquant l’esprit
d’innovation.
18
Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français
2. Circonscription raisonnée des besoins linguistiques de la lexicographie
générale monolingue
L’absence actuelle d’intérêt des éditeurs de dictionnaires français pour
l’utilisation lexicographique de la linguistique n’interdit nullement de tenter de
circonscrire ce que pourraient être les besoins de la lexicographie en la matière.
La réponse doit être modulée en fonction de la visée qui préside à l’élaboration
de dictionnaires particuliers :
– Plus un dictionnaire sera destiné prioritairement à servir de relais, lors de
consultations ponctuelles, entre des discours (à interpréter ou à produire) et des
locuteurs ayant atteint leur maturité linguistique et auxquels on peut présupposer
une capacité d’inférence vis-à-vis des informations qu’ils y trouvent, ou encore à
familiariser de jeunes apprenants natifs simultanément avec le lexique et avec le
dictionnaire, moins le recours à la linguistique sera utile pour son élaboration, à
laquelle pourvoira suffisamment le savoir-faire professionnel de lexicographes
supposés rompus à des techniques rédactionnelles spécifiques 54, en principe dotés
d’un sens linguistique affiné, et appuyés sur la logistique de leurs instances de
production.
– Par contre, plus on assignera à un dictionnaire des contraintes rigoureuses
d’adéquation dans la description d’un sous-ensemble sélectionné du lexique d’une
langue donnée, qu’il s’agisse de le constituer en somme de connaissances de
référence sur le fonctionnement de celui-ci, ou de l’adapter aux besoins
d’apprenants allophones avancés, ou encore de l’exploiter informatiquement, par
exemple dans un système de traduction assistée par ordinateur, plus le recours à la
linguistique deviendra nécessaire pour mobiliser des savoirs qu’il n’est plus du
ressort des lexicographes d’élaborer dans le cadre de leur activité ordinaire.
Je développerai successivement ces deux points, dans la continuité de P.
Corbin (1995, § 2.2.2.) et (1998, § 4.), mais en prenant appui sur des données
largement nouvelles.
2.1. Limites de l’usage de la linguistique en lexicographie monolingue
Ce n’est pas un hasard si l’essentiel de la production dictionnairique française
actuelle s’inscrit dans la tradition d’empirisme artisanal (nonobstant l’évolution
des conditions de production) qui fonda la lexicographie comme pratique destinée
à rendre des services pratiques. Chacun, en effet, semble y trouver son compte :
les éditeurs privés, que leurs intérêts bien compris, dans une économie de marché,
n’incitent pas à investir inconsidérément dans des projets hasardés et gourmands
en temps d’élaboration et en surface imprimée qui s’écarteraient trop des routines
éprouvées ; mais aussi sans doute la grande masse des utilisateurs, qu’on peut
supposer à la fois non disposés, sauf motivations très spécifiques, à surmonter les
54
Dans l’hypothèse, bien sûr, où ces qualités traditionnelles n’auraient pas été entamées d’une
part par l’évolution des conditions de travail qui fait la part belle au recrutement d’équipes de
rédacteurs temporaires au détriment de l’enracinement dans la culture rédactionnelle des
entreprises spécialisées (cf. supra § 1.2.1.), d’autre part par l’extension de la pratique de dérivation
d’ouvrages évoquée précédemment (ibid.), qui tend à donner le pas à la technique du couper-coller
sur la pratique de la rédaction d’articles.
19
Pierre Corbin
difficultés d’accessibilité des informations qu’induiraient des productions
dictionnairiques rompant avec les dispositifs les plus habituels (cf. supra § 1.2.4.),
et plus ou moins accoutumés à composer avec les approximations et
incomplétudes de ceux-ci (cf. infra § 2.1.3. et 2.1.4.) – sinon, pourquoi le genre
s’en perpétuerait-il ?
La substance même de ces dictionnaires conventionnels porte donc témoignage
de ce que la lexicographie monolingue peut proposer aux utilisateurs sans avoir
recours aux “sciences” du langage, lesquelles d’ailleurs ne sont pas sur tous les
points dépositaires d’alternatives convaincantes. Apprécier la mesure dans
laquelle cette option est pertinente revient donc à évaluer le potentiel d’utilité
pratique des dictionnaires ainsi produits. En première analyse, on peut soutenir
que les secteurs de la praxis dictionnairique dans lesquels elle semble le plus
légitime sont la catégorisation, le traitement de la prononciation, les définitions,
les contextualisations, les marques de registres et de domaines, et l’ordre des
acceptions et des expressions complexes.
2.1.1. La catégorisation
La catégorisation des unités répertoriées peut et doit se limiter au métalangage
le plus communément en vigueur, même si du champ de la linguistique émanent
d’une part des arguments qui établissent son inadéquation partielle, et d’autre part
des alternatives tant classificatoires que terminologiques. Ce constituant basique
des articles de dictionnaires, déterminant pour l’identification des items
représentés par les adresses, est soumis à des pesanteurs culturelles qui ne
permettent que des évolutions lentes : si, comme c’est souvent le cas, un
dictionnaire est destiné à un éventail ouvert de générations, sa terminologie
catégorielle aura de bonnes chances d’être indexée sur le formulaire scolaire en
vigueur deux ou trois décennies plus tôt.
2.1.2. Le traitement de la prononciation
Concernant la transcription de la prononciation des items-adresses, le recours à
l’Alphabet Phonétique International (A.P.I.) qui s’est installé puis généralisé dans
les quatre dernières décennies 55 – pour autant qu’on le considère comme un
apport de la linguistique –, s’il constitue désormais un impératif auquel aucun
éditeur n’envisagerait de se soustraire, n’en reste pas moins pour nombre
d’utilisateurs des dictionnaires un code dont la maîtrise ne va pas de soi : l’échec
commercial du Robert oral-écrit, qui utilisait un système de transcription adapté
de l’A.P.I. (cf. supra § 1.2.1.), en est un indice, et il est des lexicographes notoires
pour considérer que les systèmes de transcription ancestraux bricolés à partir de
l’alphabet ordinaire atteignaient probablement mieux leur objectif, ce que
corrobore la présence courante dans les dictionnaires monolingues français d’un
tableau aidant à décoder les signes de l’A.P.I. à partir de la graphie de mots
donnés en exemples dont la prononciation est supposée connue des utilisateurs.
55
Premiers dictionnaires français monolingues à l’utiliser de façon systématique : le Dictionnaire
du français contemporain en 1966 et le Petit Robert en 1967.
20
Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français
2.1.3. Les définitions
Le traitement définitionnel du sens et, le cas échéant, de la référence des items
lexicaux à sens descriptif 56, qui joue un rôle essentiel dans l’organisation de la
grande masse des articles de la majorité des dictionnaires généraux monolingues,
peut remplir sa fonction pratique de différentes manières, sans être nécessairement
soumis à des contraintes de rigueur sémantique extrême. S’il est raisonnable de
faire, avec Wierzbicka (1985), l’hypothèse que la maîtrise active des unités
lexicales à sens descriptif suppose celle de la structure des concepts
correspondants 57, on peut, pour les consultations de dictionnaires qui n’ont pas
pour finalité la stabilisation durable de savoirs lexicaux (au premier rang
desquelles celles qui sont faites au titre de la compréhension d’énoncés), se
satisfaire de moindres exigences et s’accommoder jusqu’à un certain point d’une
relative approximation définitionnelle, pour autant qu’elle suffit à permettre aux
utilisateurs de se faire une représentation au moins approchée du sens ou du
référent des items en effectuant certaines inférences interprétatives : ce que, de
fait, font couramment les locuteurs natifs confrontés à des définitions qui se
limitent à des débroussaillages sémantico-référentiels, qu’elles émanent de
dictionnaires ou constituent la substance d’explications métalinguistiques
formulées par d’autres locuteurs.
La mesure de l’écart entre les deux ordres d’exigences est donnée par ce qui
sépare, par exemple, les définitions de tasse, voisines et restreintes à un petit
nombre de propriétés, que proposent des dictionnaires généraux notoires comme
le Nouveau Petit Robert 2000 58 (« Petit récipient à anse ou à oreille, servant à
boire ») ou le Petit Larousse illustré 2001 59 (« Petit récipient à anse dont on se
sert pour boire »), et le prototype expérientiel, plus dense et articulé, qu’en
synthétise Martin (1993 : 152-153) 60, qui, bien que celui-ci n’en fasse pas
56
Cf. Kleiber (1997 : 32-33) : « L’hypothèse que nous suggérons est que le sens obéit à deux
modèles référentiels différents : le modèle descriptif, celui qui indique quelles sont les conditions
(nécessaires et suffisantes ou prototypiques) auxquelles doit satisfaire une entité pour pouvoir être
désignée ainsi, et le modèle instructionnel, qui marque le moyen d’accéder au, ou de construire le
référent. Le premier est prédicatif, le deuxième met en jeu des mécanismes dynamiques
(déictiques, inférentiels), qui ne constituent pas des propriétés du référent, mais des balises plus ou
moins rigides pour y arriver. »
57
« One reason why precise, exhaustive definitions of lexical items are needed is because this is
the only way to explain a culture to outsiders. » (p. 4). « To state the meaning of a word, it is not
sufficient to study its applicability to things ; what one must do above all is to study the structure
of the concept which underlies and explains that applicability. » (p. 18).
58
« près de 60 000 mots » (« Préface du Nouveau Petit Robert », p. XI).
59
« 59 000 mots » et « 28 000 noms propres » (quatrième de couverture).
60
« Une tasse est un récipient qui sert à boire. Parmi les autres objets du même type (verre,
coupe, bol, gobelet...), la tasse se distingue en ceci qu’elle est munie d’une anse (ou d’une oreille).
Ce trait est partagé seulement avec le bock, mais celui-ci est plus grand, il est en verre et il est fait
pour boire de la bière.
En termes de conditions nécessaires et suffisantes, la tasse peut donc se définir comme un
“petit récipient servant à boire, muni d’anse ou d’oreille”. Mais il va sans dire que l’expérience
que le locuteur a de la tasse va bien au-delà de ce contenu minimal.
21
Pierre Corbin
mention, manisfeste une grande parenté d’inspiration avec la construction
conceptuelle très fouillée et quasi téléologique développée par Wierzbicka (1985)
à propos de cup 61.
Pour autant, ces approfondissements de concepts qui émanent de linguistes ne
sont pas en rupture, dans leur mode d’élaboration, avec ce qui fonde la pratique
définitionnelle des lexicographes : une démarche introspective appuyée sur une
expérience de locuteurs 62, ce qui définit seulement une posture heuristique, sans
autrement fournir de procédures méthodologiques.
Conséquemment, il n’y a pas de différence d’essence entre l’investigation des
prototypes par les linguistes et les définitions ordinaires des lexicographes, mais
seulement des écarts de complétude, de complexité et de cohésion qui sont sujets
à varier fortement en fonction de la nature des projets dictionnairiques :
– Par sa forme, la tasse est généralement ronde (les angles n’en faciliteraient pas l’usage), plus
large en haut qu’en bas (jamais l’inverse, si l’on veut qu’elle se vide aisément) ; la conséquence
est qu’une tasse se renverse ; aussi est-elle habituellement posée sur une soucoupe.
– La matière de la tasse est, dans la plupart des cas, la céramique (faïence vernissée ou
émaillée, porcelaine, parfois terre cuite) ; les tasses en verre, en matière plastique, en argent ou en
inox sont inhabituelles ; pour être agréable aux lèvres, la céramique ne doit pas être trop épaisse :
la conséquence est hélas qu’une tasse peut se casser.
– La fonction de la tasse est également précise : on n’y boit pas n’importe quoi : des boissons
chaudes, pas de la bière, du vin ou de la limonade ; et pas n’importe quelle boisson chaude : du thé
ou du café. Naturellement on peut utiliser la tasse à toutes sortes d’usages : pour y présenter des
raisins de Corinthe, pour y faire de la vinaigrette, pour y nettoyer un pinceau dans de la
thérébentine... Mais ce sont là des usages déviants. La destination normale de la tasse n’est pas
celle-là.
Ainsi se dessine un objet beaucoup plus riche que les traits pertinents ne le laissaient
attendre. »
61
« Thus, the meaning of a word such as cup or mug is not an arbitrary collection of mutually
independent features, but a structured whole, where tout se tient. Neither the concept of a
prototypical cup nor the range of variability can accurately be described if this fact is not
understood. Since each individual component of a concept such as cup is determined by the
unifying principle underlying them all, the components are not mutually independent, and their
variability cannot be individually assessed. For example, size is not independent of the presence or
absence of a handle. A cup without a handle can only marginally be called a cup, but a small cup
can more easily remain thinkable of as a cup than a large one (for instance Chinese tea cups and
Turkish coffee cups are small and may have no handles). A cup must be designed in such a way
that it should be possible to drink from it by lifting it to the mouth with one hand, and not even the
whole hand but just two fingers and thumb. To meet this requirement a large cup must have a
handle, but a small cup can get by without it. » (p. 30). La définition détaillée (2 pages) de cup
articule conséquemment la finalité des objets ainsi dénommés avec diverses propriétés prenant en
compte matière, aspect, taille et mode d’utilisation (pp. 33-34).
62
Cf. Wierzbicka (1985 : 19) : « In the case of words describing natural kinds or kinds of human
artefacts, to understand the structure of the concept means to describe fully and accurately the idea
(not just the visual image) of a typical representative of the kind : that is to say, the prototype. And
to describe it fully and accurately we have to discover the internal logic of the concept. This is best
done not through interviews, not through laboratory experiments, and not through reports of
casual, superficial impressions or intuitions (either of ’informants’ or the analyst himself), but
through methodical introspection and thinking. »
22
Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français
(i) Les dictionnaires les plus élaborés pourront être à même de fournir l’essentiel
de la matière conceptuelle, quitte à la répartir, si leur dispositif microstructurel s’y
prête, entre définition et développement encyclopédique. Ainsi en va-t-il dans le
Grand dictionnaire encyclopédique Larousse pour l’article tasse, qui connecte à
une définition plus détaillée que celles du Nouveau Petit Robert 2000 et du Petit
Larousse illustré 2001 une rubrique encyclopédique qui inscrit dans une
perspective historique une évolution des relations fonctionnelles entre finalité,
forme et substance des objets dénommés tasse tout à fait compatible avec
l’analyse de cup par Wierzbicka 63.
(ii) À l’autre extrémité de la gamme, par contre, on rencontrera des dictionnaires
dont les définitions ne recensent même pas toujours un nombre de propriétés
suffisant pour satisfaire à des exigences d’explicitation minimale :
– Dans les petits utilitaires portatifs à bon marché, communément non rédigés
directement mais dérivés par réduction de dictionnaires plus importants (cf. supra
§ 1.2.1.), la simplification définitionnelle déterminée par la recherche de
l’économie typographique se traduit volontiers par un déficit de caractérisation.
Le Petit dictionnaire français Larousse de 1998, par exemple, bon représentant de
cette catégorie de répertoires avec ses « 38 000 mots, expressions et locutions » et
ses « 5 000 noms propres » 64, présente ainsi un florilège de définitions seulement
catégorisantes (poker : « Jeu de cartes ») ou faussement caractérisantes (poire :
« Fruit du poirier » (1.), cette définition étant prise dans une relation circulaire
avec celle de poirier : « Arbre fruitier dont le fruit est la poire »).
– À l’inverse, des dictionnaires pour jeunes apprenants natifs peuvent s’en tenir à
des définitions caractérisantes qui font l’économie de la catégorisation, à l’image
de celle, par ailleurs cognitivement assez riche, que propose pour tasse le Mini
débutants Larousse de 1985 (cf. supra n. 50), destiné aux élèves des cours
préparatoire et élémentaire (« On boit le thé, le café dans une tasse. La tasse a une
anse pour la tenir à la main. On la met sur une soucoupe. ») 65. On reconnaît dans
cette ellipse de l’élément catégorisant un écho aux définitions spontanées en
63
« 1. Petit récipient de forme ovoïde, cylindrique ou demi-sphérique, généralement muni d’une
anse, parfois d’un couvercle, et qui sert à boire. (V. part. encycl.) […]
– ENCYCL. Dès le Moyen Âge, on donna souvent le nom de tasse à des vases ou à des coupes à
boire en argent ou en vermeil dans lesquels on dégustait du vin ou des liqueurs. Ce n’est qu’au
XVIIIe s. que la tasse prit sa forme spécifique, bien qu’encore variée en galbe et en dimensions,
avec l’usage du thé, du café et du chocolat. La délicatesse et la légèreté de la porcelaine en firent
dès lors le matériau de choix pour les services, qui comprenaient généralement 12 pièces ; décorée
par les plus grands peintres céramistes (notamment à Sèvres), la tasse devint aussi objet
d’ornement. On en fabriqua également en faïence, d’un coût moins élevé, dont certaines, de
grandes dimensions, pour les cabarets. »
64
Quatrième de couverture.
65
Le Dictionnaire Mini débutants refondu de 1999 (cf. supra n. 50) présente un schéma
définitionnel plus canonique qui réintègre les éléments catégorisateurs (tasse : « Une tasse est un
petit récipient avec une anse. On l’utilise pour boire certaines boissons »), probablement sous
l’influence conjuguée des effets normalisateurs de l’informatique éditoriale et des dispositifs
adoptés entretemps par des dictionnaires concurrents (ibid.) : Dictionnaire Hachette benjamin de
1996, tasse : « Petit récipient avec une anse. » ; Robert benjamin de 1997, tasse : « Une tasse,
c’est un petit récipient avec une anse, dans lequel on boit. ».
23
Pierre Corbin
« C’est pour… » des enfants, qui n’ont pas toujours la faveur de l’institution
scolaire, et dont Le gros dico des tout petits (1993, « 3 006 mots » 66), présenté
comme réalisé par enquête auprès d’« enfants âgés de cinq à six ans » 67, porte
témoignage, par exemple s.v. casserole (« C’est pour faire chauffer ou cuire à
manger sur le feu ou sur une plaque »).
(iii) Par ailleurs, dans des dictionnaires de tous ordres on trouvera des
insuffisances et des erreurs, imputables non à un manque de connaissances
linguistiques, mais seulement à un déficit d’approfondissement de l’investigation
définitionnelle ordinaire :
– Insuffisante, la restriction de la définition de mots construits comme l’adjectif
poissonneux à leur sens compositionnel (“Qui abonde en poissons”), assumée
sous une forme ou une autre par un large échantillon de nos dictionnaires 68 sans
les ajustements référentiels nécessaires (l’indication que les poissons doivent être
vivants, une rivière pleine de poissons morts ne pouvant plus être dite
poissonneuse ; la mention du fait que, de façon privilégiée, ce sont des biotopes
qui pourront être qualifiés de poissonneux, et qu’ils le seront d’autant mieux que
l’abondance des poissons y sera accompagnée d’une répartition tendant à saturer
leur espace).
– Erronée, la confusion définitionnelle entre les mots et les choses, observable par
exemple dans la définition d’atchoum par “Bruit…” que retiennent divers
dictionnaires 69, atchoum n’étant pas le bruit que fait un éternuement, mais la
codification conventionnelle de ce bruit en français, qui diffère de celles de
l’anglais (atishoo), de l’allemand (hatschi), du néerlandais (hatsjie), de l’espagnol
(¡achís!), etc. 70.
Tous les manques relevés en (ii) et (iii) sont bien réels, et des dictionnaires de
même catégorie que ceux qui ont été épinglés dont les définitions comporteraient
66
« Introduction », p. 7.
« Introduction », p. 7.
68
« Qui abonde en poisson(s) » : Trésor de la langue française, Petit Larousse illustré 2001,
Dictionnaire Hachette encyclopédique illustré 2001, Petit dictionnaire français 1998,
Dictionnaire universel de poche Hachette de 1999 ; « Qui contient de nombreux poissons » :
Nouveau Petit Robert 2000, Robert méthodique, Robert de poche. Etc.
69
« Bruit que fait un éternuement » : Petit dictionnaire français 1998 ; « Bruit produit par un
éternuement » : Grand Robert de la langue française, Nouveau Petit Robert 2000, Le Robert de
poche. Etc. Assez nombreux sont les dictionnaires qui ne comportent pas d’adresse atchoum.
70
Les mêmes dictionnaires ne commettent d’ailleurs pas la même bévue pour d’autres
onomatopées. Ce flottement est illustré exemplairement dans le Nouveau Petit Robert 2000, plus
vigilant pour drelin (« Onomatopée évoquant le bruit d’une clochette, d’une sonnette ») ou vlan
(« Onomatopée imitant un bruit fort et sec »), mais qui traite boum (« Bruit de ce qui tombe,
explose », s.v. 1. boum 1.) comme atchoum. Au sein d’une lignée dérivationnelle chez un même
éditeur, on peut aussi observer des démarcations qui manifestent un retour critique sur le texte
source, par exemple dans le Robert méthodique (1982), qui se singularise, par rapport au Petit
Robert de 1977, en donnant d’atchoum une définition adéquate : « Onomatopée servant à
transcrire le bruit d’un éternuement », s.v. atchoum 1° (autre exemple de ce type de démarquage
du Robert méthodique au sein de la généalogie des dictionnaires Robert dans P. Corbin 1989a, §
2.2.2. et 2.3.2.1.2.).
67
24
Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français
davantage de spécifications ou moins d’erreurs seraient à coup sûr meilleurs 71.
Pour autant, il ne paraît pas nécessaire d’appeler la linguistique à la rescousse :
– d’une part parce que, sans rechercher le paradoxe ni porter un regard
panglossien sur la production dictionnairique monolingue française actuelle, on
peut relativiser l’importance de ces insuffisances si l’on se représente le couple
constitué par un dictionnaire et un utilisateur natif aguerri comme une sorte de
système expert dans lequel le second ajuste ses attentes et ses interprétations par
rapport à la matière que lui fournit le premier : on n’utilisera pas un dictionnaire
utilitaire pour s’initier aux règles du poker ; poire fait partie de ces mots qui ne
peuvent pas ne pas figurer dans un dictionnaire au regard de leur usualité et de la
familiarité de leur référent, mais dont celles-ci font supposer, en retour, que les
articles qui leur sont consacrés ne compteront pas parmi les plus visités par les
utilisateurs (au moins au titre de leur sens premier) 72 ; il n’est pas déraisonnable
d’imaginer que ceux-ci pourront pallier d’eux-mêmes le manque définitionnel
concernant poissonneux en application des mêmes mécanismes cognitifs qui ont
amené les rédacteurs à le produire, vraisemblablement de façon inconsciente ; et
la distorsion définitionnelle observée pour atchoum, pour effective qu’elle soit,
n’en demeure pas moins une subtitilité de nature à titiller davantage la sensibilité
des linguistes et autres professionnels de la langue et de la métalangue qu’à
troubler le tout-venant des usagers ;
– d’autre part parce que les améliorations qualitatives que l’on serait en droit de
souhaiter et qui se lisent en filigrane dans les commentaires critiques qui
précèdent ne sollicitent pas, en l’occurrence, d’autres qualifications que les
compétences ordinaires des lexicographes.
2.1.4. Les contextualisations
Le déploiement systématique du potentiel combinatoire des unités ne saurait
sans dommage, au regard de ce que peut être la complexité de celui-ci, faire
l’économie du recours à des concepts et des procédures proprement linguistiques
(cf. infra § 2.2.2.). Mais cette exigence outrepasse les finalités ordinairement
assignées par la lexicographie conventionnelle à l’exhibition de contextualisations
pour les items-adresses, qui vise non à l’exhaustivité, mais à la suggestion,
modulable en fonction des types de dictionnaires, de tendances distributionnelles
et à l’ostentation des cooccurrences les plus remarquables, ainsi qu’au
71
Par exemple, dans les dictionnaires utilitaires de poche, si le Dictionnaire universel de poche
Hachette de 1999 (« 40 000 noms communs » et « 10 000 noms propres » (première de
couverture)), qui ignore atchoum, ne se démarque pas significativement du Petit dictionnaire
français dans le traitement des autres mots pris ici comme exemples, le Robert de poche de 1995
(« 39 000 mots de la langue » et « 6 000 noms propres » (première de couverture)) tend en
revanche à proposer des définitions plus riches en traits spécificateurs, notamment pour poker
(« Jeu de cartes et d’argent basé sur des combinaisons (cinq cartes par joueur). » (s.v. poker I.)) et
pour poire (« Fruit du poirier, charnu, à pépins, allongé et ventru. » (s.v. poire 1.)).
72
Cf., appliquées à un autre objet dictionnairique, les réflexions de Béjoint (à paraître) sur les
items dont on pourrait faire l’économie dans la nomenclature de dictionnaires bilingues destinés à
aider les lectures cursives de textes en langue étrangère (dictionnaires dits « de décodage » ou « de
médiation ») quand les mêmes formes ont (en gros) les mêmes sens dans les deux langues
impliquées.
25
Pierre Corbin
renforcement des cadrages sémantico-référentiels opérés par les définitions – à
charge pour les usagers, ici encore, de combler les manques plus ou moins
accentués des articles sur la base de leurs connaissances générales et des
informations particulières que leur fournit le contexte textuel de l’item pour lequel
ils consultent le dictionnaire.
Sans présenter les qualités de complétude et de traitement méthodique que l’on
est en droit d’attendre de descriptions linguistiques, les dictionnaires de quelque
importance, que peuvent désormais étayer corpus et concordanciers électroniques,
sont susceptibles de proposer un échantillon honorable de contextualisations 73. Et
de dictionnaires aux ambitions plus restreintes (cf. supra § 2.1.3.), on n’attendra
pas autre chose que des contextualisations parcellaires plus suggestives que
proprement descriptives, autorisant tout au plus un butinage supputatif dans telle
ou telle direction, ce qui peut à nouveau être illustré par des exemples pris dans le
Petit dictionnaire français de 1998 : selon les articles, on pourra se croire autorisé
à identifier des classes contextuelles, comme dans le cas d’« étang poissonneux »
s.v. poissonneux, euse, qui incite à faire l’hypothèse que la définition (cf. supra n.
68) vaut dans le contexte de noms référant à des étendues d’eau insérées dans des
écosystèmes naturels 74, mais ne permet pas d’inférer (cf. supra § 2.1.3., (iii)) que
ce contexte est exclusif (puisqu’on ne parlera pas d’un aquarium poissonneux 75) ;
ou encore se faire une idée des types de compléments possibles d’un item verbal
pour un de ses sens, par exemple « diminuer le mérite de quelqu’un » s.v.
diminuer 2., mais pas des contraintes éventuelles sur son sujet, que la définition
(« Déprécier, rabaisser ») n’éclaire pas non plus ; ou simplement prendre acte de
l’existence d’un contexte sans pouvoir risquer d’extrapolations, cas de figure
illustré par la mention de la séquence « avoir le hoquet » s.v. hoquet à la suite de
la définition (« Contraction brusque du diaphragme »), qui ne renseigne pas sur le
caractère exclusif, privilégié ou aléatoire de la cooccurrence avec le verbe support
avoir, ni sur le caractère contraint ou libre du déterminant le dans cette
73
Mais l’interprétation de leur statut n’est pas toujours dépourvue d’équivoque. Les séquences en
italiques maigres des dictionnaires Robert, en particulier, se signalent par une polyvalence
maximale de nature à troubler les utilisateurs, comme en témoigne par exemple l’article café du
Nouveau Petit Robert 2000, dans lequel cette codification s’applique à des énoncés construits (Il
boit dix cafés par jour (I.3.)), des énoncés cités (« À onze ans, Robert et Anselme s’arrangent, en
revenant de l’école, pour s’arrêter devant un café-chantant où, dès six heures, on entend de la
musique » (II., citation de Mallet-Joris)), des unités codées de complexité variable, glosées (C’est
(un peu) fort de café (I.3., paraphrasé par « c’est exagéré, invraisemblable »)) ou non (Café au lait
(I.3.)), et de purs supports de renvois analogiques sans statut linguistique ou discursif mais
pouvant constituer des éléments de définition des items auxquels ils servent à renvoyer (Variétés
de café (I.1., séquence introduisant un renvoi à arabica, robusta, moka, dont elle constitue
l’hyperonyme définitionnel – et de fait, les définitions de robusta et de moka 1. commencent par
« Variété de café »)).
74
Ce que certains dictionnaires assument définitionnellement, par exemple le Grand Larousse de
la langue française (« Se dit d’un cours d’eau, d’un lac, d’une mer, etc., où le poisson se trouve en
abondance ») ou le Grand Robert de la langue française (« Qui contient de nombreux poissons (en
parlant d’un cours d’eau, d’un lac, de la mer…) »).
75
La définition de poissonneux dans le Lexis, plus riche que d’autres en ce qu’elle mentionne
l’élément aqueux (« Se dit d’une eau qui contient de nombreux poissons »), passe néanmoins à
côté de cette discrimination.
26
Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français
cooccurrence, etc. Dans les limites circonscrites par son ordre de grandeur, le
Petit dictionnaire français peut apparaître comme représentatif des pratiques
observables en matière de contextualisation dans bon nombre de dictionnaires
orientés de façon privilégiée vers l’aide à la compréhension (ce qu’il est convenu
d’appeler “décodage”) 76, ni systématiques, ni extensifs, ni explicites, et qui ne
requièrent pas la rigueur de description linguistique des emplois que l’on est en
droit d’attendre de dictionnaires expressément orientés vers l’aide à l’expression
(dictionnaires dits d’“encodage”), qui ne peuvent pas prendre appui sur la même
présupposition d’interactivité entre le texte dictionnairique et le bagage langagier
des usagers.
2.1.5. Indicateurs de registres et de domaines (vs indicateurs de transition de
sens)
La présence d’indicateurs de registres et de domaines, dont la fonction est de
discriminer les usages, est, pour cette raison même, souhaitable dans les
dictionnaires de tous ordres et elle peut continuer à se faire selon les conventions
en vigueur, non parce que ceux-ci seraient des modèles d’adéquation, notamment
en matière de registres, mais faute d’un dispositif susbtitutif émanant du champ
linguistique qui serait applicable à l’échelle du lexique global 77. En revanche,
mieux vaut faire l’économie des indications de transitions de sens (figuré, par
extension, par analogie, par métaphore, par métonymie, etc.), qui ne sont pas
indispensables à la compréhension de chaque sens particulier envisagé pour luimême, et dont le maniement adéquat suppose la maîtrise appropriée de
connaissances non triviales en sémantique lexicale (cf. infra § 2.2.3.). Si les
dictionnaires conventionnels un peu substantiels n’ont pas souvent cette prudence
(ibid.), les dictionnaires limités à des ambitions utilitaires modestes observent par
contre assez communément cette partition aussi circonspecte que fonctionnelle, à
l’instar du Petit dictionnaire français de 1998, dont l’article cocotte illustre
représentativement le parti pris différentiel en matière de recours à des classes
d’indicateurs :
« cocotte nf 1. Petite marmite en fonte. 2. Poule, dans le langage enfantin. 3. Morceau de
papier plié, figurant une poule. 4. FAM Femme de mœurs légères. 5. FAM Terme
d’affection. »
Un article ainsi conçu prend en compte la variation sociolinguistique en affectant
aux emplois 4. et 5. l’indicateur de registre « FAM. », mais son organisation
n’obéit pas à des principes sémantiques, puisqu’il regroupe dans une même unité
de consultation deux mots cocotte qui n’ont pas le même étymon (respectivement
76
Pour les mêmes emplois des trois mots considérés, les deux concurrents directs du Petit
dictionnaire français (cf. supra n. 71) apparaissent nettement en retrait en matière de
contextualisation (aucune cooccurrence dans aucun des deux).
77
Cf. P. Corbin (1989b, § 4.). Certains ouvrages, par exemple ceux consacrés par Bernet &
Rézeau au français parlé (Dictionnaire du français parlé, 1989 ; Richesses lexicales du français
contemporain, 1995), présentent des spécifications pragmatiques plus subtiles que le tout-venant
des dictionnaires, mais ils le doivent au sens de la langue et au soin des rédacteurs, non à
l’influence de la linguistique.
27
Pierre Corbin
les emplois 1. 78 et 2.-5. 79), et n’indique aucune filiation de sens entre ces quatre
dernières acceptions, alors qu’il serait concevable d’envisager des relations de
dérivation sémantique, d’ailleurs inégalement aisées à décrire, entre les emplois 2.
et respectivement 3., 4. et 5., appuyées sur des similarités de forme (3.) ou de
comportement (4.) 80 ou des relations de familiarité partagée (5.) 81.
2.1.6. L’ordre des acceptions et des expressions complexes
Corrélativement, plus on assigne à des dictionnaires l’objectif de rendre des
services pratiques (essentiellement en matière de compréhension) lors de
consultations ponctuelles, plus l’ordre des acceptions et des expressions
complexes doit être orienté vers la facilité de consultation, c’est-à-dire privilégier
les classements par fréquence, par domaines et par ordre alphabétique, ce qui
dispense ces dictionnaires d’avoir à construire une logique linguistique de
dérivation sémantique. Cette organisation purement fonctionnelle communément
répandue s’observe notamment dans divers dictionnaires “encyclopédiques”, dont
le Nouveau Larousse encyclopédique de 1994 constitue un exemplaire
représentatif, par exemple à travers son article cheval :
« CHEVAL n.m. (lat. caballus, rosse) -1. Grand mammifère domestique caractérisé par la
longueur des membres. (Longévité jusqu’à 30 ans ; ordre des ongulés ; famille des
équidés.) Le cheval hennit, pousse son cri. La femelle du cheval est la jument ; son petit est
le poulain. (V. ENCYCL.) -2. Équitation : Faire du cheval. -3. Viande de cheval. 4. (Abrév.). Cheval-vapeur. || Cheval de bois, jouet d’enfant figurant un cheval, en usage
autrefois. || Chevaux de bois, manège. DR. Cheval fiscal (abrév. CV), unité de mesure de
cylindrée par laquelle on détermine notamm. le montant de la vignette et des primes
d’assurance pour les véhicules automobiles. JEUX. Petits chevaux, jeu de société se jouant
avec des figurines ayant une tête de cheval. LITTER. Cheval de Troie, gigantesque cheval
de bois grâce auquel une poignée de Grecs, cachés à l’intérieur, réussirent à pénétrer dans
Troie. SPORTS. Cheval de saut, agrès sur lequel les gymnastes prennent appui, après une
course d’élan, pour effectuer un saut. »
Dans ce type d’organisation, le développement sur la langue générale précède
ceux qui portent sur les domaines spécialisés, repérables par des marques en
petites capitales grasses ; dans le développement sur la langue générale, les sens
(ici : 1.-3.) précèdent les cooccurrences (ici : 4.) ; les cooccurrences du
développement sur la langue générale sont ordonnées alphabétiquement ; et les
développements sur les domaines spécialisés se succèdent dans l’ordre
alphabétique des marques de domaines. Nul besoin de linguistique pour maîtriser
de tels dispositifs.
78
« p.-ê. du moy. fr. coquasse « récipient », altér. de coquemar » selon le Nouveau Petit Robert
2000, s.v. 2. cocotte.
79
« onomat. → 2. coco » selon le Nouveau Petit Robert 2000, s.v. 1. cocotte.
80
Selon le Dictionnaire historique de la langue française, ce sens « se greffe sur la valeur
hypocoristique du terme comme nom enfantin de la poule » (s.v. 2. cocotte), mais ce dictionnaire
n’explicite pas les modalités de cette “greffe”.
81
Les deux dictionnaires concurrents du Petit dictionnaire français (cf. supra n. 71) adoptent des
options voisines, nonobstant un dédoublement d’adresses dans le Robert de poche.
28
Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français
2.2. Besoins en linguistique de la lexicographie monolingue
Si donc, pour ce qui relève d’une lexicographie conventionnelle axée sur les
consultations de dépannage, les lexicographes peuvent faire l’économie des
lumières des linguistes, il n’en va plus de même pour l’élaboration de
dictionnaires auxquels on assigne une vocation descriptive, que celle-ci soit ou
non orientée vers la didactique, et des exigences de rigueur, de cohérence et de
systématicité. Les lexicographes peuvent alors beaucoup plus crucialement être
amenés à souhaiter croiser la route des linguistes, qui ont cette vocation pour
raison d’être, avec une liberté en plus – celle de disposer du temps nécessaire à
l’analyse –, mais aussi, assez communément, une exigence en moins – celle
d’avoir à traiter le lexique dans sa globalité.
Les besoins en apports linguistiques de ces dictionnaires qui se donnent ou se
donneraient pour objectif de présenter une description quelque peu fouillée du
lexique sont faciles à établir : il suffit de dresser le catalogue des faits dont le
traitement présente des inadéquations descriptives dans les dictionnaires existants
les plus élaborés. On n’en trouvera ici qu’un aperçu, qui pointe quelques
problèmes récurrents (les unités linguistiques non-dénominatives, la syntaxe des
unités lexicales, les indicateurs de transitions de sens), mais sans chercher à être
exhaustif.
2.2.1. Les unités linguistiques non-dénominatives
Les unités linguistiques non-dénominatives (mots “grammaticaux”, auxiliaires,
éléments de formation de mots construits,…) comptant parmi celles dont le
fonctionnement est le plus complexe et, partant, le plus difficile à décrire, il n’est
pas surprenant que leur traitement dictionnairique manifeste de sérieuses carences,
même dans des ouvrages de référence :
– S’agissant des mots “grammaticaux” (pronoms, déterminants, connecteurs,
prépositions…), l’expérience du Diplôme Européen de Lexicographie puis du
DESS “Lexicographie et Terminographie”, dans lesquels un enseignement
spécifique est régulièrement consacré à leur traitement lexicographique, nous a
montré que celui-ci tendait à être plus en prise sur la linguistique descriptive dans
le Trésor de la langue française, qui, ainsi qu’il a déjà été indiqué (cf. supra §
1.1.2. et n. 32), a bénéficié pour ces mots de l’expérience de linguistes comme
Robert Martin, que dans tout autre dictionnaire, mais au prix d’une technicité
formulatoire à la fois hors de portée des lexicographes ordinaires et non
assumable par une lexicographie à vocation commerciale qui, dans le meilleur des
cas, ne peut, à l’instar du Grand Robert de la langue française, qu’opérer un
contournement du métalangage et se cantonner dans l’implicite.
– Quant au traitement lexicographique des éléments de formation de mots, que ce
soit dans des articles de la nomenclature ou dans des tableaux ou des répertoires
annexes, il présente beaucoup de déficits d’inventaire, de cohérence et
d’adéquation dans l’ensemble des dictionnaires existants. On peut, certes, établir
des hiérarchies : observer, par exemple, que le recensement de ces éléments est
très conséquent dans le Trésor de la langue française, sans toutefois être
exhaustif ; ou encore retenir que il est fait une place dans le Robert méthodique à
l’ensemble des éléments qui y sont repérés comme constitutifs des unités lexicales
29
Pierre Corbin
qui reçoivent le statut d’adresses, ce qui n’implique pas que l’on cautionne tous
ses découpages. Mais aucun dictionnaire ne présente un tableau vraiment
satisfaisant du fonctionnement des affixes et des formants de mots composés du
français, et plusieurs sont réellement désastreux. Un peu plus de vigilance et de
bon sens permettrait, bien sûr, d’éviter certaines aberrations, mais le déficit global
du panorama d’ensemble traduit une difficulté foncière à décrire correctement les
éléments considérés sans le support d’une théorie consistante de la construction
d’unités lexicales. On trouvera dans D. Corbin (1997a), outre un court échantillon
de défaillances dictionnairiques observées (§ 2.) 82, un programme raisonné de
description lexicographique des affixes dérivationnels (§ 3.), articulé en neuf
rubriques : « variantes allomorphiques », « flexion », « prononciation »,
« catégorie », « histoire », « sens », « catégorie lexicale des bases », « catégorie
lexicale des mots construits », « contraintes sur les bases ».
2.2.2. La syntaxe des unités lexicales
Une autre difficulté importante pour une lexicographie descriptive est
constituée par la syntaxe des unités lexicales, et particulièrement des verbes, qui,
dans les dictionnaires existants, présente également beaucoup d’insuffisances dans
toutes ses dimensions, qu’il s’agisse des constructions prises en compte, de
l’articulation des constructions entre elles et avec le traitement des sens, ou de la
combinatoire lexicale. Les distorsions entre les structures visibles et les structures
effectives de certaines constructions de compléments de verbes, par exemple,
créent de réelles difficultés de traitement dans les dictionnaires qui sont rédigés
sans apport linguistique spécifique : c’est le cas notamment pour les propositions
infinitives directes introduites par le complémenteur de, dans le traitement
desquelles le Trésor de la langue française semble mieux tirer son épingle du jeu
qu’une bonne partie de la production dictionnairique, ce qu’illustre par exemple la
structuration de l’article décider 83 : la construction décider de + infinitif y est
légitimement regroupée en I.B.2.b, au sein des emplois transitifs directs (I.), avec
la construction décider que + subordonnée conjonctive (I.B.2.a) sous la définition
« Prendre un parti, déterminer une issue, conduire quelque chose à un résultat
82
83
Sur ce point, cf. aussi P. Corbin (1995, § 2.2.1.).
« I. – Emploi trans. dir.
[...]
B. – P. ext. Prendre un parti, déterminer une issue, conduire quelque chose à un résultat définitif.
1. Vieilli. [L’objet désigne un subst. inanimé abstr. ou un nominal indéf.]
[...]
2. [L’obj. est une subordonnée complétive]
a) [Le suj. du verbe sub. est différent de celui de la principale] Décider + subordonnée
conjonctive.
[...]
b) [Le suj. du verbe sub. est le même que celui de la principale] Décider de + inf. [...]
II. – Emploi trans. indir.
A. – [Le suj. désigne une pers.]
1. Décider de + subst. Arbitrer, déterminer, juger.
a) Décider de + subst. désignant une pers. [...]
b) Décider de + subst. désignant un inanimé abstr. (parfois concr.). [...] »
30
Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français
définitif » (B.), et elle est dissociée de la construction décider de + substantif
(II.A.1.), correspondant à la définition « Arbitrer, déterminer, juger » et traitée
ainsi qu’il convient parmi les emplois transitifs indirects (II.) 84. Ce traitement
linguistiquement cohérent et appuyé sur la distinction sous-jacente non triviale
entre un de proprement prépositionnel et un de complémenteur peut être contrasté,
à titre d’exemple, à celui du Nouveau Petit Robert 2000 85, défendable du point de
vue de la commodité de consultation, mais linguistiquement inconséquent et peutêtre sous-informé, qui traite uniformément toutes les constructions en de de
décider comme transitives indirectes (II.), dissociant ainsi décider de + infinitif de
sa variante décider que (I.2.), décrite adéquatement comme transitive directe (I.),
ce qui conduit inévitablement à une redondance définitionnelle entre les deux
constructions : « Arrêter, déterminer (ce qu’on doit faire) ; prendre la décision
de », qui chapeaute la construction conjonctive, a pour écho « prendre la
résolution, la détermination de », qui glose la construction infinitive.
2.2.3. Les indicateurs de transitions de sens
L’usualité de l’utilisation lexicographique d’indicateurs de transitions de sens
(figuré, par extension, par analogie, par métaphore, par métonymie, etc.) et,
partant, sa relative vulgarisation n’impliquent pas qu’elle soit aisée (cf. supra §
2.1.5.), ni ne doit donner à penser qu’elle puisse sans risque, si elle vise à la
cohérence, faire l’économie de la référence à une théorie globale du sens lexical
qui articule les types majeurs de relations sémantiques au sein du lexique 86. Dans
les dictionnaires courants qui utilisent de telles notations, il est trop aisé d’en
repérer les dysfonctionnements pour ne pas considérer qu’ils traduisent une
insécurité des rédacteurs aussi compréhensible que non blâmable face à une
entreprise qui les dépasse. Sinon – c’est-à-dire si la tâche était simple –, comment
expliquerait-on, par exemple, que dans l’article café du Nouveau Petit Robert
84
Le Grand dictionnaire encyclopédique Larousse, en raison des conditions particulières qui ont
déterminé son traitement des constructions verbales (cf. supra § 1.1.2.), opère, lui aussi, une
répartition satisfaisante des constructions en de de décider : regroupement sous l’emploi transitif
de décider de + infinitif avec décider qqch (action) et décider que + indicatif sous le sens
« prendre le parti de faire qqch, se déterminer à entreprendre qqch, prendre la résolution qu’un
événement ait lieu ; résoudre » (décider v. t. 1.) ; traitement de décider de qqch comme emploi
transitif indirect susceptible d’avoir un sujet référant à une personne (« se déterminer sur telle
action à mener, telle date à choisir, tel choix à faire » (v. t. ind. 1.)) ou à une chose (« être
l’élément décisif qui entraînera telle action, tel événement, tel choix » (v. t. ind. 2.)).
85
« I. V.tr. dir. [...] 2. MOD. Arrêter, déterminer (ce qu’on doit faire) ; prendre la décision (3°) de.
⇒ arrêter, fixer. [...] Il n’a encore rien décidé. [...] DECIDER QUE. Il décide qu’il n’ira pas
travailler. [...]
II. V. tr. ind. DECIDER DE QQCH. (PERSONNES) Disposer en maître par son action ou son jugement. Le
chef de l’État décide de la paix et de la guerre. L’arbitre décidera de la régularité des coups. ⇒
arbitrer, 1. juger. Laissez-nous en décider. – (CHOSES) Déterminer, être la cause principale. [...] ◊
DECIDER DE (et l’inf.) : prendre la résolution, la détermination de. Ils ont décidé de partir, ils en ont
décidé ainsi. Décidons de nous retrouver à huit heures. »
86
Cf. par exemple, dans un cadre de sémantique vériconditionnelle, le calcul sur les additions et
effacements de traits sémantiques proposé par Martin (1992, chap. II, § II.) pour donner des appuis
méthodologiques à l’utilisation de ces indicateurs.
31
Pierre Corbin
2000 87, on pointe des extensions discutables pour « Café soluble, lyophilisé »
(I.1.), qui ne refère pas moins à des états différents du café que « Café en grains,
moulu », non marqué, ou pour « Le moment où l’on prend le café, après le repas »
(I.3.), qui pourrait bien n’être qu’un sens contextuel et non lexical, alors que dans
le même temps on omet des métonymies patentes pour « Boisson obtenue par
infusion de grains torréfiés et moulus » (I.3.) ou « Lieu public où l’on consomme
des boissons » (II.) ?
3. Qu’est-ce que
(descriptive) ?
la
linguistique
peut
apporter
à
la
lexicographie
Le développement précédent (§ 2.) a fourni des éléments de circonscription de
la pertinence du recours à la linguistique dans l’activité lexicographique. Reste à
voir maintenant les modalités de cette contribution.
Dans son principe, la linguistique peut beaucoup de choses pour l’amélioration
des dictionnaires descriptifs, puisque la description adéquate du fonctionnement
des langues est constitutive de son programme actuel. Le simple fait de pouvoir
pointer toute une gamme de carences observables dans les traitements
dictionnairiques est à lui seul l’indice qu’il existe au moins un autre regard sur les
faits considérés, et la mise en relief des bénéfices que le Trésor de la langue
française a tirés de la participation de linguistes à son élaboration donne des
indications sur les potentialités de cette collaboration interdisciplinaire.
Si le principe est clair, la mise en pratique n’a pas la même évidence. Deux
difficultés majeures de transmission des connaissances se posent en effet : celle de
l’accès des lexicographes aux savoirs linguistiques disponibles, et celle de la
conversion de ces savoirs par les lexicographes en textes dictionnairiques
décodables par des utilisateurs non spécialistes 88.
3.1. L’accès des lexicographes aux savoirs linguistiques
L’accès des lexicographes aux savoirs linguistiques qui pourraient leur être
utiles dans leur pratique n’est pas chose aisée. La linguistique n’est pas
aujourd’hui une discipline unifiée dans ses fondements et dans ses méthodes, qui
proposerait, dans divers secteurs, un ensemble de résultats stabilisés. Tout au
87
« n. m. [...]
I. 1. Graines du fruit du caféier, contenant un alcaloïde aux propriétés stimulantes [...] ◊ Ces
graines torréfiées. Paquet de café. Café en grains, café moulu. Moulin* à café. – PAR EXT. Café
soluble, lyophilisé. 2. PAR METON. Caféiers. Une plantation de café. [...] 3. Boisson obtenue par
infusion de grains torréfiés et moulus. [...]. – Tasse, bol de café. Il boit dix cafés par jour. Mettre
deux sucres dans son café. – Petit déjeuner où l’on boit du café. Un café complet*. Un café
croissant. – Préparation à base de café. Café irlandais. [...]. ◊ PAR EXT. Le moment où l’on prend le
café, après le repas. Venez pour le café. Offrir des liqueurs au café. 4. Adj. inv. Café au lait :
couleur brun clair.
II. [...] Lieu public où l’on consomme des boissons. [...] »
88
Pour l’essentiel, les développements qui suivent redistribuent selon un autre schéma
d’exposition une matière déjà déployée dans P. Corbin (1998, § 4.).
32
Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français
contraire, elle apparaît, au moins pour le domaine français, comme une
constellation de courants éparpillés et quelquefois conflictuels, proposant des
productions inégalement adéquates et falsifiables parmi lesquelles il n’est pas aisé
de se repérer avec sûreté, dont les divers champs d’étude ne s’intègrent pas dans
une articulation coordonnée et ne présentent pas le même degré d’aboutissement,
et dont la diffusion a souvent un caractère semi-confidentiel. Or les lexicographes,
même si on leur suppose une formation de base un peu solide en linguistique (ce
qui n’est pas toujours le cas), n’ont ordinairement pas le temps, dans l’exercice de
leur profession, d’effectuer de longues recherches pour savoir où trouver
l’information utile, ni pour extraire des travaux savants ce qui est strictement
applicable pour leur pratique : l’exception du Trésor de la langue française ne
doit pas abuser ici, dans la mesure où il s’agit d’un dictionnaire qui a échappé aux
lois ordinaires de la production dictionnairique commerciale, et dont le
financement sur fonds publics a permis aux rédacteurs une latitude documentaire
hors de portée des lexicographes travaillant pour l’édition privée.
Il faudrait donc que les lexicographes puissent disposer de travaux qui
calibreraient les résultats des recherches linguistiques exploitables
dictionnairiquement dans une mise en forme propice à une utilisation sans
médiation. On pourrait penser à des sortes de métadictionnaires, c’est-à-dire des
dispositifs de compilation d’analyses linguistiques systématiques et extensives
d’unités lexicales, qui ne seraient pas directement lisibles par des lecteurs
profanes, mais dans lesquels des lexicographes suffisamment formés pourraient
puiser directement des données qu’ils devraient ensuite convertir dans des formats
textuels accessibles aux usagers 89. Deux projets, inégalement développés et dont
les finalités aussi bien que les styles diffèrent radicalement, retiennent
particulièrement l’attention, sans pour l’instant présenter un développement
suffisant pour une exploitation en vraie grandeur :
(i) dans le domaine de la combinatoire lexicale, le Dictionnaire explicatif et
combinatoire du français contemporain d’Igor Mel’čuk, qui vise à donner une
description sémantico-syntaxique systématique des unités lexicales du français en
recourant à une codification assez élaborée mais pas impénétrable 90, s’est
concrétisé jusqu’à présent dans l’analyse de quelques centaines d’unités distribuée
en quatre volumes depuis 1984 ;
(ii) dans le domaine de la construction d’unités lexicales, le Dictionnaire
constructionnel du français de Danielle Corbin (ex-Dictionnaire dérivationnel du
français), qui vise à rendre compte de la forme, de la structure et du sens des mots
construits en allant du sens construit au sens descriptif, présente un état
89
On peut relire comme des maquettes métadictionnairiques les descriptions longues, fouillées et
rédigées selon des modalités métalinguistiques spécifiques que Wierzbicka (1985) donne de
concepts associés à différents items lexicaux de l’anglais dénommant des espèces naturelles ou des
objets manufacturés (cf. supra n. 61).
90
La présentation la plus globale de la démarche se trouve dans Mel’čuk, Clas & Polguère
(1995).
33
Pierre Corbin
d’avancement encore plus faible : quelques maquettes ont été publiées 91 et un
fascicule était en préparation au moment du décès de sa conceptrice 92.
D’autres modèles de métadictionnaires seraient imaginables, et on ne peut que
regretter que les travaux de ce type soient pour l’instant encore trop sporadiques.
Peut-être faut-il y voir, au moins pour le domaine français, l’effet d’une sensibilité
insuffisante aux problèmes de lexicographie, qui irait de pair avec le fait que la
place de cette discipline dans nos cursus universitaires est très réduite.
3.2. La vulgarisation dictionnairique des savoirs linguistiques
À supposer que soit résolue la question de l’accès des lexicographes à la
linguistique utile, il reste celle des modalités du transfert de l’apport de celle-ci
dans des dictionnaires ordinaires, ce qui pose notamment des problèmes de
métalangage qui peuvent être assez épineux. La terminologie métalinguistique
qu’on a la latitude d’utiliser dans des dictionnaires destinés à un large public est
en effet nécessairement très conservatrice et décalée de plusieurs décennies par
rapport à celle de la recherche vive, parce qu’elle ne peut que s’aligner, sous peine
d’incompréhension, sur celle qui a été sanctionnée par l’apprentissage scolaire
commun à l’ensemble d’une population (cf. supra § 2.1.1.).
Dans certains cas, les problèmes terminologiques peuvent être contournés avec
une réelle réussite : on peut considérer par exemple que le Grand dictionnaire
encyclopédique Larousse a réussi à intégrer de façon satisfaisante la description
des structures argumentales des verbes inspirée du L.A.D.L. dans le moule des
codifications dictionnairiques ordinaires (cf. supra § 1.1.2. et nn. 35 et 83).
Mais dans d’autres cas, l’adaptation est moins évidente. La notion de
complémenteur évoquée précédemment (cf. supra § 2.2.2.), par exemple, est très
utile pour éclairer l’existence de deux emplois du mot de en français et pour
distinguer celui qui précède certains infinitifs de l’emploi prépositionnel ordinaire.
Mais le fait comme le terme, d’ailleurs opaque, ne sont connus que d’un très petit
nombre de locuteurs francophones ayant reçu un enseignement linguistique un
peu poussé et dispensé dans des cadres théoriques particuliers ; conséquemment, à
supposer que les lexicographes s’approprient la notion, il n’est pas envisageable
qu’ils l’importent telle quelle dans les dictionnaires, et leur marge de manœuvre
pour ruser avec la terminologie en vigueur n’est pas très importante, puisque,
derrière les mots inconnus du public, se dissimulent des notions qui le sont tout
autant, ce qui impose des stratégies d’évitement du métalangage. Ces observations
vaudraient pour bien d’autres termes, dont certains de ceux qui sont en usage dans
les maquettes des métadictionnaires que j’ai mentionnés.
Pour tous ces motifs, on peut se demander si, pour un certain temps encore,
dont la durée n’est pas appréciable, les apports de la linguistique ne pénétreront
91
D. & P. Corbin (1991), D. Corbin (1993 et 1997b).
J’espère pouvoir en publier l’état le plus avancé dans des délais pas trop éloignés, et j’aimerais,
à terme, prolonger ce projet, ce qui ne se ferait sans doute pas sans infléchissement – n’est pas
Danielle Corbin qui veut – mais pourrait, même avec une réorientation, présenter de réelles vertus
métadictionnairiques.
92
34
Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français
pas que de façon très marginale les dictionnaires, même descriptifs, destinés à un
public de non-spécialistes.
Bibliographie
Dictionnaires
Bibliorom Larousse : voir Petit Larousse (illustré).
Dictionnaire d’anglais. Niveau 1, Paris, Librairie Larousse, 1975.
Dictionnaire d’apprentissage du français des affaires = BINON Jean, VERLINDE Serge, VAN DYCK
Jan & BERTELS Ann, Dictionnaire d’apprentissage du français des affaires. Dictionnaire de
compréhension et de production de la langue des affaires, Paris, Didier, 2000.
Dictionnaire de l’anglais contemporain, Paris, Librairie Larousse, 1980.
Dictionnaire du français au collège, Paris, Larousse, 1986.
Dictionnaire du français contemporain, Paris, Librairie Larousse, 1966 ; nouv. éd., Dictionnaire
du français contemporain illustré, 1980.
Dictionnaire du français langue étrangère. Niveau 1, Paris, Librairie Larousse, 1978.
Dictionnaire du français langue étrangère. Niveau 2, Paris, Librairie Larousse, 1979.
Dictionnaire du français parlé = BERNET Charles & REZEAU Pierre, Dictionnaire du français
parlé. Le monde des expressions familières, Paris, Seuil, 1989.
Dictionnaire du français usuel = PICOCHE Jacqueline & ROLLAND Jean-Claude, Dictionnaire du
français usuel. 15 000 mots en 442 articles, Bruxelles, De Boeck Duculot.
Dictionnaire explicatif et combinatoire du français contemporain = MEL’iUK Igor e.a.,
Dictionnaire explicatif et combinatoire du français contemporain. Recherches lexicosémantiques, 4 vol., Montréal, Les Presses de l’Université de Montréal, 1984-1988-1992-2000.
Dictionnaire général de la langue française = HATZFELD Adolphe, DARMESTETER Arsène &
THOMAS Antoine, Dictionnaire général de la langue française du commencement du XVIIe
siècle jusqu’à nos jours, 2 vol., Paris, Librairie Delagrave, 1890-1900.
Dictionnaire Hachette benjamin, Paris, Hachette Éducation, 1996.
Dictionnaire Hachette encyclopédique illustré, millésime 2001, Paris, Hachette, 2000.
Dictionnaire Hachette juniors. 1. Langue française, Paris, Hachette, 1990 ; 1e éd., Dictionnaire
Hachette juniors, 1980.
Dictionnaire historique de la langue française, éd. enrichie, 3 vol., Paris, Dictionnaires Le Robert,
1998.
Dictionnaire Mini débutants : voir Mini débutants.
Dictionnaire universel de poche, nouv. éd., Le Livre de poche 8530, Paris, Hachette, 1999.
Grand dictionnaire encyclopédique Larousse, 15 vol., Paris, Librairie Larousse, 1982-1985.
Grand Larousse de la langue française en 7 volumes, Paris, Librairie Larousse, 1971-1978.
Grand Robert de la langue française = Le Grand Robert de la langue française. Dictionnaire
alphabétique et analogique de la langue française, 2e éd. entièrement revue et enrichie, 9 vol.,
Paris, Le Robert, 1985.
Larousse de base. Dictionnaire d’apprentissage du français, Paris, Librairie Larousse, 1977.
Le gros dico des tout petits = DUHAMEL Claude-Alain & BALAZ Carole, Le gros dico des tout
petits. 3 000 mots racontés par les enfants, Paris, J.-C. Lattès, 1993.
Le tour du mot. Dictionnaire Bordas Le junior, Paris, Bordas, 1988 ; 1e éd., Le tour du mot, 1985.
Lexis. Dictionnaire de la langue française, Paris, Librairie Larousse, 1975.
Maxi débutants : voir Nouveau Larousse des débutants.
Mini débutants. Mon premier vrai dictionnaire, Paris, Larousse, 1985 ; nouv. éd., Dictionnaire
Mini débutants, 1999.
Nouveau Larousse des débutants, Paris, Librairie Larousse, 1977 ; nouv. éd., Maxi débutants. Le
dictionnaire CE2, CM, Larousse, 1986 ; nouv. éd., 1991.
Nouveau Larousse encyclopédique. Dictionnaire en 2 volumes, Paris, Larousse, 1994.
Nouveau Petit Robert : voir Petit Robert.
35
Pierre Corbin
Petit dictionnaire français, éd. entièrement nouvelle, Paris, Larousse, 1998.
Petit Fleurus = Le Petit Fleurus, Paris, Éditions Fleurus, 1998.
Petit Larousse (illustré) = Petit Larousse illustré. Nouveau dictionnaire encyclopédique, millésime
1906, Paris, Librairie Larousse, 1905 ; Petit Larousse, millésime 1961, 1960 ; Le Petit
Larousse illustré, millésime 2001, Larousse, 2000. Éditions électroniques sur CD-ROM :
Bibliorom Larousse, Liris Interactive / Larousse / Microsoft, 1996 ; Le Petit Larousse, version
1.01, Liris Interactive / Larousse, 1997 ; Bibliorom Larousse 2.0, Havas Interactive / Larousse /
Microsoft Corporation, 1998 ; Le Petit Larousse 2000, Larousse Multimédia, 1999 ; Le Petit
Larousse 2001, Larousse / HER, 2000 ; Le Petit Larousse 2002, Larousse / VUEF, 2001.
Petit Robert = Le Petit Robert. Dictionnaire alphabétique & analogique de la langue française,
Paris, Société du Nouveau Littré, 1967 ; nouv. éd., 1977 ; Le Nouveau Petit Robert.
Dictionnaire alphabétique et analogique de la langue française, Dictionnaires Le Robert,
1993 ; éd. mise à jour, 2000.
Petit Robert des enfants = Le Petit Robert des enfants. Dictionnaire de la langue française, Paris,
Dictionnaires Le Robert, 1988 ; rééd., Le Robert des jeunes. Dictionnaire de la langue
française, 1991.
Richesses lexicales du français contemporain (BERNET Charles & REZEAU Pierre dir.), Nancy,
Centre National de la Recherche Scientifique / Klincksieck, 1995.
Robert benjamin = Le Robert benjamin, Paris, Dictionnaires Le Robert, 1997.
Robert de poche = Le Robert de poche, Paris, Dictionnaires Le Robert, 1995.
Robert des jeunes : voir Petit Robert des enfants.
Robert junior = Le Robert junior illustré, Paris, Dictionnaires Le Robert, 1993.
Robert méthodique = Le Robert méthodique. Dictionnaire méthodique du français actuel, Paris, Le
Robert, 1982.
Robert oral-écrit = Le Robert oral-écrit. L’orthographe par la phonétique, Paris, Dictionnaires Le
Robert, 1989.
Trésor de la langue française. Dictionnaire de la langue du XIXe et du XXe siècle (1789-1960), 16
vol., Paris, Éditions du Centre National de la Recherche Scientifique (t. 1-10) / Gallimard (t. 1116), 1971-1994.
Autres références
ATKINS B.T.S. (1993), « Theoretical lexicography and its relation to dictionary-making », in
William Frawley ed., pp. 4-43.
BATTENBURG John D. (1991), English Monolingual Learners’ Dictionaries. A User-oriented Study,
Lexicographica Series Maior 39, Tübingen, Max Niemeyer Verlag.
BEJOINT Henri (à paraître), « Vers un dictionnaire bilingue de “médiation” », communication aux
3es Journées de lexicographie bilingue de l’INALCO, Paris, 12-13 octobre 2000, à paraître dans
les Actes.
CABRE CASTELLVI M. Teresa (1994), « Entrevista a Danielle Corbin i Pierre Corbin, directors del
Diploma Europeu de Lexicografia », Caplletra. Revista internacional de filologia 17, pp. 337348.
CORBIN Danielle (1993), « Morphologie et lexicographie : la représentation du sens dans le
Dictionnaire dérivationnel du français », in Aafke Hulk, Francine Melka & Jan Schroten éds,
Du lexique à la morphologie : du côté de chez Zwaan, Amsterdam / Atlanta, Rodopi, pp. 6386.
CORBIN Danielle (1997a), « Décrire un affixe dans un dictionnaire », in Georges Kleiber & Martin
Riegel éds, Les formes du sens. Études de linguistique française, médiévale et générale offertes
à Robert Martin à l’occasion de ses 60 ans, coll. Champs linguistiques, Louvain-La Neuve /
Paris, Duculot, pp. 79-94.
CORBIN Danielle (1997b), « La représentation d’une “famille” de mots dans le Dictionnaire
dérivationnel du français et ses corrélats théoriques, méthodologiques et descriptifs »,
Recherches linguistiques de Vincennes 26, pp. 5-37 + Supplément, pp. I-VIII.
CORBIN Danielle (à paraître), Le lexique construit. Méthodologie d’analyse.
CORBIN Danielle & CORBIN Pierre (1991), « Vers le Dictionnaire dérivationnel du français »,
Lexique 10, pp. 147-161.
36
Lexicographie et linguistique : une articulation difficile. L’exemple du domaine français
CORBIN Pierre (1984), « Lexicographe-conseil », Lez Valenciennes. Cahiers de l’UER Froissart 9,
numéro spécial XXe anniversaire, Université de Valenciennes, pp. 113-121.
CORBIN Pierre (1985), « Le monde étrange des dictionnaires (6). Le commerce des mots », Lexique
3, pp. 65-124.
CORBIN Pierre (1989a), « Pour une lecture généalogique des dictionnaires généraux monolingues
français contemporains », in Gregory James ed., Lexicographers and their Works, Exeter
Linguistic Studies 14, University of Exeter, pp. 29-54.
CORBIN Pierre (1989b), « Les marques stylistiques/diastratiques dans le dictionnaire
monolingue », in Franz Josef Hausmann, Oskar Reichmann, Herbert Ernst Wiegand &
Ladislav Zgusta Hrsg., art. 57, Berlin / New York, Walter de Gruyter, pp. 673-680.
CORBIN Pierre (1991), « Le maquis lexicographique. Aperçus sur l’activité lexicographique
monolingue dans le domaine français à la fin du XXe siècle », Le français aujourd’hui 94, pp.
6-26.
CORBIN Pierre (1995), « L’articulation entre la pratique lexicographique, la métalexicographie et
la linguistique dans la formation et dans l’activité des lexicographes », in Jean Pruvost éd., Les
dictionnaires de langue. Méthodes et contenus. La journée des dictionnaires 1994, Centre de
Recherche Texte / Histoire, Université de Cergy-Pointoise, pp. 81-112.
CORBIN Pierre (1998), « La lexicographie française est-elle en panne ? », Cicle de conferències 9697. Lèxic, corpus i diccionaris, Barcelona, Institut Universitari de Lingüística Aplicada,
Universitat Pompeu Fabra, pp. 83-112.
DUBOIS Jean (1962), Étude sur la dérivation suffixale en français moderne et contemporain. Essai
d’interprétation des mouvements observés dans le domaine de la morphologie des mots
construits, Paris, Librairie Larousse.
DUBOIS Jean (1965), Grammaire structurale du français : nom et pronom, coll. Langue et langage,
Paris, Librairie Larousse.
DUBOIS Jean (1967), Grammaire structurale du français : le verbe, coll. Langue et langage, Paris,
Librairie Larousse.
DUBOIS Jean (1969), Grammaire structurale du français : la phrase et les transformations, coll.
Langue et langage, Paris, Librairie Larousse.
DUBOIS Jean & DUBOIS-CHARLIER Françoise (1970), Éléments de linguistique française : syntaxe,
coll. Langue et langage, Paris, Librairie Larousse.
DUBOIS-CHARLIER Françoise (1970), Éléments de linguistique anglaise : syntaxe, coll. Langue et
langage, Paris, Librairie Larousse.
DUBOIS-CHARLIER Françoise (1971), Éléments de linguistique anglaise : la phrase complexe et les
nominalisations, coll. Langue et langage, Paris, Librairie Larousse.
FRAWLEY William ed. (1993), Dictionaries. Journal of The Dictionary Society of North America
14, « Forum on the Theory and Practice of Lexicography ».
GATES Edward (1979), « A survey of the teaching of lexicography », Dictionaries. Journal of the
Dictionary Society of North America 1, pp. 113-130.
GATES Edward (1986), « Preparation for lexicography as a career in the United States », in Robert
Ilson ed., pp. 82-88.
GATES Edward (1989), « The training of lexicographers », in Franz Josef Hausmann, Oskar
Reichmann, Herbert Ernst Wiegand & Ladislav Zgusta Hrsg., art. 10a, pp. 94-97.
GUILBERT Louis (1971), « De la formation des unités lexicales », in Grand Larousse de la langue
française en 7 volumes, t. 1, pp. IX-LXXXI.
HARTMANN R.R.K. (1986), « The training and professional development of lexicographers in the
UK », in Robert Ilson ed., pp. 89-92.
HAUSMANN Franz Josef (1986), « The training and professional development of lexicographers in
Germany », in Robert Ilson ed., pp. 101-110.
HAUSMANN Franz Josef, REICHMANN Oskar, WIEGAND Herbert Ernst & ZGUSTA Ladislav Hrsg.
(1989), Wörterbücher / Dictionaries / Dictionnaires. Ein internationales Handbuch zur
Lexikographie / An International Encyclopedia of Lexicography / Encyclopédie internationale de
lexicographie, t. 1, Berlin / New York, Walter de Gruyter.
ILSON Robert ed. (1986), Lexicography. An Emerging International Profession, The Fulbright
Papers, Proceedings of Colloquia, vol. 1, Manchester / Dover (New Hampshire), Manchester
University Press.
37
Pierre Corbin
KLEIBER Georges (1997), « Sens, référence et existence : que faire de l’extra-linguistique ? »,
Langages 127, pp. 9-37.
LANDAU Sidney I. (1989), Dictionaries. The Art and Craft of Lexicography, 2e éd., Cambridge /
New York / Port Chester / Melbourne / Sidney, Cambridge University Press ; 1e éd., Charles
Scribner’s Sons, 1984.
MARTIN Robert (1992), Pour une logique du sens, coll. Linguistique nouvelle, Paris, Presses
Universitaires de France ; 1e éd., 1983.
MARTIN Robert (1993), « Typicité et sens des mots », in Danièle Dubois dir., Sémantique et
cognition. Catégories, prototypes, typicalité, Paris, CNRS Éditions, pp. 151-159 ; 1e éd., 1991.
MEL’ ČUK Igor, CLAS André & POLGUERE Alain (1995), Introduction à la lexicologie explicative
et combinatoire, coll. Champs linguistiques, Louvain-la-Neuve, Éditions Duculot.
PASCUAL FERRANDO Emili (1994), « La professió de lexicògraf », Caplletra. Revista internacional
de filologia 17, pp. 125-135.
REY Alain (1986), « Training lexicographers : some problems », in Robert Ilson ed., pp. 93-100.
SINCLAIR John M. (1984), « Lexicography as an academic subject », in R.R.K. Hartmann ed.,
LEXeter’83 Proceedings. Papers from the International Conference on Lexicography at Exeter,
9-12 September 1983, Lexicographica Series Maior 1, Tübingen, Max Niemeyer Verlag, pp. 3-12.
WIERZBICKA Anna (1985), Lexicography and Conceptual Analysis, Ann Arbor, Karoma
Publishers.
ZGUSTA Ladislav (1993), « Lexicography, its theory, and linguistics », in William Frawley ed., pp.
130-138.
ZWANENBURG Wiecher (1983), Productivité morphologique et emprunt, Linguisticae
Investigationes Supplementa 10, Amsterdam / Philadelphia, John Benjamins Publishing
Company.
38
Associations lexicales: du corpus aux dictionnaires
Maria Fernanda Bacelar do Nascimento
Centro de Linguística da Universidade de Lisboa
Ma contribution pour cette Journée d’Études portera sur le thème suivant:
en quoi le Corpus de Référence du Portugais Contemporain et les outils
informatiques qui lui sont associés peuvent faire avancer la lexicographie
portugaise?
L’utilisation des corpus en lexicographie n’est pas une nouveauté; au
contraire, ils ont été depuis toujours la source primaire des dictionnaires. Un
excellent exemple de cette utilisation dans la lexicographie portugaise est le
premier (et le seul) volume du Dicionário de Língua Portuguesa publié par l’
Academia das Ciências de Lisboa, en 1793. En fait, la lexicographie a été
brillamment cultivée au Portugal pendant les XVIIIe et le XIXe siècles; par
contre, la plupart des dictionnaires portugais actuels sont d’une assez faible valeur
et restent très loin derrière la production internationale laquelle reflète, de
plusieurs façons, le développement des études linguistiques contemporaines.
Pour ce qui est de l’utilisation des corpus, nous savons que, dans les
vingt dernières années, le développement de l’informatique et la capacité
grandissante des ordinateurs a apporté des bénéfices immenses au travail des
lexicographes, soit en leur permettant l’accès à des corpus très vastes et très
diversifiés, soit en leur offrant des possibilités presque illimitées d’exploration de
ces corpus du point de vue de la quantité et de la qualité des données.
Je m’en tiendrai au domaine du portugais européen et actuel quant à
l’utilisation des corpus pour l’élaboration de dictionnaires. J'esquisserai la
description de quelques ressources linguistiques disponibles au Centre de
Linguistique, notamment le Corpus de Référence du Portugais Contemporain et
les outils informatiques d’exploration des données. Finalement, je présenterai
quelques exemples de l’emploi d’un outil conçu pour l’extraction d’associations
lexicales – le Dictionnaire de Combinatoires du Portugais; ce Dictionnaire
constitue une source d'informations sur la langue et sur les usages de la langue très
importante pour le développement de la lexicographie portugaise.
Un dictionnaire de langue, quel que soit son modèle ou son support (en
papier ou électronique) est conçu autour d’un problème central: l’identification, la
distinction et la description des sens particuliers de chaque entrée. C’est,
indiscutablement, l’information que la plupart des usagers considèrent comme la
plus importante, soit pour le décodage, soit pour l’encodage du discours.
Nous savons bien que beaucoup d’éléments contribuent à la construction
des sens des mots et, aussi, que les dictionnaires, selon leurs modèles particuliers,
rendent compte de ces faits de sens en utilisant les définitions, les exemples, les
citations, les marques sociolinguistiques et aussi les phénomènes combinatoires
observés sur le plan lexical, syntaxique, textuel, etc., qui caractérisent les
différents usages et acceptions d’un mot.
Maria Fernanda Bacelar do Nascimento
La plupart des dictionnaires portugais de langue, que je connais, publiés
dans ces dernières années ne révèlent pas de marques sensibles d’innovation ni
dans le fond ni dans la forme. En les analysant, on ne perçoit pas une interaction
entre les théories linguistiques, les études lexicales les plus récentes et les
pratiques lexicographiques, interaction qui est décisive pour l’enrichissement de la
lexicologie et de la lexicographie.
Dans les dictionnaires parus le plus récemment, les sens de chaque mot
continuent à être décrits à travers une série de définitions paraphrastiques
discrètes: le choix des acceptions, ainsi que son ordre de présentation se fait en
acceptant ce qui est enregistré dans les dictionnaires précédents ou selon la
compétence linguistique des lexicographes. Dans ces dictionnaires, on ne voit
aucun indice d’une approche empirique, d’une exploration sémantique des corpus
reposant sur l’idée que le sens se construit en contexte et par le contexte. Cet état
de choses est en contradiction avec les possibilités mises à la disposition des
lexicographes, à savoir l’exploration des grands corpus électroniques.
Faire des dictionnaires, ayant recours seulement aux sources secondaires
rend la lexicographie parfaitement statique; faire appel à l’intuition du
lexicographe a, aussi, des inconvénients connus: dans la plupart des cas, son
intuition ne lui permet pas de décrire les usages fréquents d’un mot, ce qui est très
évident quand il s’agit, par exemple, d’usages où l’on peut observer des
phénomènes de lexicalisation ou de grammaticalisation.
Il faut, aussi, bien sûr, réfléchir aux limites des approches empiriques car
les résultats de ces approches dépendent, parmi d'autres, de la qualité du corpus et
de la qualité des analyses.
À ce propos, on peut lire dans le volume Les Linguistiques de Corpus de
Benoît Habert et alii, (1997, p. 105) "… les contraintes d’une approche
lexicographique [consistent] à inférer des propriétés en langue à partir
d’observations faites sur corpus, à partir de ce qui est attesté. Cette approche
repose sur l’hypothèse que le corpus est un reflet acceptable de la manière dont
les mots sont effectivement employés. (…) Le corpus détermine, par ailleurs, la
couverture lexicographique: seuls les mots et les sens attestés peuvent être
décrits".
Je suis vraiment convaincue qu’on ne peut pas se passer des
connaissances accumulées dans les dictionnaires précédents, de même qu’on ne
peut pas se passer de la compétence linguistique du lexicographe; mais je crois
qu’aujourd’hui, on ne peut pas non plus se passer du recours aux corpus
électroniques et aux outils informatiques d’exploration de ces données
linguistiques primaires sous peine de perdre des informations d’une grande valeur
et cela à plusieurs niveaux, par exemple: des informations importantes pour la
désambiguïsation morphosyntaxique et sémantique des mots, pour l’observation
des contraintes de sélection ou des phénomènes de synonymie et, plus largement,
pour repérer les relations lexicales attestées.
Je cite de nouveau Benoît Habert: "Le travail lexicographique ne peut
reposer entièrement sur le corpus. Mais si les informations extraites des corpus
doivent être controlées, corrigées, complétées, elles constituent, néanmoins, une
vue d’ensemble sur l’emploi d’un mot et une source importante pour la rédaction
40
Associations lexicales: du corpus aux dictionnaires
d’entrées de dictionnaire. Pour exploiter ce type de données, le lexicographe devra
acquérir l’expérience des outils permettant de les obtenir, afin de dépister les
points faibles de telle entrée, d’identifier les associations douteuses, de repérer les
effets d’une analyse syntaxique inexacte ou ambiguë, et de compléter les
informations extraites par ses propres méthodes d’investigation", (Habert, B. et
alii, 1997, p.105).
Le Corpus de Référence du Portugais Contemporain (CRPC) du Centre
de Linguistique de l’Université de Lisbonne (CLUL) est un corpus électronique
qui contient, actuellement, 92 millions de mots; il est constitué par des
échantillons de plusieurs types de textes du discours écrit (littéraire,
journalistique, technique, scientifique, didactique, économique, parlementaire,
juridique, etc.) et du discours oral (spontané et formel) du Portugal, du Brésil, des
cinq pays africains de langue officielle portugaise, de Macau et de Timor. Du
point de vue chronologique, le corpus contient des textes depuis la seconde moitié
du XIX e siècle jusqu’à nos jours; la plus grande partie des textes est postérieure à
l’année 1970.
Les principaux objectifs du Projet sont de:
- produire des ressources linguistiques, en particulier des corpus oraux
et écrits de variantes nationales et régionales du portugais, ainsi que
des outils informatiques pour l’extraction de connaissances, à partir
de ces corpus;
- assurer l’actualisation du corpus ainsi que l’accès et la mise à la
disposition de ces ressources à tous ceux qui travaillent soit dans la
recherche fondamentale, soit dans la production de grammaires, de
lexiques et de dictionnaires conventionnels ou électroniques, dans la
traduction, dans l’enseignement ou dans le contexte de l’ingénierie
des
langues,
des
technologies
linguistiques
ou
des
télécommunications.
Les outils d’extraction des données associés au corpus fournissent des
informations sur:
- les fréquences des occurrences;
- la lémmatisation des formes (lémmatisation théorique puisque
seulement une petite partie du corpus est annotée);
- les concordances;
- les combinatoires.
À propos de combinatoires, je voudrais présenter le Dictionnaire de
Combinatoires du Portugais. Il s’agit d’un projet de recherche sur les associations
lexicales du portugais contemporain, portant sur un souscorpus de 12 millions de
mots mais qui peut être appliqué à d’autres corpus.
Nous pouvons avoir accès aux informations suivantes:
- la liste de toutes les formes lexicales du corpus avec les fréquences à
l’écrit et à l’oral;
- la liste des lemmes théoriques de ces formes;
- toutes les paires de mots de fréquence égale ou supérieure à 2 (2
millions et demi de paires) et qui ont une distance entre les éléments
de 1 à 5 places à gauche et de 1 à 5 places à droite du noeud;
41
Maria Fernanda Bacelar do Nascimento
-
la liste des lèmmes co-occurrents du noeud;
la fréquence du noeud dans le corpus et dans les paires ;
les indices combinatoires des paires (résultat statistique obtenu à
partir de l’information mutuelle);
- les listes brutes des concordances des paires avec un contexte
restreint (une ligne) ou avec un contexte élargi. Ces listes sont
organisées par lèmmes (du noeud et des co-occurrents) et contiennent
des données de fréquence et les indices combinatoires;
- les associations de 5, 4, 3 et 2 mots contigus avec la fréquence et les
contextes;
- les références bibliographiques de chaque contexte.
En partant de ces résultats, nous voulons étudier les mots:
- dans leurs relations avec d’autres mots avec lesquels ils co-occurrent
plus au moins systématiquement, de façon continue ou discontinue;
- dans leurs relations avec les traits grammaticaux qui se dégagent de la
co-occurrence lexicale;
- dans leurs relations énonciatives et contextuelles.
J’ai choisi de vous parler surtout des faits d’associations lexicales parce
qu’ils sont assez négligés dans la plupart des dictionnaires portugais
contemporains et, pourtant, ils contribuent fortement à la connaissance du
fonctionnement et de la signification des mots. Les dictionnaires présentent
surtout les phraséologies et, très peu de fois ou très assystématiquement, des cooccurrences préférentielles ou d’autres idiosyncrasies combinatoires qui
correspondent au principe idiomatique de sélection lexicale, pour utiliser la
terminologie de Sinclair (1991, p.110).
C’est exactement ici que l’intuition du lexicographe n’est pas suffisante,
soit dans le choix, soit dans l'établissement de leur degré de figement, ou de leur
fréquence dans les divers usages. Le recours au corpus est, dans ce cas,
absolument indispensable.
Je présenterai quelques exemples de résultats obtenus après l’analyse
lexicale des données brutes fournies par le Dictionnaire de Combinatoires du
Portugais et qui mettent en évidence plusieurs types d’information que je crois
utiles aux études du lexique en général et, notament, aux travaux
lexicographiques.
Voici d'abord, un exemple qui prouve l’importance de l’équilibre du
corpus.
Le même mot "azul", observé en deux corpus de dimensions semblables
(corpus littéraire: 1.200.000 d'occurrences; corpus journalistique: 1.000.000
d'occurrences) a comme co-occurrents privilégiés des mots assez différents:
Ex. 1. Échantillon des concordances de "azul" <bleu> dans le corpus
littéraire:
calor e luz. Também aquele
hã linda de sol brilhante,
seiras. A tarde macia, com
saio em Olhão deslumbrado.
bichos tivessem descido do
céu
céu
céu
Céu
céu
azul
azul
azul,
azul
azul
me não dizia nada. Chamei um
e mar azul. Estava maré vaza.
e o Sol morno cobrindo a ver
cobalto - por baixo chapadas
e andassem ali perto, num voo
42
Associations lexicales: du corpus aux dictionnaires
la amenidade do tempo, dum céu
ando há sol, vento fresco, céu
s@i. As estrelas luziam no céu
ciam, negros, torrados. No céu
ra um rasto de estrelas no céu
no próprio pescoço. Vê no céu
de estrelas cintilantes no céu
ar o caminho da estação. O céu
: e, apesar do sol vivo, o céu
ro do Santa Rosa melando o céu
rmada pelo mar azul e pelo céu
luas, lagos, ramarias, / céus
...
sol brilhante, céu azul e mar
variavam com a cor do mar, mar
@tINICIAL@t O mar
a pincelada, maior, para o mar
i e que empoeira de azul o mar
concha azul, formada pelo mar
...
moço, bem entroncado, de olho
mesmo - conveio o moço de olho
. Uma lágrima aflorava o olho
ôs nele o aço frio do seu olho
nem parecia gerada ali, olhos
cabelos louros, aqueles olhos
ram no corpo da criança. Olhos
com as lindas pennas de olhos
Um inglês, em frente, de olhos
de que só as mulheres de olhos
stas mulheres loiras, de olhos
ção de Cristo loiro e de olhos
sentava-se um cavador de olhos
de pele cor de leite, de olhos
s Neném, a bela Neném de olhos
deles serem loiros e de olhos
udo... Irradiava-lhe dos olhos
s por ela, por causa dos olhos
otilde tivesse os mesmos olhos
tu os olhos verdes? «Nos olhos
m agonizava, a falar nos olhos
voz rouca, uma chama nos olhos
de bicho brilhou-lhe nos olhos
ura luz do céu, como nos olhos
uanto tinha que dar. «Os olhos
» O homem contemplou os olhos
elho, queimado, tinha os olhos
les cabelos louros, e os olhos
imado, a barba ruiva, os olhos
sem anéis... / Tinha os olhos
os voltava a si. Os seus olhos
otadas as cores, os seus olhos
ágrimas corriam dos seus olhos
ina de nórdico, nos seus olhos
do Henrique. O homem viu olhos
azul puríssimo, subiram lentamente
azul? E esta gente que acordou ind
azul e diáfano, a brisa temperada
azul as últimas arribações tinham
azul brilhante que estávamos a pis
azul, o negro velho. Não é a Lua,
azul.
azul cobria o homem que não temia
azul parecia leve e muito remoto.
azul. - O Santa Rosa botou hoje? azul, com uma borda de areal onde
azuis, densas florestas, / altas n
...
azul. Estava maré vaza. Pôs o fato
azul, verde, mar de chumbo nas noi
azul e branco e as luzidias / Pedr
azul que não tem fim, até à linha
azul, fundindo-se com a névoa do a
azul e pelo céu azul, com uma bord
...
azul, indaga: - Vocês lá , que sab
azul. - Também eu quero mulher prà
azul de Frida, a voz embargada, um
azul: - Que tem um Baléi que se ca
azuis, e era esbelta como um vime.
azuis que lhe enchiam a alma de al
azuis, cabelos loiros, linda... azues e sahiu pavoneando por alli
azuis e vagos, parecia nem dar pel
azuis valiam afeição de homem. Con
azuis e rosto comprido - as da Foz
azuis vai desabar, vai ter que adm
azuis, alto, que era o Gary Cooper
azuis, de cabelos loiros como os d
azuis, de tranças louras, toda sua
azuis. Nunca ninguém nos explicou
azuis e límpidos uma decisão e uma
azuis e do talhe do corpo. As saud
azuis e aquêle talhe de corpo que
azuis de Georgina arde, em sereno
azuis da menina, riu-se compassiva
azuis, que estavam quase pretos. azuis. - Não gostas dele, Manuel!
azuis. «Nem o fogo - e o fumo das
azuis de Georgina não dizem senão
azuis e o cabelo grisalho ralo, do
azuis, a barba e os cabelos ruivos
azuis, a pele macia, branca como a
azuis. Minutos depois o preá torci
azuis... Era loura e dançava... /
azuis perdiam a névoa da morte. O
azuis sem nada dentro, o corpo mol
azuis sobre o pai, como um morto,
azuis, no seu loiro bigode de rapa
azuis, e o cabelo muito curto e lo
Ex. 2. Échantillon des concordances de "azul" <bleu> dans le corpus
journalistique:
AR DE RELEVO NA EUROPA A
s) e 93 (102 praias) . A
e em 1996 irão hastear a
nacional é a Associação
995 não tinha praias com
s medidas. A Campanha da
scarreta, a «Comissão da
ratado» pela Comissão da
zem parte da Campanha da
das praias têm feito da
bandeira
bandeira
bandeira
bandeira
bandeira
bandeira
bandeira
bandeira
bandeira
bandeira
azul
azul
azul
Azul
azul)
Azul
Azul
Azul,
Azul.
azul.
da Europa foi este ano at
da Europa é um galardão a
correspondem a 34 por cen
da Europa - Seccão Portug
passou a dispor de duas:
da Europa tem como object
disse não a quatro das ci
salientando que «se as f
No que respeita a Portug
Para a associação, desde
43
Maria Fernanda Bacelar do Nascimento
ue, não vendo a habitual bandeira
ade das praias lagao sem bandeira
ade das praias lagoa sem bandeira
Lagoa, apesar de não ter bandeira
liberou não içar a única bandeira
liberou não içar a única bandeira
Senhora da Rocha a única bandeira
ualidade ambiental valeu bandeira
a Balnear das Velas. As bandeiras
veram o mesmo número de bandeiras
io recorde em número de bandeiras
s deixou de ter as duas bandeiras
ão norte, com mais duas bandeiras
iástico povo empunhando bandeiras
aquela que ganhou mais bandeiras
Algarve, com menos seis bandeiras
...
o Sul, em Mostar, os 52 capacetes
nicações, em apoio aos "capacetes
namo não precisavam de "capacetes
que, com a chegada dos "capacetes
do mandato aos 14 mil "capacetes
clara. Quando eles [os capacetes
A morte de 26 capacetes
eneral haverem morto 26 capacetes
e agora cerca de 7. 500 capacetes
No Líbano, centenas de capacetes
o de um certo número de capacetes
s jamais sofridas pelos capacetes
garmente conhecidos por capacetes
aram a tiro 26 dos seus capacetes
no Inverno, em dias frios de céu
para os franco-atiradores: um céu
...
ois madrilenos "louros e de olhos
o se fosse hoje, inglesa de olhos
. Samir, muçulmano loiro de olhos
...
e do CRSS usava as verbas do saco
er a existência de qualquer "saco
a social de Aveiro tinha um "saco
as sobre a existência de um "saco
inheiros provenientes de um "saco
irmado a a existência de um "saco
es". Uma vez recolhidos, os sacos
azul, poderão desconfiar da qu
azul A Câmara de Lagoa deliber
azul Elisabete Rodrigues A Câm
azul, a autarquia esclarece qu
azul atribuída às praias do co
azul atribuída às praias do co
azul atribuída ao concelho, um
azul a 114 praias e quatro mar
azuis passam este ano a estar
azuis de 1995, embora em muito
azuis da Europa, que foram atr
azuis ganhas em 1995, mas em c
azuis, e o Alentejo, com mais
azuis e brancas, tudo acompanh
azuis, passando de 17 para 25.
azuis, foi a região que perdeu
...
azuis espanhós da Forpronu que
azuis" . S. J.A.
azuis" . Os moçambicanos são b
azuis" , os preços subiram em
azuis" instalados nos territór
azuis] olham pela primeira vez
azuis por pistoleiros somalis
azuis paquistaneses. (Ver pág.
azuis e não deverá estar em co
azuis foram mortos desde a cri
azuis, com o objectivo declara
azuis, desde os tempos da inte
azuis, de acordo com o uniform
azuis, complicando bastante a
azul. No entanto, prefiro a Ca
azul, limpo e luminoso, sem ne
...
azuis" foram argumentos sufici
azuis, cabelos louros, bonita,
azuis, 12 anos magríssimos, fa
...
azul para reforçar o seu peso
azul" , mas Silva Júnior acusa
azul" no BCP que o seu preside
azul" não controlado no CRSS s
azul" cuja existência era desc
azul" , prometendo "assumir to
azuis serão levados para uma e
Les exemples fabriqués, quoiqu’ils soient bien formés du point de vue
syntaxique, sont très souvent considérés comme inacceptables par les locuteurs
natifs. C’est un problème qui concerne l’usage, l’environnement textuel, les cooccurrences lexicales et que le lexicographe a du mal à résoudre sans avoir
recours aux données attestées. C’est le cas, par exemple, des mots présentés
comme des synonymes mais qui, comme le montrent les exemples 3 et 4
(combinatoire des mots "vasto" <vaste> et "amplo" <ample>) présentent des
différences assez remarquables quand on observe leurs combinatoires éclairées
par les contextes relevés dans un corpus bien équilibré. Cela peut aider le
lexicographe, soit s’il veut choisir des citations, soit s’il veut s’appuyer sur les
faits observés pour fabriquer des exemples plus naturels.
Ex. 3. Échantillon des combinatoires du mot "amplo" <ample>
Nombre de contextes sélectionnés :24 CONSENSO <consensus>
Nombre de contextes générés: 24) amplos consensos IC: 10.277
44
Associations lexicales: du corpus aux dictionnaires
Nombre de contextes de la pair:7 consensos amplos (distance entre les
formes:1)Répartition: source, fichier J7,4
do povo neste tempo: procura de consensos amplos e dinâmicos, em torno de
«novo patriotismo» sampaio quer consensos amplos António Vinagre José Man
o Grade Sampaio voltou a pedir «consensos amplos» para os «objectivos ess
novo patriotismo» sampaio quer consensos amplos Sampaio voltou a pedir «c
amplos Sampaio voltou a pedir «consensos amplos» para os «objectivos ess
s graves», apelou à procura de «consensos amplos e dinâmicos, em torno de
os de democracia é a de que os consensos "amplos e dinâmicos", em torno d
Nombre de contextes de la pair:2 amplos consensos (distance entre les
formes:1)Répartition: source, fichier J2,2
didamente, no PS estão em moda os
om o seu discurso no Pontal gerar
amplos consensos. Até às legislativas de
amplos consensos fora das hostes laranja
amplo consenso IC:7.856
Nombre de contextes de la pair:15 amplo consenso (distance entre les
formes:1)Répartition: source, fichier A3,2 J12,10
gionalização e muito menos sem um
a a regionalização se houvesse um
, em 1986, se deve estabelecer um
gionalização e muito menos sem um
a a regionalização se houvesse um
ue deve ser encontrada na base de
PS). E voltou a defender «o mais
nterior não ter sido resultado de
da regionalização resultar de um
nteressados e depois de obtido um
ndentes em tribunal. Resultado de
ndentes em tribunal. Resultado de
está empenhado em promover o mais
de do PS para se encontrar o mais
e disponíveis para estabelecer um
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
consenso, ou na Assembleia da Repú
consenso mas afinal basta a compan
consenso, afinal, um Pacto Educati
consenso, ou na Assembleia da Repú
consenso mas afinal basta a compan
consenso nacional, o que exige int
consenso possível» entre os partid
consenso político, pelo que teve,
consenso entre todas as forças pol
consenso". Um piscar de olhos aos
consenso estabelecido entre todos
consenso estabelecido entre todos
consenso democrático em torno dess
consenso que se revelar possível e
consenso em volta desta matéria, é
Nombre de contextes sélectionées:18 DEBATE <débat> (nombre de contextes
générés:18)
amplo debate IC:6.560
Nombre de contextes de la pair:16 amplo debate (distance entre les formes:1)
Répartition: source, fichier A4,1 R2,2 J10,10
, igualmente, a conveniência de um
tugal. Entretanto, tivera lugar um
ama do Governo prevê "estudos e um
facção, a Revolta Activa, propondo
elaborados estudos e promovido um
facção, a Revolta Activa, propondo
ho vai defender a realização de um
o sábado. A assembleia suscitou um
o foram objecto, como deveriam, de
precedidas, na sua óptica, por um
ece que essa ampla discussão, esse
lo, até fins de 1993; mereceram um
ssa altura até agora tem havido um
o território fosse precedida de um
uar a ser vossa leitora sugiro: um
uar a ser vossa leitora sugiro: um
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
debate
debate,
debate
debate
debate
debate
debate
debate
debate
debate
debate,
debate,
debate
debate
debate
debate
45
interno que vá «tão longe
onde se verificaram as c
quanto às condições organ
para a redefinição da est
quando às condições organ
para a redefinição da est
interno sobre o tema e da
que permitiu filtrar idei
técnico e político nos vá
público. António Guterres
não terá sido tanto assi
não só no seio das magis
sobre as grandes revisões
público por forma a refor
de modo a que participem
de modo a que participem
Maria Fernanda Bacelar do Nascimento
Nombre de contextes de la pair: 2 debate amplo (distance entre les
formes:3)Répartition: source, fichier A1,1 T1,1
tivo primordial é o de permitir o
eduzida inclusão e articulação no
debate aberto e amplo entre o juiz e os
debate metodológico mais amplo da antrop
Nombre de contextes sélectionnés:13 ESPAÇO <espace> (nombre de contextes
générés:13)
espaço amplo IC: 5.706
Nombre de contextes de la pair: 9 amplo espaço <ample espace> (distance entre
les formes:1) Répartition: source, fichier A1,1 R1,1 T1,1 U1,1 J5,4
asicamente, pela criação de um
digital, travão de disco e um
a que "não sejamos somente "um
is do que tudo, ao percorrer o
nte educativa e tornando-o num
a circulação, alargando-se num
ção dos tempos livres. Terá um
Para além disso, ali, naquele
cto3" inaugurar um novo e mais
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
amplo
espaço
espaço
espaço
espaço
espaço
espaço,
espaço
espaço,
espaço
de lazer, de convívio, pedon
debaixo do assento para todo
de comércio livre" e tenhamo
que se não via. «Curiosa est
de realização do cidadão, pr
a sala aberta sobre a paisa
para convívio e formação nas
toda a gente pode apreciar
no seu bairro de sempre, o B
Nombre de contextes de la pair: 4 espaço amplo (distance entre les formes:1)
Répartition: source, fichier R1,1 T1,1 U1,1 J1,1
himento aos lisboetas "será
idade a que ele o obrigara:
por referenciar a análise a
loja Luís Cunha Decoração.
um
no
um
Um
espaço
espaço
espaço
espaço
amplo
amplo
amplo
amplo
e confortável, sem barreiras
do Terreiro ainda vazio de c
(que como tal não chega a se
e funcional onde poderá enco
Nombre de contextes sélectionnés:9 VISÃO <vision> (nombre de contextes
générés:9)
visão ampla <vision ample> IC:6.667
Nombre de contextes de la pair:6 visão ampla (distance entre les formes:
2)Répartition: source, fichier R1,1 T2,2 E1,1 J2,2
s no sector das inspecções: "Uma
antropólogos - seja através duma
balhos possuem o de permitir uma
ste com o peso atómico . Com uma
avés da leitura que consegui uma
tugal é um país aliado e tem uma
visão
visão
visão
visão
visão
visão
mais ampla" e "um trabalho mais efi
mais ampla das relações sociais, de
mais ampla e correcta de agrupament
mais ampla, @iMendeleiev@i colocou
mais ampla da vida. "US" - Para faz
mundial ampla». O representante per
Nombre de contextes de la pair:3 visão ampla (distance entre les formes:1)
Répartition : source, fichier T1,1 U1,1 J1,1
m alegrias nem tristezas, nem a
melhor, devia ter-se agido com
arão melhor a necessidade desta
visão ampla
visão ampla
visão ampla
da cidade ao sol; e senti de
e não ao sabor dos calendári
do fenómeno. O primeiro refe
Nombre de contextes sélectionnés:8 SAIA <jupe> (nombre de contextes
générés:8)
saia ampla IC:6.846
46
Associations lexicales: du corpus aux dictionnaires
Nombre de contextes de la pair:6 saia ampla <jupe ample> (distance entre les
formes:1) Répartition : source, fichier R4,3 U2,2
ensarilhando as pernas perras na
a lãzinha cor de ervilha seca, a
esa 2- Top bordado a conotilho e
que usam. @t@bA CINTURA FINA E A
com barbas de baleia no busto e
laço atrás. Fita encrustrada, na
saia
saia
saia
SAIA
saia
saia
ampla
ampla
ampla
AMPLA
ampla.
ampla
e comprida, levou-me até à sal
e comprida, o casaquinho curto
trabalhada a tule e veludo, br
RETOMAM OS SEUS DIREITOS@b@t O
Depois viria o exagero das cr
3 - É de popeline de riscas es
Nombre de contextes de la pair:2 saia ampla (distance entre les formes:2)
Répartition : source, fichier R2,2
canotilho e fio prateado com
a galão ou ponto em cruz 3 -
saia muito ampla,
Saia muito ampla,
de lindíssimo corte, do mes
executada em lainage fina,
Nombre de contextes sélectionnés:7 SUFICIENTEMENTE <suffisamment>
(Nombre de contextes générés:7)
suficientemente amplo IC:6.622
Nombre de contextes de la pair:4 suficientemente amplo (distance entre les
formes:1) Répartition : source, fichier T4,3
Fernandes «um pátio inferior
igência de um pátio interior
em que basear-se num acervo,
erização estrutural deve ser
suficientemente
suficientemente
suficientemente
suficientemente
amplo para que nele decorre
amplo para que nele se dese
amplo, de resultados das ob
amplo. A tal aconselham a c
suficientemente ampla IC: 6.438
Nombre de contextes de la pair:3 suficientemente ampla (distance entre les
formes:1) Répartition : source, fichier T1,1 J2,2
exemplificativo, mas que é
é relativamente clara mas
enho moderno e rectilíneo,
suficientemente ampla para abranger os núcleos
suficientemente ampla. Quanto à dicção, prima p
suficientemente ampla para agrupar revistas e j
Nombre de contextes sélectionnés:7 DISCUSSÃO <discussion> (nombre de
contextes générés:7)
discussão ampla IC: 6.109
Nombre de contextes de la pair : 4 ampla discussão (distance entre les formes:1)
Répartition : source, fichier A1,1 J3,3
ições nacionais, tema que gerou
s governos decidiu escamotear a
do. No entanto, parece que essa
concelho, o PDM foi alvo de uma
ampla
ampla
ampla
ampla
discussão. O representante do GD de
discussão pelas suas populações do
discussão, esse amplo debate, não t
discussão dos órgãos autárquicos e
Nombre de contextes de la pair : 3 discussão ampla distance entre les formes:2)
Répartition : source, fichier: J3,3
o Gomes, poderia ter havido uma
ede-se de novo muita calma, uma
ede-se de novo muita calma, uma
discussão mais ampla sobre esta matéria. "
"discussão pública ampla profunda e cautel
"discussão pública ampla profunda e cautel
47
Maria Fernanda Bacelar do Nascimento
A-Assemblée de la République; J- Journal ; D- Droit; R- Magazine; T- Livre téchnique; E- Livre
didactique; U- Livre litéraire ;
Ex. 4. Échantillon des combinatoires du mot "vasto" <vaste>
Nombre de contextes sélectionnés: 27 GAMA <gamme> (nombre de contextes
générés:27)
vastíssima gama <gamme très vaste> IC: 7.615
Nombre de contextes de la pair : 2 vastíssima gama (distance entre les formes:1)
Répartition : source, fichier R2,2
de beleza natural e apresenta uma
, encontrará no "Saiaecasaco" uma
gama vasta
vastíssima gama
vastíssima gama
de produtos que vão dos
de tecidos e cortes únic
7.162
Nombre de contextes de la pair:23 vasta gama (distance entre les formes:1)
Répartition : source, fichier R12,11 L1,1 J10,7
au atarvés da transacção de uma
m condições vantajosas devido à
ruir laseres sintonizáveis numa
tural de Belém uma exposição da
s firmas». A empresa possui uma
io privilegiado de pagamento. A
ceiro. têm já ao seu dispor uma
elho da Amadora tem atraído uma
ersões tem à sua disposição uma
onhecimento com pormenor de uma
para o Macintosh, fornecem uma
nome de costas largas para uma
g e publicidade que oferece uma
promoção da sua imagem e da sua
entrou no mundo da escrita Uma
de maquilhagem, oferecendo uma
elhor para todos os gostos: uma
ional. Este hotel dispõe de uma
ozes, creme de gruyère. Uma tão
ão da Brooksfield apresenta uma
rmatos diferentes, cobrindo uma
ional. Este hotel dispõe de uma
ade de mostrar, uma vez mais, a
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
gama
gama
gama
gama
gama
gama
gama
gama
gama
gama
gama
gama
gama
gama
gama
gama
gama
gama
gama
gama
gama
gama
gama
de produtos essenciais. Alguns
de serviços oferecidos, aos be
do espectro luminoso visível,
de produtos médicos e de aplic
de produtos, destacando-se, to
de cartões que inundou o merca
de cartões, não só na vertente
de actividades económicas, das
de opções, como expansões de m
de materiais metálicos, refrac
de funções para várias operaçõ
de sistemas operativos ligeira
de serviços e está apta a resp
de produtos. Esta decisão surg
de qualidade em canetas, em qu
de produtos e uma excelente re
de préconfeccionados, concebid
de quartos, todos com varanda
de queijos complementa e refor
de modelos absolutamente encan
de apuradas dentaduras, fabric
de quartos, todos com varanda
dos seus recursos. Prossegue,
Nombre de contextes de la pair: 2 gama vasta (distance entre les formes:2)
Répartition : source, fichier L2,2
o clima ocorrem numa
A utilização de uma
gama muito vasta de escalas da fenomenologia. Vão des
gama tão vasta de materiais provoca a busca de novas
Nombre de contextes sélectionnés: 27 ÁREA <aire> (nombre de contextes
générés:27)
áreas vastas IC: 6.749
48
Associations lexicales: du corpus aux dictionnaires
Nombre de contextes de la pair: 5 vastas áreas (distance entre les formes:1)
Répartition : source, fichier R1,1 L3,2 J1,1
é terem como principal componente
que se estendia desde a Europa até
ividir o território de Portugal em
amente, o POZOR, ao reconhecer que
e seria @B"entregar"@B sem combate
vastas
vastas
vastas
vastas
vastas
áreas
áreas
áreas
áreas
áreas
de várzea entre encostas d
do Atlântico Norte. Este i
com características climát
sob a jurisdição da APL po
aos "mujaheeden", esperand
Nombre de contextes de la pair : 2 áreas vastas(distance entre les formes:2)
Répartition : source, fichier L1,1 J1,1
m, igualmente, sentir em
priamente ditas, abarcam
vastíssima área
áreas mais vastas, alguns mesmo à escala dos dife
áreas tão vastas como a organização interna orien
6.458
Nombre de contextes de la pair: 2 vastíssima área (distance entre les formes:1)
Répartition : source, fichier R2,2
dade de chegada ao rio nessa
nvolvem a urbanização de uma
vasta área
vastíssima área. Por outro lado, em áreas em
vastíssima área da cidade, sem que a câmara
5.677
Nombre de contextes de la pair: 18 vasta área (distance entre les formes:1)
Répartition : source, fichier R5,5 L7,5 J6,6
na ilha da Madeira e destruiu
ilância electrónica sobre uma
ojos estão espalhados por uma
nto constitui o centro de uma
e pairara, imemorial, sobre a
ceirais do Mondego. Toda esta
al, a salsa. Após a horta uma
criado um governo livre numa
cêndio que na Páscoa consumiu
meningo-encefalite) como pela
sivamente humana, que tem uma
tureza", "a vizinhança de uma
ndo o que está em causa é uma
posta, este livro abrange uma
com sentimento». Abarcam uma
Portugal onde se encontra uma
, viram esta peça. Daí que na
plano que vai beneficiar uma
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
área
área
área,
área
área.
área
área
área
área
área
área
área
área
área
área
área
área
área
florestal, já atingiu o concel
oceânica (Paços de Ferreira, M
alguns deles são semelhantes
ajardinada, já projectada, a q
Todavia, o lado de lá da calç
se anima de cenas particulares
perfumada de árvores de espinh
continental, sem terem sacrifi
do concelho de Albergaria-a-Ve
geográfica que abrange, no Ext
de distribuição que engloba, p
naturalizada protegida" (prote
de grande sensibilidade. "Quer
que interessa a qualquer mulhe
de actuação, sendo Margarida a
montanhosa que dá pelo nome de
de Campolide se siga com muita
com cerca de quatro mil habita
Nombre de contextes sélectionnés: 13 ZONA <zone> (nombre de contextes
générés :13)
vastíssima zona IC: 6.521
Nombre de contextes de la pair: 2 vastíssima zona (distance entre les formes:1)
Répartition : source, fichier R1,1 J1,1
os nossos direitos sobre uma
riental da cidade, que é uma
vastas zonas
vastíssima zona
vastíssima zona
6.039
49
desse oceano que tão intimame
por cima da av. Gago Coutinho
Maria Fernanda Bacelar do Nascimento
Nombre de contextes de la pair: 3 vastas zonas (distance entre les formes:1)
Répartition : source, fichier A1,1 L1,1 J1,1
desenvolvimento económico de
go assume, é a existência de
o sul pelo Tejo, formam duas
vasta zona
vastas zonas
vastas zonas
vastas zonas
inóspitas ou escassamente povoad
do globo em que as mulheres, tal
de terrenos paleozóicos, uma cor
4.928
Nombre de contextes de la pair: 8 vasta zona (distance entre les formes:1)
Répartition : source, fichier R2,2 L1,1 J5,5
um lado, na «destruição de uma
uindo as próprias termas e uma
sul, saibamos construir, nesta
cêndios reduziram a cinzas uma
ria, prevendo a criação de uma
ha freguesia de Santa Eulália,
60 mil pessoas oriundas de uma
gico. Uma vedação circunda uma
vasta
vasta
vasta
vasta
vasta
vasta
vasta
vasta
zona
zona
zona
zona
zona
zona
zona
zona
verde e, por outro, numa espécie
de serra, em pleno Parque Nacion
do Atlântico, que nos é tão fami
das freguesias de Valadares, San
de comércio livre. Este acordo,
um pouco acidentada, granítica e
do interior que vai até Santarém
de areia, aqui e ali montículos
Nombre de contextes sélectionnés : 11 REGIÃO <région> (nombre de contextes
générés:11)
vastas regiões IC: 6.372
Nombre de contextes de la pair : 6 vastas regiões (distance entre les formes:1)
Répartition : source, fichier R1,1 L4,3 J1,1
mento da ordem mercantil a
multimoda de países ou de
e importância sanitária em
ea de distribuicão engloba
nte pressão demográfica em
agicamente absorvido pelas
vasta região
vastas
vastas
vastas
vastas
vastas
vastas
regiões
regiões,
regiões
regiões
regiões
regiões
do globo antes empobrecidas pe
mesmo que não sejam cosmópoli
do Oriente. Os adultos vivem n
de África e do Médio Oriente,
do mundo; - o envelhecimento d
selvagens da savana queniana.
3.843
Nombre de contextes de la pair: 3 vasta região (distance entre les formes:1)
Répartition : source, fichier R1,1 L1,1 J1,1
egisto da actividade nessa
Primavera. Todavia, em tão
l. Pólo chama Cathay a uma
vasto região
vasta região
vasta região
vasta região
submarina, sobre a qual se dispõe
de clima mediterrânico, onde a pl
da China do Norte, onde ficava a
3.382
Nombre de contextes de la pair: 2 vasto região (distance entre les formes:3)
Répartition : source, fichier L2,2
as únicas excepções do
cortando de lés a lés o
vasto lençol da região dos terrenos terciários. Na
vasto losango da região. O trabalho de erosão apen
Nombre de contextes sélectionnés : 9 ESPAÇO <espace> (nombre de contextes
générés:9)
vastos espaços IC: 6.296
50
Associations lexicales: du corpus aux dictionnaires
Nombre de contextes de la pair: 2 vastos espaços (distance entre les formes:1)
Répartition : source, fichier L1,1 J1,1
jovens actrizes e actores. Os
negações e afirmações ocupam
vasto espaço
vastos espaços
vastos espaços
da Alfândega do Porto serão
da sua alma. Ela move-se rìt
4.607
Nombre de contextes de la pair: 7 vasto espaço (distance entre les formes:1)
Répartition : source, fichier R2,1 L3,3 J2,2
ocuparam rapidamente um
o mal acostumados àquele
mesas espalhadas por um
ntais, que enquadravam o
e colunas em mármore, um
sombro? Mais uma vez, um
ociais e culturais deste
vasto
vasto
vasto
vasto
vasto
vasto
vasto
espaço
espaço,
espaço,
espaço
espaço
espaço
espaço
do mercado daquele tipo de folhas
a tanta luz, ao seu próprio chiq
tinha o nome de Toque-de-Classe.
onde (lembrava-se sempre disso, q
cheio de luz e silêncio; se os tr
entre duas longas filas de coluna
nacional, contribuindo, simultane
Nombre de contextes sélectionnés: 9 LEQUE <éventail> (nombre de contextes
générés: 9)
vasto leque IC: 7.570
Nombre de contextes de la pair : 9 vasto leque (distance entre les formes:1)
Répartition : source, fichier R4,4 J5,5
até Outubro, que inclui um
r Koj é responsável por um
que permite a oferta de um
desta medida resultou num
ia destinado a analisar um
Dão a verdadeira noção do
, a Conferência adoptou um
Um bom entrevistado tem um
Um bom entrevistado tem um
vasto
vasto
vasto
vasto
vasto
vasto
vasto
vasto
vasto
leque
leque
leque
leque
leque
leque
leque
leque
leque
de
de
de
de
de
de
de
de
de
matérias: direitos fundamentai
iniciativas de promoção da cul
possibilidades de licenciatura
comissões cobradas pelos banco
assuntos internacionais, onde
produtos que a mulher pode e d
medidas administrativas e jurí
aasuntos abordáveis e disserta
assuntos abordáveis sabe disse
Nombre de contextes sélectionnés: 7 PLANÍCIE <plaine> (nombre de contextes
générés:7)
vasta planície IC: 7.222
Nombre de contextes de la pair: 7 vasta planície (distance entre les formes:1)
Répartition : source, fichier L7,4
arremessar a água. Agora, na
agora toda negra e triste. Na
breavam. Em volta, por toda a
a todo o momento desmaia e a
es. É um saleiro. Ao longe na
da e brilhante do restolho, a
é como um beduíno do Nilo. A
vasta
vasta
vasta
vasta
vasta
vasta
vasta
planície, só havia homens de armas. Os
planície, jazem os Jacques mortos. Fin
planície, era uma confusão de carros d
planície vaporizada ilumina-se de uma
planície retalhada, correndo a par de
planície, em que se distinguem dissemi
planície matizada de povoações e bosqu
A-Assemblée de la République; J- Journal ; D- Droit; R- Magazine; L- Livre;
51
Maria Fernanda Bacelar do Nascimento
L’observation des combinatoires d’un mot révèle aussi, assez nettement,
les divers sens liés aux différents domaines thématiques dans lesqueles il est
employé. L’exemple 5 (combinatoires du mot "complexo") en est la preuve.
Ex. 5. Échantillon des combinatoires du mot "complexo" <complexe>
Nombre de contextes sélectionnés :27 DESPORTIVO <sportif>
complexo desportivo
IC:7.205
Nombre de contextes de la pair :25 complexo desportivo (distance entre les
formes:1)
eitas no molhe do rio, do
ra, conseguiu uma sala no
es, as quais se situam no
mil; à tarde, inaugurei o
r, mas, tratando-se de um
ilhão Borges Coutinho, no
vai utilizar o remodelado
l contos para as obras do
ndonava as instalações do
s a mais na construção do
ação directa. As obras no
em acesso aos relvados do
tárquica -, o projecto do
a construção de um grande
naquele que já é o melhor
eitadas". A construção do
ulo está na construção do
complexo
complexo
complexo
Complexo
complexo
complexo
complexo
complexo
Complexo
complexo
complexo
complexo
complexo
complexo
complexo
Complexo
complexo
complexos desportivos
IC:6.281
desportivo
desportivo
desportivo
Desportivo
desportivo
desportivo
desportivo
desportivo
Desportivo
desportivo
desportivo
desportivo
desportivo
desportivo
desportivo
Desportivo
desportivo
da Cova e do parque intern
da Lapa, que vai partilhar
da Luz. Aí, os ficheiros e
de Pedrouços, que inclui o
de um clube, é evidente qu
do Estádio do Sport Lisboa
do Estádio Universitário.
do Monte Aventino. No dia
do Vitória sob apupos da m
e cultural do Monte Aventi
e de lazer do Luso, na zon
Knockrabo, onde a selecção
municipal de Santo Tirso p
municipal, onde não faltar
português vocacionado para
Regional - 1ª fase, relati
regional da Cova. Aqui, os
Nombre de contextes de la pair :2 complexos desportivos (distance entre les
formes:1)
em cinemas, casas particulares e
ndo - a rua termina numa zona de
complexos desportivos
complexos desportivos
abandonados. Em po
onde a esta hora e
Nombre de contextes sélectionnés:25 TURÍSTICO <touristique>
complexo turístico
IC:7.766
Nombre de contextes de la pair:20 complexo turístico (distance entre les
formes:1)
a qual se ergue o acolhedor
riscas, enfiados num antigo
tra-se refugiado num antigo
plexo turístico na Caparica
conjunto arquitectónico do
m obras de restruturação do
de instalação de um enorme
poucos meses um importante
foi inaugurado um magnífico
nto do hotel, integrado num
complexo
complexo
complexo
Complexo
complexo
complexo
complexo
complexo
complexo
complexo
turístico.
turístico,
turístico
turístico
turístico
turístico
turístico
turístico
turístico:
turístico
52
Chegados à margem da alb
encontram-se desesperado
de luxo, sobre o lago Tan
na Caparica A Câmara Muni
e hoteleiro que dotará Se
da Penha, além de estar p
na Península de Tróia, le
na Quinta da Fonte Quente
o Caesar Park Penha Long
atingido pela ampliação d
Associations lexicales: du corpus aux dictionnaires
ra da sua compra em 1982, o
resa referiu ao EXPRESSO, o
e Sebastião JORNAL PUBLICO:
Judas lança a sua revolução
des, o abastecimento do seu
adquiridos . No futuro , um
arária, dizia respeito a um
ccontos na costrução de um
o Pereira de Sousa Fotos Um
complexos turísticos
complexo
complexo
Complexo
Complexo
complexo
complexo
complexo
complexo
complexo
turístico
turístico
turístico
turístico
turístico
turístico
turístico
turístico
turístico
encontrava-se em adiantad
será contruído em pleno b
na Caparica Complexo turí
na Caparica "É um autênti
com frutas, verduras, etc
nascerá em Cascais integr
a implantar na zona centr
em Alhos Vedros que integ
está em vias de ser const
IC:7.493
Nombre de contextes de la pair:5 complexos turísticos (distance entre les
formes:1)
inanciar a recuperação dos
s, quer na recuperação dos
mbos os empreendimentos em
de hotéis, grandes hotéis,
que pode ser apreciado são
complexos
complexos
complexos
complexos
complexos
turísticos, cujo património está aval
turísticos de Vidago e de Pedras Salg
turísticos que integrarão hotéis de l
turísticos, transportadores, órgãos o
turísticos pretensiosos a engolir as
Nombre de contextes sélectionnés :13 EXTREMAMENTE <extrêmement>
extremamente complexo
IC:5.980
Nombre de contextes de la pair:10 extremamente complexo (distance entre les
formes:1)
uma estrutura ou um conteúdo
t O funcionamento cerebral é
ral do planeta - é frágil, é
e Gilbert Sabine - @B" mas é
e de um problema de educação
dor entra num ciclo infinito
júnior). «Sabes como eu sou,
xtremamente complexo, eu sou
extremamente
extremamente
extremamente
extremamente
extremamente
extremamente
extremamente
extremamente
complexo. Não falta inclusivamen
complexo. A sua actividade integ
complexo e inconstante, é divino
complexo restringir os meios das
complexo. A prevenção do cancro
complexo que pode danificar o mi
complexo, eu sou extremamente co
complexo, percebes?, como um jog
Nombre de contextes sélectionnés :11 INFERIORIDADE <infériorité>
complexos inferioridade
IC:8.891
Nombre de contextes de la pair: 5 complexos inferioridade (distance entre les
formes:2)
keys, sofrendo de graves
neira de driblar os seus
de carácter altruísta e
ceitos nacionalistas nem
g para se libertarem dos
complexos
complexos
complexos
complexos
complexos
complexo inferioridade
de
de
de
de
de
inferioridade face aos seus cavalos,
inferioridade histórica. Ao assumire
inferioridade perante o bulício cres
inferioridade, porque é decisivo dar
inferioridade. "Temos uma vantagem c
IC:8.047
53
Maria Fernanda Bacelar do Nascimento
Nombre de contextes de la pair: 6 complexo inferioridade (distance entre les
formes:2)
ício, perseguindo-nos até ao
jamais conseguira dominar o
nte, Edith Head sofreu de um
nos cafés e cabeleireiros, o
o Sr. Truman, liberto já do
de inferioridade». O bendito
complexo de inferioridade, ao tic, à mania da
complexo de inferioridade causado pela longa
complexo de inferioridade em relação à sua fi
«complexo de inferioridade». O bendito «compl
complexo de inferioridade que a sombra desmed
«complexo de inferioridade» que contribuiu em
La présentation de ces quelques exemples a tenté de montrer quels sont
les outils développés au Centre de Linguistique de l’ Université de Lisbonne et
comment lesquels, dans le cadre d’une collaboration avec des lexicographes, ils
pourraient être disponibilisés. Nous croyons que la nécessité de rendre accessible
aux utilisateurs des dictionnaires les combinatoires attestées (groupes de mots plus
ou moins figés, rections, locutions) est un vieux problème lexicographique auquel
le traitement informatique des corpus pourra donner de nouvelles réponses.
Références Bibliographiques
HABERT, B., NAZARENKO, A. & SALEM, A. (1997), Les Linguistiques de Corpus, Paris, Armand
Colin.
SINCLAIR, J. (1991), (éd.) Corpus, Concordance, Collocation, Oxford, Oxford University Press.
54
Lexicography, Lexicology, Linking and the Hub-and-Spoke Model
W. Martin
Vrije Universiteit Amsterdam
0. Introduction
In the introduction to her article entitled “Lexicology and Lexicography Revisited” S.
Nuccorini observes that ‘lexicography has always been closely associated with lexicology,
to the extent that, as stated by Wikberg (1983: 213) “it is not unusual, even for linguists, to
confuse the two terms”’ (Nuccorini 1993: 127). In the rest of the article the author tries to
‘prove’ that one is dealing with two autonomous disciplines which (should) stand in a
bilateral relationship to each other, yet, for all that, should not be confused with each other.
In the end the same author comes to the conclusion that ‘it is not just good lexicology
which ensures good lexicography’ and that ‘the traditional links going from lexicology to
lexicography go also in the opposite direction’. Moreover, it seems to her ‘that
lexicography does not fulfil just a practical task, and that it is high time that lexicographers,
academics and linguists put lexicography on the professional and on the intellectual map’
(Nuccorini, o.c.: 137).
As a matter of fact, in this article we will start where Nuccorini has left off: the
autonomy of lexicography will no longer be under discussion. Instead of that, lexicography,
as it is conceived nowadays, will be ‘put on the intellectual map’ and taken as a starting
point, reversing the ‘traditional links’, i.e. moving from lexicography towards lexicology
and looking for the impact of the former on the latter. Not only will there be a change of
perspective, but also one of theme, the main stress, in this article, falling on lexicographical
infrastructure, an aspect not being dealt with at all in Nuccorini’s article. More in
particular attention will be paid to the infrastructure needed for the construction of
bilingual dictionaries and to the role that can be played in this respect by:
∗
data (such as linkable lexical databases);
∗
data manipulation (such as calculi to reverse and infer data from and the tools to
perform these actions);
∗
and data ‘models’ (larger frameworks to specify and situate the data and their
manipulation in, such as the Hub-and-Spoke Model).
At the end, we will examine whether, by the advent of new lexicographical infrastructure,
a redefinition of the relationship between lexicography and lexicology is necessary. As a
consequence, this paper shows the following structure:
1. Lexicography.
2. Lexicographical Infrastructure: the Construction of Bilingual Dictionaries.
3. Linking vs. Translation in Bilingual Dictionary Construction.
W. Martin
4. Linkable Reference Lexicons (LRL’s).
5. Manipulating LRL’s: Linking and Reversing.
6. A Framework for LRL’s: the Hub-and-Spoke Model (HSM).
7. Lexical Infrastructure and the Relationship between Lexicography and Lexicology.
1. Redefining Lexicography
In order to define lexicography the following ‘frame’ (1) will be used:
Lexicography
is-ako
is-of subtype
agent
co-agent
goal
has-affected-object
has-form
means
agent
beneficiary
other-participants
activity
production
lexicographer
metalexicographer
(scientific) description
(parts/aspects of) vocabulary
book, CD-ROM, database,...
IT-tool
IT-developer
user
publisher, sponsor, data provider,...
Although this definition formally differs from what one finds in most handbooks (see for
example Gouws 1989 and Lutzeier 1995), it does not really do so from the point-of-view
of contents. Next to the possibilities that a frame offers on the levels of explicitness and
consistency (2), perhaps what stands out the most in this definition in comparison with
more ‘traditional’ ones, is the fact that lexicology here, as an activity, is not considered to
be a stand-alone act of a lexicographer, but much more as a scene on which, next to
lexicographers, different players, such as metalexicographers, tool developers, users and
publishers play a role. It goes without saying that lexicographers themselves can take up
more than one role in this ‘play’. In what follows we will more in particular stress the role
of tools and infrastructure on the lexicographical scene (3).
2. ‘On the construction of Bilingual Dictionaries’
At the end of 1996, the European Commission (DGXIII) issued a call for a feasibility
study ‘on the construction of bilingual dictionaries’. The study had to design a ‘plan for the
creation of bilingual electronic dictionaries serving needs of language processing and
human users in the context of the information society’ (Technical Specifications, p. 1).
Moreover, it was further specified that ‘the plan should incorporate methods for
56
Lexicography, Lexicology, Linking and the Hub-and-Spoke Model
harmonising and standardising bilingual dictionary production out of separate monolingual
dictionaries, and for promoting best practice among publishers and other data owners, and
efficient costing in the field of bilingual dictionary production with a view to obtaining
genuine economies of scale’. Against this background, from October 1997 until May 1998,
a feasibility study has been carried out by a Consortium consisting of CLVV, IMS and
CCL (4), yielding a report entitled ‘On the Construction of Bilingual Dictionaries’ (See
Martin-Heid 1998). This report ends up with a series of recommendations in which an
adequate infrastructure is proposed and in which it is, among others, stated that a linkingbased approach is to be preferred to a directional (=translational) one ‘because linkable
dictionaries lend themselves more easily to machine-use and re-use in general’ (MartinHeid 1998: 84). In what follows we will elaborate upon the concept of infrastructure,
starting with linkable dictionaries and their implications for lexicography.
3. Linking versus Translation in Bilingual Dictionary Construction
Although every translator knows that it is impossible to translate properly working on the
form level only, yet many translation dictionaries act as if this were the case. So it should
not strike one as strange to find in a Dutch-French translation dictionary an entry such as:
organisatie:
organisation
instead of (5):
organisatie
1 [het organiseren] organisation
2 [het georganiseerd zijn, de wijze] organisation => structure, ordre
3 [vereniging] organisation => groupement, association
The difference between the two should not be sought in the difference in size and target
group (only), but much more in what is called the distortion of the Source Language (SL)
by the pull of the Target Language (TL). Or in the words of Atkins:
‘One of the priorities of the new bilingual dictionary is to avoid the
distortion of the source language analysis (...) by the pull of the target
language equivalencies to be offered in the entry: the more sense overlap
there is in the SL and TL lexical equivalents, then the greater the distortion’
(Atkins 1996; 527-528, my italics)
One could paraphrase bilingual lexicography ‘old style’, as mentioned by Atkins, as a
translational approach, substituting SL items by TL items on form level, taking, on the
meaning level, the TL as an organising principle. ‘New style’ bilingual lexicography could
then be characterised as ‘linking’. This linking, however, involves more than just avoiding
the ‘subtle distortion’ (Atkins, o.c.: 523) of the right-hand side on the left-hand side of a
bilingual dictionary. An example can clarify what is meant.
57
W. Martin
Suppose one has an English lexical database containing the item glimmer. Suppose
glimmer has got some additional information, both formal (e.g. that it is a verb) and
semantic (e.g. that if something glimmers it produces or reflects a faint, often unsteady
light). The transla tion of glimmer into Dutch which one finds in most translation
dictionaries would imply providing one or more translation equivalents for it, e.g. zwak
schijnen, glimmen, zacht schitteren, flikkeren, schemeren (6).
As one will observe, this approach yields one or more translations/equations for the SL
item given. Moreover, the translations given are mostly monodirectional in a double
respect.
First of all the equations
glimmer = zwak schijnen
= glimmen
= zacht schitteren
= flikkeren
= schemeren
are monodirectional in the sense that they hold for the direction English-Dutch, but not
necessarily so for the direction Dutch-English. In other words, it is possible that Dutch
flikkeren e.g. is an ‘adequate’ translation equivalent for English glimmer, but that it is not,
or far less, the case when reversing the equation (7). Furthermore, the information given is
monodirectional (and implicit) in a second sense, namely by the fact that the possible
differences that hold for the Dutch items among themselves are not given. Of course this
‘monodirectionality’ has to do with the fact that, often, bilingual dictionaries are meant for
human users who are supposed to know sufficiently about their mother tongue, in this case
Dutch. Monodirectionality here then means directed towards one group of users entailing
implicitness.
Opposed to the translational method is the linking method. Linking, in this context, is to
be defined as coupling semantic objects (meaning of words/expressions, not their mere
form) of a language L1, with compatible objects of another language L2, by means of
explicit links or relations, without any bias towards SL or TL. In this approach glimmer is
not just put on a par with e.g. zwak schijnen as such, but there are several links, e.g. one
from glimmer to schijnen and v.v. stating the hyper-/hyponymic relationship between the
two, another one with zwak schijnen stating next to the equivalent relationship on
conceptual level, the difference on the lexicalisation level, etc. (8).
The claim then is that linking lexical items from two different languages is much more
‘rewarding’ for bilingual lexicography than merely translating them. Not only because one
avoids the distortion of the source language analysis by the pull of the target language
equivalencie s to be offered in the entry (see Atkins, o.c.: 527-528), but also because this
approach leads to greater efficiency in operations such as reversal and derivation as will
be illustrated in the sections to follow.
4. Linkable Reference Lexicons (LRL’s)
If one accepts that, in bilingual dictionary construction, ‘linking’ outperforms ‘translating’
and so becomes the most basic, the primary, action, replacing translation, then one should
not lose sight of the fact that ‘linking’, contrary to ‘translating’, ideally (9) presupposes (at
58
Lexicography, Lexicology, Linking and the Hub-and-Spoke Model
least) two lexical databases which should function as reference lexicons. These are
lexicons that can function both as a SL- and as a TL-reference point. In other words, a
RL can serve
• both as a point of departure linked up to one or more other RL’s;
• and as a target point to which one can refer from one or more other RL’s.
So, although reference lexicons are created independently for individual languages and
thus are monolingual, they must guarantee intercompatibility, which means that they should
share some common background principles with regard to size and to semantic and
pragmatic granularity. Actually, as a rule, good, descriptively adequate (10) monolingual
dictionaries will qualify as useful linkable reference lexicons, provided that, among other
things, they contain ‘words’ as objects, not as mere forms (FU’s = form units), but as
combinations of form and meaning (LU’s = lexical units) (see preceding section).
Otherwise it could be the case that, having linked the English form knight both with the
French form chevalier and with the German form Ritter, chevalier and Ritter also would
be linked to knight in its meaning as chess piece, which would lead to an incorrect link
both for French (where one should find cavalier for the chess piece) and for German
(where the correct link is with Springer or Pferd).
In the scheme which follows (fig. 1), therefore, a distinction is made between FU’s (=
Form Units)
and LU’s (= Lexical Units or Meaning Units) and use is made of two types of links:
attachment and translation links.
FU
LU
LU
FU
ROS
[vlees]
PAARD
RIDDER
[dier] [dier] [schaak]
[animal]
STEED
[adel] [heer]
[animal] [chess]
HORSE
language 1
[chevalier] [gentleman]
KNIGHT
CAVALIER
language 2
= Attachment Links; connect FU’s of one language to LU’s of the same language (11)
= Translation Links; link LU’s in different languages (12)
Figure 1: Attachment and Translation Links
One of the basic requirements for LRL’s then comes down to the fact that Linkable
Reference Lexicons should contain LU’s, i.e. sense indicators (resumes, semantic
types, definitions) of FU’s. Contrary to what one may expect, these sense indicators need
not be expressed in the same (meta)language as long as one is working within a bilingual
59
W. Martin
framework. Furthermore, it should be obvious that when these sense indicators would be
lacking for the Target Language (L2) reversing would entail quite a lot of post-editing,
such as deleting the translation equivalent paard for knight in the meaning of chevalier. In
figure 2 below a summary of the requirements for LRL’s is given (13).
Task →
Required information type ↓
Linking
FU ↔ LU
Explicit sense indicators
Semantic relations
++
++
+
Pragmatic Constraints
+
Figure 2: Requirements for LRL’s
5. Manipulating LRL’s: Linking and Reversing
5.1 Links
In order for LRL’s to function in bilingual dictionary construction there should not only be
the LU’s as proper objects where to hook up translation links (see fig. 2), but also the links
themselves should be expressed in an adequate and explicit way. As a rule this can be
done by making use of the following four parameters:
- conceptual equivalence
- pragmatic contrast
- variant status
- lexicalisation status
As we have dealt with these parameters elsewhere (see Martin-Tamm, 1996, 682 ff.), we
will only briefly deal here with the most important ones: the pragmatic contrast and the
conceptual equivalence.
5.1.1 Pragmatic Contrast
As each Lexical Unit should be accompanied by a specification of its pragmatic value, a
pragmatic calculus can be carried out while linking two lexical units. So e.g. although from
a conceptual point-of-view the English word bed and the Dutch words bed, nest and
sponde all refer to the same concept, their pragmatics greatly differ. In both languages
bed is the neutral term, Dutch nest being informal, sponde being formal and obsolete. As a
rule the pragmatic calculus can be tuned so for it to yield a blocking between items or a
60
Lexicography, Lexicology, Linking and the Hub-and-Spoke Model
blocking only when going in one particular direction, allowing e.g. the direction marked
item → unmarked item, but not vice versa (for more examples see Martin-Tamm, 1996,
684 ff.).
5.1.2 Conceptual Equivalence
Given the fact that it is hard ever to find true interlingual synonyms, one could of course
argue that this interlingual information [i.e. the difference between items from different
languages] could be calculated from the data contained in the monolingual reference
lexicons, in particular in the semantic section. However, taking into account on the one
hand the fact that an explicit and formal system to represent lexical meaning is not
available at present, and, on the other hand, that, when linking two languages to each
other, it is very useful to do so in a way which is as economical and powerful as possible,
we consider it very useful for explicit links to inform about the so-called degree of
conceptual equivalence. Let us take up the case of ombre. In English ombre is to be
translated by two hyponyms, viz. shade (focusing on the locative aspect of ombre) and
shadow (focusing on the formal aspect). If one has a set of values such as (see MartinTamm, 1996, 683):
- complete equivalence (i.e. there is complete equivalence between Source
Language LU (SLU) and Target Language LU (TLU))
- hyperonym (i.e. the TLU is the hyperonym of the SLU)
- hyponym (i.e. the TLU(’s) is/are (a) hyponym(s) of the SLU)
- substitution by near equivalent (e.g. English barrister vs. Dutch advocaat)
- related (e.g. the English series shine, glimmer, glisten, glow, glitter and the Dutch
series schijnen, schitteren, flikkeren, glimmen, glinsteren, flonkeren)
then this set of values not only makes the choice between equivalents easier, it also makes
the reversal of equivalents much more accurate when moving from the A-B part to the
B-A part, a fact which is extremely important in the dictionary making process. Compare
the case where the hyponym-link between the English LU inflection and the Dutch
verbuiging, vervoeging will be inverted into a hyperonym-link when reversal takes place.
Explicitly stating the relationship here implies that the semantic constraints in the
hyponym-linking (viz. <w.r.t. nouns and adjectives> and <w.r.t. verbs> respectively) will
now be transformed into semantic specifications, thus not yielding Dutch vervoeging =
English inflection, D. verbuiging = E. inflection, but D. vervoeging = E. inflection <of
verbs> and D. verbuiging = E. inflection <of nouns/adjectives>.
5.2 Reversal of bilingual dictionaries
In the preceding sections we have been dealing with data (see LRL’s, section 4) and data
manipulation (linking, see section 5.1). It is obvious that in order to manipulate data one
needs tools to manipulate them with. One such a tool is OMBI. However, as dealing with
OMBI would lead us too far here, see Martin-Tamm, 1996 and Martin-Heid, 1998, for
further details, we may suffice here by stating that OMBI (an acronym for OM(keerbare)
61
W. Martin
BI(linguale) woordenboeken = Reversible Bilingual dictionaries) is an editor for bilingual
dictionaries which, as most dictionary editors, is a device to guide, structure and correct
input according to a predefined grammar. Moreover, OMBI also has linking and reversing
facilities. In other words, with OMBI (or OMBI-like editors) one can
• create LRL’s
• link them
• and automatically and accurately reverse the links
The latter is the case because of the fact that
• links are typed (meaning that there are links of different types showing different
values, e.g. complete equivalence, interlingual hyperonymy, etc. for the type
‘equivalence’)
• and a calculus defines what can be done with the values of the different types: which
links are reversible, which ones are not, under which conditions, etc.
In the rest of this section we will first give an example of an OMBI input (5.2.1), followed
by an extract from the reversal calculus (5.2.2), to end up with some illustrative cases
(5.2.3).
5.2.1 OMBI-input: Linking river to rivière
Following is a screenprint (figure 3) showing the editing (linking) of the FU/LU river in the
meaning ‘stream of water’ with the FU/LU rivière in the meaning ‘cours d’eau’. As one
can notice the lexicographer has to choose a value for the conceptual equivalence link
(specifying the meaning restriction in the case of a hyponym) and the same goes for the
variant status (‘non variant’ meaning ‘main translation equivalent’). Pragmatic and
lexicalisation contrasts do not have to be filled out here: on the basis of the properties of
the FU/LU’s they are calculated and so automatically generated.
62
Lexicography, Lexicology, Linking and the Hub-and-Spoke Model
Edit translation
Source river <noun>/stream of water
Target rivière <noun>/cours d'eau
Translation
Translation
Contrast
Contrast
Conceptual
Conceptualequivalence
equivalence
Target
Target is
is
hyponym
hyponym
Meaning
hyponym
Meaning hyponym
of
of source
source
not
not flowing
flowing into
into sea
sea
(use
language
(use language of
of hyperonym)
hyperonym)
Target
Target
is
is
Source
Source
x non-variant
? non-variant
translation of source
translation of source
0 variant
? variant
x non-variant
? non-variant
is 0 variant
is ? variant
0
? non-permitted
translation of target
translation of target
Contrast
Contrast
there is no pragmatic contrast
there is no pragmatic contrast
there is no lexicalisation contrast
there is no lexicalisation contrast
v OK
X Cancel
Figure 3: Scheme of the OMBI Screenprint of FU/LU river
5.2.2. Reversal Calculus
The following table gives the reversal calculus with respect to the conceptual equivalence
values. The left-hand side represents the values for the links between L1 and L2 which the
lexicographer has to fill out (see 5.2.1). The right-hand side provides the reversal results
which are automatically created.
63
W. Martin
L1⇒ L2
complete equivalence
interlingual hyperonymy
⇒
interlingual hyponymy
related equivalence
substitution by explanation
substitution by borrowing
substitution by near equivalence ⇒
L2⇒ L1
⇒
complete equivalence
interlingual hyponymy
⇒
interlingual hyperonymy
⇒
related equivalence
⇒
∅
⇒
∅
substitution by near equivalence
Figure 4: Reversal Calculus for Conceptual Equivalence
From the above, one can, among other things, infer that in the case English river French
rivière (target = hyponym), the reverse will yield French rivière English river (target =
hyperonym). Moreover, in reversing a Translation Equivalence Link that involves
hyperonyms and hyponyms, the calculus will also generate the following output: if the unit
in the target language, the translation equivalent, is a hyponym of the unit in the source
language, the ‘meaning hyponym’ will show up as a constraint on the translation.
A (Source)
B (Target)
river
[flowing into sea] fleuve
river
[not flowing into sea] rivière
In the reversed translation link, the unit in the target language, the translation equivalent,
will be a hyperonym of the unit in the source language, therefore the ‘meaning hyponym’
will show up as a explicitation of the source language.
B (Target)
A (Source)
fleuve
rivière
river [flowing into sea]
river [not flowing into sea]
5.2.3 Some more reversal examples
All examples following are given for illustrative purposes, their output being fully
automatically generated by OMBI; notice that also the combinations/collocations are
linked up correctly and that the results come in dictionary article lay out. As to the
complexity of equivalence types, one could differentiate between
• straightforward cases (1-to-1 relations)
• more complex cases (1-to-n, divergence; n-to-1, convergence; n-to-n, multivergence)
64
Lexicography, Lexicology, Linking and the Hub-and-Spoke Model
kaneel
kaart
kaart
bon
lot
paar1, sense1
1
paar , sense 2
paar2, sense1
cinnamon
1:1-relation
card
chart
map1
map2
ticket
menu
divergence
1:n-relation
ticket
convergence
n:1-relation
pair, sense1
couple, sense1
couple, sense2
couple, sense3
multivergence
n:n-relation
Results of reversal by OMBI with one Dutch LRL (14):
INPUT
kaneel
<noun> <-;de/het; mn> 1. [zoete specerij] cinnamon a. een pijpje kaneel a
cinnamon stick b. een snuifje kaneel a pinch of cinnamon.
paar1
<noun> <paren; het; n> 1. [tweetal] pair, couple a. twee paar schoenen two pair
of shoes b. dat is een ander paar mouwen [belg] that’s something different 2.
[duo] couple a. zij vormen een mooi paar they make a lovely couple b. het
koperen/gouden paar the couple celebrating their copper/golden wedding
anniversary c. het jonge paar the young (married).
paar2
<noun> <-; het; n> 1. [kleine hoeveelheid] couple a. een paar keer a couple of
times b. over een paar minuten in a couple of minutes c. zo weet ik er nog wel
een paar tell that to the marines.
OUTPUT
cinnamon
<noun> 1. [spice] kaneel a. a cinnamon stick een pijpje kaneel b. a pinch of
cinnamon een snuifje kaneel.
pair
<noun> 1. [two things] paar a. two pair of shoes twee paar schoenen.
couple
<noun> 1. [two things] paar 2. [two people] paar, koppel, stel a. they make a
lovely couple zij vormen een mooi paar b. a nice couple een leuk stel, een
65
W. Martin
aardig koppel 3. [small number] <informal> paar a. in a couple of minutes over
een paar minuten b. a couple of times een paar keer.
It goes without saying that the resulting output is a kind of snapshot: a function of the input
at a certain moment of time. Consequently, it is an incremental process: the more input is
given, the more output will be yielded. In our case this is what one gets for the entries
cinnamon, pair and couple, given as input only the items kaneel, paar1 and paar2 and no
other ones which equally well could contain relevant information for cinnamon, pair and
couple. The input of more D → E items can, of course, add to what already is generated
(15).
6. A framework for LRL’s: combining bilinguals in the Hub-and-Spoke Model
6.1 Introducing the model
In the preceding we have seen that by replacing the translation approach by the linking
approach bilingual dictionaries can be made in an efficient and, qualitatively speaking,
interesting way. Although at first sight there may be an apparent redundancy involved
(see the organisatie example, section 3) and more effort is needed in the construction of
one volume of a bilingual dictionary, the profits earned certainly outweigh the costs (16).
This becomes even more apparent if one moves one step further, going beyond a language
pair (A-B) and adding one more common language (C). In that case, one can construct
what we have called elsewhere a hub-and-spoke configuration (see Martin 1996 and also
Martin-Heid 1998) and fully exploit it by inferring links between the spoke-languages. The
steps underneath will clarify what is meant:
Step 1: Reversible links between two languages A and B (what has been presented and
discussed up till now):
A
B
Figure 5
Step 2: Add one language to the data collection for A ↔ B, for instance in the
configuration below:
A
C
B
Figure 6
66
Lexicography, Lexicology, Linking and the Hub-and-Spoke Model
Language A functions now as a common link. It is called the hub-language in analogy
with air-traffic organisation where often one does not fly directly from a (spoke) airport
to another (spoke) airport, but via a hub, a central airport. B and C are the spokelanguages.
Step 3: Infer the links between B and C by means of derivation rules:
A
C
B
Figure 7
A couple of observations seems to be appropriate:
1. The Hub-and-Spoke Model is a model with an enormous potential. Its strength lies in
the fact that it exploits the intra- and interlingual relations in and between languages and
does so via a hub (↔ bidirectionally). It is obvious, however, that the languages to be
linked should show a sufficient degree of equivalence (17).
2. The productivity of the Hub-and-Spoke Model increases with the number of
languages involved. Five languages, combined bidirectionally in language pairs, give e.g.
rise to ten language combinations (fig. 8). The same amount of languages organised with
one fixed hub have but to provide for four direct linkages, the six others being generated
as spin-offs (see figure 9 (18)). One can imagine that the Hub-and-Spoke Model can
offer interesting possibilities particularly in a multilingual environment, think of the EU,
but also of the situation in South Africa, where there are also eleven official languages. In
such a situation (eleven languages) 55 different pairs (=110 bilingual dictionaries; taking
both directions into account) could be derived. In a hub-and-spoke configuration one
could suffice with ten direct links (10 spokes to 1 hub), the remaining 45 being
generated as indirect spin-offs. Actually, there is a gain in data production form the third
language onwards.
E
F
D
67
W. Martin
I
S
D = Dutch
E = English
F = French
I = Italian
S = Swedish
Figure 8: Five different languages giving rise to ten language combinations
B
A (Hub)
E
C
D
Figure 9: Situation with one fixed hub
6.2 Illustrating the rules for the model
In order for the Hub-and-Spoke Model (HSM) to be operational it should have
inferential or derivation rules at its disposal: rules with which links between spokelanguages can be derived, given existing links between the spokes and a common hub.
The hub-and-spoke inference calculus as it stands now has been implemented in a
database system, but is not yet integrated in OMBI (19). To give an idea of the kind of
rules that are at stake now an example follows (figure 10):
A LU of L1 may be linked and reversed to a LU of L3 with respect to conceptual
equivalence, if the conceptual equivalence value is ‘complete’ for one of the two hub-tospoke links and the value of the other link is one of those in the first column of the
following table:
L1 ⇒ L2 or L2 ⇒ L3
L1 ⇒ L3
L3 ⇒ L1
complete
⇒ complete
⇒ complete
hyperonym
⇒ hyperonym
⇒ hyponym
68
Lexicography, Lexicology, Linking and the Hub-and-Spoke Model
hyponym
⇒ hyponym
related
⇒ related
⇒ hyperonym
⇒ related
Figure 10: Example of a derivation rule
6.3 An example of inferencing in the HSM
What follows is an extremely simplified exemplification of the HSM taking just five
lexical items (one French, two Dutch, two English) into account and looking at the result
of linking them in a HSM-configuration.
INPUT: three (monolingual) LRL’s containing respectively:
• Dutch: huilen, wenen
both meaning: tranen storten (shed tears); wenen is more formal (indicated as
↑)
• English: cry, weep
both meaning: shed tears; weep is more formal
• French: pleurer
meaning: verser des larmes (shed tears)
Desired OUTPUT: 3 bilingual ‘dictionaries’ containing these items
PROCEDURE: both French and English need to be linked to Dutch, which functions as a
hub. This direct linking can be realised via (a tool such as) OMBI. As a result, two extra
results will be generated: the reversal of French-Dutch and English-Dutch into DutchFrench and Dutch-English on the one hand, and, on the other hand, the linking of French
to English and vice versa via inferencing. Schematically this looks as in the figures
below:
French
pleurer
English
cry; weep
Dutch
huilen; wenen
Figure 11: Linking, Reversing and Inferencing via one Hub
In figure 12 the same process is schematised in two steps by the following graphical
representation:
69
W. Martin
F
INPUT
pleurer
DIRECT
verser des larmes
INTERLINGUAL LINKS
info
D
huilen
tranen storten
info
D
wenen
tranen storten
info
E
cry
shed tears
info
E
weep
shed tears
info
OUTPUT
by means of direct linking by means of reversal by means of inference
F-D
D-F
F-E
pleurer = huilen ⇒ ↑wenen huilen = pleurer
pleurer = cry ⇒ ↑weep
E-D
D-E
E-F
cry = huilen ⇒ ↑wenen
huilen = cry ⇒ ↑weep cry = pleurer
weep = wenen ⇒ ↓huilen wenen = weep ⇒ ↓cry weep = ↓ pleurer
Figure 12: Results within HSM-framework
7. Conclusion: lexicographical infrastructure and the relationship between
lexicography and lexicology
In the preceding it has been demonstrated that lexicography in order to come to a
good and efficient infrastructure, has to pay much attention to lexical structure.
Paradoxically then, it seems that lexicography, while looking for its own tools and
implements, shows a rapprochement with lexicology. Or to formulate it
otherwise: the search for and the advent of a better lexicographical infrastructure
entail both a better lexicography and a better lexicology. This does not lead to
fusion, nor should it lead to confusion, instead a synergetic effect is created:
‘good’ lexicography, by constructing and making use of tools such as have been
presented here, can offer new insights into the relational structure of the
vocabulary, and, lexicology, in its turn, getting a new impetus by the advent of
70
Lexicography, Lexicology, Linking and the Hub-and-Spoke Model
lexicographical infrastructure, can make the latter profit from its newest insights
and results with regard to the overall vocabulary structure.
In this respect one could speak of a cross-fertilisation between the two
disciplines. On the one hand, this cross-fertilisation brings the dictionary closer to
the lexicon, ‘making it more abstract’: lexicographers exploiting the systematicity
and underlying relationships of the vocabulary in order to come to better, more
efficient tools. On the other hand, the cross-fertilisation brings the lexicon closer
to the dictionary, ‘making it more concrete’: lexicologists being confronted with
the concrete data, needs and desiderata of makers of dictionaries. Both disciplines
becoming better by this, this cannot but lead for both of them to a better and more
identifiable place ‘on the intellectual map’ (Nuccorini, o.c.: 137).
Notes
1
I use the term frame here as a knowledge representation scheme in the form of a matrix with
slots, general conceptual categories, specified by fillers, (more) specific classes (see e.g. Martin
1994).
2
In Martin 1998 also flexibility is mentioned as one of the advantages of frame-based definitions
at the level of representation.
3
Often the lexicographer takes up the role of a metalexicographer as well. He also may play a role
in tool development providing linguistic and functional specifications.
4
CLVV stands for Commissie Lexicografische Vertaal Voorzieningen (Committee for
Interlingual Language Resources), a Dutch-Flemish Governmental Committee consisting of a
group of experts who give advice to both governments and help streamline and co-ordinate their
(subsidisation) policy (see Martin 1995 and 1993). The seat of the CLVV is The Hague (The
Netherlands). IMS= Institute für maschinelle Sprachverarbeitung, Universität Stuttgart; CCL =
Computing Centre, University of Leuven.
5
This is actually a strongly simplified representation of what is found in Van Dale’s Groot
Woordenboek Nederlands-Frans, 2nd edition, 1991, Utrecht. It is important to notice that here the
source language (Dutch) is kept unbiased.
6
As is to be found in Van Dale’s Groot Woordenboek English-Dutch, 3rd edition, 1998, Utrecht.
7
Flicker and glitter would certainly stand as good, probably, better candidates.
8
Contrary to glimmer in English, zwak schijnen in Dutch is not lexicalised.
9
In theory, linking between two lexical databases can occur when the databases do not pre-exist:
the objects of the databases are then created on the spot. However, this is far from ideal. A much
more favourable situation occurs when the two or at least one database does exist (see MartinHeid: 1998).
10
As is well known, description of lexemes can take place at several levels, ranging from formrelated (graphemics, phonetics) to meaning and usage-related ones (semantics, pragmatics). In
particular, the latter group is important for adequate and efficient linking.
11
The conditions are that one FU must have at least one LU and that LU’s must always be
attached to a FU.
12
The fact that in this example more links could be made, e.g. also between ‘ros’ [dier] and
‘horse’ [animal] is not the point at issue here: it is for the lexicographer to decide which concrete
items to ‘link’ and which ones not.
13
‘++’ Indicates features which are indispensable for a LRL in order for it to qualify as such. ‘+’
Indicates dispensable features which, however, greatly facilitate the linking process.
14
This means that OMBI worked with only one database (the Dutch one) given, the English one
was created while linking.
15
There always remains a post-editing phase, needed, among other things, to fill out the data
bound to language B. These data cannot be generated by reversing A-B to B-A.
16
With OMBI e.g. a conservative estimation of the reduction in workload is to be at least 25%
(see Groen, M. in ‘t, 1998: 80).
71
W. Martin
17
In Martin 1999 an experiment is reported involving Dutch, Afrikaans and Sepedi; Afrikaans
acting as a hub, the other two languages as spokes. The derived results for Dutch and Sepedi are
convincingly better then what is to be found in comparable dictionaries (Martin 1999: 41-42).
18
These spin-offs need, of course, a post-editing phase.
19
Actually what follows is based on Groot 1998.
Bibliography
ATKINS, B. (1996). Bilingual Dictionaries: Past, Present and Future, in: M. Gellerstam e.a. (Eds.),
Euralex ’96 Proceedings, I-II, Göteborg University, pp. 515-546.
GOUWS, R.H. (1989). Leksikografie. Academia, Pretoria, 287 pgs.
GROEN, M. IN ‘T (1998). Le dictionnaire bilingue. Une étude théorique et pratique sur l’opération
d’inversion. MA-Thesis in Lexicology, Vrije Universiteit, Amsterdam, 89 pgs.
GROOT, E.N. (1998). The Hub-and-Spoke Model in Practice. MA-thesis in Lexicology. Vrije
Universiteit, Amsterdam, 55 pgs.
LUTZEIER, P.R. (1995). Lexikologie: ein Arbeitsbuch, Stauffenburg, Tübingen, 167 pgs.
MARTIN, W. (1994). Knowledge-Representation Schemata and Dictionary Definitions, in: Carlon,
K. e.a. (Eds.), Perspectives in English, Peeters, Leuven, 237-256.
MARTIN, W. (1995). Government Policy and Bilingual Lexical Databases: the Action Plan for
Dutch, in: Second Language Engineering Convention, London, 1995, pp. 133-144.
MARTIN, W. & TAMM, A. (1996). OMBI: an Editor for Constructing Reversible Lexical
Databases, in: M. Gellerstam e.a. (Eds.), Euralex ’96 Proceedings, I-II, Göteborg
University, pp. 675-685.
MARTIN, W. (1998). Frames as Definition Models for Terms, in: Manu, A. (Ed.), Proceedings of
the 4th Infoterm Symposium, Vienna, pp. 189-221.
MARTIN, W. & HEID, U. (Eds.) (1998). On the Construction of Bilingual Dictionaries, The Hague,
92 pgs.
MARTIN, W., GOUWS, R. & RENDERS, L. (1999). Haalbaarheids- en definitiestudie voor een
woordenboek Afrikaans-Nederlands / Nederlands-Afrikaans, Vrije Universiteit,
Amsterdam, 1999, 62 pgs.
NUCCORINI, S. (1993). Lexicology and Lexicography Revisited, in: Hart, D. (Ed.), Aspects of
English and Italian Lexicology and Lexicography, Bagatto Libri, Rome, 1993, pp. 127139.
WIKBERG, K. (1983). Methods in Contrastive Lexicology, in: Applied Linguistics, 4, 3.
72
Le dictionnaire comme outil d'apprentissage
M.Celeste Augusto
Université d'Utrecht
1. Introduction
Mon exposé s’insère dans le cadre de l’élaboration du dictionnaire bilingue
néerlandais–portugais et portugais-néerlandais, actuellement en cours1. Mon but
n’est pas de décrire le travail d'élaboration du dictionnaire, mais de présenter
l'usage qu’on en peut faire dans l'apprentissage d'une langue. J’aborderai le sujet
dans la perspective du lexicographe et dans celle de l’usager.
Je commencerai par une caractérisation succincte et globale de ce que l’on appelle
dictionnaire d’apprentissage. Je garderai présent à l'esprit le fait que l’emploi du
dictionnaire dans l’apprentissage d’une langue, étrangère ou non, dépend de la
méthode d’enseignement utilisée et de l’objectif à atteindre. Ensuite je présenterai
les notions lexicologiques qui servent de base à ma communication, mais aussi, à
la réalisation du dictionnaire mentionné plus haut. Le point suivant aura un
caractère tout à fait pratique, car il s’agit d’un commentaire de trois entrées du
dictionnaire néerlandais-portugais. Ce commentaire sera suivi de quelques
conclusions provisoires.
2. Le dictionnaire d’apprentissage
La typologie des dictionnaires est vaste et diversifiée; on peut imaginer des
dictionnaires pour tous les domaines. Ceux qui nous intéressent sont
naturellement les dictionnaires de langue.
Tous les dictionnaires parce qu’ils donnent de l’information sont, a priori,
didactiques, cependant certains sont plus didactiques que d’autres, ayant été
élaborés dans ce but.
1
Il s’agit de la production d’un dictionnaire bilingue avec presque 48.000 entrées du côté
néerlandais et environ 35.000 du côté portugais. Cet écart relatif aux entrées est dû, entre autres, à
la façon spécifique des deux langues de travail de construire les noms composés; ainsi par
exemple <stoombad> (littéralement bain de vapeur) et <schuimbad> (littéralement bain moussant)
auront chacun une entrée et comme équivalents portugais <banho de vapor> et <banho de
espuma> respectivement, qui, à leur tour, seront enregistrés sous la même entrée, à savoir
<banho>.
Quand au dictionnaire, il est élaboré à travers un programme éditeur bilingue dénomé OMBI.
OMBI est l’acronyme de la dénomination néerlandaise OM(keerbare) BI(linguale)
woordenboeken, littéralement “Dictionnaires Bilingues Reversibles”. OMBI, grâce à une
grammaire prédéfinie, permet de lier deux bases de données lexicales et de faire automatiquement
la réversion des "links" opérés. Sur ce sujet voir Martin dans ce même volume.
M. Celeste Augusto
Il y a 20 ou 30 ans, le lexicographe2 qui produisait un dictionnaire monolingue ou
bilingue ne considérait pas l’apprenant d’une langue comme un public à atteindre.
Même les dictionnaires bilingues de la ligne de production appelée Académicos
ou Escolares de la maison d'édition portugaise Porto Editora ne satisfaisaient pas
aux principes élémentaires d’apprentissage d’une langue. Je prends au hasard
l’entrée <abafado> (étouffé) du dictionnaire Português-Francês de cette ligne; il
propose 9 équivalents en français: "étouffé, chaudement vêtu, sourd, bouché,
occulte", etc., puis une petite liste d’associations et exemples où le <vinho
abafado> (vin doux qui n'a pas été fermenté) est placé entre <quarto abafado>
(chambre étouffée) et <voz abafada> (voix étouffée). Plus récemment, en 1982, le
dictionnaire Inglês-Português de A. Houaiss, élaboré au Brésil, est paru; il
présente, sans information supplémentaire, pas moins de 34 équivalents portugais
pour le mot <bank> substantif, et 27 verbes, ce qui effectivement n’aide pas
beaucoup l’usager.
Cependant, en 1971, dans Introduction à la Lexicographie: le dictionnaire,
Dubois disait déjà (p.49), que "Le dictionnaire appartient au genre didactique et, à
l'intérieur de ce genre, l’énoncé lexicographique a les caractères principaux du
discours pédagogique. Comme tout discours pédagogique, il est un énoncé sur un
autre énoncé déjà réalisé [...] il renvoie à un certain type de communication, à un
certain rapport entre «je», «tu» et l'objet du discours «il»" et plus loin "Le
discours lexicographique est [...] de même nature que l'énoncé pédagogique de
l'enseignant, du maître qui s'identifie avec la communauté socio-culturelle et
détient le savoir". Et Dubois continue (p. 50): "Le dictionnaire enseigne, ce qui
signifie que la réponse qu'il donne n'est pas simplement une information, mais un
ordre à exécuter". Ainsi, de plus, par son caractère normatif, il fait loi, il règle la
norme linguistique, ce que l'auteur justifie plus bas (p. 50 - 52).
Si nous considérons les dictionnaires portugais produits à cette époque-là, années
cinquante et soixante, et même plus tard disons entre 1980 et 1990, je me
demande s’ils avaient un discours pédagogique.
On arrive ainsi à la question de savoir ce qu’est un dictionnaire d’ apprentissage.
Une réponse concise mais éclairante sera qu'est un instrument qui aide l’apprenant
d’une langue à développer sa capacité de communication, c’est-à-dire, à encoder
et à décoder dans cette même langue.
Laissons de côté les aspects du type âge, degré de connaissances, but
d’apprentissage de l'apprenant, etc.) et type de dictionnaire monolingue ou
bilingue et voyons maintenant, d’une façon très générale, les principales
caractéristiques d’ un dictionnaire d’apprentissage3.
2
Je me réfère ici surtout aux lexicographes portugais et brésiliens.
Pour une analyse détaillée et très éclairante sur le rôle des dictionnaires en tant qu' instruments
d’apprentissage par rapport au français et à l’ anglais, cf. P. Bogaards surtout 1990, 1995, 1996 et
1998.
3
74
Le dictionnaire comme outil d'apprentissage
En ce qui concerne la macro-structure, celle-ci dépend d’abord de la taille du
dictionnaire qu’on décide de faire, mais cela mis à part, elle doit inclure
obligatoirement les mots les plus fréquents4, tous les mots grammaticaux et, si
possible, les néologismes les plus frappants, et aussi, si sa taille le permet, les
noms de lieux ainsi que les adjectifs correspondants et les langues qu'on y parle,
car cette nomenclature est souvent une bataille sans issue.
C'est dans la micro-structure que toute information est transmise. Celle-ci au point
de vue morphologique, syntaxique, sémantique, ou des exemples, doit être utile,
compréhensible, accessible ainsi que visible. Bien que lexicologiquement peu
importante, une disposition graphique claire est élémentaire au niveau de
l’apprentissage. Une liste compacte de mots qui peuvent être des équivalents de ce
que l’on cherche, décourage n'importe qui, mais surtout ceux qui ne maîtrisent pas
encore très bien une langue. Ainsi, un ordre et une numérotation clairs,
systématiques et cohérents de toute l’ information condensée dans la microstructure sont-ils un desideratum soit du lexicographe soit de l’usager. Les
combinatoires les plus fréquentes, les valences des verbes les plus employés et les
détails pragmatiques les plus frappants ne peuvent non plus être omis.
À cause de la valeur normative (cf. les remarques plus haut) que tous les
dictionnaires véhiculent, une insertion contextuelle correcte et précise des
exemples est, selon nous, fonctionnellement indispensable. Ils sont les modèles
qui guident l’usager dans une production correcte du discours5, qui est comme
chacun sait l'un des plus difficiles buts de l'apprentissage de n'importe quelle
langue.
Non moins importante est la valeur de l’ information culturelle ou civilisationnelle
à propos de certains mots6, surtout dans les dictionnaires bilingues. Je reviendrai
plus tard sur ce sujet.
En somme, dans ce type de dictionnaire et surtout à travers la micro-structure, la
langue devra être abordée au moins dans deux de ses fonctions, la référentielle et
la communicative.
Pour illustrer ce que je viens de dire je présenterai trois entrées du même mot,
extraites de trois dictionnaires monolingues du portugais: le mot choisi est le
verbe haver (y avoir) et les dictionnaires sont Dicionário da Língua Portuguesa,
4
Aujourd' hui, avec l'informatisation des données linguistiques, on dispose de corpora de référence
qui nous donnent la fréquence non seulement des mots mais aussi de toutes les combinatoires où
ils entrent.
5
Traditionnellement, les exemples étaient soit construits par le lexicographe soit empruntés à des
textes littéraires; ce dernier cas se vérifiait surtout dans les dictionnaires monolingues.
Aujourd’hui, grâce à l’emploi des corpora dans la production des dictionnaires, on a la possibilité
de donner des exemples naturels et authentiques.
6
Cf. J. Tomaszczyk (1983) qui insiste beaucoup sur la question du vocabulaire spécifiquement
culturel dans les dictionnaires.
75
M. Celeste Augusto
de Almeida e Costa, Dicionário Contemporâneo de Português de M. Tereza
Biderman e Dicionário do Português Básico de M. Vilela.
2.1 Dicionário da Língua Portuguesa.
haver
A. v.tr. ter; possuir; obter; considerar; julgar; conseguir; existir;
acontecer; ter decorrido; ter passado
B. v. intr. ser possível
C. v.refl. portar-se; proceder
D. s. m. crédito (na escrituração comercial)
E. s.m.pl.. bens; fortuna;
~ às mãos alcançar possuir; ~ de ser obrigado a, ver-se na
necessidade de, ter fatalmente de; ~ mister ter necessidade; ~ por
bem dignar-se; por bem fazer mal ~ ser pago com ingratidão
(Do lat. habere, ”ter; haver”)
C’est un dictionnaire général de la langue, comme nous en informe l’introduction
de la 8e édition7. Il présente ici une entrée très simple, je dirai-même pauvre. Les
lettres A B C indiquent que le verbe est respectivement transitif, intransitif et
réfléchi. D et E concernent l’homonyme «haver» en tant que nom au singulier et
au pluriel. Ensuite on trouve l’exemplification de quelques associations ou
combinatoires et un dicton ou proverbe; l’entrée se termine par un renseignement
étymologique. Il n'y a pas d’information sur les contraintes grammaticales, ou sur
l’emploi du verbe ou même sur la fréquence par exemple, par rapport à la
combinatoire haver mister, qui représente un usage très ancien et que l’on
n’utilise plus aujourd’hui.
J’en viens maintenant à examiner les deux autres entrées dans les deux
dictionnaires sélectionnés qui se présentent explicitement comme des instruments
didactiques.
2.2 Dicionário Contemporâneo do Português.
haver v. haver. A. Verbo de significação plena. t.d. 1. Existir
(impessoal indicando que algo existe). Há muitas estrelas no céu.
Não havia ninguém na festa. 2. Fazer (indicando tempo). t.d. Havia
meses que a gente não se via. 3. Suceder, acontecer. t.d. Parece que
houve alguma coisa grave entre eles.
B. Verbo auxiliar (acompanhado do infinitivo de outro verbo). 1.
7
Comparée avec les précédentes, cette édition présente, malgré son caractère insuffisant, une
micro-structure améliorée, surtout au niveau de la description grammaticale.
76
Le dictionnaire comme outil d'apprentissage
Indica empenho em alguma coisa, propósito de realizar algo. Eu
hei de vencer, se Deus quiser. 2. Indica obrigação, dever. Ele há-de
cumprir todos os seus deveres. 3. Indica certeza de que algo
acontecerá no futuro. José há-de pagar aquilo que deve. Ele há-de
encontrá-la com saúde.
C. Verbo auxiliar - indica fato8 passado quando conjugado com um
particípio passado de outro verbo. Se eles não houvessem saído
cedo, teriam tido a oportunidade de conhecer o artista. / / 2. conj.
hei, havia, houve, houvera, haja, houvesse, houver, havendo,
havido, haver >> haja o que houver: aconteça o que acontecer >
não há meios de...: impossível. Apesar de procurar por toda parte,
não há meios de encontrar este produto.
haveres s.m.pl. ha-ve-res [ê]. Todos os bens, propriedades e
riquezas de uma pessoa. Nesta família alguns possuem numerosos
haveres enquanto outros são quase pobres. Com o passar do tempo
o fazendeiro foi-se tornando um homem de muitos haveres. / / cf:
haver (v.). bens.
Nous avons ici à faire à un dictionnaire «contextuel» qui suit la variante
brésilienne. L’auteur est parfaitement consciente de l’ orientation qu’ elle a voulu
imprimer au dictionnaire. Tous les sens sont contextualisés, parfois même avec
deux exemples comme dans A 1, car selon l’auteur ceux-ci servent de modèle à la
production de l’apprenant9.
Les lettres A, B, C donnent de l’information grammaticale; les chifres indiquent
les différents sens illustrés par des exemples.
À la fin de l’ entrée, nous trouvons la conjugaison du verbe, qui est irrégulière, et
encore quelques-unes des locutions les plus fréquentes. L’homonyme «haver» a
une entrée séparée, avec un renvoi à «haver» comme verbe et à «bens», qui est un
synonyme de «haveres».
2.3 Dicionário do Português Básico
haver [αvér] v. impes., v. aux., n. m.
I.[v. impes. ]: (1) - Há quantos dias não vem cá? (2) - Há, na
turma dela, alunos surdos-mudos. (3) - Havia muita gente no
arraial. ■ haja o que houver: (4) - Eu vou ao baile, haja o
que houver. (5) - O que é que houve ali? ■ haver de / que +
inf.: (6) - Tanto o vestido como a saia são bonitas. Agora só
há que escolher!
8
9
Nous gardons ici l'orthographe brésilienne, c'est-à-dire, fato et non facto.
Cf. Biderman (1992:5-6).
77
M. Celeste Augusto
II [v. aux.] haver de + inf.: (1) - Eu hei-de conseguir uma
boa nota! (2) -Hás-de procurar melhor lá em casa. (3)Havemos de ir a Viana. (4) - Se ele cá estivesse havias de ver
o que é uma voz de anjo! (5) - Espera que ele há-de estar a
chegar. (6) - Com o carro avariado, como é que eles haviam
de aparecer?
III. haver por bem: Ele houve por bem vir visitar a madrinha
doente.
IV. [v. aux.] haver + part. pass.: Ela já havia feito os deveres
quando saiu para o quintal.
V. [n. m.]: (I) Estou a conferir a coluna do haver. ■ (pl.): (2)
Parece que ele tinha alguns haveres.
G.1. Conj. 47
G.2. Haver, sentido I, é um verbo impessoal, defectivo: conjugase apenas na 3ª pessoa do singular; não tem sujeito, daí a
inexistência de acordo verbal.
G.3. Haver de + inf., sentido II, é a chamada conjugação
perifrástica. Na 2ª pessoa (singular e plural) adquire valor de
imperativo (frase 2). Na 1ª pessoa (singular e plural), sugere a
ideia de propósito (frases 1, 3). No presente (frase 3) e no
imperfeito (frase 4) equivale a um futuro ou condicional
reforçados. Nas frases interrogativas (frase 6), equivale também
a um condicional, mas sugere uma certa incredulidade ou
dúvida.
G.4. Haver, como auxiliar (v. + part. pass.), sentido IV, equivale
a ter e entra na formação dos tempos compostos. É pouco
utilizado hoje, sobretudo oralmente.
G.5. Haver, sentido V, com o sentido que tem na frase 2, só se
usa no plural.
S.1..Haver, sentido I, usa-se em expressões de tempo e significa
FAZER (frase I). Nas frases 2 e 3, quer dizer EXISTIR.■ Haja o
que houver (frase 4) quer dizer OBRIGATORIAMENTE,
ACONTEÇA O QUE ACONTECER.■ Na frase 5, é sin. de
SUCEDER, ACONTECER, OCORRER (ling. cuidada).■ Haver que
+ inf. (frase 6) tem o sentido de TER DE, DEVER.
S.2. Haver de + inf., sentido II, indica OBRIGAÇÃO (frase 2). Na
frase I, expressa apenas PROPÓSITO. Na frase 3, indica a
INTENÇÃO relativamente a uma acção futura. Na frase 4,
equivale a um condicional. Na frase 5, sugere a ideia de
FUTURO PRÓXIMO. Na frase 6, equivale a PODER, TER
POSSIBILIDADE.
S.3. Haver por bem, sentido III, é uma fraseologia e quer dizer
TER POR BEM, RESOLVER, DIGNAR-SE. É pouco usado.
S.4. Haver, sentido IV, equivale a TER. Antigamente, era sin. de
TER, POSSUIR, mas essa utilização caiu em desuso.
S.5. Haver, sentido V quer dizer CRÉDITO na escrita comercial
(frase 1).■ Haveres (frase 2) significa BENS, RIQUEZAS,
PROPRIEDADES.
78
Le dictionnaire comme outil d'apprentissage
L’introduction de ce dictionnaire nous informe qu’il a «un caractère informatif et
formatif», il a donc un but pédagogique. Chaque entrée présente deux sections, à
savoir:
1)- usage avec plusieurs exemples
2)- explications grammaticales et sémantiques
Il n’a pas une grande macro-structure, nous pouvons même dire qu'elle est assez
petite; cependant, ce dictionnaire inclut les 2217 mots les plus fréquents du
portugais10, plus environ 800 considérés aussi fréquents. À l'intérieur de la microstructure l'information est encadrée par une numérotation romane et par les lettres
G et S. La numérotation romane donne l’information sur la forme avec des
exemples qui sont bien contextualisés, c’est-à-dire, qu'ils illustrent avec précision
l’emploi du mot inséré dans des phrases.
De G1 à G5 nous trouvons les renseignements grammaticaux et de S1 à S5 les
informations sémantiques avec des synonymes. De plus, nous avons aussi des
informations sur la fréquence, en G4, S3, S4 et encore sur le niveau de langue en
S1, phrase 5. Cette dernière observation est surtout importante pour ceux qui
apprennent le portugais comme langue étrangère, car au contraire des locuteurs
natifs qui en principe maîtrisent cette donnée intuitivement, les étrangers eux
doivent l'apprendre.
Ma dernière remarque porte sur la mise en page qui rend toute l’information très
lisible et facile à trouver.
Il est évident que l' entrée, que nous venons d'analyser, est pédagogiquement la
plus riche pour un apprenant de portugais en L1 ou L211, car le vocabulaire des
exemples, comme de tous les niveaux d’information, est clair et accessible à ceux
qui ont dépassé le stade de débutants.
3. Principes lexicologiques de base de la micro-structure
De l’étude de Cruse (1986) Lexical Semantics sur le sens des mots, nous avons
retenu quelques notions, que nous identifions aux principes qui guident
l’agencement des données de la base de données lexicales du néerlandais, RBN12,
que l’équipe du dictionnaire traduit actuellement en portugais.
10
Cf. Português Fundamental (1984).
Vilela (1991,V).
12
Le RBN (Referentiebestand Nederlands = base de données de référence du néerlandais)
représente une banque de données lexicales produite dans le cadre des activités de la CLVV
(Commissie Lexicografische Vertaal Voorzieningen), qui est une Comission Gouvernamentale
Néerlandaise et Flamande. C’est un lexique multifonctionnel avec une macro-structure de presque
48.000 entrées et une micro-structure qui véhicule de l’information distribuée sur 6 niveaux
linguistiques (orthographe, prononciation, morphologie, syntaxe, sémantique, pragmatique). Cette
base de données est présentée par l’intermédiaire du programme éditeur pour les dictionnaires
bilingues OMBI (voir note 1). Celui-ci, basé sur un principe de réversibilité des unités de sens et
non des unités de forme, rend la production des dictionnaires bilingues plus facile.
11
79
M. Celeste Augusto
La première notion se rapporte aux «relations contextuelles»; selon Cruse (p. 16),
"the meaning of a word is fully reflected in its contextual relations". De ceci
résulte qu’un mot aura autant de sens que de relations contextuelles. Ce
raisonnement justifie la présence dans la micro-structure de plusieurs associations
ou combinatoires, soit grammaticales soit lexicales, et d’exemples. Les deux
autres notions qui nous intéressent sont «le lexème» et «l’unité lexicale». La
première concerne la forme du mot tel qu’il est mis en tête de l’entrée, la
deuxième les différents sens qu’il peut réprésenter.
Les lexèmes, qui sont ordonnés alphabétiquement dans le dictionnaire, sont pour
Cruse (p. 49, 76) «les items de la langue» et ils répresentent une famille d’unités
lexicales. Dans la nomenclature du programme utilisé pour la traduction du corpus
mentionné, ils correspondent aux Unités de Forme, dorénavant UF.
Toujours d’après Cruse, l’unité lexicale, dorénavant UL, est (p.77) "the union of a
lexical form and a single sense" et elle doit satisfaire obligatoirement à deux
criteria (p.24):
1- "a lexical unit must be at least one semantic constituent"
2- "a lexical unit must be at least one word"
Ainsi par exemple, l’élément préfixal du portugais RE- qui a les deux sens de
répétition et intensité, peut être considéré comme constituant sémantique, mais
comme ce n’est pas un mot nous ne pouvons pas non plus dire que c'est une unité
lexicale.
Prenons comme exemple le mot PARTIR du portugais auquel on peut assigner au
moins deux sens:
1) s’en aller, partir
2) casser, briser.
Ceci nous donne le schéma suivant:
PARTIR (=lexème / unité de forme)
1- partir (=unité lexicale)> s’en aller; partir
2- partir (=unité lexicale)> casser; briser
Ceci implique qu’une unité de forme peut avoir plus d’une unité lexicale et que
toute unité lexicale doit dépendre forcément d’une unité de forme.
Les notions, que nous venons de définir, ont une importance capitale dans le
processus de traduction, dans la mesure où ce qui est donné dans la langue cible
est un équivalent de l’ unité lexicale et non de l’ unité de forme, comme nous
l’avons vu avec l’exemple de PARTIR.
80
Le dictionnaire comme outil d'apprentissage
4. Apprendre avec un dictionnaire bilingue qui n’est pas un dictionnaire
d’apprentissage
Cette partie de mon exposé a comme point de départ quelques entrées du
dictionnaire bilingue, encore en élaboration, néerlandais–portugais et portugaisnéerlandais. Ce dictionnaire a pour but de servir à l’encodage et au décodage soit
du portugais soit du néerlandais.
J’ai choisi trois mots: deux noms AANBOD et TREFFEN et un verbe TREFFEN. Je
me propose de faire un commentaire en utilisant les notions de «unité de forme»,
«unité lexicale» et «relations contextuelles» mentionnées plus haut; je tiens aussi
à conjuguer le point de vue du lexicographe et du traducteur avec l’intention
pédagogique sous-jacente aux entrées.
Aanbod, <:N>
1. {aangebodene} 'oferta', <N>, 'proposta', <N>
a. vraag en aanbod, (free) "oferta e procura";
b. een breed aanbod, (free) "uma oferta variada/vasta";
c. een aanbod aannemen/afslaan, (LC) "aceitar/recusar uma proposta";
d. een aanbod krijgen, (LC) "receber uma proposta";
e. op een aanbod ingaan: (LC) "aceitar uma proposta";
f. een aanbod doen, (LC) "fazer uma proposta","propor",
Commençons par une entrée très simple AANBOD, qui a comme équivalents
portugais <oferta> (offre) et <proposta> (proposition). Nous avons une UF et
simplement une UL, plus des collocations du type lexical indiquées par (LC). J’ai
laissé volontairement les indications (free). Ce sont des indications données au
traducteur. Celui-ci ou le bureau rédacteur décide de traduire ou non l’exemple.
Ici nous avons opté pour la traduction car: exemple a) vraag en aanbod est
littéralement (demande et offre) mais comme en portugais l’ordre est inversé
<oferta e procura> (offre et demande) nous l’avons enregistré; dans l'exemple b)
een breed aanbod breed signifie <larga> (large) mais pas dans ce contexte;
combiné avec <oferta> on dira <variada> ou <vasta> mais pas <larga>, raison
pour laquelle nous l’avons également enregistré.
Ainsi, l’inclusion des exemples a) et b) se justifie en gardant présent à l'esprit le
point de vue du locuteur portugais qui veut décoder les segments néerlandais en
question, mais surtout le locuteur néerlandais quand il veut les codifier en
portugais. Ce dernier, par exemple, sachant que breed signifie <larga> (large)
pourrait très bien employer ici *<larga oferta> au lieu de <oferta variada / vasta>,
si l’exemple ne lui était pas présenté.
81
M. Celeste Augusto
Treffen, ¹ <N>
1. {bijeenkomst}, [synoniemen: bijeenkomst,
samenkomst] 'encontro', <N>, (gevecht, militair)
'combate', <N>
a.het kwam tot een bloedig treffen, (LC) "houve / teve
lugar um encontro sangrento";
b. een gewapend treffen, (LC) "um encontro armado";
Treffen,2 <V>, (tr)
1. {raken} 'atingir', <V-trans>, 'alcançar', <V-trans>
a. het getroffen gebied, (free) "a zona atingida";
b. getroffen worden door , (free) "ser atingido por", "ser
vítima de";
c. de juiste toon treffen, (free) "conseguir a maneira certa de
dizer";
a. als door de bliksem getroffen (-> bliksem);
2. {ontroeren} 'comover', <V-trans>, 'tocar', <Vintrans/trans>, 'sensibilizar', <V-trans>
a. dat heeft haar diep getroffen, (LC) "isso sensibilizou-a
profundamente", "isso tocou no seu íntimo";
b. haar harde woorden troffen hem zeer, (GC) "as palavras
duras dela feriram-no profundamente";
3. {tegenkomen} 'encontrar', <V-trans>
a. waar treffen we elkaar?, (free) "onde nos encontramos?",
"onde é que combinamos?";
4. {geluk hebben} "ter sorte", "acertar (em cheio)"
a. het getroffen hebben met de nieuwe secretaresse "ter
acertado em cheio com a nova secretária";
b. je treft het!, (free) "tens sorte!", "nem de propósito!";
5. {nemen, uitvoeren} (schikking, akkoord) 'conseguir', <Vtrans>, (maatregelen) 'tomar', <V-intrans/trans>,
(voorbereidingen) 'fazer', <V-trans>
a. een betalingsregeling treffen, (free) "chegar a um acordo
quanto ao pagamento de";
@ dat treft! (IU) "vem a propósito", "calha bem!";
82
Le dictionnaire comme outil d'apprentissage
Nous avons d’abord le nom TREFFEN, qui a comme équivalent en portugais
<encontro> (rencontre). Cependant, on ajoute aussi que si la rencontre est
militaire l’équivalent portugais plus précis est <combate> (combat).
C'est une entrée qui présente une seule unité lexicale et deux collocations. Cellesci, en règle générale, sont toujours traduites.
Nous avons ensuite la forme verbale, avec une UF et 5 UL dont plusieurs
collocations. Celles-ci sont toujours groupées sous le sens duquel elles dépendent.
Les différents sens de l’unité sont individualisés et illustrés par des exemples
séparément, ce qui va dans le même sens que l'actuelle tendance de l'apprentissage
d’une langue, à savoir la maîtrise du vocabulaire en contexte. À part les sens, les
différents régimes des verbes sont aussi mentionnés, car même si l’usager, et je
me rapporte à l’usager portugais, n’a pas besoin de cette indication pour décoder,
par contre, s’il veut produire un texte il lui faudra avoir accès à toutes ces
informations.
UL 1 - il y a ici un renvoi à bliksem (foudre), l’expression veut dire stupéfait,
étonné au point de ne rien pouvoir dire ou faire. Pour rendre service à l’usager, on
enregistre l’expression ici ainsi que sous l’entrée bliksem, bien que, pour éviter
des redites, l’équivalent portugais soit présenté seulement une fois, et sous
l’entrée bliksem.
UL 2 exemple b) - ici nous ajoutons l’adjectif harde (dur), car il apporte une
connotation différente, qui sera traduite par le verbe <ferir> (frapper); disons que
<comover> (émouvoir, attendrir) est positif et <ferir> négatif. Il fallait donc le
noter.
UL 3 - nous donnons une traduction équivalente de l’exemple néerlandais, qui à
son tour a été inclus car il illustre la conjugaison pronominale réciproque de ce
verbe.
UL 4 - cet UL signifie «avoir de la chance», «trouver quelque chose», mais aussi
«frapper un coup», comme dans l’exemple présenté.
@ dat treft ! : c’est une unité idiomatique qui ne peut être placée précisément dans
le sens d’une des unités lexicales mentionnées. Peut être pourrait-elle aller sous le
sens de UL4.
Le fait que cette expression ne soit pas attachée à une unité lexicale ne veut pas
dire qu’elle soit négligée. Dans la partie du dictionnaire portugais-néerlandais elle
viendra sous <calhar> et / ou sous <vir a propósito> (venir à propos).
Cette entrée telle qu’elle est présentée servira à l’usager néerlandais et à l’usager
portugais, dans l’usage productif du néerlandais et du portugais, autant que dans
83
M. Celeste Augusto
l’usage réceptif du néerlandais. Les usages contraires seront exposés dans l’ autre
partie du dictionnaire, c'est-à-dire, dans le volume portugais-néerlandais.
Ainsi, l’organisation globale de la micro-structure des trois entrées analysées
remplit du moins quatre des six tâches d’apprentissage13 par rapport au lexique,
qu’un apprenant de langue étrangère doit envisager et qui sont:
• apprendre de nouveaux mots (forme et contenu),
• apprendre de nouveaux contenus pour des formes qu’ il maîtrise déjà,
• apprendre des relations entre les mots au niveau soit de la forme soit du
contenu,
• apprendre des usages corrects et justes des mots ou des contenus
spécifiques de mots.
5. Conclusions provisoires
De tout ce que nous venons de dire, nous croyons pouvoir tirer trois types de
conclusions:
•
•
•
La première applique les notions de Cruse (1986) à l’activité
lexicographique et au développement de l’apprentissage.
La deuxième met en opposition le type d’information donnée par les
dictionnaires d’apprentissage monolingues avec celles des dictionnaires
bilingues “à vocation générale” comme le dit P. Bogaards (1990).
La troisième enfin se rapporte au caractère bi-directionnel du futur
dictionnaire bilingue néerlandais–portugais.
Il paraît évident que les notions trouvées chez Cruse (1986) et appliquées à
l’élaboration du dictionnaire, contribuent à une clarification de la tâche du
lexicographe / traducteur, qui est de traduire des sens ou des unités lexicales et
non la forme des mots. Ceci mène, entre autres, à une individualisation et mise en
exemple des sens des mots qui se marie avec la nécessité de l’apprenant d’élargir
son vocabulaire et de le faire en contexte.
Nous avons vu des exemples d’entrées de dictionnaires d’apprentissage où toute
information sur la langue est explicite (Cf. Dicionário Contemporâneo do
Português et Dicionário do Português Básico).
Dans le cas des entrées du dictionnaire bilingue, dont j’ai fait le commentaire,
nous pouvons dire que l’information est explicite par rapport à l’individualisation
des sens et à quelques renseignements grammaticaux, comme les régimes des
verbes. Pourtant, elle reste implicite en ce qui concerne certains comportements
syntaxiques, informations culturelles et façons de concevoir. Par exemple, quand
on donne comme équivalent de veertien dagen (littéralement quatorze jours)
13
Augusto et al. (1995)
84
Le dictionnaire comme outil d'apprentissage
<uma quinzena> (une quinzaine) on n’explique pas qu’il s’agit d’un trait
caractéristique des langues romanes et germaniques. De même, l'exemple du
verbe TREFFEN UL3 montre implicitement que nous avons à faire à une
conjugaison pronominale réciproque et non à une conjugaison pronominale
réfléchie.
La micro-structure des entrées des dictionnaires bilingues bidirectionnels comme
celles de AANBOD et de TREFFEN va dans la direction des deux langues. La
structure et la composition de ces entrées, au niveau de toute l’ information,
servent aux deux types d’usagers qu’il soit néerlandais ou portugais, et ce dans la
production comme dans la réception des deux langues.
Bibliographie
Dictionnaires et banques de données
BIDERMAN, M.T.C. (1992), Dicionário Contemporâneo de Português, Petrópolis: Vozes.
CARVALHO, O.C. (s.a.), Dicionário Português - Francês, Porto: Porto Editora.
COSTA, J.A. & MELO, A.S. (1998), Dicionário da Língua Portuguesa, 8ª Ed., Porto: Porto Editora.
HOUAISS, A. (1982), Dicionário Inglês–Português, Rio de Janeiro: Distribuidora Record de
Serviços de Imprensa.
Português Fundamental – vocabulário e gramática (1984), Lisboa: Instituto Nacional de
Investigação Científica, Centro de Linguística da Universidade de Lisboa.
RBN = Referentiebestand Nederlands (1998), Den Haag: Commissie Lexicographische Vertaal
Voorzieningen.
VILELA, M. (1991), Dicionário do Português Básico, 3ª Ed., Porto: Asa.
Autres références
AUGUSTO, M.C., BOGAARDS, P., HANNAY, M., MARTIN, W., SLAGTER, P.J., VENANCIO, F.,
WEKKER, H., WIJNE, C. (1995), Towards a database for general Translation Dictionaries
and Bilingual Learner Dictionaries with special Reference to Dutch and Portuguese, Den
Haag: Commissie Lexicografische Vertaalvoorzieningen.
BOGAARDS, P. (1990), "Deux langues, quatre dictionnaires". Lexicographica, vol.6, pp.162-173.
BOGAARDS, P. (1995), "Dictionnaires et compréhension écrite". Cahiers de Lexicologie, vol.
LXVII, 2, pp.37-53.
BOGAARDS, P. (1996), "Dictionaries for Learners of English". International Journal of
Lexicography, vol. 9 number 4, pp.277-320.
BOGAARDS, P. (1998), "Des dictionnaires au service de l’apprentissage du français langue
étrangère". Cahiers de Lexicologie, vol. LXXII, II, pp.127-167.
COWIE, A.P. (1983), "English dictionnaries for the foreign learner" in Lexicography: Principles
and Practice, ed. Hartmann, R.R.K. London: Academic Press, pp.135-144.
CRUSE, D.A. (1986), Lexical Semantics, Cambridge: University Press.
DEMEERSSEEMAN, H., MAAKS, I., MARTIN, W. et al (1997), Referentiebestand Nederlands –
instructies en documentatie, Den Haag: Commissie Lexicographische Vertaalvoorzieningen.
DUBOIS, J. et DUBOIS, CL. (1971), Introduction à la lexicographie: le dictionnaire, Paris: Larrouse.
ELSWIJK, M., MAKS, I., MARTIN, W., WIJNE, C. (1997), OMBI4 – user manuel, Den Haag:
Commissie Lexicographische Vertaalvoorzieningen.
HARTMANN, R. (1999), ″Lexical Reference books – what are the issues?″. International Journal of
Lexicography, vol.12, n.1, pp.5-11.
LAUFER, B. (1993), ″The effect of dictionary definitions and examples on the use and
comprehension of new L2 words″. Cahiers de Lexicologie, vol. LXIII, II, pp.131-142.
85
M. Celeste Augusto
MARTIN, W. et TAMM, A.. (1996), ″Ombi: An editor for constructing reversible lexical databases″.
Gellerstam,M. (ed.), Euralex’96 Preceedings, I – II, Göteborg University, pp.675-688.
SCHMITZ, J.R. (1998), ″A problemática dos dicionários bilingues″, in As ciências do léxico –
lexicologia, lexicografia, terminologia, Organizadoras: Oliveira, A.M. & Isquerdo, A.N.,
Campo Grande: Editora Universidade Federal de Mato Grosso Sul, pp.159-168.
TOMASCZYK, J. (1983), ″On bilingual dictionaries″. Lexicography Principles and Practice, ed.:
Hartmann, R.R.K. London: Academic Press, pp.41-52.
86
Light Verb Constructions in Bilingual Dictionaries
Jan Schroten
Utrecht University
Introduction and Outline
Light verb constructions such as to take a walk are so common that they tend to be
overlooked as interesting constructions. In this contribution, they will be discussed
in an informal way, by taking into consideration a number of peculiar facts and their
interpretation.
The objectives of this contribution are: (1) to show that monolingual and
bilingual dictionaries treat light verb constructions in different, partly conflicting
ways, and that lexicographers cannot be blamed, since the proper analysis of these
constructions is unknown; (2) to try and figure out the reason why the proper
analysis of light verb constructions is unknown or at least not understood very well;
(3) to sketch the way of overcoming the basic difficulty, which is the lack of
understanding of a hidden property of light verb constructions which must be
uncovered.
In the first section, relevant terminology will be introduced with respect to light
verb constructions. In the second section, the question will be asked and discussed
whether light verb constructions are interpreted compositionally, or wether they are
idiomatic constructions. In the third section, general statements will be given on
inconsistencies in monolingual and bilingual dictionaries, and some fundamental
reasons why these inconsistencies are found. In the fourth section, some examples
of inconstencies found in dictionaries will be discussed. In the fifth section, it will
be shown that one specific class of light verb constructions can be treated
compositionally, and in the sixth section, another class will be treated in a similar
way. In the final section, the epilogue, some additional suggestions will be made on
the proper analysis and treatment of light verb constructions.
1. Light Verb Constructions, Light Verbs, Light Verb Nouns and Full Verbs
Nouns denoting actions, processes or states can combine with a so-called "light
verb" in light verb constructions in which the verb is semantically light and in which
the noun carries the main weight of the meaning, as proposed by Grimshaw and
Mester (1986), the classic study on light verb constructions. In many cases, a light
verb construction is nearly synonymous with a full verb, which is a verb related to
the noun of the light verb construction. For example, to give (someone) a kiss is a
light verb construction which has nearly the same meaning as the full verb to kiss
(someone) The noun that we find in the light verb construction can be called the
“light verb noun”. In some cases, the light verb construction has a "passive
meaning", as in to get a kiss (from someone), which is comparable to the passive
full verb to be kissed (by someone). These observations are summarized in (1):
Jan Schroten
(1)
Full verbs, light verb constructions, light verbs and a light verb noun
(a) active full verb: to kiss (someone)
(b) active light verb construction: to give (someone) a kiss
(c) passive full verb: to be kissed (by someone)
(d) passive light verb construction: to get a kiss (from someone)
(e) light verbs: to give, to have
(f) light verb noun: kiss
Comparing English light verb constructions with translation equivalents in other
languages, such as Dutch and Spanish, it can be observed that, in a number of cases,
different light verbs are used in these languages. For example, the English light verb
noun walk combines with the light verb to take in the light verb construction to take
a walk, which is nearly synonymous with the full verb to walk. In Dutch, a walk is
not “taken”, but it is "made" in the light verb construction een wandeling maken (to
make (=take) a walk). In Spanish, a walk is "given" in dar un paseo (to give (=take)
a walk). Thus, the light verb which combines with the light verb noun is different in
these three languages. These observations are summarized in (2):
(2)
A light verb noun and its light verb in English, Dutch and Spanish
(a) English: to take a walk
(b) Dutch: een wandeling maken (literally: to make a walk)
(c) Spanish: dar un paseo (literally: to give a walk)
Languages can also be different as to the nouns that are found as light verb nouns in
a light verb construction and, again, in the choice of the appropriate light verb if the
light verb construction is used. For example, the English noun beginning cannot be
combined with a light verb, although the nearly synonymous noun start is used in
the light verb construction to make a start. In Dutch and in Spanish, the translation
equivalents of beginning can be combined with a light verb: the Dutch noun begin
combines with the light verb maken (to make) in: een begin maken (to make a
beginning) and the Spanish noun comienzo combines with the light verb dar (to
give) in: dar comienzo (to give beginning).This situation is summarized in (3):
(3)
A noun which is not found in a light verb construction in English and
which is found with different light verbs in Dutch and Spanish
(a) English: noun: beginning: full verb: to begin;
light verb construction: --(b) Dutch: noun: begin; full verb: beginnen;
light verb construction: een begin maken (maken (to make))
(c) Spanish: noun: comienzo; full verb: comenzar;
light verb construction: dar comienzo (dar (to give))
88
Light verb constructions in bilingual dictionaries
2. Light Verb Constructions and Compositionality
A closer look at light verb nouns and the light verbs with which they are combined
in light verb constructions suggests that the choice of the light verb reflects some
semantic property of the noun.
The null hypothesis is that light verb constructions are interpreted
compositionally. If this is true, the use of a different light verb in another language
with the same light verb noun, that is, a noun which is taken to be a full translation
equivalent, implies that this noun is not a full translation equivalent. It must have a
partly different meaning, reflected in the different light verb that is used. Therefore,
a closer look at the appropriate choice of the light verb might be rewarding since it
permits us to speculate on hidden parts of the meaning of the noun.
The answer to the question whether light verb constructions are interpreted
compostionally or not is important for (bilingual) lexicographers. If light verb
constructions are compositional, language differences in light verb constructions as
to the light verb that is used must be related to meaning differences of the noun. In
such cases, the translational equivalence of the nouns is “optimal”, and not perfect
or total.
In short, a different choice of light verb for the best translation equivalent of the
light verb noun in another language implies that the nouns are not perfect translation
equivalents, that is, that they do not match perfectly. The different choice of light
verbs reflects hidden differences of meaning in the light verb nouns.
However, many translations of light verb nouns in bilingual dictionaries seem to
be treated by the lexicographers as perfect matches, even if they combine with
different light verbs. This is the reason why bilingual dictionaries treat light verb
constructions in a rather unsystematic way.
Let us try to figure out what is going on. If compositional translation of a light
verb construction gives a good result in another language, the light verb
construction need not be specified in the dictionary. If a different light verb is
chosen or preferred, bilingual dictionaries tend to treat these as idioms, but not
systematically. The reason is that light verb constructions are not understood by
lexicographers, nor by linguists. Even elaborate monolingual dictionaries treat light
verb constructions inconsistently.
Apart from the meaning differences in light verbs in different languages, there is
a much more serious problem for the bilingual lexicographer, which is that a light
verb used in one language can be missing in another language.. For example, the
Dutch verb krijgen (to get) can be said to be the "passive" variant of "active" geven
(to give); see Everaert and Hollebrandse (1995). In Spanish, we find the "active"
light verb dar (to give), but there is no "passive" light verb comparable to Dutch
krijgen (and English to get). It is evident that the Spanish full verb recibir (to
receive) which is the "passive" variant of the full verb dar (to give) is not used as a
light verb. Now, if there is a Dutch "passive" light verb construction with the verb
krijgen (to get), the bilingual lexicographer has to make a choice, taking one of three
options. The first option is to leave out the "passive" variant, since it is taken to
reflect a general, syntactic and/or semantic difference between Spanish and Dutch
or English. Spanish takes active choices in cases that Dutch can choose an active or
89
Jan Schroten
a passive construction. A second option is to incorporate only the active light verb,
leaving out the passive equivalent. A third option is to incorporate both the active
and passive light verb construction, giving an idiomatic or an active translation of
the passive light verb construction, since there is no literal translation available.
Let us consider some aspects of the properties of light verb constructions that
have been mentioned. If light verb constructions are interpreted compositionally,
light verb nouns which combine with the same light verb must be assumed to share
some semantic property, and if different light verbs are used, this reflects a semantic
difference, even between light verb nouns that would seem to belong to the same
semantic class.
This general thesis is resumed in (4):
(4)
Light verb constructions are interpreted compositionally
Compositional interpretation of light verb constructions is done in the
following way:
(i) The light verb accesses part of the meaning of the noun;
(ii) The light verb and the noun are fused in a composite predicate
3. Why light verb constructions are treated inconsistently in monolingual and
in bilingual dictionaries
The reasons why monolingual dictionaries give an inconsistent treatment of light
verb constructions are sketched in (5):
(5)
Light verb constructions in monolingual dictionaries
Light verb constructions in monolingual dictionaries are treated
inconsistently,
due to the two following circumstances:
(a) The number of light verbs is unknown.
(b) The properties of the light verb nouns which they accompany are
unknown.
Therefore, light verb constructions cannot get a consistent treatment.
The consequences for bilingual dictionaries are sketched in (6):
(6)
Light verb constructions in bilingual dictionaries
Light verb constructions in bilingual dictionaries are treated inconsistently,
due to the two following circumstances:
(a) The differences in the number of light verbs and their semantic
properties in the two languages are unknown.
(b) The differences in the meaning of nouns which are optimal, but not
perfect, translation equivalents, are unknown.
Therefore, light verb constructions cannot get a consistent treatment.
90
Light verb constructions in bilingual dictionaries
4. Inconsistencies in the treatment of light verb constructions in a monolingual
dictionary: some examples
In this section, some typical cases of inconsistency in the treatment of light verb
constructions in a Dutch monolingual dictionary will be shown.
The first case is based on the synonymy of zoen ("kiss") and kus ("kiss"), and the
different treatment that the nouns are given in the authoritative monolingual
dictionary (Van Dale Nederlands):
(7)
Light-verb constructions with "kiss" in a Dutch monolingual dictionary
(i) zoen (kiss): iemand een -- geven (to give someone a --)
(ii) kus (kiss): een -- krijgen van iemand (to get a -- from someone)
(iii) pakkerd (hug and kiss): iemand een -- geven (to give someone a --)
The Dutch nouns given in (7i) and (7ii) are close in meaning. No speaker doubts
that the active light verb geven (to give) and the "passive" light verb krijgen (to get)
can be used with equal ease with both nouns. Nevertheless, the dictionary has
included geven (to give) with one noun and krijgen (to get) with the other noun. A
near synonym like colloquial pakkerd (hug and kiss) is given with the "active" light
verb geven (to give); the "passive" light verb is not given, although it can be used
with equal ease.
This different treatment of synonyms or near synonyms reflects the lack of
coherence, which is evident as soon as one makes a systematic comparison of other
near-synonyms which combine with the same light verb according to the intuitions
of the native speaker and how they are treated in the dictionary. In some cases, no
light verb constructions is given; in fact, this is the rule, not the exception. In other
cases, only one light verb is given if two or more are possible. In still other cases,
the light verb construction is suggested to share characteristics of a fixed collocation
or an idiomatic expression.
The unsystematic way of presenting or omitting light verb constructions which
can be used with a noun, the haphazard way of selecting one light verb in cases that
different light verbs can be used, and the lack of differentiation with respect to
regular light verb constructions and more idiomatic, fixed collocations reflect a lack
of understanding of a number of essential properties of light verb constructions.
Of course, the analysis of light verb constructions and how they are incorporated
in the dictionary is only useful if the results can be used to obtain a better
understanding of essential properties. The basic point is that, in many cases, the
light verb constructions have not been incorporated for reasons of idiomaticity or to
inform the user of specific details of the compositional meaning. Ususally, the light
verb construction itself is given, not its meaning, which suggests that a frequent and
appropriate way of saying things is given. There is little indication in the definitions
of the light verbs that their light verb property has been taken into account, and there
is no systematic treatment of the nouns with which they are assumed to combine in
a regular fashion.
It remains to be seen how light verb constructions can be analyzed in a more
91
Jan Schroten
systematic and coherent fashion.
5. A class of light verb constructions: light verb nouns denoting
activities and processes and the choice of light verb
bodily
A typical noun of bodily activity is sigh. The light verb which is chosen is to give, in
the three languages that are taken into consideration. And more generally, light
nouns referring to bodily processes which are conceived as controlled or
controllable actions, take the same light verb, in English and in Dutch:
(8)
Light verb nouns denoting controllable bodily activities
and the corresponding light verb
(i) English: to give a sigh / a smile / a wink / a sob
(ii) Dutch: een zucht / een glimlach / een knipoog / een snik geven (=give)
If the process is conceived as taking place as an uncontrollable action, we find the
verb to let, as in to let a fart / burp / belch. In Dutch, the light verb used with the
equivalents of the nouns fart / burp / belch is laten (to let), a light verb which is
regularly used with other nouns denoting an uncontrolled process which cannot be
avoided, which one must let go: een wind / scheet / boer laten (=to let a fart / fart /
belch):
(9)
Light verb nouns denoting uncontrolled bodily processes
and the corresponding light verb
(i) English: to let a fart / a burp / a belch
(ii) Dutch: een scheet / een boer/ een boer laten (=let)
Thus, there is a clear difference in the choice of light verb dictated by the meaning
of the noun: controlled actions take to give and uncontrolled processes take to let.
In Spanish, the situation is different, with interesting properties. Although there
is a translation equivalent of the verb to let, which is dejar, we do not find
convincing uses of this verb as a light verb. The translation equivalent of the noun
burp is eructo, but the light verb construction is avoided and the full verb eructar is
used. If a light verb is used, it is "optimal", one might say, but it is not perfect:
dictionaries signal the use of dar (to give) or hacerse (to make oneself) as variants.
The most interesting part is the absence of the light verb construction in many
variants of Spanish, which can be one of the effects of the absence of the light verb
to let in Spanish.
These examples of light verb constructions with nouns denoting bodily actions
and processes are intended to show that the light verb has meaning. Nouns denoting
controlled bodily actions and processes take the verb to give, and nouns denoting
uncontrolled bodily processes take the verb to let, in English and in Dutch. In
Spanish, which has no light verb to let, the light verb construction tends to be
avoided and the full verb eructar is used or some "optimal" but imperfect solution
is chosen: light verbs which come closest: hacerse (to make oneself) and dar (to
92
Light verb constructions in bilingual dictionaries
give). There is considerable variation.
To resume, the light verb dar ("to give") in Spanish takes nouns denoting
controlled bodily actions. If the action is uncontrolled, the lack of light verb
corresponding to to let makes the light verb construction unavailable, and the full
verb is used, or dar (to give) can be used, or hacerse (to make onself). The semantic
space which is not taken by the (inexistent) light verb to let is filled up (in some
variants) by its complementary light verb to give, which might have acquired a
different meaning.
Now consider the expression given in (10):
(10)
Giving winks in Spanish
(i) hacer un guiño a alguien (lit.: to make a wink to someone)
(ii) guiñar los ojos a alguien (lit.: to wink the eyes to someone)
In Spanish, winks are not “given”, winks are “made”; the indirect object is
interpreted as the Beneficiary, not the Goal of the action. Intuitively speaking, one
would assume that hacer is chosen, and dar (give) avoided, and that Spanish
interprets winks as products, not as objects which have some Goal.
A quite different kind of example is provided by the noun sneeze, which
denotes a typically uncontrolled and, more importantly, irrepressible bodily
action. The same thing can be said of hiccups: the light verb construction is
infelicitous and the full verb is preferred. Both cases are shown in (11) for
English, Dutch and Spanish:
(11)
Sneezes and hiccups in English, Dutch and Spanish
(a) English: ??to give a sneeze -> to sneeze; ??to give a hiccup -> to
hiccup
(b) Dutch: ??een nies geven -> niezen; ?een hik geven -> hikken
(c) Spanish: ?dar un estornudo -> estornudar; ?dar un hipo -> hipar
Thus, a more detailed analysis leads to the characterization of light verbs given in
(12), in which the uncontrollable processes have been subdivided in repressible
processes like a belch and irrepressible processes like a sneeze:
(12)
Ligt-verbs and nouns denoting bodily activities and processes
to give
(a) English:
[CONTROLLABLE]
to let
[REPRESSIBLE]
-[IRREPRESSIBLE]
geven
(b) Dutch
[CONTROLLABLE]
laten
[REPRESSIBLE]
-[IRREPRESSIBLE]
hacer
(c) Spanish
[CONTROLLABLE]
-[REPRESSIBLE]
-[IRREPRESSIBLE]
Furthermore, note that the three classes of nouns take possessive pronouns which
93
Jan Schroten
denote the owner of the body in which the activity or process takes place. The
owner of the body is, of course, the "origin" and the "originator" or "producer", so
to speak. The interpretation suggested in (13) will give the correct result:
(13)
Interpretation of possessive pronouns of nouns denoting bodily activities
and processes
(a) English: his sighs / farts / sneezes
[ORIGIN: owner of
the body]
(b) Dutch: zijn zuchten / scheten / ?niesen [->genies][ORIGIN:owner of
the body]
(c) Spanish: sus suspiros / pedos / estornudos
[ORIGIN: owner of
the body]
What I have tried to show in this part is that the nouns denoting bodily actions and
processes have in common that the owner of the body in which the activity or
process takes place is the [ORIGIN] interpretation assigned to the possessive
pronouns. Thus, the thematic role [ORIGIN] is part of the semantic contents of
these nouns. Another part of the semantic contents of these nouns is that they are
conceived as different types of activity or process: controllable, or uncontrollable
and repressible or irrepressible. Light verbs are sensitive to these semantic
characteristics of nouns denoting bodily activities and processes.
This implies that the semantic content of the light verb is real, although it is
difficult to describe. For some nouns, no suitable light verb can be found, and the
full verb must be used, since the light-verb construction is felt as inappropriate.
For other nouns the kind of bodily action or process determines the right choice,
or an unusual choice suggests an unusal interpretation, as in the following Dutch
examples:
(14)
Different light verbs giving different interpretation
to the light-verb construction in Dutch
(i) een boer laten / ??geven / *doen (to let / have / do a belch)
(ii) een baby een boer laten doen / ??laten /??geven (to make a baby
burp)
The difference is that the use of laten (let) implies involuntary activity, whereas
the use of geven (give) suggests that there was the intention of belching. The case
of doen is special: ususally, the expression een boer(tje) laten doen (to make do a
burp) is used to express transitive "to burp". The producer of the burp is a baby,
and the father or mother (or whoever) is waiting for the baby to burp, to produce
the bodily activity or process.
Again, the light verb contributes to the interpretation of the light-verb
constructions.
94
Light verb constructions in bilingual dictionaries
6. Another class of light verb constructions: light verb nouns denoting states
of mind and emotions and the choice of the light verb
Consider the state of mind denoted by fright: in English, a person can give
someone a fright. The person "receiving" a fright is said to have a fright or to take
fright. In Spanish, the equivalent noun susto is combined with dar (to give) or
tener (to have). In Dutch, both verbs are unusual: ??iemand (een) schrik geven (to
give someone (a) fright) and ??(een) schrik krijgen (to get a fright) are unusual,
and normally expressed in different ways, with verbal constructions: iemand aan
het schrikken maken (to make someone be frightened) and schrikken (to take
fright) or iemand laten schrikken (to make someone frighten).
The state of mind noun fright can take a possessive pronoun denoting the
experiencer, not the cause or originator: her fright refers to the fright she has, not
to the fright that she produces. In fact, in the sentence I gave her a fright, we find
the typical light-verb phenomenon which Grimshaw and Mester (1988) analyzed
for Japanese. The verb to give makes it possible to use the "shifted" dative her,
that is, the indirect object loses its typical preposition to while shifting to the
position before the direct object. The experiencer interpretation of the shifted
indirect object, however, depends on the noun fright, and is not dependent on the
verb. This is easy to see by taking into account the unacceptability of *I gave her
a sigh. Sighs do not imply experiencers but they involve an originator, as in I
gave a sigh.
Examples such as these show that the noun can only combine with light verbs
which have a suitable semantic representation. Thus, nouns involving originators
take a light verb whose subject has a source role. Nouns involving experiencers
take a light verb with a different property, a subject with locative or goal
interpretation.
The use of to give with the experiencer noun fright gives a causative
interpretation, the experiencer subject of to have a fright corresponds to the
indirect object of causative to give: to give someone a fright.
This typical pattern is somewhat awkward in the three languages under
consideration:
(15)
Experiencer and causative light-verb constructions with nouns
denoting states of mind in English, Dutch and Spanish
(a) English: I had a fright / I got fright -> he gave me a fright
(b) Dutch: ?ik had schrik / ?ik kreeg schrik-> ?hij gaf me schrik
(c) Spanish: ?yo tuve un susto -> ?me dio un susto
The usual way of expressing how a person is feeling is by using the noun feeling
and by specifying the kind of feeling as its complement, as in he had a feeling of
uncertainty or by using the verb to feel. The same expressions are found in Dutch
and Spanish, as can be seen in (16):
(16)
Feelings in English, Spanish and Dutch
(a) English: he had a feeling of uncertainty / uneasiness / tenderness
95
Jan Schroten
to feel uncertainty / uneasiness / tenderness
(b) Dutch: hij had een gevoel van onzekerheid / ongerustheid / tederheid
hij voelde onzekerheid / ongerustheid / tederheid
(c) Spanish: tenía un sentimiento de inseguridad / inquietud / ternura
sentía inseguridad / inquietud / ternura
With these nouns, the use of the light verb to have gives awkward results in the
three languages: (English) ??to have uncertainty /?? uneasiness / ??tenderness;
(Dutch) ??onzekerheid / ??ongerustheid / ??tederheid hebben; (Spanish) tener
??inseguridad / ??inquietud / ??ternura. Note that these awkward light-verb
constructions contain nouns which have no full-verb variant. Verbs like *to
uncertain / * to unease / *to tender in English, *onzekeren / *ongerusten /
*tederen in Dutch and *insegurar / *tern(ur)ar in Spanish are verbs which do not
sound as even remotely possible, and inquietar has only transitive “cause”
meaning (to worry), not the intended “feel” meaning.
There is a clear difference with doubt, which is not treated as a noun of feeling;
the typical light verb with doubt is to have: (English) to have doubt; (Dutch)
twijfel hebben; (Spanish) tener duda(s). The same goes for thoughts and
suspicions. The corresponding verb is available as well: English to doubt, Dutch
betwijfelen and Spanish dudar are full verbs with a meaning similar to the light
verb construction.
Pursuing our attempt at characterizing aspects of light verb constructions,
consider two central emotions and how they behave: love and hate. The verb with
which they are construed easily is to feel, and the light verb to have is awkward.
Of course, one can have a feeling of love or hate, and the possessive pronoun is
used to indicate the “possessor”, the person feeling love or hate. In this case,
however, the full verb is used more than the light verb construction: to love and to
hate. Similar observations can be made with respect to Dutch and Spanish.
Thus, nouns denoting feelings take possessive pronouns expressing the
experiencer, the person who has the feeling. They can be the complement of the
noun feeling and be combined with the light verb to feel ; in many cases, no full
verb related to the noun is available. It is somewhat surprising that the light verb
construction which is part of a relative clause is usually acceptable, as shown in
(17):
(17)
Some characteristics of nouns denoting feelings
Typical noun denoting feeling: uneasiness
(i) Use of possessive pronoun:
his uneasiness / John’s uneasiness / the uneasiness of the citizens
(ii) Use of light verb
to feel uneasiness / ??to have uneasiness
(iii) Use of a relative clause containing the experiencer
the uneasiness that he feels / has
This suggests that the verb to feel is like a light verb which collocates, not
surprisingly, with nouns denoting feelings. Nominalization of to feel gives the
96
Light verb constructions in bilingual dictionaries
noun feeling which takes the kind of feeling, the feeling which is felt, as its
complement. The noun feeling itself takes the light verb to have.
Looking at this picture from the lexicographic point of view, it implies that the
ideal dictionary would benefit from the lexical specification that uneasiness,
uncertainty, tenderness, love and hate are kinds of feelings. In fact, I want to
suggest that the genus that has always been one of the building blocks of
lexicographic definitions, is essential. If the lexicon specifies the genus
[FEELING] for all nouns denoting feeling, the use of the verb to feel follows, and
can be used as a test.
Now consider the use of the light verb to have in expressions like to have
courage / patience in which the noun can be said to denote a property: they are
not conceptualized as feelings, but as characteristic properties, which are temporal
or permanent. Properties can be lost, of course, which is why one can lose one’s
courage or patience, whereas feelings like uneasiness cannot be lost.
It follows that doubts, like suspicions and thoughts are not feelings; they are in
the mind, and not in the heart, as are feelings and emotions. They can be
characterized as states of mind, or ideas, which one has but not feels.
Thus, if the genus of doubts, suspicions and thoughts is given as [IDEA], it
must be added that ideas can be “had”. The dictionary must provide the user with
the information that all nouns which have the genus [IDEA] can collocate with to
have.
A similar decision, that each noun which can be collocated with a light verb,
must be specified as to the genus it belongs to, can be taken for other light verb
constructions.
Furthermore, each genus must be characterized as collocated with one or more
light verbs. If monolingual dictionaries are built up this way, bilingual
dictionaries can be construed in much the same way, by stating the genus and the
light verb or verbs it collocates with.
Consider the following simplified way of how to treat the nouns uneasiness
and suspicion in a monolingual dictionary of English:
(18)
Uneasiness and doubt in a monolingual dictionary of English
(i) uneasiness: genus = [FEELING]
genus = [FEELING] > light verb: to feel
(ii) doubt:
genus = [IDEA]
genus = [IDEA] >light verb: to have
Only in this way will it be possible to clearly distinguish the more idiomatic and
metaphorical uses, and to compare languages in such a way that bilingual
lexicography.will benefit.
7. Epilogue
The main objectives of this contribution have been:
(i) to show why light verb constructions should be treated as compositionally
97
Jan Schroten
interpretable constructions;
(ii) to show how a systematic treatment of light verb constructions can be given.
If one takes into account proposals such as Giry-Schneider (1987) (on French
“support verb” constructions which are like light verb constructions), Solé (1966)
(a study on Spanish constructions with hacer (to make)), Cattell (1984) and
Kearns (1989), one might conclude that light verb constructions are idiomatic and
permit lexical treatment only.
Other studies, however, show that regular semantic patterns can be found:
Everaert and Hollebrands (1996) show that the light verb must have some
semantic content, and this is shown also in Hollebrandse and Van Hout (1999), a
study on child language and the use of light verb constructions.
In this contribution, the “semantic approach” has been taken, and the lead
given by Everaert and Hollebrands (1996) has been followed. The semantic
analysis of light verb constructions is not only difficult, but it involves aspects of
meaning that are not well understood. This is the reason why dictionaries are
unsystematic and give unsatisfactory results. Light verbs seem to have access to
hidden properties of light verb nouns, which are not understood.
In order to discover which semantic properties are at stake, two kinds of (light
verb) nouns have been selected and their behavior in light verb constructions has
been investigated: one involving nouns denoting bodily actions and processes,
and one involving nouns denoting feelings and thoughts. The analysis has been
tentative, and it has given some provisional, but interesting results.
The most promising lead is given by the sketch of how to characterize the
hidden semantic property to which the light verb has access and which determines
its choice and interpretation. The characterization of nouns that has been sketched
suggests that the most promising route to follow has been sketched in Wierzbicka
(1982) and Pustejovsky (1995). It is evident that a much more detailed
investigation on light verb constructions in different languages is needed. If the
approach that has been suggested is on the right track, the results will be benificial
to lexicographers, permitting a more systematic treatment of light verb
constructions in monolingual and bilingual dictionaries.
Bibliography
CATTELL, R. (1984), Composite Predicates in English. Sydney: Academic Press (= Syntax and
Semantics, 17).
[Collins English=] Collins Dictionary of the English Language (1986). Editors: P. Hanks, W.T.
McLeod, L.Urdang, 2nd ed. London: Collins.
EVERAERT, M; HOLLEBRANDSE, B. (1996), `The Lexical Representation of Light Verb
Constructions’, Berkeley Linguistic Society, 21.
GIRY-SCHNEIDER, J. (1987), Les prédicats nominaux en français : les phrase simples à verbe
support. Genève : Droz,
GRIMSHAW, J. & MESTER, A. (1988), `Light Verbs and Theta Marking’, Linguistic Inquiry, 19,
205-232.
HOLLEBRANDSE, B. & VAN HOUT, A. (1999), `Light Verb Learning in Dutch’. In: Verrips. M.;
WIJNEN, M. (eds). Proceedings of the Dutch –German Colloquium on Language Acquisition.
98
Light verb constructions in bilingual dictionaries
Amsterdam Series in Child Language Development, 3.
KEARNS, K. (1989), `Predicate Nominals in Complex Predicates’. In: Laka, I; Mahajan, A. (eds)
MIT Working Papers, 10: Functional Heads and Clause Structure, 123-134.
PUSTEJOVSKY, J. (1995), The Generative Lexicon. Cambridge, Mass.: MIT Press.
SOLE. Y. (1966), HACER: Verbo funcional y lexical. Washington D.C.: Georgetown Univ. Press.
[Van Dale Nederlands =] Van Dale Groot Woordenboek der Nederlandse Taal. (1984). Editors:
G. Geerts; H. Heestermans; C.K. Kruyskamp. 11th. rev. ed. 3 vols. Utrecht / Antwerp: Van
Dale Lexicografie.
[Van Dale Engels=] (1984) Van Dale Groot Woordenboek Engels-Nederlands.(1984). Editors: W.
Martin; G.A.J.Tops. Utrecht / Antwerpen: Van Dale Lexicogafie
WIERZBICKA, A. (1982), `Why can you have a drink when you can’t *have an eat’, Language 58,
753-798.
99
La création morphologique dans le dictionnaire
Francine Melka
Université d'Utrecht
0. Introduction
Le point de départ de cet article est une constatation double. La première, c'est qu'on
a souvent présenté le français comme une langue morphologiquement pauvre.
Ullman (1975: 127-8) constate "la défaillance de la dérivation et de la composition
[française]"; plus loin, il remarque que "l'appauvrissement de la composition et de la
dérivation en français moderne constitue l'un des traits les plus remarquables de la
morphologie". La comparaison entre le français et les langues germaniques, qui
connaissent une productivité maximale (nombreux composés correspondant à des
mots simples en français, verbes à particules en anglais, en allemand traduits par des
verbes simples ou des verbes plus une préposition en français, etc.) et même avec des
langues romanes comme l'italien dont la suffixation est très productive (suffixes
augmentatifs, diminutifs, etc.) pourrait donc faire croire au statisme du français en
matière de morphologie.
La deuxième constatation, c'est que la lecture des journaux actuels, de la publicité et
le parler des locuteurs jeunes et des moins jeunes, d'ailleurs, semblent contredire la
première constatation. Il est significatif, par exemple, que dans le collectage de
néologismes fait dans un séminaire par un groupe d'étudiants de troisième année1,
c'est la catégorie "néologismes morphologiques" qui était de loin la plus importante.
En voici quelques-uns relevés parmi tant d'autres dans des journaux récents:
(1)
le technostress
wintériser (les camps de réfugiés)
une vidéoconférence
l'hypoallergénicité
la serbophilie
les ultra-orthodoxes en Israël
les post-sionistes, etc.
Il ne s'agit ici nullement de démontrer que le français est une langue "riche"
morphologiquement (statistiquement parlant par rapport aux langues germaniques ou
d'autres langues romanes), mais de montrer que, vue à travers un dictionnaire comme
Le Nouveau Petit Robert, la production dérivationnelle et compositionnelle, la
troncation, la siglaison sont relativement importantes, en d'autres termes, que la
création morphologique en français ne stagne pas. Je le ferai en comparant deux
1
Séminaire de troisième année, Ecole Normale de Tilburg: les étudiants ont compté qu'entre 40% et
60% des néologismes trouvés étaient des néologismes morphologiques.
La création morphologique dans le dictionnaire
éditions du Petit Robert éditées à quelque 20 ans d'écart2.
Mon but est essentiellement d'examiner la richesse de la dérivation et de la
composition: la productivité (ou la non productivité) d'anciens et de nouveaux
affixes. En ce qui concerne la composition, il faudra examiner les composés français
(savants et non savants), et se demander, comme certaines études le soulignent, s'ils
obéissent à certaines règles de formation, tête à gauche ou tête à droite, et ce que
nous pourrions en conclure. Pourrait-on ou non, par exemple, conclure à une
influence grandissante de l'anglais?
Tout d'abord, j'examinerai rapidement deux thèses qui traitent des règles de
dérivation et de composition. Ensuite, je présenterai le corpus et l'analyserai.
1. Deux études sur la dérivation et la composition
Deux thèses présentent sur la dérivation et la composition en français des
interprétations contradictoires.
C'est dans Syntax of Words, publié en 1982, que Selkirk reprend l'idée que, en ce qui
concerne l'anglais, la grande majorité des composés ont la tête à droite ; la tête est le
noyau du composé; elle détermine la catégorie, la pluralité:
(2) living room living rooms
apple pie apple pies
La tête se situe rarement à gauche en anglais, mais cela se passe dans le cas des
verbes à particules:
(3) step out, throw up, come in, run away.
Il y a aussi un petit nombre de composés anglais qui sont exocentriques, c.-à-d. qui
n'ont pas de tête à proprement parler:
(4) pickpocket, scarecrow
Dans l'exemple de PICKPOCKET, ni le verbe "pick" ni l'argument "pocket" ne
peuvent être la tête, puisque le "pickpocket" signifie la personne qui fait les poches,
2
Ce travail ressemble, en partie seulement, à l’entreprise de Dubois, Guilbert, Mitterand et Pignon
(1971), où les auteurs étudient le mouvement du vocabulaire français en comparant deux éditions du
Petit Larousse, celle de 1949 et de 1960. Je reviendrai tout au long de cet article sur leurs résultats.
Mais, dès maintenant, on peut dire que leurs objectifs et les miens diffèrent grandement: ces auteurs
étudient tout le vocabulaire et non pas seulement l'aspect morphologique; de plus, leur étude ne porte
pas sur les composés, bien qu'ils analysent très brièvement les "dérivés" à affixes grecs et latins.
101
Francine Melka
qui vole.
Selkirk présente brièvement le cas du français: elle propose que la tête est à gauche.
Comme preuve elle avance que TIMBRES prend la marque du pluriel et détermine la
catégorie du composé:
(5) timbres-poste (m), chefs d'oeuvre (m)
Di Sciullo et Williams (On the Definition of Word, 1987) défendent une autre thèse
sur le français: la tête en français est à droite, comme en anglais, et la preuve en est
que dans le cas de la dérivation, l'affixe détermine la tête; ainsi dans CHANT-EUR, EUR désigne l'agent et donne sa catégorie à la formation V + N. -EUR est considéré
comme un nom (1987:25) aussi longtemps qu'il est accolé à un autre élément.
Quant aux formations comme:
(6) essuie-glace, couche-tôt, gagne-petit, etc.
(que d'ailleurs Selkirk considérerait comme exocentriques), Di Sciullo et Williams en
font des formations syntaxiques qui obéissent à des règles syntaxiques où, par
exemple, ESSUIE est le prédicat et GLACE le thème (V + argument); ils les
appellent d'ailleurs "syntactic words". Quant aux formations comme TIMBREPOSTE, ils en font aussi des idiomes, des expressions syntaxiques fixes. Ainsi, selon
eux, mots syntaxiques et idiomes mis à part, il ne reste que des composés avec tête à
droite: "... with the listed syntactic phrases and the phrases reanalyzed as words
removed, French morphology can be seen as strictly right-headed" (1987:83).
On peut retenir de ces deux thèses que, d'une part, pour Selkirk les composés français
ont généralement la tête à gauche, mais pas tous, et que, d'autre part, pour Di Sciullo
et Williams, la tête est à droite en français, la preuve en est le cas des dérivations.
Quant aux nombreuses compositions nouvelles, les composés savants, ils ont tous la
tête à droite, ce qui leur permet d'ajouter un affixe, ce que la composition non
savante, tête à gauche ne permet pas (cf. notamment Zwanenburg, 1992):
(7) [strong-mind]-ed [video-conférenc]-ier
Le composé non savant anglais ainsi que le composé savant français (7) ont tous
deux la tête à droite ce qui permet l'affixation, alors que la tête à gauche du composé
non savant français ne permet pas l'affixation (8):
(8) * [amour-propre]-eux.
C'est à la lumière de ces deux thèses que j'examinerai donc deux points principaux, la
productivité des affixes et la formation des composés, i.e., leur tendance à se former
102
La création morphologique dans le dictionnaire
avec la tête à droite ou à gauche ou, éventuellement, leur tendance à l'exocentricité.
2. La méthode et le corpus:
La méthode que j'ai adoptée est la suivante: j'ai comparé deux éditions du Petit
Robert, celle de 1970 et celle de 1993 (dernière édition remaniée, à ma
connaissance): l'édition de 1970 étant réellement celle de 1967, l'écart entre les deux
éditions est donc de 25 ans. Renouvellement des dictionnaires et correction des
dictionnaires (cf. D. Corbin, 1987:34) sont naturellement des façons de rendre
compte de l'évolution d'un lexique. L'édition de 1993 a été renouvelée et/ou
"corrigée"
de diverses manières, notamment en comblant des lacunes
morphologiques accidentelles, en combinant des mots virtuels, possibles 3.
Dans chacune des deux éditions, j'ai choisi la lettre C et cela pour deux raisons.
D'abord pour le nombre d'entrées, la lettre C représente à peu près 10% du nombre
total des entrées dans les deux dictionnaires, ensuite, parce que la lettre C comporte
toutes sortes de suffixes savants ou non:
(9) -ALGIE, -CULTURE, -GENÈSE, -GRAPHIE, -ITE, -LOGUE, -PHOBE,
-SCOPIE, -VORE, etc.
et aussi des préfixes savants et non savants:
(10) CARDIO-, CHIR(O)-, CHOL(E)-, CHROME-, CHRONOS-, CHRYO-,
COM-, CO-, CONTRE, etc.
L'édition de 1970 compte sous C circa 5.600 entrées; de ce total environ 200 mots
ont disparu, dont 100 formations morphologiques. L'édition de 1993 comporte sous
C environ 6.200 entrées dont environ 775 nouvelles. De ces 775 mots nouveaux, 580
sont des nouvelles formations morphologiques, c.-à-d. environ 75% du total des
nouvelles entrées. Si mon échantillon (la lettre C) est représentatif, on peut dire que
la création morphologique en français moderne reste relativement vivante4.
3
D. Corbin donne l'exemple de DÉGOUDRONNER qui est ajouté à l'édition du PR (Petit Robert)
de 1977, alors que DEGOUDRONNAGE ne l'est pas (bien qu'il soit attesté dans le Lexis de la même
date). Quant à mon corpus, j'ai noté que certaines lacunes de composés savants commençant pas
ANTI- ont été comblées dans l'édition de 1993: 101 items ont été ajoutés (Le Petit Robert de 1993
comprend 180 entrées commençant par ANTI-l'édition de 1970 n'en a que 79).
Ainsi faudra-t-il garder en tête que la création morphologique est ici restreinte à ce qu'un seul
dictionnaire (en l'occurrence le PR) propose. La création virtuelle de mots possibles est certainement
bien plus importante.
4
Dubois et alii (1971) s'occupent, eux, du vocabulaire en général, et aussi des nouvelles acceptions
d'un mot (polysème: métaphores, métonymies); ceci n'est, bien entendu, pas entré en ligne de compte
dans mon calcul. Je n'ai compté que les entrées morphologiques nouvelles.
103
Francine Melka
Sous entrées morphologiques, j'ai donc compté:
1. les sigles/acronymes
C.B., C.D., C.E.D.E.X., etc.
2. les troncations
CRADE de CRADINGUE, etc.
3. les dérivations
CASTAGNER (verbe) de CASTAGNE
Pour le décompte des dérivés, j'ai procédé de la façon suivante: CASTAGNER est
un nouveau verbe dérivé de CASTAGNE que j'ai compté. Par contre, CASTAGNE
n'est pas compté comme un dérivé, bien qu'il vienne de CHATAIGNE; j'ai
considéré que le rapport était trop lointain entre les deux mots et peu compréhensible
pour le locuteur natif moyen.
CANNER de « to can » (angl. "mettre en boîte"), COLAPSER (de l'angl. « to
collapse »), CANNABISME, CANNABIQUE (de CANNABIS) ont été comptés
pour la même raison que celle invoquée plus haut. Mais CANNABIS venant de
CHANVRE n'a pas été compté, le rapport n'étant pas évident, à mon avis.
J'ai inclus aussi des unités telles que CARCÉR-AL (le radical est savant et sert à
former un mot bien connu du vocabulaire commun INCARCÉRER; -AL donne sa
catégorie au mot et est reconnaissable comme affixe adjectival par le locuteur natif
moyen.
Par contre j'ai omis un mot comme CANADAIR, bien que le mot soit formé sur
CANADA: le rapport sémantique "Canada" et le sens du mot (avion muni de
réservoir d'eau) n'est pas évident. Mon choix pourrait donc paraître arbitraire
quelquefois et pourrait être matière à discussion.
4. les compositions non savantes et savantes:
CAMPING-CAR, COTON-TIGE, CARRÉ-ÉPONGE, CAPILLICULTURE,
CERVICALGIE, etc. Ici aussi, j'ai considéré que CAPILLI- et CERVI-, grâce à
"capillaire" et "cervical", expressions connues des locuteurs, étaient compréhensibles
et ont été adoptés. Pour les exemples de termes techniques, il est vrai que je me suis
basée sur mon intuition de locuteur natif, ce qui pourra sembler arbitraire.
3. Analyse et résultats
Le nombre total des nouvelles entrées morphologiques s'élève à 580. De ce nombre
total 5,5% des entrées sont des troncations et siglaisons, soit 31 items; 59% sont des
104
La création morphologique dans le dictionnaire
dérivés, soit 342 items et, enfin, 36% sont des compositions, soit 208 items. Je
présenterai d'abord les résultats bruts, puis analyserai un certain nombre de
phénomènes qui me paraissent intéressants. (Les listes en appendices ne proposent
qu'une partie du corpus.)
Pour les dérivations, la question est de savoir si l'on peut déceler de nouvelles
distributions: suffixes qui tendent à disparaître, d'autres qui tendent à être plus
productifs et à supplanter d'autres formations. C'est à cette question que je tenterai de
répondre en examinant les résultats.
3.1. Troncations et siglaisons (appendice 1)
Les troncations nouvelles sont au nombre de 12 (soit 2% du total des nouveautés
morphologiques); les mots tronqués sont des mots du vocabulaire courant; la
troncation s'est faite soit à droite soit à gauche et pas toujours à la syllabation (cf.
CLANDÉ, COKE):
(11) cipal, clandé (clandestin), coke (cocaïne), coca, croque...
J'ai compté 19 siglaisons, soit 3.5% du total5:
(12) CD, CD ROM, CRS, CB, CEDEX, CCP...
3.2. Les dérivations:
Elles sont très nombreuses (près de 60% du total) et concernent surtout la catégorie
des substantifs, assez peu celle des adjectifs et verbes. Je commencerai par (A) les
noms de machines, engins, etc., puis je continuerai (B) par les noms d'agents dont le
renouvellement (disparition et productivité de certains affixes) est spectaculaire. Sous
noms d'agents, j'examinerai aussi les nouveaux féminins et masculins (formés sur des
racines de féminins). Ensuite, je listerai (C) d'autres substantifs indiquant l'action,
l'état, la qualité, l'attitude, etc., puis (D) les verbes, (E) les adjectifs.
A) Les noms de machines (appendice 2)
Les dérivés en -EUR ou -EUSE indiquant des noms de machines, d'appareils,
d'engins, de logiciel, etc.: je compte 20 entrées nouvelles (3.6% du total) et pas de
sorties. Ce résultat est impressionnant car je n'examine qu'un dixième de tout le
corpus (la lettre C):
(13) chargeuse, chouleur, conteneur, cutteur...
Dubois et al. (1971) dans leur étude ne relèvent pour la totalité du dictionnaire
examiné, Le Petit Larousse, que 65 nouveaux cas de noms de machines, engins, etc.!
Mes résultats montrent donc combien la technique s'est développée et combien elle
5
"3.5% du total" signifie du total des créations morphologiques, c'est-à-dire 580.
105
Francine Melka
influence la structure du vocabulaire.
B) Les noms d'agents (appendice 3)
♦ Les noms d'agents (métier ou valeur générale) en -EUR/ -EUSE, -EUR/TRICE sont relativement peu nombreux, 11 en tout pour la lettre C (5 noms de
métier et 6 noms d'agent à valeur générale), soit environ 2% du corpus total (
appendice 3):
(14) cadreur, coréalisateur, castrateur, contamineur, etc.
Presqu'autant d'entrées, 10, disparaissent entre 1970 et 1993. Il s'agit de 6 noms de
métiers et 4 noms d'agent à valeur générale:
(15) Noms d'agent disparus: confectionneur, cylindreur, corrigeur,
cornemuseur, cambreur, coltineur, convoiteur, chuchoteur, chipeur, clabaudeur
♦ Le nombre de noms d'agent, de métier en -IER/-IÈRE et en -EUX sont
aussi assez peu nombreux ( appendice 3). On en compte 5 (moins de 1%):
(16) carlinguier, carpettier, chaussonnier, colzatier, etc.
et: coqueleux
Ces suffixes en -EUR/-IER/-EUX ne sont pas très productifs, mais ils continuent à
vivoter, semble-t-il. Ils sont probablement actuellement supplantés par -ISTE,
comme on le verra plus bas.
♦ Les noms d'agents en -IEN/NE forment 1% du corpus, soit 6 items; ils
sont formés sur des noms (propres) et des sigles: COPERNICIEN, CAPÉSIEN, (
appendice 3)
♦ Les noms d'agents indiquant un nouveau féminin sont au nombre de 10
(soit 1.75% du total). Ce sont des noms de métier (7) peu prestigieux en général (sauf
CHIRURGIENNE) ou des noms indiquant un état ou une attitude négatifs:
CAVALEUSE, CONNE, COUILLONNE. Je n'ai relevé qu'un seul nouveau
masculin formé sur le nom d'agent féminin, CHAISIER formé sur le modèle déjà
attesté de CHAISIÈRE.
♦ Le suffixe en -ISTE, indiquant un nom d'agent, avec un peu plus de 4% du
total, soit 23 entrées, est très productif. (Il faut tout de même noter 3 sorties,
6
CRIMINOLOGISTE , CITHARISTE, CYCLOMOTORISTE). En voici un
6
CRIMINOLOGISTE a été remplacé par CRIMINOLOGUE pour une raison qui n'est pas
106
La création morphologique dans le dictionnaire
échantillon, le reste de la liste se trouve en appendice 3:
(17) cabliste, coloriste-conseil, clubiste, cuisiniste, etc.
Il est à noter que le développement de ce suffixe, depuis la Révolution déjà, reste
considérable; mais une nouvelle tendance se dessine: le nom d'agent en -ISTE
continue à signifier "adepte d'une doctrine, d'un mouvement politique", mais sert
aussi maintenant à former, et c'est là la nouveauté, des noms de métiers
(CHAUFFAGISTE, CARISTE...). Ainsi ce suffixe est bien vivant et évolue vers
d'autres domaines. Il est, d'autre part, intéressant de noter que Dubois et al. (1971)
avaient prédit que ce suffixe en -ISTE n'avait que peu d'avenir.
C) D'autres suffixes nominaux:
♦ Parallèlement au suffixe en -ISTE, le suffixe en -ISME est productif.
Certaines formations sont toutes nouvelles CULTURISTE/CULTURISME ou
CATASTROPHISTE/CATASTROPHISME; certaines comblent des lacunes:
CENTRISME. Les créations sont au nombre de 18, soit plus de 3% du total des
formations morphologiques. Elles indiquent, dans mon corpus, parallèlement à une
doctrine philosophique ou politique (cf. Dubois et al.), aussi une attitude, une qualité,
un état, par exemple: CANNABISME signifie l'intoxication par le cannabis:
(18) castrisme, centrisme, catastrophisme, culturisme, clanisme (appendice
3).
Une seule entrée a disparu CÉNOBISME.
♦ Le suffixe en -ITÉ se retrouve dans 11 entrées (soit environ 2% du total);
on compte une seule sortie CONVENTUALITÉ ( appendice 4). Les noms sont
formés sur une racine adjectivale en -EL, -AL, -ABLE/-IBLE, -AIRE, -IF ou IQUE:
(19) confidentialité, collégialité, communicabilité, comestibilité, circularité,
compétitivité, criticité
Cette formation en -ITÉ était, semble-t-il, autrefois réservée aux mots du domaine de
la philosophie et du droit; aujourd'hui, c'est plus le vocabulaire général qui est touché.
Enfin, il y a eu autrefois une certaine concurrence entre les suffixes -ITÉ et -ISTE
au profit de -ISTE, mais nous constatons que le suffixe en -ITÉ reste productif.
claire, puisque le suffixe -ISTE est tellement productif actuellement et que -OGUE est en perte de
vitesse.
107
Francine Melka
♦ Les suffixes nominaux en -AGE (on compte 18 nouvelles entrées en
AGE, soit plus de 3% du total, et 3 sorties, CHARRUAGE, CREUSAGE,
CALQUAGE), en -MENT (8 nouvelles entrées, environ 1.5% du total et 2 sorties,
CAILLEMENT, CONVERTISSEMENT) et en -UDE (1 entrée) seront traités
ensemble (voir l'appendice 5), bien qu'au point de vue des pourcentages ils diffèrent
grandement; la raison en est qu'il existe de nombreux (nouveaux) doublets, par
exemple: CAILLAGE vs. CAILLEMENT, qui disparaît, ou CLIQUÈTEMENT
vs. CLIQUETIS, ou encore COMPLÈTEMENT vs. COMPLÉTUDE, qui sont
tous deux nouveaux. Cependant, il est difficile d'établir si le nouveau doublet a une
valeur différente: une nouvelle distribution par rapport à l'ancienne entrée. Grosso
modo, il n'est pas aisé de trouver des régularités dans les doublets.
Pourtant, j'ai noté que CALAGE (nouvelle entrée) indique un sens général et abstrait
par rapport à CALAISON, plus technique, qui s'emploie exclusivement pour un
bâteau; la même différence vaut pour CHARPENTAGE (abstrait) versus
CHARPENTERIE (pour un chantier); COPINAGE semble être plus abstrait que
COPINERIE. J'ai relevé quelques doublets intéressants avec distribution différente
qui indique que la concurrence entre les suffixes -AGE et -EMENT ou -UDE est
encore vraie (voir aussi Dubois et al., 1971). Mais encore une fois il est impossible de
trouver des régularités, à en juger par les exemples suivants:
(20) CLIQUÈTEMENT (sens général) CLIQUETIS (bruit sec, en
particulier de clefs, de chaînes);
CAMBREMENT (sens général) CAMBRAGE (sens technique, réservé aux
tiges de chaussures);
CAQUÈTEMENT (de poules) CAQUETAGE (sens métaphorique de
"bavardage";
COMPLÈTEMENT (action de compléter un dessin, un test) et
COMPLÉTUDE (abstrait, état de ce qui est achevé);
COLLATIONNEMENT/COLLATION (même sens de "repas").
Dubois et al. présentent les deux suffixes -AGE et -EMENT comme des
distributions ayant chacune leur caractéristique: -AGE indiquerait une action
technique, concrète et -EMENT une action abstraite ou le résultat d'une action. Au
contraire mon corpus indique dans le cas de doublets nouveaux que le suffixe en AGE marquerait un sens abstrait (cf. COPINAGE, CAQUETAGE,
CHARPENTAGE) ou général.
♦ Pour le suffixe en -TION ( appendice 6), les entrées sont au nombre de 9
(1.5% environ) et les sorties au nombre de 1 (CONGLUTINATION).
♦ Les suffixes en -OT et en -ET/-ETTE indiquant des diminutifs sont au
nombre de 11 (3 en -OT et 8 en -ETTE, entre autres CALCULETTE,
108
La création morphologique dans le dictionnaire
CHOUQUETTE, CLOPINETTE),
morphologiques ( appendice 7).
soit
2%
du
total
des
formations
♦ Ce suffixe en -ERIE est peu formateur. Il est lié à des noms de petite
industrie, de commerce artisanal qui disparaissent en même temps que le suffixe luimême. J'ai compté 2 entrées, CRÊPERIE, CARTERIE. L'autre suffixe en -ERIE
désignent des noms du vocabulaire commun dans un emploi péjoratif qui est
probablement concurrencé par d'autres suffixes. Mon corpus n'en contient que deux:
CHIERIE, CULCUTERIE.
♦ Les suffixes familiers en -OCHE/-OQUE et surtout en -ARD sont plus
productifs que -ERIE, respectivement 2 et 8:
(21) caldoche, chintoque
(22) connard, cyrard, corpsard, crobard, camisard, chiard, clébard, combinard
♦ Deux noms d'arbres exotiques en -IER sont mentionnés dans le corpus,
COLATIER, CENELLIER, ainsi que trois noms désignant un terrain ou une forêt
plantés d'arbres en -AIE et en -IÈRE : CÉDRAIE, CÉDRIÈRE, COCOTERAIE.
♦ la formation nominale en -IQUE, sur le modèle de informatique, indique
un ensemble de technologies, de techniques et leur étude. On ne compte que 4
entrées (moins de 1% du total) seulement, mais on peut penser que cette formation
(qui n'est pas mentionné chez Dubois et al.) prendra de l'ampleur:
(23) connectique, confortique, créatique, criminalistique
♦ Le suffixe nominal en -IS-ATION sera traité en même temps que le
suffixe verbal en -IS-ER ( appendice 8 et voir D).
D) Les suffixes verbaux:
♦ Le suffixe en -IS-ER et le suffixe nominal en -IS-ATION sont des
suffixes très formateurs avec 20 entrées (13 verbes et 7 noms) et aucune sortie, soit
3.50% du total. Dubois et alii en avaient relevé 48 pour l'ensemble du dictionnaire et
52 sorties. Dans mon corpus, quatre items (verbes + noms) sont nouveaux; il s'agit de
COLORISER, CLOCHARDISER, CULPABILISER, CONCEPTUALISER;
les autres créations comblent des lacunes.
Dubois et alii (1971) remarquent que ces nouveautés appartiennent au vocabulaire
politique et économique. Dans mon corpus, cette tendance est de moindre mesure, les
termes font plutôt partie du vocabualre général. Si mon corpus est représentatif, on
peut dire que ce suffixe passe d'un registre technique à un registre général.
109
Francine Melka
Enfin, il faut noter que le suffixe nominal -IS-ATION semble remplacer des suffixes
en perte de vitesse comme les suffixes en -AISON, -ON et -ION, -TION (voir
l'appendice 8).
♦ Le suffixe verbal en -ER avec ces 20 nouveautés, soit 3.50% du total,
confirme sa productivité déjà connue ( appendice 9). On constate qu’on ne trouve
aucune formation verbale en -IR, -RE, -OIR, par exemple. Les nouveaux verbes
sont formés sur un radical anglais, ou bien sont de nouvelles formations argotiques,
ou encore des verbes techniques:
(24) canner, cliquer, se crasher, calancher, calotter, chlorer, claveter,
compresser7
♦ Le corpus ne contient que trois créations de verbes à suffixe péjoratif , qui
indique aussi la répétition en -AILLER: COUPAILLER, COUCHAILLER,
CRACHOUILLER.
E) Les suffixes adjectivaux:
♦ La formation adjectivale en -IQUE, qui n'apparaît pas chez Dubois et alii
en 1971, est productive: elle comprend 15 entrées, soit environ 3 % du total; il n'y a
aucune sortie. Elle désigne presqu'entièrement des entités scientifiques ou techniques
( appendice 10), et aussi deux entrées du langage courant ou populaire :
(25) calorique, cannabique, capitalistique, cataclysmique, cellulitique,
cénoroïque, et : charismatique, chiatique
♦ Le suffixe en -ABLE et -IBLE touche 8 entrées, soit plus de 1.5% du
total; les sorties, au nombre de 7, comme CIVILISABLE, CONDENSABLE,
CONGELABLE, CONDUCTIBLE, ne signifient pas que ces adjectifs ont disparu
du lexique, mais peut-être que ces formes sont à considérer comme des allomorphes
du verbe encore disponibles.
(26) captable, commercialisable, commutable, compensable, comprimable,
constructible, corrigeable, crédible.
♦ Dans mon corpus, j'ai relevé 8 formes verbales en -ANT (circa 1.5% du
total), mais apparaissant de façon autonome (du verbe) dans le dictionnaire. Dubois
et al. (1971) prédisaient que ce suffixe disparaîtrait. Ce n'est pas vraiment le cas.
Dans mon corpus, sur un total de 8 items, 3 formes sont aussi employés comme
substantifs, ce qui est à considérer comme une étape dans l'acquisition d'un statut à
7
COMPRESSER concurrence "comprimer".
110
La création morphologique dans le dictionnaire
part: COAGULANT, CONTESTANT, COOPÉRANT. Les autres formes restent
adjectivales.
(27) caquetant, cariant (de carie), circulant, cliquetant, coagulant, codant,
contestant, coopérant
♦ Les suffixes en -IF sont aussi au nombre 8, soit environ 1.5% du total. Je
considère ce suffixe comme assez productif contra Dubois et al., qui l'estiment
moribond en 1971: Dubois n'avait dénombré que 13 entrées dans la totalité du
dictionnaire et avait enregistré 57 sorties.
(28) captatif, caritatif, conatif, conclusif, contragestif, contreproductif,
connotatif, créatif
♦ Le suffixe adjectival en -AL se retrouve dans 5 entrées, soit moins de 1%
du total. Dubois et al. ne le mentionnent pas dans leur étude. C'est un suffixe
technique ici:
(29) carcéral, colorectal, comportemental, conjonctival, consortial.
♦ J'ai regroupé ici un certain nombre de suffixes adjectivaux peu productifs
(moins de 1% chacun):
-EL ou -IEL, 4 entrées: ce suffixe était très productif chez Dubois et
al. (qui en avaient dénombré 30 entrées pour 1 sortie). Les entrées font partie du
vocabulaire scientifique: économique, politique, philosophique et informatique dans
mon corpus.
(30) catégoriel, communicationnel, conversationnel, contextuel
-EUX, 4 entrées et une sortie CÉRUMINEUX: ce suffixe a eu et a
une double fonction de suffixe péjoratif et scientifique. Cette double fonction
concurrencielle n'est probablement pas étrangère à sa disparition: il a été concurrencé
par -ARD, suffixe péjoratif, et -IQUE, suffixe scientifique.
(31) carieux, cespiteux, chloreux, crapoteux
-OIRE, 4 entrées:
(32) classificatoire, compromissoire, confiscatoire, consommatoire
-IDE, 2 entrées: cardioïde, caroténoïde.
-AIS, 2 entrées du domaine géographique: charolais, charentais.
111
Francine Melka
3.3 Les composés savants et non savants (appendice 11):
Ils forment 36% du total des créations morphologiques, soit 208 items. Les critères
de la place du déterminé (tête à droite ou tête à gauche) ou de l'exocentricité ont
permis de dégager cinq catégories différentes. Les résultats en pourcentage sont les
suivants:
- Les composés non savants tête à gauche sont au nombre de cinq, soit 4.50%
du total des composés et moins de 1% du total des créations morphologiques:
(33) carte-réponse, carte-vue, cradingue (crasseux+dingue), check up, cinéparc.
- On compte 45 composés non savants tête à droite, soit 21.50% du total des
composés et 9% du total des entrées morphologiques:
(34) camping-car, club-house, court-métrage, check-list, contre-culture,
cinétir...
- On dénombre seulement 2 composés savants tête à gauche, ce qui est
l'équivalent de 1% du total des composés:
(35) calciurie (calcium dans l'urine), cétonémie (substance cétonémique dans
le sang).
- Les composés savants tête à droite forme la catégorie la plus vaste avec 130
items, soit 62.50% des composés et 23% du total des entrées morphologiques:
(36) caméscope,
cytosquelette, etc.
carboglace,
claustrophobe,
colopathie,
crudivore,
- La dernière catégorie est celle des composés exocentriques; elle comprend
23 items, soit 11% des composés et 4.50% du total des entrées:
(37) casse-cul, cul-bénit, couche-tard, cyclo-pousse, carré-éponge, etc.
Enfin, j'ai mis à part un item comme CAFÉ-THÉATRE, dont le déterminé pourrait
être aussi bien à droite qu'à gauche (cf. Zwanenburg, 1992).
Plusieurs remarques s'imposent à propos de ces résultats:
1) On constate que les composés savants sont les plus nombreux, ce qui
montre un développement ample du vocabulaire technique ces vingt dernières
années, mais aussi l'intégration de ce vocabulaire technique dans la langue commune.
112
La création morphologique dans le dictionnaire
2) Les composés savants ont le déterminé à droite: l'élément savant (ou l'un
des éléments savants), grec ou latin, qui se situe à gauche, semble se comporter
comme un préfixe.
3) dans les résultats des composés non savants, ce qui frappe c'est le petit
nombre de composés tête à gauche (5) et le nombre important de composés tête à
droite (45). On s'attendrait à l'inverse en français. On pourrait interpréter ce résultat
en invoquant l'influence syntaxique de l'anglais (les composés savants et non savants
anglais, en règle générale, ont la tête à droite): les emprunts lexicaux que le français
fait à l'anglais est considérable; ce serait donc par ce biais que le Français aurait
tendance à construire les nouveaux mots sur le modèle anglais, tête à droite. Cette
interprétation est, selon moi, plausible, mais demande à être vérifiée sur un corpus
plus important.
Une autre interprétation est possible. Si l'on examine les 45 composés tête à droite,
on note que 9 des items sont des emprunts (sans changement) à l'anglais et que pour
27 items l'élément de gauche est CO-, CONTRE- ou COURT-. Si l'on considère
que ces derniers items (27) se comportent comme des composés savants du type
CANCÉROLOGUE dont le premier élément peut être vu comme un préfixe, il ne
reste, alors, que 5 composés tête à droite: CINÉSHOP et CINÉTIR, dont on
pourrait aussi admettre que l'élément CINÉ- est un préfixe,
CABLODISTRIBUTION, formé apparemment sur TÉLÉDISTRIBUTION, lui
aussi un composé savant tête à droite, et enfin deux items CRÉDIT-BAIL et
CUBITAINER. Ces explications changeraient l'interprétation des faits: des 45
composés non savants tête à droite, en fait, seuls deux ou trois items seraient à
considérer comme déviants.
4) Deux composés savants ont le déterminé à gauche: CALCIURIE et
CÉTONÉMIE. Ceci est surprenant puisqu'on s'attend à une place à droite en
français.
5) La catégorie des exocentriques est importante dans mon corpus (4.50% du
total des entrées morphologiques). Selkirk (1982) mentionne que cette catégorie n'est
pas significative en anglais. Si mon échantillon est représentatif, cette catégorie est
significative en français.
4. Conclusion
La comparaison d'une petite partie de l'édition du Petit Robert de 1970 et de celle du
Nouveau Petit Robert de 1993 montre que le mouvement morphologique entre ces
deux périodes est important: en ce qui concerne les entrées de la lettre C (qui forment
un dixième du nombre d'entrées totales du dictionnaire), 75% des additions sont
morphologiques. La variété des formes morphologiques nous fait penser que la
potientialité morphologique du français existe bien et que, si le dictionnaire reflète
les dires des locuteurs, cette compétence morphologique est utilisée par les locuteurs.
113
Francine Melka
Pour ce qui est de la dérivation, la fécondité de certains affixes est évidente: les
suffixes en -EUR pour les noms de machines, en -ISME qui indiquent comme
originalement des noms abstraits de tendance politique, philosophique, mais qui, en
plus actuellement, expriment des états, des qualités , en -ISTE qui désignent des
noms de métiers (tout en continuant à désigner des personnes adeptes d'une doctrine
philosophique, religieuse ou politique) et tend à remplacer le suffixe en -EUR. Pour
ces deux derniers suffixes on assiste à un passage de la langue technique à la langue
commune.
Les suffixes en -AGE et -ISATION semblent remplacer de vieux suffixes comme AISON et -SON, qui sont nettement en perte de vitesse. Quant à -IQUE (suffixe
adjectival) et -IQUE (suffixe nominal), ils se portent bien et on peut prédire qu'ils se
développeront dans les domaines techniques surtout.
La formation des féminins (noms de professions et noms désignant un état, une
attitude) est très restreinte dans mon corpus. Le résultat est peut-être décevant, mais
reflète probablement l'attitude des Français et Françaises, un certain conservatisme
socio-linguistique.
En ce qui concerne les composés, le corpus offre quelques surprises: le petit nombre
de composés non savants tête à gauche (5 seulement) et l'abondance de composés
non savants tête à droite (45). Pour rendre compte de ce dernier phénomène, j'ai
proposé deux explications, soit que certains composés non savants se comporteraient
comme des composés savants (tête à droite), soit que ces résultats seraient l'effet de
l'influence grandissante de l'anglais et de sa syntaxe sur le français. Après tout cela ne
serait pas la première fois que les langues germaniques influenceraient la syntaxe
française (cf. la syntaxe du français du XIIe siècle)!
Enfin, l'abondance des composés savants et dérivés savants est frappante dans mon
corpus. Les lexiques techniques, scientifiques en général se sont enrichis. Il est
intéressant de constater que le vocabulaire technique, surtout celui de la médecine,
passe dans le vocabulaire courant; ceci reflète peut-être nos actuelles préoccupations,
nos angoisses en matière de santé.
114
La création morphologique dans le dictionnaire
Bibliographie
Dictionnaires
Le Petit Robert (1970), sous la direction de Josette Rey-Debove et Alain Ray, Robert: Paris
Le Nouveau Petit Robert (1993), sous la direction de Josette Rey-Debove et Alain Ray, Robert: Paris
Autre références
CORBIN, D. (1987), Morphologie dérivationnelle et structuration du lexique, Niemeyer: Tübingen, 2
volumes
DARMESTETER, A. (1877), De la création actuelle de mots nouveaux dans la langue française et des
lois qui la régissent, Vieweg: Paris; Slatkine Reprints: Genève, 1972
DI SCIULLO, A.-M. & WILLIAMS E. (1987), On the Definition of Word, MIT Press: Cambridge, Mass.
DUBOIS, J., GUILBERT, L., MITTERAND, H. ET PIGNON, J. (1971), Le mouvement général du
vocabulaire français de 1949 à 1960, d'après un dictionnaire, In Introduction à la
Lexicographie, J. Dubois & Cl. Dubois, réd., Larousse: Paris, 111-132
KAMPERS-MANHE, B. (1993), La composition comme processus de formation de néologismes, In: Du
lexique à la morphologie: du côté de chez Zwaan, A. Hulk, F. Melka et J. Schroten, réd.,
Rodopi: Amsterdam/Atlanta
SELKIRK, E.O. (1982), The Syntax of Words, MIT Press: Cambridge, Mass.
ZWANENBURG, W. (1987), Le statut de la formation des mots savants en français et en anglais, Meta,
XXXII, 3, 223-229
ZWANENBURG, W. (1992), French Compounds, Rivista di Linguistica, 4, 1-21
115
Francine Melka
Appendice 1
Siglaisons et troncations
La troncation entrées: 12
1.
2.
3.
4.
5.
6.
cipal
clandé
clodo (clochard + crado)
coke
cracra
croque
La siglaison entrées: 19
1.
2.
3.
4.
CD
CB
CRS
CEDEX
Appendice 2
La dérivation
Noms de machines
entrées : 20
-eur, -euse (nom de machine, instrument, engin, appareil, logiciel)
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
calculateur
capteur
carotteuse
chargeuse
chouleur
clignoteur
climatiseur
cloueuse
codeur
collisionneur
compacteur
comparateur
composeuse
conjugateur
conteneur
convecteur
coprocesseur
cuiseur
curseur
cutteur
116
La création morphologique dans le dictionnaire
Appendice 3
Noms d'agents
entrées : 5
sorties : 6
-eur, -euse (nom d'agent, métier)
1.
2.
3.
4.
5.
cadreur
conserveur
coordinateur
coréalisateur
crawleur
entrées : 6
-eur, euse
1.
2.
3.
4.
5.
6.
sorties : 3
-eur/trice (valeur générale)
cafardeur
castrateur
chialeur
chieur
contaminateur
crâneur
entrées : 4
sortie : 1
-ier, ière (nom d'agent, de métier)
1.
2.
3.
4.
carlinguier
carpettier
chaussonnier
colzatier
1.
- eux nom d'agent, de métier entrée: 1
coqueleux [éleveur de coqs de combat]
117
Francine Melka
entrées: 6
-ien/nne
1.
2.
3.
4.
5.
6.
capésien
capétien
centralien
cogniticien
connecticien
copernicien
entrées: 10
nouveaux féminins (dont 7 noms de métiers)
entrée: 1
nouveau masculin
1.
3.
5.
7.
9.
camionneuse
cavaleuse
chemisière
chirurgienne
couillonne
1.
chaisier
2.
4.
6.
8.
10.
canetière
cheminote
chiffreuse
conne
contre-maîtresse
entrées: 23 sortie: 1
-iste (agent)
entrées: 18 sorties: 3
-isme (tendance)
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
cabliste
cariste
cédétiste
catastrophiste
comportementaliste
concouriste
conjoncturiste
convivialiste
consumériste
coloriste-conseil
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
118
cannabisme
carriérisme
castrisme
catastrophisme
centralisme
centrisme
clanisme
clientélisme
climatisme
comparatisme
La création morphologique dans le dictionnaire
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
collaborationniste
constructiviste
croisiériste
claviste
clubiste
chambriste
chauffagiste
corporatiste
crématiste
cébiste/cibiste
cuisiniste
culturiste
cytologiste
11.
12.
13.
14.
15.
16.
17.
18.
confessionnalisme
connexionnisme
constructivisme
consumérisme
créationnisme
culturalisme
culturisme
clyclotourisme
Appendice 4
entrées: 10
noms en -ité
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
circularité
collégialité
comestibilité
communicabilité
commutativité
comparabilité
compétitivité
confidentialité
continentalité
convivialité
Appendice 5
entrées: 18 sorties: 3
noms en -age
entrées: 8 sorties: 2
-ement
1.
2.
cabrage
caillage
1.
2.
119
cambrement
caquètement
Francine Melka
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
16.
15.
17.
18.
calage
canetage
carossage
cassage
catalogage
centilage
charpentage
ciblage
clonage
coiffage
copinage
couponnage
court-circuitage
crabotage
court-métrage
cryptage
3.
4.
5.
6.
7.
8.
entrée : 1
-ude
1.
complétude
Appendice 6
entrées: 9 sortie: 1
-tion
1.
2.
3.
4.
5.
6.
7.
8.
9.
capacitation
carbonatation
caséification
chloration
chosification
cimentation
complémentation
concertation
contraception
120
carillonnement
chamboulement
complètement
collationnement
cliquètement
croupissement
La création morphologique dans le dictionnaire
Appendice 7
entrées: 2
-ot (diminutif)
1.
2.
charlot
colinot
entrées: 11
-et/ette
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
caget
cagette
calculette
cartelette
castorette
chevillette
chouquette (petit chou)
clopinette
clayette
cuisinette
cuissette(s)
Appendice 8
entrées: 20
-iser
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
-isation
cancériser
coloriser
clochardiser
culpabiliser
conceptualiser
chartériser
césariser
cannibaliser
convivialiser
contractualiser
conscientiser
créoliser
crédibiliser
121
Francine Melka
1.
2.
3.
4.
5.
6.
7.
clochardisation
collectivisation
colorisation
conceptualisation
concrétisation
culpabilisation
curarisation
Appendice 9
entrées: 20
-er
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
cafter
calancher
se camer
se canner
canner
castagner
châtaigner
chinoiser
chlorer
chosifier
cibler
cloner
claveter
cliquer
cocotter
compacter
cranter
(se) crasher
complexer
compresser
122
La création morphologique dans le dictionnaire
Appendice 10
entrées: 15
formation adjectivale en -ique
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
calorique (calorie)
cannabique
capitalistique
caproïque
cataclysmique
cathartique
cellulitique
cénoroïque
charismatique
chiatique
cholique
christique
cryptique
cytologique
cosmologique
Appendice 11
Les composés
entrées: 5
composés non savants tête à gauche
1.
2.
3.
4.
5.
carte-réponse f.
check-up m.
ciné-parc m.
carte-vue f.
cradingue (crasseux+dingue)
entrées: 2
composés savants tête à gauche
1.
2.
calciurie f.
cétonémie f.
123
Francine Melka
entrées: 130
composés savants tête à droite
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
cinémomètre m.
cancérologue m/f
capiculture f.
carboglace f.
cytosquelette m.
clitoridectomie f.
cervicalgie f.
criminologue m/f
colopathie f.
cholécystotomie f.
caméscope m.
carpiculture f.
entrées: 45
composés non savants tête à gauche
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
club-house m.
cash-flow m.
camping-car m.
check-list f.
clapman m.
crédit-bail m.
court-métrage m.
cinétir m.
cubitainer m.
cinéshop m.
câblodistribution f.
coproduire
contre-publicité f.
contre-culture f.
entrées: 23
composés exocentriques
1.
2.
3.
4.
5.
camping-gaz m.
carré-éponge m.
coton-tige m.
capital-risque m.
croque-madame m.
124
La création morphologique dans le dictionnaire
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
contre-la-montre m.
casse-cul m.
coupe-ongles m.
chien-assis
contre-emploi m.
chausse-pisse f.
cyclo-pousse m.
cul-bénit m.
contre-transfert
couche-tard m/f.
couche-tôt m/f.
entrée: 1
composé non savant tête à droite ou à gauche
1.
café-théâtre
125
DE LA LEXICOLOGIE A LA LEXICOGRAPHIE/
FROM LEXICOLOGY TO LEXICOGRAPHY
Francine Melka & M. Celeste Augusto (eds.)
LISTE DES AUTEURS/ AUTHORS’ LIST
M. Celeste AUGUSTO
Affiliation: UiL OTS Utrecht University/ IVT Portuguese Department
e-mail address: [email protected]
Maria Fernanda BACELAR DO NASCIMENTO
Affiliation: Universidade de Lisboa – Centro de Linguística
e-mail address: [email protected]
Pierre CORBIN
Affiliation: Université Charles de Gaulle – Lille III
e-mail address: [email protected]
Willy MARTIN
Affiliation: Vrije Universiteit Amsterdam
e-mail address: [email protected]
Francine MELKA
Affiliation: UiL OTS Utrecht University/ IVT French Department
e-mail adress: [email protected]
Jan Schroten
Affiliation: UiL OTS Utrecht University/ IVT Spanish Department
e-mail adress: [email protected]
126