Cours

Transcription

Cours
A. Tutin : Sémantique – Modélisation des associations lexicales - UFR des Sciences du Langage, Université Stendhal Grenoble 3
Agnès Tutin
Master 2 des Sciences du Langage
Année 2009-2010
Linguistique
Vendredi 10h30-12h30
B 220
6 séances de 2 h
Sémantique : modélisation des associations lexicales
Plan de cours
1. Introduction
2. Typologie des expressions figées
3. Les collocations : des expressions semi-figées entre lexique et
syntaxe, entre langue et parole
4. Collocations et motivation
5. Les modélisations des collocations
Evaluation
1 travail personnel à partir du contenu du cours et des lectures.
Bibliographie de base (elle sera complétée en cours)
Gonzalez-Rey I. (2002). La phraséologie du français. Toulouse, Presses
universitaires du Mirail.
Gross G. (1986). Les expressions figées en français : noms composés et autres locutions.
Paris, Ophrys.
Grossmann Francis, Tutin Agnès (eds.) (2003), Les collocations : analyse et
traitement, Travaux et recherches en linguistique appliquée, Amsterdam,
de Werelt.
Grossmann, F., Tutin, A. (2007). Motivation of lexical associations in
collocations: the case of intensifiers for “nouns of joy”, in Wanner
L. (ed), Selected Lexical and Grammatical Issues in the Meaning-Text Theory In
honor of Igor Mel’čuk. Amsterdam (Pays Bas) Philadelphia (USA), John
Benjamins, 139 -165.
Hoey M. (2005). Lexical priming : A New Theory of Words and Language.
London: Routledge.
Nunberg G., Sag I., Wasow Th. (1994). Idioms. Language, vol 70, n°3, 491538.
Tutin A, Grossmann F. (2002). “Collocations régulières et irrégulières :
esquisse de typologie du phénomène collocatif”, Revue française de
Linguistique appliquée, « Lexique : recherches actuelles », vol. VII-1. 7-25.
Verlinde S., Selva Th., Binon J. (2003).Les collocations dans les
dictionnaires d'apprentissage: repérage, présentation et accès. In: Les
collocations: analyse et traitement / Ed. Francis Grosman et Agnès Tutin. Amsterdam: De Werelt, 2003. - p. 105-115.
Supports de cours
Tous les ouvrages et articles mentionnés sont disponibles à la bibliothèque
des sciences du langage (ou en ligne). Des copies d’articles seront distribuées
ou mises en ligne sur le BV.
Sur le BV à :
http://grenoble.bv.rhone-alpes.fr/personal/tutina_ugr3/SharedDocuments
Aller dans M2_sémantique
Cowie A. (ed.) (2001). Phraseology : theory, analysis, and applications. New-York :
Oxford University Press
Fónagy I. (1997). Figement et changement sémantique, in La Locution entre
langue et usages, M. Martins-Baltar (ed.), Fontenay-Saint-Cloud, ENS
Editions, 131-164.
Permanences
Lundi de 15h30 à 16h30 en D208.
courriel : [email protected]
Introduction
1
1.1
. Sémantique formelle :
- les conditions de vérité d'un énoncé qui permettent le calcul du
sens.
L’objet de la sémantique
Définition
Dans le cadre de ce cours, nous nous intéresserons principalement à la
sémantique lexicale, mais nous aborderons également la sémantique
grammaticale et la sémantique du discours.
La sémantique est une branche de la linguistique qui étudie les signifiés
véhiculés par différents types d’unités linguistiques (les morphèmes lexicaux
ou grammaticaux, les énoncés, voire les discours).
Exercice : voici quelques unes des définitions de la sémantique.
Laquelle vous semble la plus claire et la plus complète ? (Référez vous
à ce qui précède).
Voici quelques-uns des objets possibles de la sémantique :
. Sémantique lexicale :
- la signification des mots simples ou des mots composés ; la
signification des expressions figées (il a cassé sa pipe) ;
- les relations lexicales (les rapports de sens entre les mots : relations
d'homonymie, de synonymie, antonymie, hyperonymie, partie-tout,
etc.) ;
- la polysémie des mots (ex. écrire : graphier, rédiger, communiquer
par lettre… ) ;
- les champs ou les réseaux sémantiques, c’est-à-dire les liens qui
unissent des unités lexicales ayant une parenté sémantique (ex. le
champ sémantique des sentiments).
. Sémantique du discours
- le sens et l’usage linguistique des connecteurs (ex. les connecteurs
justificatifs comme car, parce que, puisque, etc.) oppositifs (mais,
pourtant, quand même), consécutifs (donc, par conséquent, ainsi…).
. Sémantique grammaticale :
- la distribution des actants au sein d'un énoncé, qui correspond à
des rôles sémantiques (ex. La pâtisserie Lenoir a fourni la mairie en petits
fours : 3 actants).
- la valeur sémantique des temps verbaux ainsi que les aspects
(accompli, non accompli, perfectifs, imperfectifs, etc : ex. voyager =
imperfectif ; partir = perfectif).
(1) « La sémantique est l'étude du sens » (J. Lyons, 1978, Eléments de
sémantique, Paris, Larousse).
(2) La sémantique est l'étude du sens des mots (P. Guiraud, la sémantique,
coll. Que-sais-je ?,1955)
(3) « La sémantique est l'étude du sens des mots, des phrases et des
énoncés » (Lerat, Sémantique descriptive, 1983).
(4) « La sémantique se charge (…) de rendre compte de tous les aspects de
la signification que l’on ne peut mettre directement en relation avec des
caractéristiques formelles, mais qui appartiennent néanmoins au savoir
partagé par les membres d’une communauté linguistique. » (V. Nyckees, La
sémantique, Paris, Belin, 1998).
(5) La sémantique, (du grec sèmantikos, dérivé adjectival de sèmainein :
signifier) a pour objet l’étude du sens véhiculé par les formes linguistiques.
Elle décrit la partie de notre compétence qui nous permet d’interpréter les
énoncés, d’évaluer leur bonne formation au regard du sens et de reconnaître
intuitivement des relations de sens telles que la synonymie et la paraphrase
(…), l’implication (« Si c’est une tulipe, alors c’est une fleur »),
l’incompatibilité (« Si c’est une tulipe, ça ne peut être une rose, et
réciproquement »), etc. (Riegel, Pellat, Rioul, Grammaire méthodique du français,
Paris, PUF, 1994, p.24).
2
2
Il existe une discussion sur le statut exact de la pragmatique : doit-on ou non
l’intégrer à la sémantique ? Dans la pratique, il est en effet parfois difficile de
savoir quelle est la part du codage linguistique. Tout un courant de la
sémantique moderne (celui de l’école du linguiste belge Oswald Ducrot)
défend l’idée que les mots, grâce à leurs signifiés, ont en eux-mêmes une
orientation argumentative. Ainsi, dire d’une personne qu’ « elle est peu
intelligente » c’est vouloir dire en fait « qu’elle n’est pas intelligente », et
pourquoi pas «elle est bête », voire « elle est complètement stupide ». La
description linguistique de peu dans des énoncés de ce type en français
devrait donc prendre en compte ces effets de sens sur l’énoncé.
Sémantique et disciplines connexes
Le niveau sémantique ne peut être appréhendé sans être mis en relation avec
d’autres niveaux sémantiques. Les phénomènes analysés relèvent donc également
d’autres disciplines linguistiques, en particulier la syntaxe et la pragmatique.
2.1.1
Sémantique et sémiologie
La sémiologie est la science des signes (et pas seulement des signes linguistiques) ;
il s’agit d’un domaine beaucoup plus large que la sémantique, qui a parfois
cependant besoin de certains de ces concepts, à commencer par le premier, celui
de signe.
2.1.2
2.1.4
La lexicologie, étude des unités lexicales, s’intéresse à la fois à la
morphologie lexicale et à la sémantique lexicale. Elle comporte donc une
intersection avec une branche de la sémantique, la sémantique lexicale, qui
s’intéresse à la manière dont se construit le sens des mots.
Sémantique vs syntaxe
Les relations entre syntaxe et sémantique sont complexes. En effet, la syntaxe
s’efforce de faire abstraction du sens pour se limiter aux relations formelles
entre les constituants. Historiquement, cette position est relativement récente :
en grammaire traditionnelle, l’utilisation de critères sémantiques dans les
définitions grammaticales (ex. sujet/objet direct/verbe transitif, etc.) était
courante. La position moderne est plutôt de considérer qu’il y a bien autonomie
du niveau syntaxique par rapport au sens, mais qu’en même temps, il est possible,
dans une certaine mesure, de corréler certains rôles sémantiques et leurs
réalisations syntaxiques.
On verra dans ce cours que l’examen des expressions figées ou associations
polylexicales remet parfois en cause l’autonomie des niveaux lexical et syntaxique,
les deux niveaux étant inextricablement liés. Les grammaires de construction
(par exemple, Croft & Cruse 2000) tendent à considérer les expressions figées
comme des constructions syntaxiques où les positions syntaxiques sont saturées
par des éléments spécifiques. Dans la tradition contextualiste anglaise à la
suite des travaux de Halliday (Cf. par exemple, Hunston & Francis (2000) ou
Hoey (2005)), on n’oppose pas non lexique et syntaxe. Ces approches
fonctionnalistes soulignent le fonctionnement phraséologique de la langue.
Cette conception ne remet pas en cause l’autonomie nécessaire du plan
morphosyntaxique par rapport au plan sémantique, mais elle montre qu’on a
intérêt à explorer leurs relations de manière systématique.
2.1.3
Sémantique et lexicologie
Sémantique et pragmatique
3
La pragmatique s’intéresse aux effets de sens, produits en contexte et non à
la part du sens qui se trouve codée par la langue. Quand je dis il fait froid,
dans une pièce dans laquelle la fenêtre est ouverte, je suggère qu’il serait bon
de la fermer. La pragmatique étudie donc la valeur actionnelle du langage,
dans la suite de l’étude des actes de langage, issue de la philosophie
analytique (Austin, Strawson, Searle).
La question de la phraséologie en linguistique
Les expressions polylexicales posent des problèmes théoriques tout à fait
intéressants pour la théorie linguistique. Elles ont longtemps été considérées
comme des anomalies, des exceptions aux règles linguistiques, qui mettaient à mal
la compositionnalité linguistique. Ainsi, dans la tradition de la grammaire
générative, les expressions figées sont considérées comme des exceptions, dont
les règles habituelles ne peuvent pas rendre compte, et qui doivent être traitées de
3
façon spécifique. A l’heure actuelle, de nombreux modèles linguistiques prennent
en compte cette composante comme un élément central de la théorie linguistique,
comme le mentionnent Legallois et François ci-dessous.
(1) le sens d’une expression linguistique complexe est entièrement
déterminé par le sens de ses constituants ;
(2) le sens d’une expression complexe peut être prédit en fonction des
règles générales, à partir du sens de ses constituants ;
(3) chaque constituant (au sens syntaxique du terme) a un sens et ce sens
contribue au sens de l’ensemble de l’expression.
En principe, les énoncés des langues naturelles respectent le principe de
compositionnalité : ainsi, dans une phrase comme le chat a attrapé la souris, le sens
du tout (la phrase) dépend entièrement du sens des constituants. Le sens de la
phrase peut être prédit, à condition que l’on connaisse les règles de la syntaxe
française. Cependant, dans les expressions figées, le principe de
compositionnalité est souvent mis à mal. Un cordon bleu n’est pas un cordon
qui est bleu, un dos d’âne (dans une route) ne peut pas être interprété de façon
littérale. La non compositionnalité n’empêche pas une certaine motivation, ce que
nous allons examiner en détail dans ce cours.
On pourrait parler d’un tournant phraséologique de la linguistique ; non
pas parce que, au regard des publications et des colloques, la phraséologie
est devenu un objet de plus en plus fréquent d’analyse – il n’y aurait là
qu’une « institutionnalisation » d’un thème de recherche parmi d’autres –
mais bien plutôt parce que la phraséologie, obligeant il y a peu la théorie à
un détours, est devenue la matière première de certaines conceptions
linguistiques : elle propose un renouvellement de l’analyse syntaxique,
sémantique, textuelle et psycholinguistique sur la base d’observations plus
empiriques, grâce, notamment, au recours aux corpus de grandes
dimensions. (Legallois & François 2006 : 4).
•
La phraséologie met à mal la distinction nette entre syntaxe et
lexique :
4
Les expressions semblent relever du lexique, en tant qu’elles sont
mémorisées par les utilisateurs, présentent souvent une unité référentielle et
se traduisent souvent par un mot simple dans une autre langue.
Elles relèvent aussi de la syntaxe dans la mesure où ces expressions sont
mises en œuvre par les règles de la syntaxe (et nombre d’entre elles auront
en outre un comportement assez régulier du point de vue syntaxique).
•
La sémantique utilise différentes méthodes :
- l’observation du comportement des mots dans les textes, dans des
contextes artificiellement créés mais aussi dans des corpus ; dans le cadre du
cours, nous recourrons fréquemment aux exemples sur corpus.
- des tests linguistiques : ex. le test de substitution en contexte qui permet
de tester le degré de synonymie de deux unités lexicales : ex.X. éprouve de la
haine pour Z ; X éprouve de l’inimitié pour Z.
Nous utiliserons régulièrement ce type de test pour mettre en évidence les
propriétés sémantiques.
La phraséologie réactualise le débat entre langue et parole
Les phénomènes phraséologiques, en particulier les moins figés comme les
collocations, remettent en question la distinction classique entre langue et
parole, entre compétence et performance. Ils appartiennent à la langue dans
la mesure où ils sont stockés dans le lexique, mais relèvent aussi de la parole,
étant étroitement liés à des phénomènes de fréquence et d’usage.
•
La phraséologie remet en question
compositionnalité classique en sémantique
le
principe
Méthodes d’observation et d’analyse
5
de
Complément bibliographique
•
•
Le principe de compositionnalité repose sur trois conditions :
4
Croft, Cruse (2000). Cognitive linguistics. Cambridge University Press
2000.
Legallois, D., François J. (2006). Autour des grammaires de
construction et de patterns. Cahier du Crisco n° 21. Janvier 2006.
•
•
d'enseignement hebdomadaires en plus, un effort sur les langues, l'informatique et la
méthodologie, un tutorat systématique en première année, etc.
Hoey M. (2005). Lexical priming : A New Theory of Words and Language.
London: Routledge.
Hunston S. & Francis G. (2000). Pattern Grammar: a corpus-driven
approach to the lexical grammar of English (Studies in Corpus Linguistics
4). Amsterdam: John Benjamins.
1. Repérez les expressions qui ne paraissent pas compositionnelles
sur le plan sémantique. Y en a-t-il beaucoup ? Y a-t-il des
expressions polylexicales qui ne paraissent pas véritablement
figées ?
Mais les organisations étudiantes ne voient rien venir, ou presque. Les universités où
le tutorat existait déjà vont le généraliser. Celles qui avaient un bureau d'insertion
professionnelle vont le développer. Mais la plupart restent discrètes sur leurs
novations de rentrée. «Pour renforcer l'encadrement des premières années, il faut des enseignants
supplémentaires, et c'est le premier obstacle», explique Thiébaut Weber, président de la
Fage, la seconde organisation étudiante. Valérie Pécresse, qui avait réussi à geler les
effectifs de son ministère en 2008, a dû annoncer des réductions de postes en 2009 un départ à la retraite sur six ne sera pas remplacé. Son budget reste malgré tout l'un
des rares à augmenter - de 10 % pour 2009-2011. «On risque de se retrouver avec des
moyens en plus mais pas assez de postes pour les mettre en place», poursuit Thiébaut Weber.
(extrait de Libération, 17 juillet 2008).
La ministre de l'Enseignement supérieur et de la Recherche Valérie Pécresse a
multiplié les annonces de réforme. Après la loi très contestée sur l'autonomie des
universités (la LRU), elle a promis de rénover la licence, de moderniser le système
d'aides sociales, d'améliorer la vie étudiante, etc. Retour sur ce qui va vraiment
changer à la rentrée, alors que les inscriptions seront closes demain.
2. Les expressions polylexicales sont souvent motivées
sémantiquement. En particulier, elles expriment souvent une
métaphore analysable. Essayez d’expliquer la métaphore dans les
expressions suivantes.
Des «patrons» à la tête des universités. La LRU commence juste à s'appliquer et il
faudra attendre pour en mesurer les effets. Seules les instances dirigeantes des
universités ont été renouvelées. Désormais elles ont à leur tête des conseils
d'administration (CA) resserrés avec des présidents aux pouvoirs renforcés et une
représentation étudiante amoindrie. La plupart des présidents sortants ont été
reconduits. Beaucoup ont toutefois eu la mauvaise surprise de voir que le nouveau
mode d'élection renforçait leur opposition interne. Les listes syndicales, hostiles à la
LRU, l'ont souvent emporté chez les maîtres de conférences. Les étudiants, eux, se
sont retrouvés en position d'arbitre. Du coup on a vu des blocages lors de l'élection
au CA des personnalités extérieures choisies par le président.
Avoir un poil dans la main.
Mettre la main à la poche.
Manger les pissenlits par la racine.
Trouver chaussure à son pied.
Mettre un cautère sur une jambe de bois.
6
Exercices
La partie cruciale commence maintenant. La semaine prochaine, le ministère
annoncera la liste des premières universités qui deviendront autonomes au
1er janvier 2009 avec un budget, incluant les salaires, qu'elles vont gérer elles-mêmes.
Il faudra alors négocier la masse budgétaire avec l'Etat. Et cela s'annonce rude.
«Certains pensent encore que l'université coûte trop cher», expliquait récemment Michel
Lussault, vice-président de la CPU (conférence des présidents d'université).
Des promesses pour la licence. Dans le cadre du plan «Réussite en licence», Valérie
Pécresse a annoncé une série de mesures pour diminuer les forts taux d'abandon des
premières années : la multiplication des cours en petits groupes, cinq heures
5
Chapitre 1 : Caractéristiques des expressions polylexicales
1
Introduction
Les expressions polylexicales ne constituent pas du tout une classe
homogène. Elles sont extrêmement variées et reçoivent de très nombreuses
appellations, comme nous le verrons. Il est usuel de les appréhender dans un
continuum, à travers leur « degré de figement ». Shapira (1999 : 10), par exemple,
considère que « le figement est un phénomène scalaire, ses produits pouvant
présenter une rigidité plus ou moins intense ». Tout le monde s’accordera en effet
sur le fait que dos d’âne ou cordon bleu présentent intuitivement un degré de figement
plus élevé que amour propre qui lui-même sera perçu comme plus figé que amour
passionnel ou amour haine.
Cependant, la notion de continuum, si elle apparaît intuitive, ne va pas sans poser
de problèmes :
- D’une part, les différents critères utilisés pour déterminer le figement sont
souvent indépendants. Le figement s’exprime donc sur plusieurs échelles, qui
ne sont pas nécessairement parallèles. Par exemple, le caractère syntaxique
contraint de certaines expressions polylexicales ne s’accompagne pas
nécessairement d’une opacité sémantique, et inversement. Par exemple, peur
bleue est très contraint sur le plan syntaxique (pas de possibilité d’insertion de
modifieur ou de verbe d’état : *une peur très bleue, *sa peur était bleue). Sur le plan
sémantique cependant, on peut considérer que l’expression n’est pas
complètement opaque, puisque le sens habituel de peur reste accessible.
Inversement, une expression comme fermer sa porte à qqch (=’exclure’ qqch) est
peu compositionnelle au sens strict (même si le sens est déductible par
métaphore). En revanche, cette expression peut connaître des alternances et
insertions syntaxiques :
o
o
Cette porte n’est pas complètement fermée (= cette solution n’est pas
complètement exclue).
Nous n’avons fermé définitivement notre/cette/la porte à cette solution.
-
D’autre part, la notion de continuum est finalement peu utile. Placer des éléments
sur une échelle de figement ne constitue nullement un traitement suffisant, en tout
cas pour de nombreux traitements linguistiques, comme pour les applications en
didactique des langues ou en traitement automatique des langues. Il conviendra
davantage pour nous de caractériser les expressions polylexicales à partir d’un
ensemble de critères pertinents.
En bref, si la notion de continuum du figement apparaît intuitivement pertinente, elle
doit être maniée finement.
Précision terminologique :
Le terme « expression figée » (« frozen expression » ou « fixed expression » en
anglais), même s’il est très employé – y compris ici ! – apparaît trop limitatif pour
couvrir l’ensemble des phénomènes que nous souhaitons examiner dans ce cours
et nous lui préférerons le terme plus neutre (et peu théorique) d’ « expression
polylexicale » (« multiword expression » en anglais), plus générique, pour désigner
l'ensemble des éléments qui nous intéressent. On ne peut en effet appeler
« expressions figées » des expressions qui ne sont ni véritablement figées sur le
plan sémantique, ni sur le plan syntaxique comme grièvement blessé, immense regret, joie
indicible, perpétrer un crime et qui sont pourtant perçues comme lexicalisées.
Nous définirons les expressions polylexicales comme :
Des expressions :
- qui comprennent plusieurs mots (graphiques),
- dont les composants apparaissent fréquemment en cooccurrence, mais
peuvent également apparaître de façon autonome.
- qui sont mémorisées comme un tout par les locuteurs.
Cette définition large permet d’englober aussi bien des « mots composés » que des
« collocations » ou des « formules routinières ».
6
2
Types de constituants des expressions polylexicales
La question des constituants est tout à fait centrale dans la typologie des
expressions polylexicales. Nous n’aborderons ici que des séquences intégrant
des éléments lexicalisées. Cela exclut donc les pures constructions syntaxiques
chères aux linguistes du courant des « grammaires de constructions ».
Les constituants mettant en jeu les expressions figées sont extrêmement divers.
Ils vont de la phrase dans le cas des parémies ou proverbes aux locutions
faisant fonction de déterminants ou de prépositions. Certaines séquences
préconstruites (certaines colligations et collocations) ne peuvent d’ailleurs
pas être véritablement considérées comme des constituants au sens traditionnel
du terme.
2.1
Phrases
Les expressions préconstruites constituant des phrases « verbales » (à temps
fini) apparaissent dans les proverbes ou parémies.
1. Pierre qui roule n’amasse pas mousse.
2. Qui a bu boira.
Ces expressions peuvent d’une certaine façon être considérées comme
appartenant à la phraséologie, du fait de leur caractère préconstruit et
mémorisé. Elles sont généralement très figées sur le plan syntaxique et
présentent des constructions tout à fait caractéristiques (Cf. Anscombre 2003,
Schapira 1999). En revanche, elles présentent des spécificités par rapport aux
autres expressions figées qui les rendent tout à fait marginales. Leur caractère
phrastique les exclut bien entendu du lexique. De plus, contrairement aux
autres expressions figées, elles constituent des prédications autonomes. Enfin,
elles ont une valeur rhétorique spécifique, illustrative, et sont très liées au genre
oral.
Les phrases, verbales ou averbales, apparaissent également dans ce que
Mel’čuk (par exemple, 1998) appelle les « pragmatèmes », ces expressions
« toutes faites » qui apparaissent dans des situations de communication
spécifiques, généralement à l’oral, comme les formules de politesse ou les
formules rituelles, comme les suivantes :
3. comment allez-vous ?
4. par exemple !
Ces expressions reçoivent d’autres appellations : « phrases de routine » chez
Schapira (1999) ou « énoncés de motif usuels » chez Martins-Baltar (1995).
Fónagy (1997) les appelle « énoncés liés », et remarque que ces expressions ne
peuvent être traduites littéralement, sous peine de contresens. La formule de
politesse répondant un remerciement en français de rien a ainsi comme
contrepartie anglaise le très éloigné you’re welcome. Comme le souligne Fónagy,
décrire adéquatement ces expressions est une véritablement gageure, l’accès
sémasiologique étant de peu d’utilité. C’est essentiellement la composante
pragmatique qui doit être ici privilégiée.
2.2
Constituants sub-phrastiques
Les expressions polylexicales sont plus couramment des constituants subphrastiques. Certaines expressions correspondent à ce que l’on peut analyser
comme des syntagmes dans la tradition des grammaires de constituants. Dans
certains cas, la formation syntaxique de la séquence polylexicale correspondra à
une expansion obéissant aux règles habituelles de la grammaire : une séquence
lexicale associable à une structure XP pourra être analysée comme ayant la
catégorie X. Par exemple, le syntagme tête de turc est construite comme une
expansion nominale a une structure classique de type N1 de N2 et la catégorie
syntaxique que l’on peut associer à cet élément est le nom. On parle souvent de
structure endocentrique pour ce type de formation des séquences polylexicales.
C’est ainsi le cas d’expressions :
expansions du nom :
tête de turc
peur bleue
expansions de l’adjectif
fou amoureux
bête comme ses pieds
expansions du verbe
faire la manche
péter les plombs
avoir peur
expansions de la préposition
par monts et par vaux
En revanche, d’autres séquences à structure exocentrique, généralement
perçues comme très figées, ne sont pas analysables sur le plan syntaxique à
l’aide des règles habituelles de la syntaxe. Dans un crève la faim, crève la faim
s’analyserait comme un syntagme verbal alors qu’il a une fonction nominale.
bon marché s’apparente à un adjectif (dans un livre bon marché), alors qu’il a une
structure nominale. ventre à terre, qui a aussi une structure nominale, a une
fonction adverbiale dans il court ventre à terre.
Enfin, mentionnons les séquences polylexicales correspondant à des mots
grammaticaux, qui ont un fonctionnement tout à fait atypique sur le plan
syntaxique. Ils ne renvoient pas à des catégories syntaxiques majeures et ont un
fonctionnement syntaxique tout à fait idiosyncrasiques, pour la plupart d’entre
eux :
déterminants : la plupart des, bien des …
pronoms : le mien, autre chose
conjonctions : bien que, avant que …
prépositions : au dessus-de, en dehors de …
Ces expressions, souvent négligées par la phraséologie, sont extrêmement
nombreuses. Légèrement différent apparaît être le cas d’expressions comme les
suivantes qui semblent répondre à des patrons productifs, et qu’on pourra
analyser, pour nombre d’entre elles, comme des collocations :
Une foule de
Une nuée de
dans l’espoir de/que
de crainte de
2.3
Séquences subphrastiques qui n’ont pas véritablement valeurs
de constituants
Certaines séquences polylexicales ne peuvent s’analyser ni comme syntagmes au
sens de la grammaire de constituants, ni commuter avec des mots simples. C’est
en particulier le cas de certaines formules routinières (formulaic sequences) très
étudiées dans le cadre de la phraséologie anglo-saxonne (par exemple, Schmitt
2004), parfois considérées comme des « colligations » (Siepmann 2006),
auxquelles il n’est pas facile d’attribuer une catégorie syntaxique claire. Il s’agit
d’expressions comme :
5.
6.
7.
8.
tout se passe comme si …
it is argued that …
plus … , plus ….
En ce qui concerne …
Il s’agit souvent de marqueurs discursifs, ayant une fonction rhétorique et
pragmatique spécifique (Siepmann 2006).
D’autres types de séquences ne constituent pas des syntagmes au sens des
grammaires de constituants. Il s’agit par exemple d’associations de type sujet-verbe
comme les suivantes :
9. La peur paralyse …
Les éléments de l’expression entretiennent toutefois une relation syntaxique
classique (sujet-verbe).
3
Le comportement syntaxique des expressions polylexicales
Il a été remarqué depuis longtemps et par de nombreux linguistes que les
séquences polylexicales présentaient des comportements très variables par rapport
au figement syntaxique, qu’il s’agisse de l’insertion d’éléments, de la commutation
ou des alternances syntaxiques. On trouve ainsi chez Svensson (2004) et Gross
(1996) un inventaire de critères syntaxiques permettant de déterminer le degré de
figement syntaxique d’une expression, dont nous mentionnons quelques-uns :
-
-
-
-
Inséparabilité des constituants de l’unité :
cordon bleu : °un cordon vraiment bleu1.
vs
jupe marron : jupe vraiment marron.
Substitution difficile, blocage lexical :
pomme de terre, °poire de terre, °pomme de glaise.
Vs
cours de linguistique, cours de sémantique, livre de linguistique.
Alternances syntaxiques (surtout pour les verbes) difficiles :
o Passif :
Il a cassé sa pipe °sa pipe a été cassée.
Vs Il a brisé son verre son verre a été brisé.
o Transformation relative :
Il a mordu la poussière °La poussière qu’il a mordue.
Vs Le chien a mordu le garçon Le garçon que le chien a mordu.
Anomalies syntaxiques fréquentes (par exemple, absence de
déterminants, structure spécifique), normalement impossibles. Il s’agit
souvent d’archaïsmes.
Il a plié bagage.
Vs *Il a plié feuille.
Il est ivre mort.
Vs *Il est soul mort.
Ces différents critères syntaxiques ne sont cependant pas nécessairement
convergents, ce qui rend parfois difficile l’application de degré de figement
syntaxique.
Exercice : En appliquant les critères examinés plus haut, déterminez
dans quelle mesure les expressions ci-dessous sont figées sur le plan
syntaxique. Le figement syntaxique va-t-il de pair avec le figement
sémantique ?
-
1
Péter les plombs
Rompre la glace.
Le signe “ ° ” indique un changement de sens par rapport à l’unité de départ.
-
4
Avoir faim.
Plier bagage.
Critères sémantiques
La question de la compositionnalité sémantique est centrale dans la définition
des expressions polylexicales. Toutes les définitions des expressions figées
(phrasèmes, locutions) intègrent d’une façon ou d’une autre cette notion, … mais
n’en donne pas la même définition (Voir aussi la définition donnée en
introduction)!
une locution prototypique est caractérisée […] par sa non-compositionnalité. On
a beau comprendre tous les mots qui entrent dans tirer le diable par la queue cela ne
suffit pas pour comprendre ce que cette locution veut dire. (Martin 1997 : 293)
compositionality – that is, the degree to which the phrasal meaning, once known,
can be analyzed in terms of the of the contribution of the idiom parts (Nunberg
et al. 1994 : 498)
Le critère de compositionnalité peut mettre en jeu deux notions :
- Le calcul d’un sens sémantique à partir de sens associés aux composantes
de l’expression.
- La prédictibilité du sens de l’expression à partir du sens des composants.
Pour Nunmberg et al., certaines expressions relativement « opaques », mais
résultent d’une combinaison de parties, et ces auteurs préfèrent recourir au terme
de conventionnality (caractère conventionnel dans ce second cas) pour la deuxième
notion. Ils montrent ainsi que de nombreuses expressions a priori opaques (et donc
« conventionnelles ») sont en fait compositionnelles, une fois que l’on connaît le
sens de l’expression. Ils distinguent ainsi les idiomatic phrases comme casser sa pipe
(syntagmes idiomatiques, non compositionnels) des idiomatically combining expression
(expression compositionnellement idiomatiques, comme vendre la mèche ou rompre
la glace, pour lesquelles on peut décomposer le sens en un sens calculable à partir
des parties (pour vendre la mèche, ‘vendre’ = ‘diffuser’ et ‘la mèche’ = ‘le secret’.
Des critères syntaxiques sont aussi employés.
La définition de la compositionnalité de Nunberg et al. rejoint le critère d’opacité
souvent utilisé pour définir les expressions figées : les expressions figées seraient
difficiles à interpréter si on ne connaît pas a priori leur sens. Certaines expressions
au sens non prédictible à partir des sens littéral des parties, sont cependant
relativement transparentes, leur sens étant calculé par métaphore, par exemple,
mauvaise graine ou séparer le bon grain de l’ivraie.
Mel’čuk I. (1998). Collocations and Lexical Functions. In A. P. Cowie (ed.),
Phraseology. Theory, Analysis and Applications. Oxford, Clarendon Press,
23-53.
Exercice : Indiquer pour chaque expression suivante dans quelle
mesure elle est opaque sur le plan sémantique et dans quelle mesure le
sens est prédictible par le calcul du sens des parties.
Schapira C. (1999). Les Stéréotypes en français. Proverbes et autres formules. Paris :
Ophrys.
-
5.
Pied à terre.
Peur bleue.
Mettre les voiles.
Coup d’œil.
Pertes abyssales.
Autres critères
Certains paramètres caractérisent particulièrement certaines expressions
polylexicales :
-
Le caractère métaphorique, qui concerne de nombreuses expressions
(mauvaise graine, pomme de terre), mais pas toutes, par exemple bien que, fait
divers, pèse-bébé.
Le registre peu soutenu de certaines expressions : hurler de rire, avoir le feu
aux fesses.
Le caractère souvent subjectif des expressions (langage évaluatif) :
travailler d’arrache-pied, un ennui mortel, un amour fou.
6. Bibliographie (hors bibliographie de base)
Anscombre J-C. (2003). Les proverbes sont-ils des expressions figées ?.
Cahiers de lexicologie 82, pp. 159-173.
Martins-Baltar M. (1995). Enoncés de motif usuels : figures de phrase et
procès en déraison. Cahiers du Français Contemporain, « La locution
en discours », M. Martins-Baltar (ed.). N° 2, Décembre 1995. 87118.
Svensson M.H. (2004). Critères de figement : L’identification des expressions figées en
français contemporain. Umeå Universitet, Umeå.
Chapitre 2 : Les collocations : des expressions semi-figées, entre
lexique et syntaxe, entre langue et parole
Les collocations : plusieurs définitions pour plusieurs traditions
La notion de collocation est souvent décrite comme floue dans la littérature
linguistique. Williams (2003 : 33) dit ainsi :
Les collocations sont en quelque sorte l’Arlésienne de la linguistique : tout le
monde en parle, mais elles restent difficilement saisissables.
Depuis quelques années néanmoins, cette notion, sous l’influence de la
lexicographie et des applications de traitement automatique du langage,
commence à être plus finement étudiée et définie, et une terminologie plus stable
se fait jour.
Dans le cadre de ce cours, nous nous intéresserons sous le terme de collocations
à des expressions stéréotypées, parfois partiellement figées comme avoir faim, perte
abyssale, ivre mort, formuler une hypothèse … D’autres définitions sont cependant
parfois utilisées, comme nous allons le voir.
4.1
Les collocations chez Firth et dans la tradition
contextualiste anglaise : “you shall know a word by the
company it keeps”
Firth, dans les années 40, est l’un des premiers à utiliser la notion de
collocation en linguistique. Pour lui, le sens doit s’analyser dans le contexte
textuel, et pas en recourant à l’intuition :
Meaning by collocation is an abstraction at the syntagmatic level and is not
directly concerned with the conceptual or idea approach to the meaning of
words. One of the meanings of night is its collocability with dark, and of dark,
of course, collocation with night. (Firth 1957 : 196)
[Le sens dans les collocations est une abstraction au niveau syntagmatique et
n’est pas directement concerné par l’approche conceptuelle ou idéationnelle
du sens des mots. Un des sens de nuit est sa relation collocationnelle avec noir
et, pour noir, évidemment, la collocation avec nuit.]
C’est Firth qui est à l’origine de la fameuse citation : « you shall know a
word by the company it keeps “, qui comme le souligne Williams (2003),
n’est pas extrêmement claire. Ses disciples, en particulier, Halliday,
Sinclair et plus tard Hoey, proposeront des définitions plus claires de
la notion de collocation.
Halliday, avec une approche fonctionnelle, s’intéresse aux structures
de la langue. Dans approche « lexico-grammaticale », il étudie
comment les associations lexicales, les collocations, participent à la
cohésion textuelle.
laugh … joke, blade … sharp, ill… doctor […] The cohesive effect of such pairs
depends not so much on any systematic relationship as on their tendency to
share the same lexical environment, to occur in COLLOCATION with one
another. In general, any two lexical items having similar patterns of
collocation – that is, tending to appear in similar contexts – will generate a
cohesive force if they occur in adjacent sentences. (Halliday & Hasan 1976:
285-286)
Depuis le début des années 80 cependant, une plus grande attention a été
prêtée à ce phénomène par des linguistes, qui ont essayé d’en donner des
définitions précises (par exemple, Cruse 1986 ; Hausmann 1989 ; Mel’čuk
1998 ; ou plus récemment, Bartsch 2004). [Remarque : l’inventaire des
définitions « classiques » n’est pas exhaustif ici].
John Sinclair (Sinclair 1991: 170) n’adopte pas une définition
fondamentalement différente de la notion de collocation, et insiste sur les
critères de type statistique :
• Cruse (1986 : 40)
The term collocation will be used to refer to sequences of lexical items which
habitually co-occur, but which are nonetheless fully transparent in the sense
that each lexical constituent is also a semantic constituent. Such expressions as
(to pitch a semantic area at random) fine weather, torrential rain, light drizzle, high
winds are examples of collocations. These are or course easy to distinguish
from idioms; nonethless, they have a kind of semantic cohesion — the
constituent elements are, to varying degrees, mutually selective. The semantic
integrity on cohesion of a collocate is the more marked if the meaning carried
by one (or more) restricted contextually, and different from its meaning in
more neutral contexts.
Collocation is the occurrence of two or more words within a space of each
other in a text ... Collocations [...] can be important in the lexical structure of
the language because of being frequently repeated. This second kind of
collocation, often related to measure of statistical significance, is one that is
usually meant in linguistic discussions (Sinclair 91, p 170).
Cette approche large est encore partagée par certains chercheurs en
Traitement Automatique des Langues ou par des chercheurs se situant dans
la lignée des contextualistes anglais comme Hoey (2005).
4.2
•
La tradition « continentale »
Dans la tradition continentale (terme de Williams (2003)), les collocations
sont modélisées dans un cadre lexicologique et lexicographique. Cette
conception plus étroite associe les collocations à des associations lexicales
fréquentes où les éléments entretiennent des relations syntaxiques.
C’est cette conception de la notion de collocation, parfois appelée
collocation lexicale restreinte, que nous adopterons ici.
Hausmann (1989 : 1010)
On appellera collocation la combinaison caractéristique de deux mots dans
une des structures suivantes :
a) substantif + adjectif (épithète)
b) substantif + verbe
c) verbe + substantif (objet)
d) verbe + adverbe
e) adjectif + adverbe
f) substantif + (prép.) + substantif
La collocation se distingue de la combinaison libre (the book is useful/ das Buch
ist nützlich/ le livre est utile) par la combinabilité restreinte (ou affinité) des mots
combinés (feuilleter un livre vs. acheter un livre). La collocation se distingue
d’autre part des locutions (idioms, Redewendungen, par ex. monter un bateau à
qn/jdn. durch den Kakao ziehen/ to pull sb’s leg) par son non-figement et sa
transparence. Or, cette transparence n’empêche nullement la collocation d’être
imprédictible. L’apprenant étranger, tout en la comprenant (s’il comprend les
mots combinés), ne saurait automatiquement la reproduire. Il doit l’apprendre,
parce que les langues, dans la totalité des combinaisons possibles, font un
choix idiosyncratique.
La notion n’est pas nouvelle : elle apparaissait déjà chez Bally dans son traité
de stylistique française (1909) sous le terme de séries phraséologiques.
Entre les extrêmes (groupements passagers et unités indécomposables) se
placent des groupes intermédiaires appelés séries phraséologiques (p.ex. les séries
d’intensité ou les périphrases verbales). (p 66)
Il y a série ou groupement usuel lorsque les éléments du groupe conservent
leur autonomie, tout en laissant voir une affinité évidente qui les rapproche,
de sorte que l’ensemble présente des contours arrêtés et donne l’impression
du “ déjà vu ”. (p 70)
12
•
1)
Within a span of 3:3 (or 5:5) words to the left and right of a node word
(the search node).
2) two (or more) words which co-occur recurrently with the node word,
3) and whose frequency of co-occurrence can be said to be statistically
significant according to at least one of the three statistical algorithms
employed (the default threshold values are MI ≥ 10,00 and t-score ≥
2,5% for 95% certainty and a significantly high chi-square rating.
are said to constitute collocation candidates. These collocation candidates are
subsequently subjected to qualitative criteria. In order to qualify as genuine
collocations, the constituents
4) must be in a direct syntactic relation with each other, and
5) display either lexically and/or pragmatically constrained lexical
selection, or
6) have an element of semantic opacity such that the meaning of the
collocation cannot be said to be deducible as a function of the
meanings of the constituents.
Mel’čuk (1998 : 30-31)
A COLLOCATION AB of L is a semantic phraseme of L such that its
signified ‘X’ is constructed out of the signified of the one of its two
constitueny lexemes - say, of A - and a signified ‘C’ [‘X’ = ‘A⊕ B’] such that
the lexeme B expresses ‘C’ contingent on A.
The formulation “B expresses ‘C’ contingent on A » covers four major cases,
which correspond to the following four major types of collocations :
1. either ‘C’ ≠ ‘B’, i.e. B does not have (in the dictionary) the corresponded
signified;
and a. ‘C’ is empty, that is, the lexeme B is, so to
speak, a semi-auxiliary slected by A to support it in a particular syntactic
configuration;
Or b. ‘C’ is not empty but the lexeme B expresses
‘C’ only in combination with A (or with a few other similar lexemes)];
2. or ‘C’ = ‘B’, i.e., B has (in the dictionary) the corresponding signified;
and
a. ‘B’ cannot be expressed with A by any otherwise
possible synonym of B;
or b. ‘B’ includes (an important part of) the signified
‘A’, that is, it is utterly specific, and this B is ‘bound’ by A].
Examples (lexeme A is in small caps)
Case 1a : collocations with support (= ‘light’) verbs, such as [to] do a FAVOR,
[to] give a LOOK, [to] take a STEP, [to] launch an APPEAL, [to] lay SIEGE [to
N].
Case 1b : collocations such as black COFFEE, French WINDOW, Fr. BIÈRE
bien frappée <*battue> ...
Case 2a : collocations with intensifiers, such as strong <*powerful> COFFEE,
heavy <*weighty> SMOKER, deeply <*profoundly> MOVED, [to]
ILLUSTRATE vividly.
Case 2b : collocations such as The HORSE neighs, aquiline NOSE, rancid
BUTTER or artesian WELL.
•
Ces différentes définitions mettent en jeu un ensemble de paramètres
qu’il conviendra d’examiner de plus près.
5
Paramètres définitoires des collocations
Plusieurs critères définitoires sont proposés dans les définitions
« lexicales » de la notion de collocation si l’on se base sur les définitions
classiques des auteurs de référence.
-
La fréquence de la cooccurrence des éléments
Ce critère, qui apparaissait essentiel dans la tradition contextualiste, est
exploité de façon informelle chez Cruse (« habitually cooccur »), est défini
comme élément nécessaire (mais non suffisant) chez Bartsch. L’utilisation
de seuils précis permet n’apparaît pas inutile en linguistique de corpus, et
évite d’une certaine façon l’arbitraire.
On notera que le critère statistique est absent chez Hausmann et Mel’čuk.
Bartsch (2004 : 76-77)
Collocations are lexically and/or pragmatically constrained recurrent
cooccurrences of at least two lexical items which are in a direct
syntactic relation with each other.
-
The following criteria are employed in the empirical part of the study for the
computer-aided extraction of collocation candidates from the corpus:
L’aspect arbitraire (la non prédictibilité) de l’association lexicale :
La réalisation lexicale de collocation n’est pas prévisible (Hausmann : “ [la]
transparence n’empêche nullement la collocation d’être imprédictible ”). Si
13
torrentielle peut en effet apparaître en cooccurrence avec pluie, cela paraît
nettement moins naturel avec précipitations torrentielles. Cela est encore plus
manifeste pour les collocations imagées du type appétit d’ogre ou faim de loup
(vs. ?appétit de loup et ?faim d’ogre).
Il faut cependant tempérer cette affirmation en signalant :
1) que les associations sont peut-être arbitraires lexicalement mais
qu’elles concernent des parties du discours précises, comme cela
est souligné par Hausmann,
2) que certaines relations sémantiques et syntaxiques favorisent
l’apparition des collocations (le modèle des fonctions lexicales
code précisément ces relations syntactico-sémantiques),
3) que dans de nombreux cas, on peut expliquer la cooccurrence des
éléments de la collocation à l’aide de principes sémantiques.
Nous reviendrons sur ces points plus loin dans le cours.
de constituants (plutôt que de lexies) pour englober des exemples comme
les suivants, pour lesquels l’élément qualifiant se ré alise par un syntagme : il
y a ici association d’un mot (par exemple, fort, bruit) avec un syntagme (comme
un turc, à crever les tympans). Il paraît en revanche justifié de considérer les
collocations comme constituées de deux parties dont le statut est d’ailleurs
inégal. Il arrive cependant que des expressions englobent davantage que deux
termes : essuyer un échec cuisant, avoir une peur bleue. Dans la plupart des cas, il est
possible de considérer qu’on a simplement affaire à deux collocations
distinctes qui ont été fusionnées et sont ici superposées : essuyer un échec et
échec cuisant, avoir peur et peur bleue, même si la fusion est parfois bloquée,
essentiellement pour des raisons syntaxiques. Nous avons montré
récemment (Tutin, 2008) que de nombreuses collocations considérées
comme ternaires, pouvaient en fait être analysées comme des superpositions
de collocations, ou des collocations récursives.
-
-
La transparence sémantique de la collocation.
Cruse et Hausmann soulignent que les collocations peuvent être facilement
interprétées par le locuteur, même si leur forme n’est pas prévisible. Leur
sens se déduit, même s’il apparaît difficile de prévoir la réalisation lexicale
des éléments. Les exemples de Hausmann (célibataire endurci, feuilleter un livre)
seront facilement compris par un locuteur non natif du français qui serait
toutefois tout à fait incapable de les produire spontanément. Pour Mel’čuk,
les choses sont un peu plus complexes. Dans certains cas de figure, le sens
n’est pas réellement transparent. C’est le cas d’expressions comme peur bleue
ou colère noire, généralement intégrées dans la définition de collocation, dont
l’adjectif n’est pas immédiatement interprétable. La “ transparence ” ne
caractérise donc peut-être pas l’ensemble de la classe. Bartsch, comme
Mel’čuk, considère que les collocations peuvent comporter une part
d’opacité sémantique telle que le sens de la collocation n’apparaît pas
déductible du sens des composants.
Mel’cuk et Hausmann considèrent tous deux que les composants de la
collocation n’ont pas le même statut. (Hausmann : “ Dans la collocation, le
statut des deux partenaires combinés n’est pas égal. ”). Pour Hausmann, un
élément est autonome (la base), il a son sens habituel. L’autre (le collocatif)
dépend du premier, qui conserve son sens habituel. Mel’čuk propose une
analyse comparable.
Cette dissymétrie de la collocation a été remise en question par plusieurs
linguistes comme Bartsch, qui ne l’emploie pas. Force est de constater
néanmoins qu’elle est institutionnalisée dans les dictionnaires de collocations
où les informations collocationnelles sont généralement entrées sous l’article
de la base (Par exemple, faire peur, avoir peur ou peur bleue S.V. peur). Nous
reviendrons sur ce point plus loin.
-
-
La dissymétrie des composants de la collocation (un élément
conserve son sens habituel).
La notion de sélection lexicale
Le caractère binaire de la collocation
Pour Mel’čuk et Hausmann, les collocations doivent surtout être envisagées
dans le cadre de la production, l’encodage. Hausmann (1989) suggère que la
base impose la sélection du collocatif. Cette perspective apparaît encore plus
claire pour Mel’cuk. Pour lui, il y a collocation, lorsque, voulant “ produire ”
Pour Hausmann comme pour Mel’čuk, la collocation est essentiellement
constituée de deux mots ou de deux lexies. Cette bipartition n’est pas aussi
marquée chez Cruse ou Bartsch. Même si ce caractère duel est vérifié dans la
plupart des collocations, il nous paraît plus pertinent de parler d’association
14
une suite de deux expressions, le choix d’une des expressions n’est pas libre,
mais imposé par l’autre élément.
-
Dans ce cas, on peut décomposer la collocation comme
deux collocations superposées : avoir faim + faim de loup. Les
deux expressions apparaissent indépendamment.
- comme des collocations qui s’appliquent de façon
récursive :
ce
problème
l’a
mis
en
colère.
en colère peut être analysé comme une collocation. Cette
expression entre elle-même dans une collocation plus large
mettre en colère (ou être en colère). En colère peut se rencontrer en
dehors de ces environnements :
Je ne l’ai jamais vu en colère.
La question de la binarité des collocations est un point
important dans la modélisation lexicographique des
collocations, comme on le verra au chapitre 4.
La relation syntaxique entre les deux composantes de la
collocation
Les éléments de la collocation doivent entretenir une relation syntaxique. Ce
point important est souligné par Hausmann (qui donne cependant une
définition trop restreinte des schémas syntaxiques possibles) et par Bartsch.
Ce point distingue la définition « continentale » de nombre de définitions de
la tradition contextualiste anglaise.
6
Une définition de travail pour les collocations
-
Des associations qui présentent des propriétés syntaxiques
spécifiques :
o Les éléments de la collocation entretiennent (ou peuvent
entretenir) une relation syntaxique directe de type sujetverbe, verbe-complément, nom-épithète, … qui peut facilement
être représenté par des grammaires de dépendance à la Tesnière.
o Les collocations sont généralement des expressions
polylexicales endogènes, qui se forment pour la plupart
d’entre elles à l’aide des règles habituelles de la syntaxe.
Ainsi, une expression comme pèse-bébé ne peut pas être une
collocation.
o Il arrive cependant que certaines collocations présentent un
construction syntaxique atypique comme dans ivre mort ou
amour haine.
-
Sur le plan sémantique, les collocations présentent les propriétés
suivantes :
o Elles sont en partie (ou parfois complètement
compositionnelles).
Un élément de la collocation conserve son sens habituel. L’autre
élément peut être relativement régulier (gros fumeur), transparent
en analyse (ou reconnaissance) (un appétit d’ogre) ou relativement
opaque (peur bleue).
Dans le cadre du cours, nous adoptons l’approche « continentale » sur les
collocations.
Voici un ensemble de critères que nous retiendrons pour définir les
collocations :
-
Les collocations sont des associations mettant en jeu
(prototypiquement) deux éléments linguistiques sémantiquement
pleins :
o Nous excluons ainsi les associations d’un élément lexical plein
avec un mot grammatical. Par exemple, dans :
Il donne le livre à Max.
donner à ne sera pas considéré comme une collocation.
En revanche, dans :
Elle a commis ce crime par amour.
par amour pourra être considéré comme une collocation, car la
préposition, ici pleine, indique la cause.
o La plupart des collocations qui semblent comporter davantage
que deux termes peuvent être analysées :
- comme des superpositions de collocations :
il avait une faim de loup.
15
o
o
Les collocations peuvent généralement être analysées comme
des relations de type prédicat-argument. L’élément qui
conserve son sens habituel est l’argument, alors que l’élément
plus imprédictible est le prédicat. Dans appétit d’ogre , d’ogre est un
prédicat qui intensifie l’argument appétit . Dans donner faim,
donner est le prédicat causatif qui porte sur l’argument faim.
On appelle généralement base l’élément stable et prédictible de
la collocation, alors que l’élément moins prédictible est appelé
collocatif. Dans donner faim, faim serait le collocatif et faim serait
la base.
ou un syntagme prépositionnel :
ennuyeux comme la pluie
….
Collocations nominales :
o Où le collocatif est un adjectif :
perte abyssale
o Où le collocatif est un complément nominal :
temps de chien, hypothèse de départ
où la base est le complément de nom :
bouffée de haine, histoire d’amour
o
-
…
-
7
Sur le plan de l’usage, les éléments de la collocation apparaissent de
façon récurrente. Si le sens de la collocation est souvent transparent, les
éléments qui la lexicalisent sont souvent arbitraires. Les locuteurs non
natifs comprennent ainsi souvent les collocations mais ne savent pas
nécessairement comment les produire. C’est pourquoi la question des
collocations apparaît essentielle en didactique du lexique et est beaucoup
étudiée dans ce cadre. Ces expressions polylexicales doivent être
apprises et mémorisées.
Nous avons proposé une classification sémantique prenant en compte
l’opacité du collocatif (Tutin & Grossmann 2002).
- Sont considérées comme collocations opaques les collocations dans
lesquelles le sens du collocatif n’est ni prédictible, ni transparent : peur
bleue, colère noire.
- Les collocations transparentes sont difficilement prédictibles sur le
plan lexical, mais transparentes en compréhension : triste à pleurer, bête à
manger du foin, courir à perdre haleine.
- Les collocations régulières sont transparentes et généralement
prédictibles (l’usage est ici déterminant) : gros mangeur, tristesse affreuse.
Elles sont préférées par les locuteurs natifs.
Classification des collocations
Les classifications syntaxiques prennent souvent en compte la structure
syntaxique des collocations, par exemple :
- Collocations verbales
o Où le collocatif est sujet :
la peur paralyse
o ou complément nominal :
mourir de peur
o ou un constituant infinitif :
rire à pleurer
…..
- Collocations adjectivales :
o Où le collocatif est un autre adjectif :
ivre mort
o ou un adverbe :
immensément riche
Bibliographie
Bartsch S. (2004), Structural and functional properties of collocations in English, A
corpus study of lexical and pragmatic constraints on lexical co-occurrence.
Tübingen, Narr.
Cruse D.A. (1986). Lexical Semantics. Cambridge. London, Cambridge
University Press (Cambridge Textbooks in Linguistics).
Firth J.R. (1957) : Papers in Linguistics 1934-1951. Oxford, Oxford University
Press.
Halliday, M.A.K., Hasan, R. (1976) : Cohesion in English. London, Longman.
Hausmann F. J. (1989), Le dictionnaire de collocations. In Hausmann F.J.,
Reichmann O., Wiegand H.E., Zgusta L. (eds), Wörterbücher : ein
internationales Handbuch zur Lexicographie. Dictionaries. Dictionnaires.
16
A. Tutin : Sémantique – Modélisation des associations lexicales - UFR des Sciences du Langage, Université Stendhal Grenoble 3
Berlin/New-York : De Gruyter. 1010-1019.
Mel’čuk I. (1998). Collocations and Lexical Functions. In A. P. Cowie (ed.),
Phraseology. Theory, Analysis and Applications. Oxford, Clarendon Press,
23-53.
Sinclair J. (1991) : Corpus, Collocation, Collocation. Oxford, Oxford University
Press.
Exercice 1 : Pour chaque collocation suivante, indiquez
a) la base et le collocatif,
b) la structure générale de la collocation (type syntaxique de la
collocation)
c) la relation syntaxique entre la base et le collocatif,
d) le type sémantique de la collocation.
Exercice 2 :
Collocation ou pas collocation ? Telle est la question du lexicographe.
Imaginez que vous ayez à sélectionner les collocations pour un
dictionnaire comme le TLF, qui comporte un champ syntagme.
Dans la concordance suivante (extrait du mot amour dans Une vie de
Maupassant), quelles expressions aimeriez-vous sélectionner comme
collocations ? Les collocations sont-elles nombreuses ?
it heureuse d'être enfermée dans cette aventure d'amour qui parlerait sans cesse à sa pensée des espoirs
un souffle de bonheur. Et elle se mit à rêver d'amour. L'amour ! Il l'emplissait depuis deux années d
l'haleine du printemps lui eût donné un baiser d'amour. Tout à coup, là-bas, derrière le château, sur
he mystérieuse de bonheurs planant sur elle. Un amour de la solitude l'envahissait dans la douceur de c
ut-il comme elle envahi par une sorte d'ivresse d'amour ? ou bien, savait-il seulement par expérience qu'
amps, elle ne songeait encore qu'à la poésie de l'amour, et fut surprise. Sa femme ? ne l'était-elle pas
Tutin A. (2008), For an extended definition of lexical collocations, Proceedings
of Euralex, Barcelone 15-19 juillet 2008, Université Pompeu Fabra.
Williams G. (2003). Les collocations et l’école contextualiste britannique » In
F. Grossmann et A. Tutin (éd.). Les collocations : analyse et traitement,
coll. Travaux de recherches en linguistique appliquée, Paris :
Éditions De Werelt, p. 33-44.
Les critères proposés sont-ils faciles à appliquer ? Observe-t-on des
exceptions ?
Le gilet est bleu ciel.
Il est bête à manger du foin.
Nous avons crié haut et fort notre attachement à ce principe.
Jean est ivre de colère.
Je vous remercie infiniment de votre bienveillance.
on mystérieuse de ce qui est le grand secret de l'amour. Sans qu'elle eût entendu monter l'escalier, on
les tapisseries du mur, sur la vieille légende d'amour qui enveloppait sa chambre. Mais, comme Julien
e courant. Soudain Jeanne eut une inspiration d'amour. Elle emplit sa bouche du clair liquide, et, les
'intimité enfantine et charmante des niaiseries d'amour, des petits mots bêtes et délicieux, le baptême a
s où ses illusions étaient écloses, son attente d'amour se trouvait tout de suite accomplie. L'homme espé
Julien, pour la première fois, lui avait parlé d'amour ; et elle resta là, rêvassant, presque sans songe
ait d'elle, s'il lui parlait même ; toute trace d'amour avait subitement disparu ; et les nuits étaient r
mable comme autrefois. Ses larges yeux, miroirs d'amour, étaient redevenus caressants ; et ses cheveux, t
lus exaltée qu'elle avait été plus déçue dans son amour, plus trompée dans ses espérances. Il lui fallait
des souvenirs attendris des premiers temps de son amour ; non qu'il lui revînt au coeur un renouveau d'af
e de l'affreux secret n'amoindrirait-elle pas son amour filial ? L'embrasserait-elle des mêmes lèvres pie
ités, son dégoût des préoccupations humaines, son amour de Dieu, son inexpérience juvénile et sauvage, sa
de lui. Le printemps était venu, ravivant leur amour, les jetant chaque jour aux bras l'un de l'autre,
ec mère et tante. Ils avaient maintenant un grand amour pour la culture de la terre ; et tous trois plant
lettres de cette créature qui paraissait folle d'amour pour lui. Elle parlait d'un voyage en Angleterre,
affreuse de désespoir, embrassant, en des élans d'amour exalté, tout ce qu'elle ne pouvait prendre avec e
plus longtemps sans reconnaître publiquement son amour et son dévouement si fidèles. Elle a du reste de
Chapitre 3 : Collocations et motivation
Il est intéressant de remarquer que la quasi-totalité de ce type de schémas a une
fonction sémantique intensive, comme si le schéma produisait en quelque sorte le
sens intensif, quel que soit le contenu lexical de l’expression. On peut ainsi relever
dans Frantext des expressions peu stéréotypées mais pour lesquelles le sens
intensif est néanmoins associable, comme le suivant :
Les collocations sont souvent présentées comme des associations arbitraires, mais
ce point de vue peut, selon nous, être tempéré, en tout cas pour nombre de
collocations. On repère en effet de nombreuses zones de régularités, tant
syntaxiques, que sémantiques dans ces associations. On a déjà vu au chapitre
précédent que les collocations présentaient des schémas syntaxiques réguliers
(structures syntaxique endogènes), communs pour la plupart avec les expressions
« libres ». Sur le plan sémantique, de nombreuses régularités se font jour, d’une
part, en ce qui concerne le type de relations liant les éléments de la collocation, et
d’autre part, dans les interactions sémantiques entre les éléments de la collocation,
comme nous le verrons dans une étude de cas autour des noms d’émotion.
1
R529/ BOULANGER.D / LE TEMERAIRE / 1962
page 43 / III
Que c'était long à crever ce cri déchirant, de plus en plus vif, de plus en plus
en sang, de plus en plus, ah vite !
1.2
Des relations sémantiques productives
1.1
Certaines relations sémantiques sont particulièrement productives. Le
modèle des fonctions lexicales standard, utilisé dans le cadre du Dictionnaire
Explicatif et Combinatoire développé par Igor Mel’cuk et ses collègues à
l’Université de Montréal, rend compte de ces relations.
Des schémas syntaxiques auxquels on peut associer des
instructions sémantiques : « comment la syntaxe produit
du sens »
On relève que dans de nombreuses collocations, les collocatifs utilisent des
schémas syntaxiques spécifiques auxquels on peut associer des sens spécifiques.
C’est en particulier le cas des structures comparatives comme les suivantes qui ont
généralement un sens intensif :
-
Des relations sémantiques productives entre la base et le
collocatif : le modèle des Fonctions Lexicales
Les FL associent “ un sens très général et abstrait ” à “ un rôle syntaxique
profond, qui peut s’exprimer lexicalement de plusieurs façons selon l’unité
lexicale à laquelle ce sens s’applique ” (Mel’čuk 1998 : 32).
• Exemple : la fonction Magn (qui exprime l’intensité) s’appliquant à peur
(ici, la base) produira des mots comme bleue, intense, grande, panique…
Adj comme N : pâle comme la mort, rusé comme un renard, beau comme un
astre…
V comme N : pleurer comme une Madeleine, rire comme un bossu, …
Adj à Vinf : triste à pleurer, ennuyeux à mourir, …
V à Vinf : geler à pierre fendre, pleuvoir à boire debout (Québec) …
Elles sont de la forme f(x) = y
x : argument (mot-clé).
y : valeur(s).
18
Funci : verbe support qui prend comme sujet le mot-clé et le i-ème
actant comme premier complément du verbe.
Magn(fort) = comme un turc.
Magn(peur) = bleue, grande, immense …
Magn(travailler) = d’arrache-pied, énormément, comme un fou
Func2(douleur) = se manifester dans
Laborij : verbe support qui prend comme sujet le i-ième actant comme
sujet, le j-ième comme premier complément du verbe et le mot-clé
comme deuxième complément du verbe.
Les FL standard :
• reçoivent une étiquette conventionnelle : Magn (intensité), Oper
(verbe support), Ver (tel qu’il doit être) … (nom choisi d’après le latin).
• Ont les propriétés suivantes :
o La FL est généralement productive : il y a beaucoup de
valeurs pour ce sens dans la langue.
o La FL a généralement beaucoup de valeurs.
o La FL se retrouve dans beaucoup de langues.
• Une cinquantaine de FL standard.
Labor12(interrogatoire) = soumettre
Verbes phasiques
Verbes exprimant le début, la fin et la continuation d’un procès.
Se combinent généralement avec une FL verbale (d’où la classification dans
les FL syntagmatiques).
IncepOper1(amour) = tomber (Qu.)
FinOper1(patience) = perdre
ContOper1(sang froid) = garder
Les FL non standard couvrent des cas moins productifs.
• Ex : ‘ qui est présente à la naissance ’ (maladie) = congénitale.
•
Quelques exemples de FL syntagmatiques très productives :
Modifieurs adjectivaux ou adverbiaux
Verbes supports (terme de M. Gross.
Magn(peur) = bleue, intense, panique …
Ver(argument) = valable
Bon(conseil) = précieux
Verbes qui sont sémantiquement vides en cooccurrence avec des noms
(prédicatifs). D’après la Grammaire Méthodique du Français (1994 : 232) : “ On
appelle verbes supports des verbes comme faire, donner, mettre, etc., qui, à côté
de leurs emplois ordinaires, se combinent avec un nom, un adjectif ou un
groupe prépositionnel pour construire une forme complexe
fonctionnellement équivalente à un verbe. ” Dans les verbes supports, la
prédication est portée par le nom, non par le verbe.
Quasi-méronymes (plus moins des relations partie-tout)
Sing(savon) = barre
Mult(soldat) = régiment
Culm(bonheur) = comble
Culm(carrière) = sommet
Operi : verbe support qui prend comme sujet le i-ième actant comme
sujet et le mot-clé comme premier complément du verbe.
Oper1(visite) = rendre
Oper2(visite) = recevoir
19
2
Des associations lexicales motivées entre base et
collocatif
Comme on l’a vu au chapitre précédent, certaines collocations peuvent d’une
certaine façon être considérées comme transparentes ou régulières, car le
collocatif est facilement compréhensible, voire explicable. Nous aimerions
montrer dans cette partie que pour nombre de collocations, la cooccurrence entre
base et collocatif (et le choix lexical) n’est pas fortuite, mais explicable à l’aide de
règles de sélection sémantiques, parfois un peu complexes à mettre en évidence.
Notre démonstration s’appuiera ici sur le champ sémantique des noms d’émotion
et les collocatifs d’intensité (Grossmann & Tutin 2007), mais elle pourrait être
étendue à d’autres champs sémantiques.
Voici une synthèse de ce traitement :
2.1
Les noms de joie et les intensifieurs
L’objectif dans ce travail était de montrer que les associations lexicales
collocatives étaient motivées par la structure sémantique des composants de la
collocation. Pour ce faire, nous avons d’abord dans un premier temps, analysé la
structure sémantique des composants.
2.1.1
Polarité Qualité
Etat
Bonheur
Chagrin
++
+
+
-
-
Désespoir
Gaieté
Joie
Peine
Tristesse
++
+
+
+
+
+
+
-
+
+
Les noms de « joie »
Intériorité Contrôle
+
+
Dynamis
me
-
+
+
+
+
+
+
-
+
+/+
+
?
+
+
?
+
-
Tableau 1 : Description des noms de joie à l’aide de dimensions
Pour les noms de sentiment, nous avons limité notre étude aux noms de joie (et
leurs antonymes), en sélectionnant les noms les plus fréquents dans un corpus
contemporain de Frantext : joie, bonheur, gaieté, désespoir, tristesse, chagrin, peine. Nous
avons caractérisé ensuite ces noms à l’aide de dimensions sémantiques.
Intensité
2.1.2
Les adjectifs intensifieurs
Les Adjintens apparaissant en cooccurrence avec les Ndj sont extrêmement
variés et peu d’entre eux se combinent avec l’ensemble des Ndj. Ils sont peu
idiosyncrasiques (beaucoup apparaissent avec plusieurs Ndj), et sont peu
idiomatiques (i.e. facilement interprétables par des règles de
compositionnalité). Les données, comportant a priori peu d’anomalies,
semblent donc aller dans le sens de notre hypothèse. Cependant, la
distribution des AdjIntens les plus fréquents, semble aléatoire et laisse un
peu perplexe.
L’intensité.
La polarité (agréable ou désagréable, positif ou négatif).
La qualité (= disposition du sujet).
L’état (duratif).
Le dynamisme (mouvement intérieur ou extérieur).
L’intériorité (une émotion intérieure est une émotion qui ne s’extériorise
pas).
Le contrôle : Le Ndj envahit, submerge l’individu qui perd le contrôle sur
l’émotion ressentie. Cette dimension est bien entendu corrélée à
l’intensité.
Bonheur
20
Gaieté
Joie
Tristesse
Grand (a) 112
Vrai (a)69
Petit (a) 47
Pur (a) 19
Parfait (p) 18
Immense (a) 10
Absolu (p) 10
Intense (p) 9
Immense (p) 7
Parfait (a) 6
Grand (a) 4
Vrai (a) 2
Fou (p) 2
Gros (a) 2
Franc (a) 2
Réel (a) 1
Eclatant (p) 1
Léger (a) 1
Formidable (a) 1
Grand (a) 169
Immense (a) 24
Profond (p) 24
Immense (p) 19
Pur (p) 12
Petit (a) 11
Enorme (p) 11
Fou (p) 8
Terrible (p) 7
Gros (a) 6
Grand (a) 40
Profond (p) 13
Profond (a) 11
Infini (a) 11
Immense (a) 9
Infini (p) 8
Affreux (a) 7
Immense (p) 5
Indicible (a) 4
Indicible (p) 3
Il convient alors, comme pour les noms, de proposer une analyse des
dimensions sémantiques des adjectifs.
• Mesure. Cette dimension apparaît pour les adjectifs qui s’appliquent
prototypiquement à des grandeurs physiques2 et offre un moyen
standard de coder l’intensité des Ndj.
• Authenticité (vrai, réel …).
• Complétude. Cette dimension, qui décrit la plénitude de l’émotion
ressentie.
• Incommunicabilité (ineffable, indicible).
• Manifestation (traduit extériorité).
• Polarité.
• Temporalité.
L’analyse est résumée dans le tableau 3.
Désespoir
Chagrin
Peine
Grand (a) 10
Profond (a) 6
Total (p) 6
Immense (a) 5
Affreux (p) 4
Absolu (p) 3
Atroce (a) 3
Vrai (p) 2
Violent (p) 2
Parfait (a) 2
Grand (a) 30
Gros (a) 13
Vrai (a)10
Petit (a) 7
Profond (p) 5
Immense (a) 3
Affreux (a) 3
Véritable (a) 3
Infini (a) 2
Immense (p) 2
Grand (a) 14
Vrai (a) 4
Profond (p) 4
Immense (p) 4
Gros (a) 3
Infini (p) 3
Affreux (a) 2
Horrible (a) 2
Petit (a) 2
Affreux (p) 2
Tableau 2 : Les adjectifs intensifieurs les plus fréquents avec les noms de joie
Seuls grand et vrai (que nous considérons ici comme un intensif) apparaissent
avec l’ensemble des Ndj. Les généralisations, si elles sont possibles, ne
seraient donc pas très productives au niveau de la classe des Ndj. Par ailleurs,
il saute aux yeux que de nombreux Adjintens, hormis grand et vrai qui
semblent des intensifs “ à tout faire ”, s’emploient avec d’autres types de
noms d’émotions que les Ndj : un ennui profond, une envie folle, etc. Nous
faisons l’hypothèse que certains Adjintens s’associent de façon privilégiée
avec certaines dimensions (profond par exemple semble fonctionner avec
l’intériorité).
2 L’adjectif grand, appliqué à la taille d’un individu, signale que celui-ci dépasse la moyenne.
Immense signifie littéralement “ qui n’a ni borne ni mesures ”, etc.
21
Mesure
Absolu (p)
Affreux (ap)
Atroce (a)
Enorme (p)
Fou (p)
Franc (a)
Fugitif (p)
Grand (a)
Gros (a)
Immense (ap)
Indicible (ap)
Ineffable (ap)
Infini (ap)
Intense (p)
Léger (a)
Parfait (ap)
Petit (a)
Profond (ap)
Pur (ap)
Terrible (p)
Total (p)
Violent (p)
Véritable (a)
Vrai (ap)
Authenti Complétud
cité
e
Incommunic
abilité
Manifestati
on
Polarité
Temporalit
é
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
Tableau 3 : Les dimensions des Adjintens
Une fois noms et adjectifs analysés, on peut observer le fonctionnement des
affinités et proposer des principes d’appariement qui permettront de rendre
compte de la cooccurrence.
22
2.1.3
Les remarques qui précèdent débouchent sur l'idée que, hors le cas des
intensifs standard du type GRAND, les AdjIntens permettent
l'intensification des Ndj sur différentes dimensions. Les affinités lexicales
offrent au locuteur un choix restreint lié aux dimensions qu'il veut
sélectionner.
Principes d’appariement
L’observation des cooccurrences et des dimensions dégagées permet de proposer
un ensemble de principes de cooccurrences expliquant les appariements.
a. Renforcement

En bref, peu de collocatifs s’associent fréquemment avec l’ensemble des
noms d’un champ sémantique homogène. L’étude lexicale fine des
composantes sémantiques des éléments de la collocation montre que les
associations ne sont pas aléatoires, mais régies par des principes
d’appariement réguliers. Les associations lexicales ne peuvent donc pas dans
ce cas être véritablement considérées comme arbitraires.
Si le nom comporte déjà le trait intensif, l’utilisation de l’adjectif intensif
conduit à un renforcement. Dans ce cas, la tendance observée est l’utilisation
d’un intensif adjectival de degré élevé (souvent un superlatif). Le désespoir se
définit comme une “ très forte émotion désagréable ” (DEC) ou comme une
“ extrême affliction ” (TLF et PR). Petit désespoir ne pourrait guère être utilisé
qu’ironiquement ; grand (a) est utilisé 40x dans le corpus avec tristesse contre
seulement 10x avec désespoir (sur 335 co-occurrences) : le désespoir, par
définition est grand, et si on veut l’intensifier, il vaut mieux utiliser un
intensif plus fort (désespoir immense : 5x ; désespoir total : 6x).
Bibliographie
Mel’čuk I. (1998). Collocations and Lexical Functions. In A. P. Cowie (ed.),
Phraseology. Theory, Analysis and Applications. Oxford, Clarendon Press,
23-53.
Grossmann F., Tutin A. (2007). Motivation of Lexical Associations in
Collocations : the Case of Intensifiers denoting ‘Joy’, Festchrift in
Honour of Igor Mel’čuk, Leo Wanner (ed), Benjamins, 139-165.
b. Convergence de polarité
Si la base comporte le trait de polarité agréable, le collocatif revêt en
principe le trait “ appréciatif ”, ou un trait neutre. Même chose en ce qui
concerne le trait de polarité désagréable. L’exemple qui illustre le mieux ce
principe est celui de l’adjectif affreux, de polarité dépréciative, qui n’exprime
l’intensité qu’en cooccurrence avec un substantif orienté négativement
comme déesespoir.
c. Cohérence avec le type sémantique du Ndj
Exercice 1 :
Par analogie avec les FL rencontrées dans les exemples, déterminez les FL
qui rendent compte des collocations suivantes :
Certains noms ont une certaine ambivalence, inhérente à leur sémantisme, et
peuvent dénoter une émotion au sens strict, mais parfois aussi un état ou une
qualité. Certaines contraintes de sélection liées aux AdjIntens peuvent
favoriser ou bloquer l'association avec ces noms polysémiques. Par exemple,
absolu ou total semblent convenir à un Ndj qui peut se traduire par un état,
comme bonheur ou désespoir, tandis qu'ils apparaissent quasiment impossibles
avec un Ndj comme chagrin. Un Ndj comme gaieté, qui peut être considéré,
dans certains de ses emplois, comme un nom de qualité (cf. elle était d'une
gaieté folle) peut plus facilement que d'autres, semble-t-il, être associé à des
adjectifs marquant la manifestation.
prendre peur
une hypothèses adaptée
un séjour de rêve
un essaim d’abeilles
assister à un cours
la peur gagne (qqun)
une bouffée de haine
Que pensez-vous du codage des Fonctions Lexicales ?
23
A. Tutin : Sémantique – Modélisation des associations lexicales - UFR des Sciences du Langage, Université Stendhal Grenoble 3
Chapitre 4 : Modélisation des collocations dans les
dictionnaires spécialisés
Le repérage et l’étude des propriétés des expressions polylexicales doit permettre
de déboucher sur une modélisation de ces expressions adaptée, et permettant de
déboucher sur des propositions de description concrètes en linguistique
appliquée, qu’il s’agisse de la lexicographie, du traitement automatique des langues
ou des applications en didactique des langues.
-
OCDSE : Oxford Collocations Dictionary for students of English (2002), Crowther,
J. et al. Oxford, Oxford University Press.
L’OCDSE , le dernier né des dictionnaires anglais de collocations, présente une
nomenclature riche (9000 mots clés). Voici ci-dessous un exemple d’article pour
le mot flower.
Dans ce chapitre, nous nous intéresserons particulièrement aux applications
lexicographiques, en particulier autour du codage des collocations. Signalons aussi
qu’en traitement automatique du langage, la modélisation des expressions
polylexicales fait aussi l’objet de nombreuses modélisations, parfois complexes.
3
Dictionnaires de collocations : des ouvrages récents
L’encodage des expressions polylexicales dans les dictionnaires est directement
relié est la modélisation linguistique qu’on en propose. Depuis quelques années,
l’intérêt croissant des études sur la phraséologie a permis de déboucher sur des
produits lexicographiques plus innovants, qui distinguent les différents types
d’expressions polylexicales. On a ainsi vu apparaître dans les pays anglo-saxons, à
côté des classiques dictionnaires d’ idioms, des dictionnaires de collocations dès les
années 80. La plupart de ces dictionnaires sont explicitement destinés aux
apprenants de l’anglais langue étrangère. Voici quelques-uns de ces dictionnaires :
-
BBI : The BBI dictionary of English word combinations , Benson M., Benson E.
and Ilson R. Amsterdam ; Philadelphia, J. Benjamins. Première édition :
1986.
LTP : Dictionary of selected collocations (1997), Hill J., Lewis M. Hove, Language
teaching publications LTP.
Fig. 1 : L’article du mot flower dans le OCDSE
collocations : la collocation est codée à partir de la base, qui est l’élément
stable et « normal » de la collocation. Ainsi, par exemple, la collocation
soulever l’admiration est codée dans l’article de admiration dans le Dictionnaire des
cooccurrences de Beauchesne.
Cette façon de faire pose peu de problèmes lorsque la distinction entre base
et collocatif est claire, mais peut apparaître problématique lorsque l’analyse
est plus délicate. C’est souvent le cas de certaines expressions de structures
N prep N comme meute de chiens. Doit-on considérer meute comme une sorte
de quantifieur, auquel cas le terme chien peut être considéré comme la base ?
Ou bien doit-on considérer le terme meute comme étant précisé
sémantiquement par chien, et ici c’est meute qui serait la base ? Les cas
ambigus comme ceux-ci peuvent donc conduire à deux analyses, et les
dictionnaires de collocations devraient ici proposer une double entrée pour
ces éléments.
Le traitement des collocations atypiques, comme les coordinations (sain et
sauf, pur et dur …) ou les collocations ternaires est également problématique.
Plusieurs types de traitement sont proposés selon les dictionnaires.
Dans le domaine français, la lexicographie est moins riche dans ce champ. Les
dictionnaires de collocations y sont aussi plus récents, si l’on excepte le Dictionnaire
Explicatif et Combinatoire, qui n’a pas une vocation grand public :
- DC : Beauchesne, J. (2001). Dictionnaire des cooccurrences. Montréal, Guérin.
- DCM : Le Fur D. (Dir.) (2008). Dictionnaires des combinaisons de mots : les
synonymes en contexte. Paris, Le Robert.
- LAF : Mel’čuk I., Polguère A. (2007). Lexique Actif du Français. Bruxelles,
De Boeck.
Le LAF n’est pas exclusivement un dictionnaire de collocations, comme on
le verra plus loin.
Voici un exemple de traitement pour l’article du mot admiration dans le DC.
4.2
Le traitement syntaxique proposé dans la plupart des dictionnaires de
collocations est assez succinct et porte principalement sur les types de
constituants (Cette information est cependant absente de certains
dictionnaires de collocations comme le DC). Dans le OCDSE (Figure 1), on
indique ici généralement le constituant occupé par le collocatif en précisant
l’ordre des mots.
Dans de nombreux dictionnaires de collocations (par exemple, LTP, DC,
DCM), seules les collocations à base nominale sont traitées, et les structures
des collocations ne sont pas très diversifiées.
D’une manière générale, les informations syntaxiques sont assez succinctes
et ne permettent pas toujours facilement d’employer le dictionnaire de façon
adaptée en encodage. Par exemple, dans le DC, l’ordre des adjectifs (anté- ou
postposé) n’est pas indiqué.
Figure 2 : L’article du mot admiration dans le Dictionnaire des cooccurrences de
Beauchesne
On remarque en outre que le terme de collocation n’apparaît pas dans les titres
français (frilosité des éditeurs ? peur d’effrayer les usagers ?).
4
4.1
Le traitement syntaxique
Le codage des informations linguistiques dans les
dictionnaires de collocations
Le codage de la collocation à partir de la base
Si la dissymétrie des collocations est parfois remise en question par les
linguistes, elle est de fait institutionnalisée dans les dictionnaires de
25
4.3
Le traitement sémantique
Dans la plupart des dictionnaires de collocations, le traitement sémantique
est très restreint.
Le traitement est absent dans certains dictionnaires comme le DC où une
énumération en vrac est proposée. Le dictionnaire servira surtout d’aidemémoire dans ce cas, mais ne pourra pas être utilisé pour l’encodage.
Un traitement par rapprochement synonymique est proposé dans le DCM
ou l’OCDSE où les collocatifs sont regroupés par analogie.
Enfin, le LAF propose un encodage sémantique plus fin, à l’aide d’étiquettes
inspirées du Dictionnaire Explicatif et Combinatoire (voir chapitre 3), comme on
peut le voir dans la figure 3.
Figure 3 : Un extrait du LAF
Le traitement, inspiré du DEC, indique la structure syntaxique dans laquelle
le mot s’insère et propose les associations lexicales paradigmatiques et
syntagmatiques. Par exemple, l’étiquette Intense est utilisée pour des
associations comme grande admiration, profonde admiration ou vive admiration.
26
Exercice : Le traitement des expressions polylexicales dans le
TLFi.
Vous comparerez le traitement des expressions suivantes dans le TLFi
(http://atilf.atilf.fr/tlf.htm).
- pied fin.
- pied bot.
- pied à terre.
- pied grec.
- pied plat.
- pied noir.
Le traitement du TLF vous paraît-il adapté ?
27