Projet de thèse prioritaire

Transcription

Projet de thèse prioritaire
Projet de thèse prioritaire :
Analyse morphologique des mots construits sur base de noms d'hommes et
femmes politiques
Directrices : Fiammetta Namer & Stéphanie Lignon
Résumé
Le projet de thèse porte sur l’étude des mots construits en français à partir des patronymes
d’hommes et femmes politiques (Thatcher > thatchérien, Staline > stalinisme, Mitterrand >
mitterrandolâtre) en mettant l’accent sur les productions récentes liées aux acteurs de la vie
politique française depuis 1981 (Fabius > fabiusien, Giscard > Giscardium, Taubira >
taubiratiser). L’objectif de la thèse est double : identifier les modes de formations récurrents,
ou originaux, utilisés par les locuteurs pour créer ces mots nouveaux, et détecter la perception
que les locuteurs ont (eu) des personnalités politiques français.
Contexte
Le sujet de thèse porte sur l’étude des mots construits en français à partir des patronymes
d’hommes et femmes politiques (Thatcher > thatchérien, Staline > stalinisme, Mitterrand >
mitterrandolâtre) en mettant l’accent sur les productions récentes liées aux acteurs de la vie
politique française (Fabius > fabiusien, Giscard > Giscardium, Taubira > taubiratiser). Ce
projet de thèse s’appuie sur les travaux et les résultats du projet NHuma, financé par
l’Université de Strasbourg, puis par l’ATILF et la région Lorraine.
Les quelques études consacrées à la construction de dérivés français à partir de bases
anthroponymiques (Leroy 2004, 2005, 2008, Leroy & Roger 2014, Lignon 2000, Lignon et
Plénat 2009, Roché 2007, Roché 2011) ont montré que ce type de noms propres attirait
certains patrons morphologiques de façon préférentielle. Mais jusqu’ici, l’objet des études que
l’on peut consulter est cantonné à la description de cas particuliers.
Objectif
L’objectif de cette thèse est à la fois beaucoup plus large, car elle tend à une description de
l’ensemble des constructions morphologiques à partir de bases anthronymiques, et plus
spécifique, car le doctorant se focalisera sur les cas de mots construits à partir de bases
désignant des hommes et femmes politiques français contemporains. Il s’intéressera à la vie
politique française à partir de 1981. Le choix de cette date, comportant forcément une part
d’arbitraire, s’explique par l’existence, encore de nos jours, d’une partie des hommes et
femmes politiques d’alors.
Cette volonté de circonscrire l’objet d’étude se justifie par souci de réalisme (faire l’analyse
de la formation des mots à partir de tous les hommes/femmes politiques, quels que soient
l’époque et le lieu dans lesquels ils ont vécu, est irréaliste) et pour garantir la stabilité des
résultats obtenus : l’unité sociétale, culturelle, temporelle et spatiale permettra au doctorant de
dégager des tendances en matière d’innovation lexicale, mais également de détecter la
perception que les locuteurs ont (eu) des personnalités politiques de la France depuis 1981.
Partenariat international
En s’inscrivant comme une émanation du projet NHUMA, ce sujet de thèse pourra à la fois
profiter des travaux et résultats de ce projet, et, en retour, en nourrir les discussions. Par sa
collaboration avec NHUMA, le doctorant va intéragir avec des spécialistes des différentes
composantes des sciences du langage et regroupés autour du thème des noms d’humains,
(dont les patronymes de personnalités politiques font naturellement partie, tout en s’en
singularisant de différentes manières) : les chercheurs de Strasbourg, autour de Catherine
Schnedecker (LiLPA), de Bochum, avec l’équipe dirigée par Wiltrud Mihatsch, de
l’université d’Artois (Nelly Flaux, Grammatica), de Valenciennes (Véronique Lagae,
CALHISTE) et de Toulouse (Dejan Stosic, CLLE-ERSS)
Description du sujet de thèse
L’objectif est double, comme cela est présenté en détail dans les sections 1 et 2. Il s’agit,
premièrement (section 1), d’étudier les moyens formels susceptibles de générer des mots
nouveaux à partir de patronymes d’hommes et femmes politiques (désormais PHFP) : pour
réaliser cette étude (section 1.3), il s’agira de distinguer les règles morphologiques déjà
étudiées dans la littérature, et formant des mots à partir de noms propres en général (section
1.1) des moyens inédits, rencontrés pour la première fois avec les PHFP (section 1.2). Le
travail portera également sur la dimension sémantique de ces créations : quelle interprétation
donner aux néologismes à base PHFP, suivant qu’il s’agisse d’un verbe, d’un nom ou d’un
adjectif, et suivant la connaissance partagée que les locuteurs ont de l’action ou de la
personnalité de l’homme ou la femme politique en question.
Dans la Section 3, la démarche méthodologique nécessaire à la réalisation de ces objectifs est
présentée, démarche qui amènera le doctorant à travailler en corpus (recherche de données
authentiques, non enregistrées dans les dictionnaires).
Section 1 : étude formelle des mots nouveaux à base PHFP
Par étude formelle, nous entendons trois choses : l’identification des moyens morphologiques
(suffixes, préfixes, éléments de composition) mobilisés par les locuteurs ; l’estimation de la
proportion dans laquelle ils sont choisis pour créer des mots nouveaux ; l’analyse la forme
sous laquelle apparaît le PHFP dans ces mots nouveaux.
Section 1.1 la suffixation portant sur les patronymes en général
Une première partie de l’étude pourrait s’attacher à vérifier que les modes de dérivation les
plus fréquemment mobilisés dans les productions à base patronymique (-ien, -iste et -isme, esque) restent les plus disponibles, et que leur répartition s’effectue toujours suivant les
contraintes identifiées dans les travaux antérieurs (Leroy 2004, Lignon 2000, Lignon et Plénat
2009, Roché 2007, Roché 2011a) : par exemple, lors de la construction d’un nom commun ou
d’un adjectif, -ien est le suffixe neutre le plus employé (on parle d’époque nassérienne pour
désigner la période de gouvernement Nasser en Égypte), -iste et –isme sont les marqueurs que
les locuteurs favorisent pour désigner, respectivement un partisan (celui de Nasser était un
nassériste) et le courant politique qui s’est formé autour de la personne ainsi valorisée
(l’idéologie des nasséristes était le nassérisme) ; enfin -esque est marqué, sinon
péjorativement, du moins de façon stéréotypée : dans
« Le referendum de ce dimanche 10 décembre proposait aux caribéens de transformer leurs
Départements d’Outre-Mer en Collectivités d’Outre-Mer. 69,8% des Guyanais ont voté
« non » et chez les Martiniquais ont atteint le score chiraquesque de 78,9%. » 1
l’emploi de chiraquesque sert à évoquer (non sans une certaine dérision) le vote quasiunanime en faveur de J Chirac au deuxième tour de la présidentielle de 2001.
1
http://www.streetpress.com/sujet/144-les-martiniquais-et-les-guyanais-disent-non-a-lautonomie-accrue#
Section 1.2 les nouveaux moyens morphologiques
Un deuxième aspect du travail pourrait concerner les modes de formation moins centraux,
plus singuliers, dont l’émergence, dans le lexique actuel, semble indiquer des tendances
constructionnelles nouvelles des locuteurs : les exemples suivants illustrent l’emploi d’affixes
ou éléments de composition (notés en gras) que l’on n’associe pas habituellement aux
constructions à base patronymiques :
Mélenchonard : « le socialisme, louis-philippard ou mélenchonard »
Raffarinette : « A QUAND la « raffarinette » ? L'évolution des ventes dans l'industrie automobile
préoccupe le gouvernement. »
Chiraquie : « Coup de froid sur la Chiraquie »
Lepénomètre : « La chaîne nationale a fait bondir le lepénomètre à travers le territoire »
Vallsolâtre : « (…) un ministre qui a participé aux différentes réunions interministérielles mais
n'est pas particulièrement « vallsolâtre » »
Marinophile : « Article (…) flatteur, de la part d’un média pas franchement marinophile »
Fillonnerie : « Fillon avait glissé: «Je dois devenir important puisque Sarkozy parle de Fillonnerie.»
Ramayadisation : « Najat Vallaud-Belkacem agace au gouvernement: "elle est en voie de
Ramayadisation" »
Woertheux : « Tout va bien dans le pays Woertheux »
Bachelotade : « A quand la prochaine bachelotade ? »
Une attention particulière sera portée à la fréquence d'emploi des dérivés détectés, comme à
celle des types morphologiques, pris dans leurs globalités. Les premiers chiffres serviront à
mettre en perspective les résultats obtenus (une forme hapaxique n'ayant pas le même poids
qu'un dérivé à haute fréquence d'emploi) ; les seconds, à comparer l'impact des différents
modes de formation identifiés, dans l'évolution du vocabulaire morphologiquement construit à
base anthroponymique.
Section 1.3 Forme des patronymes dans le construit
D’un point de vue formel, le travail de thèse consistera à identifier la forme empruntée par le
patronyme dans le construit. En effet, on retrouve dans certains cas l’intégralité de la forme du
patronyme dans le construit (avec éventuellement suppression du e graphique), comme dans
hollandisme (voir aussi : Strauss-Khannien, Fabiusien, Languiste, Bartoloniste) mais ce
patronyme peut également apparaître sous forme de sigle (comme avec DSKerie) ou sous une
forme tronquée (comme avec ségomania).
Les motivations liées au choix de la forme du patronyme employé pour construire le dérivé ou
le composé sont sans doute multiples et feront appel à des paramètres structurels comme la
taille du PHFP (nombre de syllabes), sa complexité (se sert-on du nom de famille uniquement,
du prénom, des deux, le patronyme est-il composé, etc.) le type de finale présent (consonne ou
voyelle), etc.
Ces différents paramètres, outre le choix de la forme du PHFP, occasionneront également
l’apparition de variantes. En effet, la mise en contact du PHFP et de l’affixe, si elle opère
parfois par simple juxtaposition de la base et de l’affixe, comme dans mitterrandien, peut
également entraîner des phénomènes de troncation de la voyelle finale e.g. taubiresque,
d’épenthèse de consonne entre la base et l’affixe, e.g. taubiratiser, d’apparition ou de
suppression de consonnes latentes e.g. montebourgien et monterbouriste, phénomènes dont le
travail de thèse cherchera à paramétrer l’apparition.
Section 2 : interprétation des néologismes
Dans un deuxième temps, consacré à l’étude sémantico-pragmatique de ces construits, le
doctorant aura pour tâche d’analyser, à l’aide des contextes d’emploi des formes étudiées, le
sens donné au néologisme par son créateur. Il cherchera à établir dans quelle mesure il est
possible de déterminer si ce sens renvoie plutôt aux décisions prises par l’homme ou la femme
politique, et donc à sa politique, ou plutôt à sa personnalité. Il pourra se servir, dans cette
analyse, de résultats obtenus dans des travaux antérieurs en morphologie en général, (Hathout
et Namer 2014 ; Namer 2013a,b ; Namer & Jacquey 2012 ; Namer 2012 ; Namer, Bouillon,
Jacquey 2007 ; ) et des études portant sur les noms d’humains, que ce soit en sémantique
(Molino 1982 ; Gary-Prieur, 1991 ; Kleiber 2007) ou en morphologie (Dal & Namer 2010 ;
Cartoni & Namer 2012 ; Leroy 2005, 2008, ; Leroy & Roger 2014 ; Villoing & Namer 2014)
Cet examen morphologique donnera lieu à une cartographie des modes de formation
employés et de leur fréquence, de manière à offrir une image de la manière dont les locuteurs
francophones appréhendent les faits politiques, ainsi que celles et ceux qui les réalisent.
Des résultats possibles sont les suivants : à quels PHFP correspond le nombre le plus varié de
néologismes construits, le type référentiel de ces construits renvoie-t-il une image plutôt
positive, négative ou neutre de la personnalité et de l’action de l’homme ou la femme
politique en question. En particulier, il serait bon d’examiner de quelle manière il est fait
allusion aux réalisations de la personnalité politique (par le biais de verbes, par exemple), à
ses partisans ou opposants ; ou encore, ce que qualifient les adjectifs construits, et ce
qu’exprime cette qualification (est-elle objective ou subjective).
Section 3 : Méthodologie de collecte
Le doctorant s’appuiera sur deux sources de données, qui ont déjà été explorées grâce à des
outils et des méthodologies présentées dans des travaux antérieurs (Hathout et al. 2009, Dal et
Namer 2012 ; Namer 2013 (2003) ; Dal et Namer 2014) :
- le corpus frWaC qui nous assure des résultats fiables jusqu’en 2009 (date de
constitution du corpus). Conçu dans le cadre du programme WaCky (Baroni & al. eds,
2006) et mis à disposition en 2009, frWaC comporte 1,6 milliard d’occurrences et
réunit le contenu textuel de documents en ligne caractérisés par leur appartenance au
domaine français. Le contenu de ce corpus est le fruit d’une initiative visant à
reproduire, dans un format exploitable par des outils d’analyse automatique de corpus,
la diversité des contenus récents de la Toile dans des proportions comparables à
l’original, tout s’en affranchissant des moteurs de recherche commerciaux.
- La Toile, en raison du caractère immédiat et spontané des productions langagières que
l’on peut y trouver, moyennant un nettoyage des données collectées.
De façon ponctuelle, le corpus pourra être enrichi par le recours au contenu des journaux, des
émissions de radio ou télévision.
Les données de départ, collectées à partir des archives du Journal Officiel, ou de celles des
sites officiels des partis politiques, sont la liste des prénoms, noms, et, le cas échéant, sigles
et/ou surnoms des hommes et femmes ayant exercé une fonction depuis 1981 (président et
ministres, parlementaires et personnalités de la majorité et de l’opposition pendant chacune
des mandatures examinées).
Ces données sont utilisées ensuite pour construire de façon automatisée l’ensemble des
« néologismes candidats » pouvant dériver morphologiquement de ces PHFP.
Afin de pouvoir réaliser automatiquement cette étape de génération de mots « possibles », le
doctorant commencera par élaborer des règles phonographiques permettant d’envisager tous
les cas de figure possibles. Par exemple, pour la formation d’un verbe en –iser à partir d’un
PHFP, les constructions suivantes doivent être envisagées :
Si le PHFP est à finale vocalique :
• Troncation de la voyelle finale : Taubira > taubiriser
• Concaténation avec ou sans tréma sur le –i- initial : Taubira > taubiraiser /
taubiraïser ;
• Insertion d’une consonne entre la voyelle finale et l’affixe, en proposant un choix
multiple de type de consonnes : Taubira > taubira(t/s/l/ss)iser.
Si le PHFP est à finale consonantique :
• Concaténation (avec éventuellement troncation du –e graphique) : Fabius >
fabiusiser ; Hollande > hollandiser;
• Troncation de la dernière rime : Fabius > fabiser ; Hollande > holliser;
• Allographie –c/-qu-, -g / -gu- ou ge-, etc. : Chirac > chiraquiser, Montebourg >
montebourgeiser / montebourguiser-etc.
• Redoublement de consonnes : Toubon > toubonniser, Fabius > fabiussiser
Une fois établies l’ensemble de ces stratégies, celles-ci sont organisées dans un format
algorithmique permettant de générer automatiquement, pour chacune des règles
morphologiques identifiées, les candidats aux requêtes automatiques.
L’algorithme ainsi élaboré est implémenté dans un langage de programmation dédié (i.e. le
langage Perl, adapté à la manipulation de textes) de manière à engendrer toutes les formes
candidates.
Les sources de données (la Toile, frWaC) sont ensuite interrogées à l’aide de ces candidats
comme autant de requêtes, les résultats obtenus sont triés, le nombre d’occurrences utiles pour
chaque résultat non nul est mémorisé, et seuls les contextes jugés pertinents sont conservés.
C’est à partir de la liste triée, quantifiée et contextualisée résultante, traduite sous forme de
base de données lexicale (Hathout & Namer 2014) que s’effectue alors l’analyse décrite dans
les sections 1 et 2.
Ancrage dans les thématiques du laboratoire
Cette proposition de sujet de thèse prioritaire s’inscrit dans les priorités l’axe 1
« Morphologie » de l’équipe Lexique. Ce sujet bénéficie de résultats d’un travail préparatoire
qui est le fruit d’une collaboration entre plusieurs équipes françaises et allemande.
Ce travail permettra la constitution d’un corpus de néologismes et d’une grammaire de dérivés
à base nom propre d’humain, ce qui n’a jamais été fait auparavant. De plus, les résultats de
cette thèse, grâce à la nature des données utilisées comme base (les PHFP) qui bénéficient
d’un grand éclairage médiatique, pourront être partiellement utilisés à des fins de
vulgarisation de l’analyse linguistique, afin de montrer l’apport de cette analyse à la manière
dont les citoyens appréhendent les personnalités politiques.
Bibliographie citée dans le projet de thèse
Cartoni, Bruno and Namer, Fiammetta (2012). ''Linguistique contrastive et
morphologie : les noms en -iste dans une approche onomasiologique''. 3eme Congrès
Mondial de Linguistique Française (CMLF), Lyon, ILF.
Dal, G. & F. Namer (2014). Adjectifs positifs en -able et négatifs en in- correspondants en
français : ou pourquoi seuls sont importables les ordinateurs portables. CMLF, Berlin :
1741-1755.
Dal, Georgette and Namer, Fiammetta (2012). ''Faut-il brûler les dictionnaires ? Ou
comment les ressources numériques ont révolutionné les recherches en morphologie''.
3eme Congrès Mondial de Linguistique Française (CMLF), Lyon, ILF.
Dal, Georgette and Namer, Fiammetta (2010). "French property nouns based on
toponyms or ethnic adjectives: A case of base variation". Variation and Change in
Morphology (Selected papers from the 13th International Morphology Meeting, Vienna,
February 2008) Rainer, F., Dressler, W. U., Kastovsky, D. and Luschützky, H. C.
Amsterdam, John Benjamins: 53-74.
Gary-Prieur, Marie-Noëlle (1991). "Le nom propre constitue-t-il une catégorie
linguistique ?" Langue Française 92: 4-25.
Hathout, N. & F. Namer (2014). "Démonette, a French derivational morpho-semantic
network." Linguistic Issues in Language Technology 11(5): 125-168.
Hathout, N., Namer, F. 2014, “Discrepancy between form and meaning in Word
Formation: the case of over- and under-marking in French”, Current Issues in Linguistic
Theory series, numéro spécial : “Morphology and Meaning”, eds. Franz Rainer, Wolfgang
U. Dressler, Francesco Gardani and Hans Christian Luschützky. Amsterdam: John
Benjamins
Kleiber, Georges (2007). "Sur le rôle cognitif des noms propres." Cahiers de lexicologie
91(2): 151-165.
Leroy, S. (2004), Le nom propre en français, Paris ; Gap : Ophrys.
Leroy, Sarah (2005). "Les dérivés de NPr dans le TLFi : quelles bases pour quels sens ?"
Corela: http://corela.revues.org/1146.
Leroy, Sarah (2008). "Les noms propres et la dérivation suffixale." Neuphilologische
Mitteilungen: 55-71.
Leroy, Sarah and Roger, Coralie (2014). "Les verbes construits en -is(er) sur bases noms
propres". Foisonnements morphologiques. Etudes en hommage à Françoise Kerleroux.
Villoing, F., David, S. and Leroy, S. Paris, Presses universitaires de Paris ouest.
Lignon, S. (2000), La suffixation en -ien : aspects sémantiques et phonologiques. Thèse
de doctora. Université Toulouse-Le Mirail.
Lignon, S, & Plénat, M. (2009). Échangisme suffixal et contraintes phonologiques. In
Aperçus de Morphologie du français, eds. Bernard Fradin, Françoise Kerleroux and Marc
Plénat, 65-82. Paris: Presses Universitaires de Vincennes.
Molino, Jean (1982). "Le nom propre dans la langue." Langages 66: 5-20.
Namer, F. (2013a). "A Rule-Based Morphosemantic Analyzer for French for a FineGrained Semantic Annotation of Texts". SFCM 2013. Mahlow, C. and Piotrowski, M.
Heidelberg, Springer: 93-115.
Namer, F. (2013b). Adjectival bases of French -aliser and -ariser verbs: syncretism or
under-specification? Selected Proceedings of the 7th Décembrettes: Morphology in
Toulouse,. N. Hathout, F. Montermini and J. Tseng. München, Lincom Europa: 185-210.
Namer, F. and Jacquey, E. (2012). "Word Formation Rules and the Generative Lexicon:
Representing noun-to-verb versus verb-to-noun Conversion". Advances in Generative
Lexicon Theory. Pustejovsky, J., Bouillon, P., Isahara, H., Kanzaki, K. and Chungmin, L.
Dordrecht, Springer: 385-414.
Namer, F. (2012). "Nominalisation et composition en français: d'où viennent les verbes
composés?" Lexique 20: 173-205.
Namer, F., Bouillon, P. and Jacquey, E. (2007). ''A morphologically driven reference
semantic lexicon for French''. 4th Workshop on Generative Approaches to the Lexicon,
Paris.
Roché, M. (2007). Logique lexicale et morphologie : la dérivation en -isme. Dans Selected
Proceedings of the 5th Décembrettes : Morphology in Toulouse, eds. F. Montermini, G.
Boyé et N. Hathout. Somerville : Cascadilla Proceedings Project, 45-58.
Roché, M. (2011). Quel traitement unifié pour les dérivations en -isme et en -iste. Dans
Des Unités Morphologiques au Lexique, ed. M. Roché. Paris: Hermès, 69-143.
Villoing, F. & Namer, F. (2014). "Composition néoclassique en –logue et en –logiste : les
noms en -logue sont ils encore des noms de spécialistes ?" Verbum 34(2): 213-231.