Cours 1 : Introduction à la linguistique générale
Transcription
Cours 1 : Introduction à la linguistique générale
Cours : LLSDL117 : Grammaire 1 Paris X UFR LLPHi 2007/2008 Cours 1 : Introduction à la linguistique générale Bibliographie ๏ Sur la syntaxe : ‣ Delaveau. A. (2001) Syntaxe : la phrase et la subordination. Armand Colin. ‣ Creissels, D (2006) Syntaxe générale : une introduction typologique (1). Hermès. ‣ Riegel, M., Pellat, J-C., Rioul, R (1994) Grammaire méthodique du français. PUF. ๏ Sur la linguistique générale : ‣ Ferdinand de Saussure (1916) Cours de linguistique générale. Plan du cours Ce premier cours porte sur l’introduction à la linguistique générale. Nous allons d’abord présenter très brièvement l’histoire de l’apparition de la linguistique avant d’aborder l’ensemble des notions élémentaires de la linguistique, introduites par Saussure. L’exposé se poursuivra par l’étude des différents niveaux d’organisation de la langue et des unités de chaque niveau, pour se terminer par la présentation de la procédure d’identification de ces unités par le test de commutation. 1 Yayoi NAKAMURA-DELLOYE, 15 octobre 2007 Cours : LLSDL117 : Grammaire 1 Paris X UFR LLPHi 2007/2008 1. Histoire de l’apparition de la linguistique Avant le XXème siècle, la linguistique en tant que telle n’existait pas. Le langage a d’abord été étudié dans le cadre de la description de l’histoire de la littérature, puis suite à la découverte du sanskrit, le langage est devenu un objet d’observation chez les grammairiens comparatistes, qui faisaient des études comparatives entre le sanskrit et le latin ou le grec. À cette époque, le centre de préoccupation était le problème de l’origine du langage. Ensuite, est apparue l’école des néogrammairiens, qualifiés parfois de précurseurs de la linguistique : ils s’intéressaient avant tout aux phénomènes phonétiques. Dans ce contexte, et avec les travaux de Saussure, l’étude du langage a acquis le statut de science. Saussure est le fondateur du structuralisme en linguistique, et il est considéré généralement comme le père de la linguistique. Le Cours de linguistique générale qu’il a donné à l’université de Genève entre 1906 et 1910 a été publié par ses étudiants à partir de leurs notes (voir la bibliographie). 2. Théorie de Saussure Saussure a introduit différentes notions élémentaires, dont voici les principales : 1. Langage / langue / parole 2. Linguistique synchronique et diachronique 3. Travaux descriptifs et prescriptifs 4. Système de signes 5. Signe, signifiant, signifié 6. Arbitraire du signe 7. Valeur 8. Identité 9. Rapports syntagmatiques et paradigmatiques 2.1. Langage / langue / parole Selon Saussure, la matière de la linguistique est l’ensemble des manifestations du langage. Elles sont hétérogènes, diverses, multiformes, insaisissables dans leur totalité. L’objet de la linguistique est le sous-ensemble des manifestations du langage, que le linguiste constitue en adoptant tel ou tel point de vue. L’ensemble des manifestations du langage doit d’abord être divisé en deux types : la parole et la langue. Autrement dit, le langage se compose de la parole et de la langue. La parole est un fait individuel, qui relève de l’action individuelle, variable, unique, imprévisible. La langue est un fait social, constant, commun aux sujets parlants. C’est le code commun à tous les membres d’une communauté linguistique. 2 Yayoi NAKAMURA-DELLOYE, 15 octobre 2007 Cours : LLSDL117 : Grammaire 1 Paris X UFR LLPHi 2007/2008 2.2. Linguistique synchronique et diachronique Par ailleurs, pour Saussure, les langues sont à la fois stables et instables. D’un côté, toute langue évolue, et d’un autre, elle est toujours dans un certain état. Ainsi, Saussure distingue l’étude synchronique de l’étude diachronique de la langue. C A B D La synchronie peut être représentée comme une relation entre deux points appartenant à une même époque (la ligne A-B dans la figure). L’étude synchronique s’intéresse à la compréhension de la langue, telle qu’elle se présente à un moment donné, c’est-à-dire un état de langue. L’étude diachronique se consacre au passage d’une époque à l’autre, pour l’étude d’un fait particulier (le passage de C à D dans le schéma). Par exemple, pour le verbe « aimer », du point de vue diachronique on peut étudier l’évolution historique de sa forme ou de son sens. On peut également faire une étude synchronique en étudiant toutes les constructions possibles avec ce verbe ou tous les sens qu’il peut avoir, dans le français d’une époque donnée, aujourd’hui ou encore au XVème siècle. 2.3. Travaux descriptifs et prescriptifs Qu’ils soient diachroniques ou synchroniques, les travaux linguistiques sont descriptifs, c’est-à-dire que la linguistique se contente d’enregistrer comme un fait, l’existence de tel ou tel emploi. En revanche, les travaux des grammaires scolaires sont prescriptifs, c’est-à-dire qu’ils cherchent à recommander voire imposer un emploi. 2.4. La langue comme système de signes Saussure critique l’approche de ses prédécesseurs et leur vision éclatée de la langue : ils la considéraient comme une simple liste d’éléments renvoyant individuellement et de manière indépendante à des objets du monde. Pour Saussure, la langue est un tout organisé ou un système. À l’intérieur de ce système, chaque terme est défini par les relations qu’il entretient avec tous les autres. Les éléments qui constituent le système sont des signes. Ainsi, Saussure définit l’objet de la linguistique comme l’étude des systèmes de signes que constituent les états de langue. 3 Yayoi NAKAMURA-DELLOYE, 15 octobre 2007 Cours : LLSDL117 : Grammaire 1 Paris X UFR LLPHi 2007/2008 2.5. Signe, signifiant, signifié Le signe linguistique unit non une chose et un nom, mais un concept et une image acoustique. Ils sont tous deux psychiques et sont unis dans notre cerveau par le lien d’association. concept = signifié image acoustique = signifiant Le signe linguistique est donc une entité psychique à deux faces, inséparables l’une de l’autre. Aucun des deux termes ne peut exister sans l’autre. Comme la notion de signe ne s’applique pas seulement au code linguistique oral mais à tout système de signes, Saussure utilise les termes de signifiant pour image acoustique et de signifié pour concept. 2.6. Arbitraire du signe Le lien qui unit le signifiant au signifié est arbitraire, ou encore le signe linguistique est arbitraire. Autrement dit, il n’y a pas de lien naturel qui lie les propriétés du signifiant à celles du signifié, et ce lien est immotivé. Par exemple, entre le concept « chaise » et la suite de sons « chaise », il n’y a aucun rapport naturel. Le lien qui lie cette forme phonétique et ce concept, ou ce signifiant et ce signifié est de nature conventionnelle. 2.7. La pensée et la langue La pensée est comme une nébuleuse où rien n’est nécessairement délimité. Il n’y a pas d’idée préétablie et rien n’est distinct avant l'apparition de la langue. Sans le recours aux signes, nous serions incapables de distinguer deux idées d’une façon claire et constante. Le rôle caractéristique de la langue vis-à-vis de la pensée est de servir d’intermédiaire entre la pensée et le son, dans des conditions telles que leur union aboutit nécessairement à des délimitations réciproques d’unités. Le fait linguistique relie donc ces deux domaines confus et amorphes, et ce de manière arbitraire. 2.8. Valeur Un signe linguistique a également une valeur. Saussure prend, pour mieux illustrer cette notion, comme exemple le jeu d'échecs. Le cavalier, dans sa matérialité, hors des conditions du jeu, ne représente rien. Il ne peut devenir élément réel et concret qu’une fois inséré dans les autres pièces et les conditions de jeu. Il y est revêtu de sa valeur. Le signe, situé dans le système qu’est la langue, a donc lui aussi une valeur. Sa valeur est le sens défini par ses positions relatives par rapport aux autres signes. 4 Yayoi NAKAMURA-DELLOYE, 15 octobre 2007 Cours : LLSDL117 : Grammaire 1 Paris X UFR LLPHi 2007/2008 Par exemple, le contenu conceptuel associé au signe « chaise » est constitué non seulement de son signifié, mais aussi du fait qu’il n’est ni « siège », ni « fauteuil ». La valeur est ainsi définie négativement et oppositivement. « fauteuil » « chaise » « siège » signifié signifié signifié signifiant valeur signifiant valeur signifiant 2.9. Identité Saussure introduit également la notion d’identité. Dans les deux phrases : Cette question est complexe. C’est une phrase complexe. on reconnaît l’identité des deux séquences de sons ou de lettres « complexe ». Ils peuvent être prononcés différemment avec des intonations différentes ou ils peuvent être écrits dans des contextes complètement différents avec des nuances différentes. Mais il est possible de les interpréter comme le même mot. L’identité des éléments est déterminée par leurs différences avec les autres éléments de la langue. Malgré les différentes nuances que ces emplois peuvent prendre, on les considère comme le même mot « complexe », dans la mesure où ils sont différents des autres signes (comme « difficile » ou « compliqué »). L’identification est la reconnaissance d’un seul et même élément à travers ses multiples emplois dans des contextes et des situations différents. 2.10.Rapports syntagmatiques et paradigmatiques Comme nous l’avons vu à plusieurs reprise, la langue est un système et chacun de ses éléments, les signes, sont en relation avec tous les autres. Ces relations se déploient selon deux axes distincts, l’axe syntagmatique et l’axe paradigmatique. Les rapports syntagmatiques sont les rapports de successivité et de contiguïté. Ce sont des rapports que les signes entretiennent dans la chaîne parlée. Par exemple, dans la phrase : Les enfants aiment la maîtresse. l’unité « les enfants » entretient une relation syntagmatique avec l’unité « la maîtresse ». De même, dans la phrase : La maîtresse aime les enfants. l’unité « les enfants » entretient également une relation syntagmatique avec l’unité « la maîtresse » mais elle est différente de celle que nous avons constatée dans la phrase précédente. 5 Yayoi NAKAMURA-DELLOYE, 15 octobre 2007 Cours : LLSDL117 : Grammaire 1 Paris X UFR LLPHi 2007/2008 À côté de ces rapports syntagmatiques, internes à la chaîne parlée, il existe d’autres rapports, que Saussure appelle rapports paradigmatiques. Il s’agit de rapports qui se créent entre les signes hors de la chaîne du discours. Ces rapports paradigmatiques donnent lieu à la formation de groupes de signes sur la base de relations de types divers. Par exemple, dans la phrase : Pierre travaille dans l’enseignement. « enseignement » est en relation syntagmatique avec les autres unités comme « Pierre » ou « travaille », mais hors de cette chaîne linéaire, le terme « enseignement » évoque différentes unités comme « enseigner » qui a la même racine, « apprentissage » qui a un sens plus ou moins proche, ou encore « changement » qui a le même suffixe « -ment », etc. 6 Yayoi NAKAMURA-DELLOYE, 15 octobre 2007 Cours : LLSDL117 : Grammaire 1 Paris X UFR LLPHi 2007/2008 3. Différents niveaux d’organisation des langues Il existe différents niveaux de structure linguistique et chacun est pris en charge par une composante spécifique de la linguistique. La linguistique est divisée généralement en cinq domaines : la phonologie, la morphologie, la syntaxe, la sémantique et enfin la pragmatique. Éléments linguistiques Phonologique son / phonème Morphologique morphème Syntaxique mot / groupe / phrase Sémantique sens grammatical Pragmatique sens communicatif Contenus Niveaux de représentation Formes de l’expression On distingue les disciplines qui s’occupent de la forme de la langue (la phonologie, la morphologie, la syntaxe) de celles qui s’intéressent au sens (la sémantique et la pragmatique). 3.1. La phonologie Les données des études linguistiques sont avant tout des suites de sons ou des plus petites unités linguistiques appelées phonèmes : c’est le niveau de représentation linguistique dit phonologique. La phonétique et la phonologie L’étude des sons dans leur réalité physique est l’objet de la phonétique. La phonologie est l’étude des sons sous l’angle de leur pertinence linguistique, c’est-à-dire qu’on ne s’intéresse qu’aux phénomènes de sons qui contribuent effectivement à la signification linguistique. La phonologie étudie le système phonologique des langues. Phonème Les éléments qui constituent le système phonologique sont des unités appelées phonèmes. C’est la plus petite unité linguistique, non porteuse de signification. Mais c’est une unité abstraite, distinctive et oppositive, c’est-à-dire susceptible de produire 7 Yayoi NAKAMURA-DELLOYE, 15 octobre 2007 Cours : LLSDL117 : Grammaire 1 Paris X UFR LLPHi 2007/2008 un changement de sens. Cette abstraction se fonde sur le fait que tous les sons utilisés ne sont pas perçus comme différents. Pertinence des oppositions Par exemple, le français utilise deux types de son « o » : [o] et [ɔ] dans par exemple les mots « peau » et « col ». Mais leur différence acoustique n’est pas exploitée pour produire des différences de signification. Ils constituent donc, du point de vue de la langue, une seul unité, un phonème /o/1. [o] [ɔ] /o/ En revanche, la différence entre [p] et [b] permet de créer des mots différents comme « pain » et « bain », ou « peau » et « beau ». On dit alors que leur opposition est pertinente. Ils constituent donc bien deux phonèmes distincts /p/ et /b/. Les oppositions pertinentes varient d’une langue à l’autre. 3.2. La morphologie Les phonèmes composent ensuite des unités appelées morphèmes. Il s’agit de la plus petite unité munie de sens et elle constitue les mots. C’est le niveau de représentation morphologique. La morphologie étudie la structure interne des mots. Morphèmes Le mot est composé d’une ou plusieurs unités appelées morphèmes qui sont les plus petites unités linguistiques munies à la fois d’une forme et d’un sens. Par exemple, dans le mot « inacceptables », on peut identifier quatre éléments dotés à la fois d’une forme et d’un contenu : in (inconnu, invisible) accept (accepter, acception) = base ou racine able (capable, aimable) s (marque du pluriel) Les morphèmes se répartissent en deux grandes classes : morphèmes lexicaux et morphèmes grammaticaux. Les morphèmes lexicaux ont une certaine autonomie. Les morphèmes grammaticaux, qu’on appelle affixes, ne peuvent pas apparaître isolés comme « in », « able » et « s » de « inacceptables ». Processus de formation des mots Il existe deux types de processus de formation des mots : l’affixation et la composition. L’affixation consiste à combiner une racine qui est un morphème lexical et différents affixes. Le mot « inacceptables » est formé par l’affixation avec une racine « accept » et des affixes « in », « able » et « s ». Il existe deux types d’affixation : la flexion et la 1 Conventionnellement, on note les sons entre [] et les phonèmes entre //. Yayoi NAKAMURA-DELLOYE, 15 octobre 2007 8 Cours : LLSDL117 : Grammaire 1 Paris X UFR LLPHi 2007/2008 dérivation. La flexion est un processus de variation de formes d’un mot. Les affixes de flexion sont destinés à marquer les différents traits grammaticaux exigés par la catégorie de la racine (marques de genre, de nombre, de personne, etc.). La dérivation est, quant à elle, un processus de mots non composés. Les affixations de dérivation ont pour effet de modifier le contenu (e.g. inefficace) ou l’appartenance catégorielle de la racine (e.g. heureusement). La composition est le processus qui combine plusieurs unités susceptibles d’être employées seules, comme « machine à écrire », « chaise longue » ou « fibre optique ». Double articulation Toutes les chaînes parlées sont donc segmentées d’abord en morphèmes, plus petites unités munies de sens, puis en phonèmes, plus petites unités linguistiques. Cette structure de la langue, organisée en deux niveaux, est appelée la double articulation. C’est cette double articulation qui permet la production d’un nombre infini d’énoncés divers. 3.3. La syntaxe Les mots constituent ensuite des groupes et des phrases : c’est le niveau syntaxique. La syntaxe étudie l’organisation des groupes de mots dans la phrase. C’est le domaine auquel nous nous intéressons, et sur lequel nous reviendrons plus tard. 3.4. La sémantique et la pragmatique Les éléments linguistiques que nous venons de voir sont des formes de l’expression. Mais le langage est constitué non seulement de la forme mais aussi du contenu. On peut distinguer deux types : le sens grammatical et le sens communicatif. Le sens grammatical est le sens véhiculé par les formes linguistiques, et il s’oppose au sens communicatif. Le sens grammatical relève du domaine sémantique et le sens communicatif, du domaine pragmatique. Ces deux types de sens peuvent être différents, comme le montrent ces exemples : Est-ce que tu peux manger plus vite ? (interrogation totale qui demande généralement une réponse oui ou non) ---> avec contexte, communicativement c’est un ordre Tu as l’heure ? (forme interrogative totale) ---> communicativement en disant cela, on demande l’heure qu’il est. Ces phénomènes sont dus à l’existence de deux langues différentes. On distingue alors dans la description linguistique la phrase de l’énoncé (Riegel et al. : p 26) : Une phrase donnée est une entité structurale abstraite, qu’on peut caractériser par un ensemble de règles de bonne formation phonologique, morphologique, syntaxique et sémantique. Elle se réalise sous la forme concrète d’énoncé. Également (Delaveau 2001 : Ch. 1, p. 10) : 9 Yayoi NAKAMURA-DELLOYE, 15 octobre 2007 Cours : LLSDL117 : Grammaire 1 Paris X UFR LLPHi 2007/2008 Ce qui est proféré et entendu dans la communication, nous l’appelons « énoncé ». Nous entendons par là un événement unique, non répétable, qui peut prendre des formes diverses. Sa signification est sensible à la situation et au contexte où il est produit ou entendu. Chaque fois qu’on parle, qu’on écrit ou qu’on pense, c’est sous la forme d’énoncés. Ces énoncés sont chaque fois uniques non seulement dans leur forme et dans leur contenu, mais dans leur caractère d’événement historique. On peut sans doute les reproduire [...] mais on ne peut les répéter. Ces énoncés ont une signification complète, entre autre parce qu’ils sont pris dans une situation et dans un contexte qui les éclairent. [...] dans ces énoncés, on va repérer du répétable, à savoir certaines formes associées à des significations, et c’est ce répétable que nous appelons « phrase ». La phrase est répétable, parce qu’on peut utiliser la même phrase pour plusieurs énoncés, c'est-à-dire plusieurs proférations ; ainsi « il pleut » prononcé le 5 janvier 1995 à Fort de France, et le 10 novembre 1995 à Paris, constitue autant d’énoncés distincts, et c’est une seule phrase. 3.5. Test de commutation : procédure de découverte des unités distinctives de la langue Nous avons vu les différents niveaux d’organisation des langues et les unités qu’il était possible de repérer à ces différents niveaux. Nous nous intéressons maintenant à la procédure de découverte des unités distinctives de la langue. Autrement dit, comment se font le repérage et l’identification de ces différentes unités linguistiques dans la chaîne parlée. Afin de repérer les unités distinctives de la langue, on utilise un test dit de commutation. La commutation consiste en la substitution d’une unité par une autre. Cette méthode a été proposée par les linguistes du courant appelé distributionnalisme. Le distributionnalisme est apparu aux États Unis vers les années 30, dans le cadre de la description des langues amérindiennes. Pour décrire ces langues qui étaient à l’époque inconnues et peu décrites, ils ont d’abord rassemblé un corpus, c’est-à-dire un ensemble d’énoncés. Une fois qu’ils ont constitué le corpus, ils ont cherché à le segmenter. La segmentation des énoncés correspond à l’identification des unités. La segmentation d’une langue inconnue est une tâche très complexe. Pour segmenter le corpus, les linguistes distributionnalistes ont d’abord rapproché les morceaux comparables. La comparaison de ces morceaux comparables a permis ensuite de déterminer les unités distinctives. Cette comparaison est basée sur le principe de commutation. Phonèmes Prenons un exemple de commutation en vue de l’identification des phonèmes. Notre corpus est : [la mer] [la ter] [la per] 10 Yayoi NAKAMURA-DELLOYE, 15 octobre 2007 Cours : LLSDL117 : Grammaire 1 Paris X UFR LLPHi 2007/2008 la m er t p Le rapprochement de ces trois segments permet de dégager une variation en troisième son, et [m], [t] et [p] sont commutatifs. Ce sont donc des unités distinctives, des phonèmes. Morphèmes Dans le cas de l’identification des morphèmes, trois critères doivent être vérifiés : 1. l’unité doit être commutative ; 2. significative, et ; 3. discrète, c’est-à-dire être la plus petite. Dans le cas du dernier exemple, [m], [t] et [p] sont commutatifs, mais ils ne sont pas significatifs, donc on ne peut pas les considérer comme des morphèmes. Prenons maintenant un exemple : /lə bato/ /le bato/ Les phonèmes /ə/ et /e/ sont non seulement commutatifs mais aussi significatifs en considérant /ə/ comme la marque du singulier, et /e/ comme la marque du pluriel. / ə / et / e / sont donc des morphèmes, unités distinctives munies de sens. Quels morphèmes pourrait-on identifier dans les exemples suivants ? /le bato/ /se bato/ Les phonèmes /l/ et /s/ sont non seulement commutatifs mais aussi significatifs en considérant /l/ comme la marque du défini, et /s/ comme la marque du démonstratif. /l/ et /s/ sont donc des morphèmes. Prenons un autre exemple et cette fois avec des formes écrites : march e (1°, 3° pers, singulier) march es (2° pers, singulier) march ons (1°pers, pluriel) march ez (2° pers, pluriel) march ent (3° pers, pluriel) On peut reconnaître le morphème racine « march » et les affixes « e », « es », « ons », « ez », « ent », qui sont chacun munis de signification (entre parenthèses). Segmentation des corpus dans des langues inconnues Essayons maintenant de segmenter les corpus de langues que nous ne connaissons pas. 11 Yayoi NAKAMURA-DELLOYE, 15 octobre 2007 Cours : LLSDL117 : Grammaire 1 Paris X UFR LLPHi 2007/2008 Corpus Swahili Considérons d’abord un petit corpus en swahili. Essayons de segmenter les énoncés. (Source : Fuchs & Le Goffic (1992) Les linguistiques contemporaines. Hachette : p. 56) 1. atanipenda 2. ananipenda 3. anakupenda 4. anawapenda 5. alikupenda 6. ninakupenda A. Le rapprochement des énoncés 2, 3, 4 permet de faire l’hypothèse que la troisième syllabe représente une unité isolable où peut se trouver un membre d'une classe « ni », « ku » et « wa ». ana ni penda ku wa B. Le rapprochement des énoncés 1 et 2 permet de dégager une variation en deuxième consonne ou en deuxième syllabe. Il est impossible de décider uniquement avec des données aussi limitées. a t a nipenda n C. Par ailleurs, le rapprochement des énoncés 3 et 5 nous signale la variation en deuxième syllabe. a na kupenda li D. L'analyse C donne des arguments en faveur de l'hypothèse, faite à B, de la variation syllabique. Cela donne lieu à une variation en deuxième syllabe ta-na-li a ta ni na ku li wa penda E. Enfin, le rapprochement des énoncés 3 et 6 permet de dégager une variation en syllabe initiale. a ta ni ni na ku li wa penda Cette analyse a permis la segmentation en quatre fragments et l’identification des unités. 12 Yayoi NAKAMURA-DELLOYE, 15 octobre 2007 Cours : LLSDL117 : Grammaire 1 Paris X UFR LLPHi 2007/2008 Mais pour déterminer les morphèmes, ces hypothèses doivent être confirmées par l’analyse d’un corpus plus grand avec la prise en compte également du sens de chaque unité identifiée. Corpus Japonais : Considérons maintenons un corpus en japonais. Essayons de le segmenter, d’identifier les plus petites unités munies de signification. Faisons une hypothèse sur les mots français correspondant à chaque unité japonaise qui aura été identifiée. 1. watasiwaeigawomimasu Je regarde le film. わたしはえいがをみます 2. watasiwaterebiwokaimasita J’ai acheté une télé. わたしはてれびをかいました 3. watasiwaterebiwomimasita J’ai regardé la télé. わたしはてれびをみました 4. chichiwaeigawomimasita Mon père a regardé le film. ちちはえいがをみました 5. chichiwaoperawomimasita Mon père a regardé l’opéra. ちちはおぺらをみました 13 Yayoi NAKAMURA-DELLOYE, 15 octobre 2007