Chapitre 1. Les mémoires Au moyen de recherches expérimentales

Transcription

Chapitre 1. Les mémoires Au moyen de recherches expérimentales
Chapitre 1. Les mémoires
Au moyen de recherches expérimentales, d’observations, d’études des troubles de la
mémoire et du langage et d’enregistrements de l’activité du cerveau, les chercheurs ont mis
en évidence l’existence de différentes mémoires.
Les durées et les capacités de stockage permettent de distinguer cinq catégories de
mémoires :
- Les registres de l’information sensorielle ;
- La mémoire à court terme ;
- La mémoire de travail qui est constituée d’un administrateur central, d’une
boucle articulatoire, d’un calepin visuo-spatial, et d’une mémoire tampon
épisodique. Elle opère dans la plupart des tâches que nous effectuons tout
au long de la journée.
- La mémoire à long terme dont la capacité et la durée de stockage peuvent
être théoriquement illimitées.
Toutes ces mémoires sont mises en œuvre dans nos activités quotidiennes.
La mémoire à long terme contient différents souvenirs et connaissances : souvenirs
d’événements qui ont marqué notre vie, mémoire du sens des mots et de objets et des
situations, connaissances encyclopédiques et schématiques mais aussi procédures tant
motrices (comment je fais pour marcher, comment je fais pour démarrer la voiture…) que
mentales (comment je fais pour lire, comment je fais pour comprendre un texte…).
Ces informations sont stockées soit sous forme verbale soit sous forme imagée. Les
images étant aussi bien visuelles (iconiques), qu’auditives (échoïques), olfactives, tactiles ou
kinesthésiques.
Registres de l’information sensorielle, mémoire à court terme, mémoire de travail,
mémoire à long terme, mémoire épisodique, mémoire autobiographique, mémoire
sémantique, mémoire déclarative, mémoire encyclopédique, mémoire procédurale, sont autant
d’intitulés qui témoignent de la multiplicité des approches de la mémoire. L’objet de ce
chapitre n’est pas de faire une étude approfondie de ces différentes mémoires mais d’en
esquisser une description permettant de situer la mémoire sémantique dans cet ensemble.
Cette énumération des termes désignant les différentes mémoires fait ressortir une
opposition entre les intitulés qui font référence à un axe chronologique et ceux qui
dénomment des contenus. La description des contenus et de leur organisation concerne
essentiellement la mémoire à long terme dont fait partie la mémoire sémantique. L’approche
chronologique permet de situer les différentes mémoires et d’en préciser les propriétés. Les
registres de l’information sensorielle, la mémoire à court terme, la mémoire de travail, la
mémoire à court terme et la mémoire à long terme sont différentes catégories de mémoire
correspondant à une organisation allant d’un stockage de l’ordre de quelques centièmes de
secondes à un stockage à long terme. Les propriétés et les caractéristiques de ces mémoires
ont fait l’objet de nombreuses études. Les données expérimentales et les observations faites en
neuro-psychologie tendent à valider l’existence et la spécificité de ces différentes mémoires.
On en trouvera une description précise et argumentée dans l’ouvrage d’Alan Baddeley traduit
en français et intitulé « La Mémoire Humaine » (Presses Universitaires de Grenoble, 1993).
1. Registres de l’information sensorielle
Les registres de l’information sensorielle désignent des lieux où l’information
sensorielle est stockée après une présentation très courte (quelques dizaines de millisecondes).
Ce stockage est court, généralement inférieur à une seconde. La dénomination de ces registres
sensoriels varie selon le type de stimulation : lorsque le stimulus est visuel on parle de
mémoire iconique, lorsqu’il est auditif de mémoire échoïque (Neisser, 1967).
Les exemples où cette situation se rencontre dans la vie quotidienne sont à trouver
dans les tâches de surveillance de radar, de conduite rapide ou de contrôle qualité. A chaque
fois la durée de présentation des stimuli est courte et ne permet pas un traitement complet de
l’information. Certaines présentations de générique de film ou de sous-titres sont tellement
rapides qu’elles ne peuvent être traitées qu’après l’effacement de l’image.
Le paradigme expérimental qui a été codifié par Sperling (1960) pour étudier ces
registres sensoriels montre qu’ils s’exercent dans des situations où les durées de présentation
des stimuli sont très courtes. Sperling présente durant 50 millisecondes 3 rangées de quatre
lettres. La tâche du sujet est de rappeler tout ce dont il se souvient (cf. figure 1). Dans ces
conditions, les sujets rappellent en moyenne 4 à 5 lettres. La capacité de la mémoire iconique
est d’environ 4 à 5 unités, c’est l’empan mnésique immédiat. Le rappel doit être immédiat car
500 millisecondes après la présentation des stimuli la performance est quasiment nulle. C’est
dire que la durée du stockage est courte.
Comment expliquer que les rappels soient si faibles ? Une explication possible serait
que durant 50 millisecondes les sujets n’ont le temps de ne percevoir que 4 à 5 lettres ? Pour
tester cette hypothèse, Sperling réalise une expérience reprenant le paradigme décrit
précédemment en ajoutant un signal sonore indiquant quelle rangée doit être rappelée :
première ligne, seconde ligne ou troisième ligne. Lorsque ce signal est présenté durant les 100
ms qui suivent la présentation des stimuli, la performance est maintenue, elle reste égale à 4/5
lettres. Si le signal apparaît après 500 ms. la performance est dégradée elle peut tomber
jusqu’à 10 % de réponses correctes. L’explication serait que durant les 100 millisecondes qui
suivent la présentation des stimuli, l’image reste présente sur la rétine et donc le sujet peut la
lire. C’est ainsi que l’indication de la ligne qu’il faut rappeler ne dégrade pas la performance.
Il s’agit bien de la lecture d’une image rémanente puisque si on superpose un stimulus
masquant (simple flash lumineux, suite de traits ou de lettres) après la présentation des 12
lettres la performance est fortement détériorée. En revanche, si les lettres sont projetées sur un
œil et le masque sur l’autre œil, la performance n’est pas affectée. La trace utilisée dans la
mémoire sensorielle est bien périphérique, elle se situe au niveau de la rétine. Les processus
biochimiques qui transforment la lumière en message électrique qui va se propager le long du
nerf optique ont une durée d’extinction non négligeable. La rétine comme l’écran de
télévision a une rémanence qui fait que l’image persiste quelques temps (environ 100 ms.)
après la disparition de la stimulation. Ce temps est utilisé pour procéder à des traitements de
l’image tels que la lecture. Ces données ont permis à Sperling d’affirmer que la mémoire
iconique met en jeu deux processus :
- une image consécutive, simple rémanence de la trace sensorielle qui dans le cas de
la vision peut durer aux alentours de 100 ms. Pendant cette période la trace
sensorielle reste inscrite sur les récepteurs. Dans le cas de la vision l’image
provoquée par la stimulation résulte de la décomposition des photorécepteurs, c’est
à dire d’un processus chimique relativement lent à s’effacer. L’image persiste donc
après la fin de la stimulation. C’est cette rémanence qui fait qu’au cinéma nous ne
percevons pas une suite d’images fixes (25 images par secondes) mais un
enchaînement donnant l’impression du mouvement ;
- le traitement de certains éléments de cette image, traitement commencé au début
de la stimulation et se poursuivant alors même que la stimulation a cessé. Par
traitement on entend la mise en œuvre d’opérations cognitives liées à la tâche que
doit réaliser le sujet : lire les lettres qui sont présentées, identifier les mots qui sont
entendus… L’idée est donc que les traitements cognitifs initiés lors de la
présentation des stimuli se poursuivent sur l’image consécutive jusqu’à ce que
celle-ci disparaisse.
C’est par abus de langage que l’on parle de « mémoire sensorielle » le terme de
registre sensoriel décrit mieux la rémanence qui permet le développement de différents
traitements alors que la stimulation a cessé. En résumé, une stimulation produit des
modifications biochimiques dont l’effacement est lent. Le système cognitif traite cette image
rémanente.
Figure N° 1 : Séquence de présentation des stimuli permettant de mettre en évidence et
d’expliquer le fonctionnement de la mémoire sensorielle iconique. Douze lettres (4 lettres
présentées sur 3 lignes) sont présentées durant 50 millisecondes, à l’issue de cette
présentation un signal sonore indique quelle ligne doit être rappelée (l’écart entre la fin
de la présentation des lettres et le signal est varié), ce signal déclenche le rappel.
Stimuli présentés
X T B L
U I
A S
K D Z F
Séquences des opérations
Présentation de la suite de lettres
Signal sonore
Rappel
50 millisecondes
2. La mémoire à court terme
Comme pour les registres sensoriels, l’existence d’une mémoire à court terme a été
mise en évidence et étudiée en utilisant un protocole expérimental bien précis. La méthode
consiste à présenter une liste d’items généralement des mots. Chaque item est présenté une
seule fois. La durée de présentation et la succession des stimuli sont telles que le sujet n’a pas
la possibilité de procéder à des autorépétitions. A la fin de la présentation de la liste le sujet
doit rappeler tous les items dont il se souvient.
La description de ce protocole expérimental ne doit pas masquer que cette épreuve
renvoie à des situations familières telles que retenir un numéro de téléphone qui est présenté
oralement, transcrire un message oral ou se souvenir des noms présentés dans un générique.
Dans tous les cas, les items se succèdent à une cadence rapide1 de sorte que l’auditeur ou le
lecteur ne puisse ni répéter mentalement ni faire un traitement profond du stimulus présenté.
La capacité de la mémoire à court terme est limitée à 7 (+ ou – deux) unités ou
schunks2, quelque soit la longueur de la liste présentée. En fait, il est possible d’augmenter la
quantité de matériel retenu en constituant des groupes (schuncks). C’est ainsi qu’Ehrlich
(1972) a montré que les stimuli soient des lettres, des mots de 2, 3 ou 4 syllabes ou des
phrases de 2, 3 ou 4 mots les sujets étaient toujours capables de rappeler entre 6 et 7 unités
différentes : pour les mots isolés, la capacité de rétention variait donc de 12 à 24 syllabes ;
pour les phrases la capacité de rétention allait de même de 12 à 24 mots mais dans tous les
cas, le nombre d’unités (lettres, mots ou phrases) rappelées était compris entre 6 et 7.
1
Contrairement à ce qui se passe dans le paradigme mis en œuvre dans l’étude des registres sensoriels les stimuli
ne sont pas présentés simultanément mais successivement.
2
Un schunk est un groupe de base. Lorsque des mots sont présentés, le mot compose un schunk, lorsque des
phrases composées d’un sujet, d’un verbe et d’un complément, ces phrases sont des schunck, lorsque ces phrases
sont composées de plusieurs propositions, ces phrases sont des schunck…
Dans la vie de tous les jours on est amené à éprouver l’efficacité de ces
regroupements. Ainsi nous regroupons généralement par dizaine les chiffres qui composent
notre numéro de téléphone. Lorsque nous communiquons ce numéro, nous le faisons non en
énumérant les unités : six, zéro, quatre, huit, trois, neuf, sept, cinq, deux, huit, mais en
regroupant : soixante, quarante huit, trente neuf, soixante quinze, vingt huit. Ces
regroupements facilitent la rétention.
La mémoire à court terme se caractérise par un oubli massif dans les quelques
secondes qui suivent la fin de la présentation de la liste. Comme il était précisé
précédemment, cet oubli n’apparaît que si le sujet n’a pas la possibilité de répéter les items
qu’il a perçu ou d’en faire un traitement profond.
Pour étudier cette mémoire Brown (1958) et Peterson (1959) ont mis au point un
protocole permettant d’éviter l’autorépétition et le traitement profond. Il consiste à régler la
cadence de présentation des stimuli de sorte à éviter le développement de ces deux processus.
Dans cette même intention, durant le temps qui sépare la fin de la présentation des stimuli du
début du rappel, il est demandé aux sujets de réaliser une tâche dite tâche tampon consistant
habituellement à compter à rebours de deux en deux. Cette tâche de comptage peut varier de 0
à 18 secondes. Occupé à effectuer cette tâche, le sujet ne peut répéter les stimuli qui lui ont
été présentés. L’expérience montre qu’à partir de 18 secondes, l’oubli est massif. Nous
faisons cette expérience quotidiennement lorsque lors de la prise de note nous tentons d’écrire
intégralement ce que l’enseignant dit.
Cette mémoire a souvent été comparée à un réservoir a capacité limitée qui stocke de
façon provisoire des informations. Lorsque le réservoir est rempli l’entrée de toute nouvelle
information ne peut se faire qu’en remplacement d’une unité ancienne. Lorsque les 7 premiers
éléments sont stockés, l’intégration de nouveaux amène à effacer les anciens. Tout se passe
comme si la mémoire à court terme était une boite dont la contenance était limitée à 7 objets.
Lorsque cette limite est atteinte, il n’est possible de faire entrer un objet que si un autre est
enlevé. C’est ce que tend à prouver l’étude des effets sériels. Par effets sériels on entend ici
les effets induits par l’ordre de présentation des stimuli.
Au cours des rappels, des effets de positions sérielles (cf. fig. 2) sont observés : les
premiers et les derniers stimuli présentés sont mieux rappelés que les stimuli intermédiaires.
On désigne par effet de primauté le fait que les premiers stimuli de la liste sont mieux
rappelés que les stimuli du milieu et par effet de récence le fait que les derniers stimuli sont
mieux rappelés que ceux du milieu.
La courbe de rappel a une forme en U dissymétrique. Dans le cas d’un rappel
immédiat, la branche de droite (derniers stimuli présentés) est plus élevée que celle de gauche
(premiers stimuli présenté) : l’effet de récence est supérieur à l’effet de primauté. Dans le cas
d’un rappel différé, la branche de gauche (premiers stimuli présentés) est plus élevée que celle
de droite (derniers stimuli présentés) : l’effet de primauté est plus important que l’effet de
récence.
Pour comprendre les déterminants de l’effet de récence et de l’effet de primauté il faut
décrire les facteurs qui les font varier.
Pour ce qui est de l’effet de récence il faut noter qu’il est particulièrement diminué
dans deux conditions :
a) lorsque la durée de l’intervalle entre la fin de la présentation de la liste et le rappel
est augmentée ;
b) lorsque durant cet intervalle des tâches interférentes sont développées. Dans ces
deux conditions, l’effet de récence est diminué et peut même être supprimé.
En revanche, l’effet de récence n’est pas modifié par les variables qui déterminent la
performance en mémoire à long terme. L’effet de récence ne dépend pas de :
-
la fréquence d’usage des mots. La fréquence d’usage est un indicateur du niveau
d’utilisation du mot dans un corpus donné. On calcule combien de fois, un mot est
rencontré dans un corpus. Ce corpus peut être écrit (ensemble des romans du
XVIII° siècle…) ou oral (ensemble des conversations enregistrées dans un
contexte donné…). On dira qu’un mot est fréquent s’il a été très utilisé dans le
corpus de référence. En revanche, on dira qu’il est rare s’il a été peu rencontré. En
fait la fréquence d’usage est un indicateur de la familiarité et donc de la
disponibilité du mot dans la mémoire du sujet (Rossi, 1985). Or, les recherches sur
la mémoire à long terme indiquent que plus les mots sont fréquents meilleure est
leur rétention en mémoire à long terme. Cette fréquence d’usage n’affecte pas
l’effet de récence.
- le rythme de présentation. En mémoire à long terme plus ce rythme est lent
meilleure la rétention. Dans la mesure où le sujet ne peut ni répéter les stimuli qui
lui sont présentés ni en faire un traitement profond, le rythme de présentation n’a
pas d’effet sur l’effet de récence.
- les relations sémantiques entre les items. En mémoire à long terme, plus les
relations sémantiques entre les items à retenir sont fortes meilleure sera la
rétention. Ces relations sont sans effet sur l’effet de récence.
- la longueur de la liste. En mémoire à long terme, plus la liste est longue moins la
rétention est bonne. Or, la longueur de la liste ne modifie pas l’ampleur de l’effet
de récence.
- l’effet de récence n’est pas touché dans l’amnésie de Korsakoff. Dans l’amnésie de
Korsakoff, les malades sont incapables de nouveaux stockages à long terme alors
même que la mémoire à court terme n’est pas affectée. Cette amnésie antérograde
est associée à des lésions de l’hippocampe.
Toutes ces données montrent la spécificité de l’effet de récence. En revanche, l’effet
de primauté est du à l’attention portée aux premiers stimuli et au manque d’interférence3
affectant les premiers items. Or, ces deux facteurs ont des effets incontestables sur la mémoire
à long terme. L’attention portée aux stimuli est évidemment une condition nécessaire à leur
mémorisation en mémoire à court terme. Quant à l’interférence, c’est une des causes
principales de l’oubli. Les similitudes entre les stimuli appris ou à apprendre amènent à des
confusions qui détériorent les performances.
La caractéristique essentielle de la mémoire à court terme est évidemment la durée de
stockage qui ne dépasse pas quelques minutes. Au-delà l’effacement est quasi total.
Imaginons l’encombrement de notre mémoire si tous les événements liés à la mémoire à court
terme (rétention de numéros de téléphone, des discussions…) n’étaient pas effacés ou si nous
n’avions pas la possibilité de sélectionner ce qui doit être retenu.
Dans la description qui vient d’être faite on trouvera nombre d’arguments en faveur de
l’existence d’une mémoire à court terme différente de la mémoire à long terme. L’étude du
vieillissement fournit d’autres faits en faveur de cette dualité. Chacun a pu observer des
personnes âgées qui se souviennent parfaitement des poèmes appris à l’école primaire mais
qui ne savent plus où elles ont mis leurs clés, si elles ont fermé la porte, éteint la lumière…
Les observations faites à propos de différentes amnésies confirment l’existence d’une
mémoire à court terme différente de la mémoire à long terme. Les amnésies antérogrades qui
concernent l’oubli d’événements survenus après l’accident aussi bien que les amnésies
3
Interférence : « Altération d’une performance résultant d’une activité ou tâche intercalée ou concurrente. Dans
le domaine de la mémoire, l’interférence concerne l’altération de l’acquisition en mémoire, mise en évidence
dans une épreuve de récupération (rappel ou reconnaissance), dont la cause peut être identifiée dans un
apprentissage antérieur (interférence proactive) ou dans un apprentissage intercalé entre l’apprentissage initial et
le test de rétention.» Dictionnaire de Psychologie, Doron, Parot, 1991, PUF : Paris.
rétrogrades qui touchent le passé du malade peuvent se manifester alors même que la
mémoire à court terme n’est pas atteinte. Le malade oubliant les faits du passé réussit les
épreuve de mémoire à court terme restituant un nombre de réponses correctes équivalent à
celui du bien portant. Les structures cérébrales impliquées dans la mémoire à court terme
diffèrent de celles dans lesquelles sont stockés les souvenirs.
S’il est généralement admis que mémoire à court terme et mémoire à long terme
possèdent des propriétés différentes et remplissent des fonctions différentes en revanche, la
distinction entre mémoire à court terme et mémoire de travail est en discussion. Pour nombre
d’auteurs actuels, cette distinction n’a plus lieu d’être, le mémoire de travail remplit les
fonctions de la mémoire de la mémoire à court terme, pour d’autres la mémoire à court terme
est nécessaire à la mise en œuvre de la mémoire de travail. Seule l’existence de supports
cérébraux différents permettrait, dans l’état de nos connaissances actuelles, de trancher en
faveur de l’autonomie de ces deux structures.
Figure N°2. Courbe des effets sériels en mémoire à court terme. Les deux courbes
donnent le pourcentage de rappels corrects en fonction de l’ordre de présentation des
stimuli. On peut ainsi lire sur la courbe rouge que 60 % des sujets ont rappelé le
premier item de la liste, 58 % le second, 56 % le troisième… La courbe bleue décrit
les résultats dans la situation où les sujets doivent rappeler la liste apprise dès la fin de
sa présentation. On peut observer que les premiers items présentés (effet de primauté)
et les derniers (effet de récence) sont mieux rappelés que les items du milieu de la
liste. La courbe rouge donne les résultats de l’épreuve lorsque le rappel est différé, les
sujets faisant une tâche tampon (par exemple, compter à rebours) entre la fin de la
présentation de la liste et le début du rappel.
Pourcentages de rappels
100
rappel
immédiat
90
80
Série1
Série2
70
rappel différé
60
50
40
1
3
5
7
9
11 13
Rang de présentation des items
3. La mémoire de travail
Pour Baddeley (1993)4, la mémoire de travail permet de maintenir disponibles
des informations perçues et d’activer les connaissances et les procédures qui sont nécessaires
à leurs traitements. En fait elle mobilise et gère les informations et les procédures nécessaires
à la réalisation des différentes tâches. Elle joue un rôle déterminant dans la compréhension du
langage, la résolution des problèmes, la réalisation de tâches de complexités variables,
l’acquisition de nouvelles connaissances ainsi que le traitement des images et de l’espace. La
4
Cette présentation est directement inspirée de l’ouvrage de Baddeley dont on trouvera les références dans la
bibliographie.
définition proposée par Baddeley souligne que la mémoire de travail ne saurait être confondue
avec la mémoire à court terme. Dans la mémoire à court terme, les conditions de présentation
ne permettent pas de développer des traitements complexes puisque les stimuli ne sont
présentés qu’une seul fois à une cadence suffisamment rapide pour empêcher l’autorépétition
et les traitements nécessitant du temps (Sperling, 1960). En revanche, on peut considérer que
les traitements développés dans le cadre de la mémoire de travail opèrent sur des informations
maintenues en mémoire à court terme avant d’être l’objet d’analyses et de traitements
complexes. Le développement des études sur la mémoire de travail tend si ce n’est à faire
disparaître du moins à minorer le rôle et la fonction de la mémoire à court terme.
La mémoire de travail est constituée d’un administrateur central, d’une boucle
articulatoire, d’un calepin visuo-spatial et d’une mémoire tampon (buffer) qui stocke
temporairement les informations. L’articulation de ces différentes structures est représentée
sur la figure N° 3.
3.1. L’administrateur central
Comme son nom l’indique il décide lequel des trois autres systèmes (boucle
articulatoire et calepin visuo-spatial) doit intervenir ou, si nécessaire, il coordonne leurs
interventions réciproques. C’est un contrôleur qui focalise l’attention sur certains aspects de la
tâche ou des stimuli, sélectionne les informations pertinentes, active les parties de la mémoire
à long terme concernées et déclenche l’exécution des programmes de traitements nécessaires
à la réalisation de la tâche. Ce contrôleur agit aussi bien sur la saisie des informations que sur
leurs traitements. Il coordonne les opérations cognitives mises en œuvre, mobilise les
procédures de traitement et active les contenus nécessaires à la réalisation de la tâche. Par
procédure de traitement on entend des savoir-faire cognitifs (procédures qui permettent de
lire, de comprendre, de compter, de calculer…) ou moteurs (opérations qui doivent être mise
en œuvre pour démarrer la voiture, changer une roue, appliquer une recette culinaire…). Par
contenu on entend les connaissances : ce que je sais à propos du volcan, de la voiture, des
dinosaures…. L’administrateur central fixe et organise les priorités déterminant l’ordre dans
lequel les traitements doivent être effectués par les systèmes esclaves. Selon Baddeley (1996),
il remplit quatre fonctions :
a – Coordonner les opérations liées à la réalisation de différentes activités.
La coordination des opérations concerne aussi bien la suite des opérations nécessaires
à la réalisation d’une tâche que la gestion de deux tâches simultanées. Dans les situations de
doubles tâches telles que conduire et téléphoner le système doit partager l’attention, donner
selon le moment priorité à l’une d’entre elles.
Gérer l’attention apportée aux tâches verbales et aux tâches visuo-spatiales mais aussi
contrôler, coordonner et articuler l’ordre des traitements qui doivent être effectués. Cette
gestion comporte aussi la résolution des conflits et l'établissement des priorités. Lors de la
conduite sur autoroute, lorsque les conditions météorologiques sont bonnes, le chauffeur peut
discuter avec ses passagers, en revanche, s’il aborde une partie du trajet difficile il négligera
ses échanges et même les interrompra. L’administrateur central décide de l’orientation de
l’attention du conducteur.
La coordination des opérations à l’intérieur d’une tâche donnée concerne aussi bien la
gestion des opérations effectuées en parallèle que la modification de l’ordre habituel des
traitements. Il peut s’agir par exemple des retours en arrière qui au cours de la lecture
permettent de revenir sur une information pour la vérifier ou pour préciser certains de ces
aspects. Il en est de même de l’ordre dans lequel les calculs doivent être faits pour résoudre un
problème. Cette coordination s’impose aussi dans les activités liées aux savoir-faire moteur.
Les exemples peuvent être trouvés dans la conduite automobile où l’on doit adapter sa façon
de conduire en fonction de l’état de la route, sèche, mouillée, enneigée, verglacée…
La sélection concerne aussi les stimuli ou les propriétés de ces stimuli sur lesquels
l’attention doit être porté : caractéristiques du véhicule que l’on dépasse, type de chargement
et danger qu’il peut présenter…
b – Rompre les automatismes.
Il s’agit d’inhiber des traitements automatiques afin de permettre la réalisation des
traitements impliqués par la tâche. La tâche STROOP (1935) illustre bien cette fonction. Dans
cette situation le sujet doit dénommer la couleur de l’encre de mots qui désignent des couleurs
(cf. fig.3). Cette tâche apparemment simple s’avère compliquée du fait que la lecture et
l’activation du sens du mot lu sont automatiques et rapides. Ainsi, il y a conflit entre la
réponse de lecture qui active les sens associés au mot désignant une couleur et la réponse de
dénomination qui correspond à une autre couleur. Dans ce cas, l’administrateur central a pour
fonction d’inhiber la réponse de lecture et de permettre à la réponse de dénomination de
s’exprimer. On trouvera sur la figure N° 3 un type de matériel utilisé pour mettre en évidence
l’effet STROOP.
c – Sélectionner les informations qui doivent être traitées ou activées et inhiber celles qui
doivent l’être.
Cette sélection concerne aussi bien les stimuli qui doivent être pris en compte, les
caractéristiques des stimuli qui doivent être prises en compte que les connaissances qui sont
disponibles en mémoire.
Choisir l’information pertinente est essentiel dans nombre de tâches. L’exemple du
diagnostic de panne ou du diagnostic médical illustre parfaitement la situation. Ces
diagnostics reposent sur la capacité à isoler les symptômes pertinents et à ignorer les autres.
Au-delà du choix des stimuli la sélection des connaissances stockées en mémoire qui doivent
être activées est tout aussi importante. Cette sélection peut être illustrée par l’activation d’un
sens particulier (acception) du mot lu et simultanément, l’inhibition des autres sens. Compte
tenu de la polysémie du langage cette activité est très fréquente dans la communication
verbale. Ainsi, par exemple, le lexème ombilic désigne le «nombril », la « dépression se
situant à la base ou à au sommet de certains fruits », la « partie centrale d’un plat ou d’une
assiette quand elle est en saillie arrondie », une « dépression peu étendue et creuse, cuvette au
fond d’une vallée glacière », ou une « plante à racine tubéreuse (crassulacées), dont une
variété à fleurs pendantes est appelée nombril de vénus. »(Dictionnaire Le Robert, 1995). Le
choix d’un de ces sens se fait de façon automatique au cours de la lecture. Il dépend du
contexte. Il est effectué par l’administrateur central.
Figure N° 3. Exemple d’épreuves correspondant au test Stroop (1935). Les sujets doivent
dénommer le plus vite possible la couleur des pastilles et de l’encre avec laquelle les mots
sont écrits. La dénomination des couleurs des pastilles et de la couleur de l’encre avec
laquelle sont écrits des mots n’évoquant pas les couleurs (table, livre, farine, sel) se fait sans
difficultés. En revanche, la dénomination de l’encre avec laquelle les mots désignant d’autres
couleurs ou désignant des associés à ces couleurs (ciel, citron, sang, prairie) est ralentie. Ce
phénomène est généralement expliqué par la compétition entre réponse de lecture et réponse
de dénomination. La lecture des mots est automatique et rapide. Cette lecture aboutit à
l’activation des signifiés qui sont associés au mot. La réponse de lecture doit donc être inhibée
pour permettre l’expression de la réponse de dénomination. Cette compétition entre réponse
de lecture et réponse de dénomination engendre un conflit lorsque les deux réponses
appartiennent au même champ sémantique. Dans cette situation, le rôle de l’administrateur
central consiste à inhiber la réponse de lecture afin de permettre l’expression de la
dénomination. L’effet STROOP peut être mis en évidence avec d’autres matériels, citons par
exemple le dessin d’un animal sur lequel est écrit le nom d’un autre animal (dessin d’un
chameau comportant en son centre le mot OURS), la tâche des sujets étant comme
précédemment de désigner l’animal représenté.
Tâche de dénomination de couleurs
ROUGE VERT JAUNE BLEU BLEU JAUNE ROUGE VERT JAUNE
ROUGE JAUNE VERT BLEU VERT ROUGE JAUNE VERT BLEU
CIEL CITRON SANG PRAIRIE SANG CIEL PRAIRIE CITRON SANG
CITRON SANG CIEL PRAIRIE CIEL CITRON PRAIRIE SANG CIEL
TABLE LIVRE FARINE SEL LIVRE SEL FARINE TABLE FARINE
LIVRE SEL TABLE FARINE SEL LIVRE TABLE FARINE LIVRE
d- L’activation, le maintien en activité et la manipulation des informations ou des
procédures stockées dans la mémoire à long terme.
C’est évidemment une des fonctions essentielles de l’administrateur central. Il
recherche et active aussi bien les procédures que les connaissances qui sont nécessaires pour
effectuer une tâche mais aussi il les maintien en activité et les manipule. En ce sens, il va agir
sur les informations stockées provisoirement en mémoire à court terme et donc empêcher leur
effacement. Il va leur appliquer des traitements dont le résultat pourra être l’objet d’une
réponse explicite ou implicite, transitoire ou stockée en mémoire à long terme. La recherche,
la mise en œuvre et l’adaptation des procédures pertinentes sont évidemment nécessaires mais
au-delà de la mise en œuvre des procédures connues il faut s’adapter aux situations nouvelles
en recombinant les procédures anciennes ou en en créant d’autres. L’administrateur central
remplit cette fonction fondamentale. C’est dire son importance aussi bien dans l’utilisation
des connaissances stockées en mémoire que dans l’élaboration de nouvelles connaissances.
Ce système central gère ce que les informaticiens appèlent des systèmes esclaves, à
savoir la boucle articulatoire et le calepin visuo-spatial (cf. figure 4).
3. 2. La boucle articulatoire
Elle a pour fonction de traiter le matériel verbal. Elle comporte deux composantes :
- « une unité de stockage phonologique » qui aura pour fonction et pour but de
« traiter les informations provenant du langage » (Baddeley, 1993).
L’information y est conservée durant un temps bref (1,5 à 2 secondes) ;
- « Un contrôle articulatoire » qui code phonologiquement les informations
graphiques et gère le langage intérieur utile aussi bien à la répétition subvocale
qu’aux raisonnements complexes.
La distinction entre codage phonologique et contrôle articulatoire est importante. Le
contrôle articulatoire renvoie à un langage interne mettant en œuvre les schémas articulatoires
tandis que le stockage phonologique correspond à des « images » phonologiques stockées en
mémoire et activées lors de l’audition et la compréhension du langage parlé. Pour comprendre
ce qui se dit nous devons posséder en mémoire des représentations phonologiques du langage.
Ces représentations nous permettent de « reconnaître » les mots prononcés par nos
interlocuteurs. L’activation de ces représentations phonologiques va permettre non seulement
la « reconnaissance » des mots mais aussi l’activation des sens qui lui sont associés. Le
stockage provisoire du message sous une forme phonologique est donc une étape essentielle
du traitement du langage.
Pour parler nous activons des schémas articulatoires. Nombres d’auteurs considèrent
que les tâches de raisonnement complexe nécessitent un « parler intérieur » et donc une
articulation non audible.
Selon Baddeley (1993) la boucle articulatoire rend compte en particulier du fait que :
a) lors du rappel, les items phonologiquement similaires (homophones) sont
moins bien rappelés que ceux qui sont phonologiquement différents. Cette
donnée semble indiquer que les items perçus sont codés phonologiquement
dans la mémoire de travail ;
b) la mémoire des mots courts est supérieure à celle des mots longs. L’effet de
la longueur plaide aussi en faveur d’un codage phonologique car, le
traitement phonologique d’un mot long est plus complexe que celui d’un
mot court ;
c) la répétition de mots ou de chiffres pendant que l’on effectue une tâche
affecte l’efficacité de la mémoire de travail. La tâche de répétition gène
aussi bien le codage phonologique que l’articulation sub-vocale qui serait
nécessaire à la réalisation de certaines tâches;
d) l’articulation de syllabes non significatives à haute voix ou à voix basse
perturbe la tâche du sujet. Comme précédemment, cette activité perturbe à
la fois le codage phonologique et l’articulation sub-vocale ;
e) le rappel et l’apprentissage sont détériorés lorsqu’ils sont accompagnés par
la lecture d’un texte même lorsque la langue dans laquelle ce texte est écrit
n’est pas connue du sujet. Comme précédemment, cette lecture perturbe à
la fois le codage phonologique et l’articulation sub-vocale.
Selon Baddeley, la boucle articulatoire va permettre les traitements impliquant
(directement ou indirectement) le langage. Elle est active dans toutes les tâches nécessitant
l’auto-répétition telle que l’apprentissage de poèmes. Elle gère ce langage intérieur nécessaire
à la réalisation de tâches complexes. Elle permet de maintenir disponible le matériel verbal.
Elle est impliquée dans la répétition mentale ou le codage verbal des images et des objets.
3. 3. Le calepin visuo-spatial
Il stocke de façon temporaire les images visuo-spatiales et les maintient disponibles
durant leurs traitements. Baddeley (1993) insiste sur l’importance de l’imagerie mentale et
tente de démontrer que l’image mentale comporte une composante visuelle et une composante
spatiale. La composante spatiale traite les problèmes liés aux localisations, la composante
visuelle concerne les autres paramètres de l’image : forme, couleur... Le traitement spatial
peut être indépendant du traitement visuel. Baddeley emprunte aux auteurs travaillant sur
l’image les arguments en faveur du bloc visuo-spatial. Son argumentation s’appuie sur leurs
données. Il rappelle que :
- les mots ayant un fort pouvoir évocateur d’images sont mieux retenus que les mots
dont le pouvoir d’imagerie est faible et que cet effet est accentué lorsque les sujets
sont incités à créer les images évoquées par ces mots ;
- si l’on fait apprendre la description d’un bateau en commençant par l’avant puis
que l’on cache ce bateau et que l’on demande au sujet de situer des objets appris,
on observe que le temps de réponse est proportionnel à leur localisation : plus
l’objet se situe à l’arrière du bateau plus le temps de réponse est long (Kosselyn,
1980). De même, dans les tâches effectuées sur des objets mémorisés, les temps de
réponses sont proportionnels aux durées d’explorations. Ces données sont
habituellement interprétés comme prouvant l’existence d’une mémoire imagée
qualifiée d’analogique pour signifier qu’il existe une ressemblance entre l’objet
réel et la représentation qui est stockée en mémoire. Pour certains auteurs, la
représentation mentale comporterait les mêmes propriétés topographiques que
l’objet.
- L’utilisation du paradigme de la double tâche permet de valider l’hypothèse d’un
calepin qui aurait des fonctions tant visuelles que spatiales. Les sujets doivent
effectuer simultanément deux tâches. Si ces deux tâches mettent en œuvre des
processus similaires, leurs réalisations simultanées doivent provoquer des
interférences. Au contraire, si elles impliquent des traitements différents elles ne
seront à l’origine d’aucune confusion. Concrètement, si le calepin comporte une
composante visuelle, toute tâche secondaire visuelle doit perturber son
fonctionnement. De même, si le calepin comporte une composante spatiale, toute
tâche secondaire nécessitant un traitement spatial doit perturber son
fonctionnement. Les données de Brooks (1967), Baddeley et Hitsch (1974),
Baddeley et Lieberman (1980) et Logie et Marchetti (1991), qui ont utilisé le
paradigme de la double tâche, semblent valider l’existence des deux composantes
du calepin visuo-spatial.
-
Les observations faites sur un patient manifestant des troubles de la localisation
spatiales confirment cette dissociation entre imagerie spatiale et imagerie visuelle.
Elles sont rapportées par Luzzati, Vecchi, Agazzi, Cesa-Bianchi et Vergani (1998)
qui décrivent les symptômes d’un patient qui est capable de se représenter les
objets qu’il a vu mais qui est incapable de rappeler leur position, de les faire
tourner mentalement et de réaliser toutes les opérations faisant appel à l’imagerie
spatiale. Ces observations témoignent de l’autonomie de l’imagerie visuelle par
rapport à l’imagerie spatiale.
Toutes ces données témoignent en faveur de l’existence d’un calepin visuo-spatial
capable de traiter aussi bien les caractéristiques visuelles que les propriétés spatiale des objets,
des images et des environnements.
3. 4. La mémoire tampon épisodique
Introduit en 2000 par Baddeley, la mémoire tampon épisodique est un système de
stockage temporaire qui maintien disponible les informations nécessaires à la réalisation de la
tâche. Sa capacité est supérieure à celle de « feu » la mémoire à court terme puisqu’elle peut
conserver actives durant tout le temps de leurs traitements les informations utilisées durant la
réalisation de la tâche. Cette tâche pouvant durer plusieurs minutes. Cette mémoire est
qualifiée d’épisodique pour marquer qu’elle stocke provisoirement des informations perçues
dans le contexte particulier où est effectué la tâche. Cette mémoire tampon, intégrée dans la
mémoire de travail, pourrait remplacer la mémoire à court terme.
L’ensemble constitué par le système de contrôle central, la boucle articulatoire, le
calepin visuo-spatial et la mémoire tampon épisodique est représenté sur la figure 4. La
mémoire de travail est une interface qui va utiliser les connaissances stockées dans la
mémoire à long terme pour traiter les informations qui lui sont soumises.
Figure N° 4. Représentation de l’organisation des différentes unités de la mémoire de
travail. La mémoire de travail est représentée par les cases colorées en orange. Selon la
nature de la tâche et du matériel, l’information est traitée soit par la boucle
articulatoire, soit par le calepin visuo-spatial soit par les deux. L’administrateur central
détermine les informations qui doivent être traitées et les traitements qui doivent être
effectués. L’administrateur central remplit une fonction d’interface entre l’information
perçue et les différentes connaissances stockées en mémoire.
Stimuli sensoriels
Boucle articulatoire
- traitement phonologique
- contrôle articulatoire
Mémoire tampon
épisodique
Calepin visuo-spatial
- traitement visuel
- traitement spatial
Administrateur central
-
Coordination
Rupture des automatismes
Sélection des informations à traiter, activer ou inhiber
Manipulation des différentes connaissances stockées en
MLT
Mémoire à long terme contenant des
connaissances et des procédures
4. La mémoire à long terme
Cette mémoire correspond à un stockage allant de quelques heures à plusieurs années.
Dudai (2002) énumère trois composantes de la définition. La mémoire à long terme se
manifeste par « un changement durable du comportement, ou de comportements potentiels qui
résulterait d’expériences individuelles… », elle se caractérise par « la rétention des
informations après l’apprentissage », elle est constituée «de représentations internes qui
peuvent être activées ou reconstruites ». Dans tous les cas, le support de cette mémoire est le
réseau neuronal qui possède une propriété fondamentale nommée « plasticité neuronale ».
Cette expression décrit le fait que les synapses et donc la transmission de l’influx nerveux
sont modifiées par l’apprentissage, l’acquisition de nouveaux comportements et de nouvelles
connaissances.
Pour certains auteurs, le stockage serait, sauf détérioration pathologique, définitif,
l’oubli ne serait pas du à un déficit de stockage mais à des difficultés de récupération ou à des
interférences. Tout ce qui aurait été stocké en mémoire à long terme persisterait mais, dans
certaines conditions, les souvenirs seraient soit difficiles à récupérer, soit confondus avec
d’autres. D’autres hypothèses sont aussi étudiées, le fait que le réseau ayant stocké des
informations soit mis en sommeil c'est-à-dire ne soit pas réactivé pendant de longues périodes
pourrait aboutir à un affaiblissement progressif des modifications synaptiques introduites par
les apprentissages
Le stockage des informations en mémoire à long terme, dans le cas des apprentissages
volontaires, suppose soit la répétition, soit un traitement qualifié de profond. Lors de
l’apprentissage de poèmes, on est amené à répéter les vers jusqu’à ce qu’ils soient appris.
L’apprentissage d’un cours, ne faisant pas appel à ce que l’on qualifie de « par cœur »,
consiste à comprendre ce cours, à analyser sa cohérence, bref à développer tout un certain
nombre de traitements profonds portant sur la signification. Ces traitements aboutissent au
stockage en mémoire à long terme des informations traitées.
Dés 1970, les psychologues ont distingué une mémoire déclarative (dite aussi
explicite) et une mémoire non déclarative (dite non explicite). L’opposition entre mémoire
implicite et mémoire explicite date des premières observations de Korsakov (1911). Ce
célèbre neurologue décrit un patient qui lui tend la main lorsqu’il rentre pour la première fois
dans sa chambre. Dix minutes après être sorti de la chambre, Korsakov rentre de nouveau, le
patient ne se souvient pas de l’avoir vu mais ne lui tend plus la main. Ce comportement
manifeste que la mémoire explicite du patient est atteint puisque interrogé, le patient répond
ne pas avoir rencontré le médecin. En revanche, la mémoire implicite semble intacte puisque
le patient ne sert plus la main de son médecin car on ne tend pas la main deux fois. Ce patient
manifeste des troubles de la mémoire explicite alors que la mémoire implicite semble
préservée.
Sous la rubrique « mémoire déclarative » on retrouve la mémoire sémantique et la
mémoire épisodique (cf. figure 5). La mémoire non déclarative comporte les aptitudes et
habitudes, les conditionnements simples, les apprentissages non associatifs et les « priming ».
Dans ce contexte le terme « priming »5, désigne le fait que la présentation répétée de stimuli
aboutit à faciliter leurs reconnaissances ultérieures. Les faits en faveur de ces distinctions sont
essentiellement liés à l’observation d’individus présentant des troubles de la mémoire
déclarative sans que les mémoires non déclaratives soient affectées.
L’expression « mémoire déclarative» désigne des mémoires verbales, sémantiques,
encyclopédiques… Mes connaissances du volcan et de son fonctionnement, du moteur à
5
Qui dans la suite de l’ouvrage désignera les phénomènes «d’amorçage » sémantiques.
quatre temps et de son fonctionnement sont des connaissances déclaratives. Le fait que ces
connaissances puissent être transmises par le langage doit être nuancé pour trois raisons :
a) par ce qu’être capable de décrire verbalement une connaissance ne signifie pas que
cette connaissance soit stockée sous une forme verbale. Le problème des modalités
de stockage des connaissances est sujet à discussion. Nous verrons ultérieurement
que la perte du langage n’est pas forcément associée à la perte des connaissances
déclaratives.
b) parce que la plupart des connaissances peuvent être décrites verbalement : les
procédures mises en œuvre pour marcher peuvent être décrites verbalement ces
descriptions feront partie des connaissances déclaratives. Ces descriptions ne me
permettent pas de marcher. Les procédures que je mets en œuvre pour marcher ne
sont pas déclaratives, elles font partie de ma mémoire procédurale.
c) enfin par ce que nombre d’auteurs estiment que la mémoire déclarative peut
contenir des images.
Compte tenu de ces réserves, il est néanmoins possible de considérer que la mémoire
déclarative contient des connaissances généralement exprimées sous forme verbale.
Les contenus de la mémoire dite déclarative sont désignés par des intitulés différents
on distingue ainsi la mémoire sémantique, la mémoire épisodique, la mémoire
autobiographique et la mémoire encyclopédique.
La mémoire autobiographique désigne la mémoire des événements de notre vie
personnelle : souvenirs d’une fête, d’un mariage, de la joie d’une naissance, d’une rencontre
ou d’un deuil. Baddeley oppose souvenirs de personnes et souvenirs d’événements. On se
souvient de tel camarade ou de tel enseignant mais on peut aussi se souvenir d’une fête, d’une
naissance ou d’un accident. La mémoire autobiographique est constituée d’images et
d’indications précises du contexte dans lequel s’est déroulé l’événement stocké.
Les études sur la mémoire autobiographique indiquent que les sujets ont tendance à retenir
les événements qui ont été vécus et associés à de fortes émotions. Dans ce cadre, les
événements désagréables sont plus facilement oubliés. Refoulement ou oubli, il est plus facile
de se rappeler les moments agréables que les moments désagréables. Pourtant les événements
liées à des chagrins ou à la peine ressentie à l’occasion d’un décès restent en nous présents.
L’expérience subjective qui accompagne le rappel et l’événement stocké caractérise la
mémoire autobiographique.
La notion de mémoire épisodique est introduite par Tulving en 1972 elle « concerne
les événements personnellement vécus par un sujet, constitués « d’épisodes » qui peuvent être
localisés grâce à leurs coordonnées de temps, de lieu, et à l’origine d’une biographie
singulière. » (Dictionnaire de Psychologie, Doron, Parot, 1991, PUF : Paris). Habituellement,
la mémoire épisodique et la mémoire autobiographique sont confondues pourtant, en 2002,
Conway oppose mémoire autobiographique et mémoire épisodique sur la base de la durée du
stockage. La mémoire épisodique stockerait durant quelques minutes ou quelques heures des
informations sensori-perceptives détaillées des événements vécus. Ces « souvenirs » seraient
ensuite intégrés dans la mémoire autobiographique. Dans cette mémoire serait stockée durant
plusieurs mois et années l’expérience personnelle de l’individu. La rétention de l’ensemble du
contexte, des lieux, des moments et des circonstances spécifiques dans lesquelles les
événements se sont produits caractérisent la mémoire épisodique.
En 1983, Tulving propose de baser l’opposition entre mémoire sémantique et mémoire
épisodique sur l’expérience subjective qui accompagne le rappel. Il distingue deux formes de
conscience : la conscience « autonoétique » qui a trait à la connaissance de soi et qui désigne
des souvenirs et la conscience « noétique » qui renvoie aux connaissances. L’opposition entre
connaissance et mémoire nous dirons souvenirs est reprise par Gardiner en 2002.
Figure N° 5; Contenus de la mémoire à long terme
Mémoire à
long terme
Mémoire déclarative ou explicite
Mémoire épisodique
Mémoire sémantique
Mémoire non déclarative ou
implicite
Aptitudes et
habitudes
"Priming"
Conditionnement
simple
Apprentissage non
associatif
Depuis Tulving (1972) on oppose mémoire épisodique et mémoire sémantique. La
mémoire épisodique et la mémoire autobiographique sont des mémoires qui sont marquées
par des expériences individuelles. Par opposition la mémoire sémantique contient des
informations concernant des connaissances générales tels que les signifiés des lexèmes et les
schémas de connaissances. La mémoire sémantique contient des connaissances partagées
tandis que la mémoire épisodique renvoie à des expériences personnelles. La mémoire
sémantique contiendrait les connaissances du monde. La phrase « Lyon capitale des Gaules »
renvoie à la mémoire sémantique tandis que le souvenir du bon repas pris dans un bouchon
lyonnais serait stocké dans la mémoire épisodique ou la mémoire autobiographique.
Les contours de la mémoire sémantique sont encore sujets à discussion. Une
approche restrictive consiste à en faire un dictionnaire des concepts, le lieu où seraient stockés
les signifiés de tous les lexèmes ou objets connus par le sujet. C’est ce dictionnaire qui a été
l’objet du plus grand nombre de recherches et de modélisations. Il faut pourtant noter que
nombres d’auteurs, à l’instar de Baddeley (1993) élargissent le champ de recherche en
intégrant dans la mémoire sémantique l’ensemble des schémas de connaissances. Ce point
sera discuté dans le chapitre neuf.
Aux différentes mémoires déclaratives est généralement opposée le mémoire procédurale.
La mémoire procédurale contient des savoir-faire, des comment faire aussi bien perceptivomoteur que cognitifs : comment je fais pour démarrer la voiture, conduire, quelles procédures
j’utilise lorsque je me sers de tel logiciel mais aussi des procédures mentales que j’ai
automatisées et dont je n’ai pas toujours conscience : comment je fais pour lire, comprendre,
faire une multiplication… Cette mémoire est donc constituée de séquences d’actions motrices
(la suite des actions mises en œuvre pour démarrer mon ordinateur ou réaliser une fonction
particulière) qui peuvent comprendre des schémas moteurs c’est à dire des programmes de
mouvements (programmation de la marche, des actions mises en œuvre lorsque je skie, je
nage…) et des programmes cognitifs. Ces programmes ont été l’objet d’apprentissage puis
sont devenus automatiques et peuvent donc être déclenchés et se dérouler sans nécessiter
d’attention. Soulignons que ces programmes d’actions (moteurs ou cognitifs) peuvent être
stockés sans avoir été verbalisés. Je fais du vélo sans être capable d’expliquer comment je fais
pour tenir en équilibre, je comprends un texte sans être capable d’expliciter comment je fais.
Lors de la mise au point des systèmes experts les chercheurs ont été frappés de constater que
nombres d’opérateurs possédaient des savoir-faire qu’ils étaient incapables de décrire
verbalement. Ils savaient faire mais ils ne savaient pas dire comment ils faisaient. Il en est de
même des procédures mentales, nous sommes capables de comprendre un texte mais nous
ignorons comment nous faisons pour comprendre. Cette mémoire procédurale a parfois été
qualifiée d’ « anoétique » c’est-à-dire de non consciente. La description de ces savoir-faire
cognitifs est l’objet principal de la recherche en Psychologie Cognitive.
L’opposition entre mémoire procédurale et mémoire déclarative a une justification neurophysiologique puisque les neurologues ont observés des patients manifestant des troubles de
la mémoire verbale sans perturbation de la mémoire procédurale. Ces individus étaient
capables d’apprendre de nouvelles procédures alors qu’ils étaient incapables de stocker des
informations verbales.
D’autres expressions sont utilisées pour qualifier la mémoire à long terme. Ainsi, par
exemple, Schacter (1985) insiste sur le fait que l’apprentissage peut être implicite ou
explicite. La notion d’explicite renvoie à l’effort conscient pour apprendre, à l’opposé, un
apprentissage implicite serait réalisé sans volonté prédéterminée. La répétition des
événements aboutit à des apprentissages qui n’ont pas été obligatoirement volontaires. Ces
apprentissages peuvent être qualifiés d’implicites. Cette distinction serait cruciale dans la
mesure ou elle déterminerait la qualité de l’apprentissage.
Une autre opposition basée sur le contenu de la mémoire à long terme concerne la
distinction entre mémoire verbale et mémoire imagée. Cette dernière regroupe l’ensemble des
images visuelles, auditives, olfactives, tactiles, gustatives ou kinesthésiques qui sont stockées
à long terme. Représentation imagée de cette maison où je passais mes vacances. Goûts et
odeurs des madeleines qui rappellent à Marcel Proust les charmes de son enfance.
Les données obtenues grâce aux techniques d’imagerie cérébrale nous indiquent que si
l’on demande à des individus de se souvenir de la plage sur laquelle ils ont passé leurs
dernières vacances ils activent les zones associatives du cortex occipital qui traitent les images
visuelles. Ces mémoires imagées seraient donc localisées dans des zones spécifiques du
cerveau différentes des lieux où sont stockées les informations verbales.
La validité de ces différentes mémoires ne sera pas traitée dans le cadre de cet
ouvrage. Mais l’énumération qui vient d’en être faite soulève la question de leur autonomie.
Ces différentes mémoires (procédurale, épisodique, bibliographique, sémantique,
encyclopédique, verbale, imagée…) sont-elles des entités différentes composant la mémoire à
long terme ou simplement des modes de description d’un système unique ? La réponse à cette
question conditionne les recherches sur l’organisation de la mémoire à long terme. S’il existe
plusieurs entités différentes, comment chacune d’entre elle est-elle organisée, quels liens
entretient-elle avec les autres structures ? S’il n’existe qu’une seule structure comment
s’articulent et s’intègrent ces différentes connaissances ? Comment les représentations et
connaissances verbales et imagées s’intègrent-elles aux savoir-faire moteurs ou cognitifs?
Toutes ces questions sont au centre des recherches actuelles. Traitant de la mémoire
sémantique nous nous intéresserons uniquement au lien entre cette mémoire et les autres.
Pour ce qui est de la distinction entre mémoire sensorielle, mémoire de travail et
mémoire à long terme, dans l’état de nos connaissances, les psychologues attestent de leurs
spécificités. Amnésie antérograde touchant les souvenirs anciens, alexies et aphasies touchant
la compréhension et la production du langage sont autant de détériorations qui témoignent
d’une relative autonomie de ces différentes mémoires.
Résumé
Pour décrire les différentes mémoires il est habituel d’adopter une perspective
chronologique allant d’un stockage de l’information de quelques centièmes de seconde à la
mémoire à long terme. Dans ce cadre on distingue habituellement quatre catégories de
mémoires :
- Des registres sensoriels qui conservent durant moins d’une minute la trace
d’informations présentées pendant à peine quelques centaines de millièmes de
secondes. En vision, la capacité de ce registre ne dépasse pas 5 unités. Ces
registres sont spécifiques de chaque système sensoriel : visuel, auditif,
kinesthésique, olfactif, gustatif ou liés au toucher.
- Une mémoire à court terme qui stocke les informations durant quelques secondes.
Elle permet le maintien en mémoire d’informations qui ne sont présentées qu’une
seule fois, n’ont pas pu être répétées ou n’ont fait l’objet d’aucun traitement
profond. La capacité de cette mémoire n’excède pas 7 à 9 éléments. Cette mémoire
a pour caractéristique le fait que les premiers (effet de primauté) et les derniers
items (effet de récence) de la liste apprise sont mieux retenus que les items
centraux. Certains chercheurs tentent actuellement de l’intégrér dans la mémoire
de travail.
- Une mémoire de travail définie comme « un système de maintien temporaire et de
manipulation de l’information, nécessaire pour réaliser des activités cognitives
complexes, telles que la compréhension, l’apprentissage, le raisonnement. »
(Baddeley, 1993). Elle est composée d’un administrateur central qui focalise
l’attention sur certains aspects de la tâche ou des stimuli, sélectionne les
informations pertinentes, active les parties de la mémoire à long terme concernées
et déclenche l’exécution des programmes de traitements nécessaires à la réalisation
de la tâche. Cet administrateur central gère trois systèmes esclaves :
- la boucle articulatoire qui gère le traitement du matériel verbal ;
- le calepin visuo-spatial qui se charge du traitement des composantes
visuelles et spatiales des stimulations ;
- La mémoire tampon épisodique qui stocke provisoirement les
informations nécessaires à la réalisation de la tâche.
- Une mémoire à long terme qui comprend :
- des procédures tant motrices que cognitives ;
- des informations autobiographiques et des souvenirs d’épisodes de la
vie ;
- une mémoire sémantique qui serait un dictionnaire mais comprendrait
aussi différents schémas de connaissances.
Cette mémoire à long terme comprendrait des registres verbaux et imagés.
C’est à l’exploration de la mémoire sémantique qu’est consacré cet ouvrage.
Pour en savoir plus
BADDELEY A. (1992), La mémoire humaine, théorie et pratique. Presses Universitaires de
Grenoble : Grenoble.
ERHLICH S. (1972), La capacité d’appréhension verbale. PUF : Paris.
LIEURY A. (2000), Psychologie générale : cours et exercices. Dunod : Paris.
Mots clés : registres sensoriel, mémoire à court terme, mémoire de travail, mémoire à long
terme, mémoire sémantique, mémoire épisodique, mémoire encyclopédique, mémoire
procédurale, mémoire verbale, mémoire imagée.
Questions
1. Durées de stockage et capacités des registres sensoriels, de la mémoire à court terme
et de la mémoire à long terme.
2. Décrivez les expériences permettant d’expliquer le fonctionnement des registres
d’information sensorielle.
3. A quoi sont dus les effets de primauté et de recense constatés lors de l’étude de la
mémoire à court terme.
4. Décrivez les éléments constitutifs de la mémoire de travail.
5. Décrivez le fonctionnement de la mémoire de travail lors du traitement d’une tâche
verbale ou lors de la localisation d’objets dans l’espace.
6. Sur quelles bases expérimentales peut-on distinguer les deux fonctions du calepin
visuo-spatial de la mémoire de travail.
7. Qu’est ce qui distingue la mémoire à court terme de la mémoire tampon de la
mémoire de travail.
8. Décrivez les différents constituants de la mémoire à long terme.
9. Qu’est ce que la mémoire procédurale. Illustrez votre propos au moyen d’exemples.
10. Décrivez la mémoire épisodique. Comment se distingue-t-elle de la mémoire
sémantique ?
Chapitre 2. Les réseaux sémantiques, modèles d’organisation de la mémoire sémantique
Comprendre le langage tant oral qu’écrit nécessite que l’on dispose d’un dictionnaire
mental nommé «Mémoire sémantique ». La mémoire sémantique est représentée sous la
forme d’un réseau d’unités (mots) interconnectées.
L’organisation de ce réseau a été l’objet de différentes études. Les premiers modèles
proposaient une organisation hiérarchique (dite taxonomique) allant de l’objet singulier (le
canari) à la classe de niveau le plus élevé (les êtres vivants). La hiérarchie reposait sur la
relation ISA « l’objet X est un… ».
A chaque unité sont associées des propriétés (traits sémantiques).Que sont ces traits
sémantiques ? Comment les réseaux sémantiques représentent-ils les sens stockés en
mémoire ? Quelles données permettent de valider les modèles de représentation de la
mémoire sémantique ? Telles sont les questions qui sont abordées dans ce chapitre.
Arbre taxonomique
Etres vivants
Animaux
Objets manufacturés
Etres humains
Oiseau : vole a des plumes est
Canari
Pigeon
Poisson
Sole
BAR
Les contours de la mémoire sémantique varient selon les auteurs. Baddeley classe dans
ce magasin la plupart de nos connaissances historiques, géographiques, sociales,
psychologiques… De façon plus restrictive les auteurs qui construisent des réseaux
sémantiques se limitent à la modélisation de l’organisation du lexique mental et de la
signification des mots. Cette modélisation est l’objet de recherches aussi nombreuses que
riches.
Dans ce chapitre, il ne sera traité que des réseaux simulant l’organisation des concepts
et de leurs significations. Il s’agit donc essentiellement d’étudier le répertoire de la mémoire à
long terme qui contient les sens associés aux lexèmes connus par un individu donné. Le
lexème « est l’unité de base du lexique… A. martinet… suggère ensuite de distinguer lexème
et morphème, le lexème « trouvant sa place dans le lexique » et le morphème «apparaissant
dans la grammaire ». L’unité travaillons se divisera ainsi en deux, un lexème travaill- et un
morphème –ons. » (Dictionnaire de linguistique et des sciences du langage). Force est de
constater que les travaux sur les réseaux sémantiques ont négligé le traitement des
morphèmes.
Compte tenu des données de neuro-psycholgie, nous reprenons à notre compte la
distinction entre signifiant et signifié (de Saussure, 1962). Le signifiant est l’image acoustique
ou phonologique aussi bien que le dessin correspondant à l’écriture du mot tandis que les
signifiés sont les sens et les significations qui sont attachées aux signifiants. Pour de Saussure
(1962) « le signe linguistique unit non une chose et un nom, mais un concept et une image
acoustique… Nous proposons de conserver le mot signe pour désigner le total, et de
remplacer concept et image acoustique respectivement par signifié et signifiant ; ces deux
derniers termes ont l’avantage de marquer l’opposition qui les sépare soit entre eux, soit du
total dont il font partie. ». Il précise que l’image acoustique « n’est pas le son matériel, chose
purement physique, mais l’empreinte psychique de ce son, la représentation que nous en
donne le témoignage de nos sens ». C’est une représentation mentale constituant ce
qu’ultérieurement les psychologues nommeront le répertoire phonologique. Quant au signifié
F. de Saussure en dit peu de chose. Le célèbre linguiste représente les constituant du signe
linguistique au moyen de la figure 4.
Figure N° 4. Représentation proposée par de Saussure (1962) des constituants du signe
linguistique.
CONCEPT
IMAGE ACOUSTIQUE
En accord avec les définitions données par Saussure la figure N°4 peut être remplacée
par la figure N°5.
Figure N° 5. Nouvelle représentation des constituants du signe linguistique conforme
aux définitions données par de Saussure (1962).
SIGNIFIE
SIGNIFIANT
Dans ce cadre théorique la mémoire sémantique serait constituée de l’ensemble des
signifiés associés aux signifiants. Remarquons que le sens ne se limite pas aux signifiés
associés aux lexèmes, les propositions et les phrases sont aussi porteuses de sens. Qui plus est,
le sens n’est pas limité au verbal, les objets, les individus humains ou animaux, les situations
et les événements sont aussi porteurs de sens. La mémoire sémantique devrait donc contenir
les sens associés à ces différentes catégories de « signifiants ». Or force est de constater que
relativement peu de recherches ont été consacrées à la comparaison des sens associés à ces
différents matériels.
De façon implicite, les chercheurs font comme si la mémoire sémantique était une
structure unique pouvant être activée de façon similaire par l’audition ou la lecture d’un mot,
la perception d’objets, d’êtres vivants ou d’événements. Or, des recherches de Cornuejols et
Rossi (2000) indiquent qu’aux mots et images sont associés des signifiés différents. Si au
lexème zèbre est habituellement associé rayure à la perception d’une image représentant cet
animal est associé savane. Ce constat devrait amener à s’interroger sur l’existence de
différents réseaux sémantiques. L’analyse comparative et la spécificité des signifiés associés à
chacune de ces entrées n’ont pas fait l’objet d’études systématiques. La question reste
pourtant posée.
La grande majorité des travaux portant sur les réseaux sémantiques ont trait à l’étude
et à la modélisation du stockage des signifiants correspondants aux lexèmes et des signifiés
qui leur sont associés. La description de ces réseaux permet de comprendre comment la
recherche en psychologie conçoit la mémoire du sens. C’est la raison pour laquelle, les
principes d’organisation de ces réseaux vont être décrits et analysés. L’autre intérêt des
réseaux réside dans le fait qu’ils ont été l’objet de modélisation. Or, les modèles sont des
instruments puissants de validation et de prédiction. Ils constituent des maquettes qui peuvent
être manipulées et testées efficacement. Le modèle est un outil de recherche puissant. Le
succès des modèles a été assuré par le développement de l’informatique.
1. Les réseaux sémantiques, principales définitions
L’idée de réseaux sémantiques repose sur l’hypothèse que la mémoire est organisée en
un système d’unités interconnectées. L’expression « réseau sémantique » est due à Quillian
(1968) qui désigne ainsi : «une structure de représentation des connaissances qui se présente
sous la forme d’un graphe comportant des nœuds. Ces nœuds correspondent à des objets, des
concepts ou des événements. Ils sont reliés entre eux par des arcs qui spécifient la nature de
leurs relations. Ce type de graphe est fini, orienté, étiqueté, généralement connexe et
cyclique. », (G. Otman, 1998 vocabulaire des sciences cognitives). Les figures 6, 7 et 8
représentent différents types de réseaux sémantiques. Le développement des modélisations
connexionnistes (McClelland & Rumelhart, 1981 ; Farah & McClelland, 1991 ; Cree, McRae
& McNorgan, 1999) a largement contribué au succès de ce type de représentation.
Avec Quillian (1968) l’objectif des chercheurs qui travaillent sur les réseaux
sémantiques « est d’inscrire les concepts dans une structure élargie, de telle sorte que le sens
d’un concept émerge de la place qu’il occupe dans le réseau et des types de relations qu’il
entretient avec les concepts voisins » (G. Otman, 1998 vocabulaire de sciences cognitives).
Ainsi, construire un réseau sémantique nécessite que l’on précise : a) la nature des unités qui
composent le réseau ; b) le principe d’organisation du réseau ; c) les types de liens qui relient
les unités.
Les unités sont des concepts. Mais le concept utilisé par les chercheurs en psychologie
ne correspond pas exactement au concept de de Saussure. Dans la perspective de de Saussure,
un concept correspond à l’ensemble des signifiés associés à un lexème (mot). Alors que dans
le cadre des réseaux sémantiques les concepts sont des unités verbales ayant une signification
Dans les réseaux sémantiques, la notion de concept désigne le lexème stocké en mémoire. Sur
la figure 6, oiseau et canari sont des concepts auxquels sont associés des signifiés : a des
ailes, peut voler, a des plumes ou peut chanter, est jaune. Ainsi l’utilisation de la notion de
concept fluctue selon le contexte dans lequel il est utilisé. C’est la raison pour laquelle
nombre d’auteurs refusent de l’utiliser. Nous partageons cette réserve est préférerons les
notions de lexème, de signifiant et de signifiés.
La principale propriété des réseaux est que, par définition, les unités dont il est
constitué sont inter-connectées. Ces connexions aboutissent à ce que l’activation d’une unité
puisse se propager aux unités auxquelles elle est associée. Donc, le réseau est conçu comme
un système de propagation de l’activation. Par activation on entend en neurosciences « une
augmentation rapide de l’excitabilité du système nerveux… » (1998, Vocabulaire des
Sciences Cognitives). Les psychologues utilisent ce terme pour désigner un état d’éveil et
d’activité du système. Il doit être opposé à l’état de repos qui n’est pas obligatoirement une
situation de non activité. Il est admis que les cellules ont une activité de base dite de repos.
L’activité (opposée à l’état de repos) est soit activatrice soit inhibitrice. Dans un cas,
l’activation va augmenter l’activité cellulaire par rapport à l’activité enregistrée en situation
de repos, dans l’autre (inhibition) elle va diminuer l’activité de repos et rendre la cellule
difficile à activer. Le modèle renvoie à l’activité d’une cellule neuronale qui peut être soit en
état de repos, soit activée, soit inhibée. Dans l’état de repos la cellule a une activité de base
d’entretien. Dans l’état d’activation son potentiel électrique est plus élevé, cette activité peut
être plus ou moins importante et être transmise aux cellules auxquelles elle est connectée.
Dans la situation d’inhibition, l’activité est diminuée de sorte que l’activation des cellules
devient difficile. Dans tous les cas, l’activation se traduit par une augmentation de la
consommation d’énergie. Pour le psychologue, les informations stockées en mémoire seraient
en quelque sorte dans un état de sommeil ou d’inactivité. Ces informations pourraient être
réveillées c'est-à-dire soit être rendues disponibles soit être activées. La notion d’activation
recouvre les deux sens : rendre disponible ou rendre actif et conscient.
Dans ces modèles, les chercheurs introduisent généralement des règles de propagation
de l’activation. Dans le chapitre suivant nous verrons que plusieurs règles de propagation sont
proposées. Schématiquement elles peuvent être résumées comme suit :
- La propagation de l’activation aboutit à ce que toutes les unités reliées soient
activées de façon identique ;
- La propagation peut être modulée de sorte que le niveau d’activation varie selon la
distance, plus on s’éloigne de la source plus l’activation diminue. C’est ainsi que
Quillian (1968) décrit un algorithme de diffusion de l’activation selon lequel, plus
le nombre de nœuds séparant deux unités est grand plus la diffusion sera faible.
- L’activation dépend de la force associative, plus cette force est grande plus
l’activation sera forte (Rips, Shoben et Smith, 1973)
- La force de l’activation dépend de la nature des relations.
- Dans les réseaux compétitifs, seule l’unité la plus activée reste opérationnelle,
l’activation des autres unités est supprimée. Ainsi, par rétro-propagation les unités
dont l’activation n’est pas la plus forte reviennent à leur état de repos.
Dans tous ces cas de figures l’activation peut varier en fonction du temps. Différents modèles
d’évolution peuvent être appliqués.
Dans les chapitres ultérieurs, différents types de relations seront proposés mais on doit
retenir qu’une des propriétés essentielles des réseaux est de permettre la modélisation de
systèmes de propagation de l’activation. D’où l’importance de l’organisation des unités.
Le principe d’organisation le plus fréquemment étudié est la similitude. Les unités
seraient regroupées sur la base de leurs similitudes : plus leur similarité est grande plus leurs
proximités seraient grandes. Pourtant, les critères de similarité varient d’un modèle à l’autre.
Les divergences portent sur la nature des ressemblances. Les regroupements sur la base de
catégories taxonomiques6 ont connu un certain succès. S’inspirant des classifications
appliquées aux sciences de la nature, les auteurs ont proposé des organisations de type
taxonomique qui sont des systèmes d’emboîtement de classes structurées selon un mode
hiérarchique. L’organisation taxonomique des réseaux sémantiques a été l’objet de
nombreuses études.
2. L’organisation taxonomique : description
Une taxonomie est un système d’organisation de catégories par inclusions. Par
catégorie on entend des ensembles d’objets équivalents se situant au même niveau
d’organisation. Dans la classe des oiseaux, le pigeon , l’hirondelle, le moineau et le canari se
situent au même niveau. La dimension verticale de la taxonomie définit les systèmes
d’inclusion tandis que l’horizontale correspond à la segmentation de la catégorie. Le niveau
d’inclusion définit le niveau d’abstraction (Rosch et Llyod, 1978). Le moineau fait partie de la
classe des oiseaux qui font partie de la classe des animaux qui font partie de la classe des êtres
vivants. Ces inclusions sont dénommées ISA (de l’anglais is a) ce qui signifie « est un », le
moineau est un oiseau, l’oiseau est un animal, l’animal est un être vivant… Un exemple
d’organisation taxonomique est présenté sur la figure N° 6.
Les classes (superclasses, sous classes) dénotent des relations de généralisation et de
spécialisation. Chaque classe regroupe des objets qui partagent des propriétés communes.
L’organisation taxonomique de la mémoire sémantique a été proposée par Collins et
Quillian dés 1968 et défendue par de nombreux auteurs (cf. Sartori & Job, 1988). Les
catégories sont issues soit de la tradition aristotélicienne soit du courant expérimentaliste. La
conception aristotélicienne repose sur l’idée de regroupements sur la base de propriétés
6
Taxonomie désigne la classification d’éléments. A l’origine il s’agissait de classer les êtres vivants :
mammifères, insectes…
communes. Les classes ainsi constituées sont organisées de façon hiérarchique allant du plus
général (être vivant) au plus spécifique (moineau). Comme indiqué sur la figure 6, la classe la
plus général est ici animal qui peut être décomposée en deux classes intermédiaires : oiseau et
poisson. A ce niveau intermédiaire se trouvent aussi les mammifères. Dans la classe des
oiseaux se trouvent les canaris, les autruches… qui constituent le niveau le plus spécifique.
Cet arbre est constitué de nœuds auxquels sont attachées des propriétés. Un animal a de
la peau, peut se déplacer, mange, respire…, le nombre de caractéristiques de ce type est
important. Ces propriétés seront analysées dans le paragraphe traitant des traits sémantiques.
Quoiqu’il en soit, l’intérêt d’une organisation hiérarchique de ce type est que chaque nœud
hérite des propriétés des nœuds qui lui sont supra-ordonnés. Le canari, puisqu’il fait partie de
la classe des oiseaux possède toutes les caractéristiques de ceux-ci : il a des ailes, des plumes,
un bec, deux pattes, il est ovipare, il vole… Ainsi, les traits communs à une classe d'objets ne
sont stockés qu’une seule fois. En revanche, si l’individu ne possède pas une qualité de la
classe à laquelle il appartient, on est obligé de spécifier la qualité qui n’est pas possédée.
Ainsi l’autruche ne vole pas donc il faut spécifier qu’elle ne possède pas la principale qualité
des oiseaux « voler ». En dehors de ces cas particuliers, le système d’inclusion est
économique.
Dans l’exemple de la figure 6, trois types de catégories sont ainsi distingués :
- La catégorie supra-ordonnée (hyperonyme) qui correspond au niveau d’abstraction le
plus élevé et forme la catégorie la plus inclusive : animal ;
- La catégorie sous ordonnée (hyponyme) qui est la moins inclusive et la plus concrète :
canari, autruche, requin, saumon ;
- Les niveaux de base ou catégories intermédiaires qui sont riches en attributs mais se
situent entre la catégorie supra-ordonnée et la sous ordonnée : oiseau, poisson.
Selon Rosch (1973), le processus de catégorisation se faisant à partir de traits perceptifs,
les catégories reflèteraient la structure des attributs perçus dans le monde. A l’appui d’un
système de catégorisation de type taxonomique, Rosch évoque un certain nombre de données
expérimentales. Elle montre ainsi que :
- si l’on demande de lister les attributs d’objets ou de mots les désignant tous les
individus donnent les mêmes réponses ce qui témoignerait de l’universalité des
attributs au sein d’une population donnée ;
- les listes d’attributs sont stables et limitées ce qui tend à montrer que ces attributs sont
des traits fondamentaux dont le nombre est limité;
- plus on monte dans la hiérarchie taxonomique plus le nombre d’attributs diminue et
inversement plus on descend dans la hiérarchie plus le nombre d’attributs augmente.
Elle établit ces faits à partir de questionnaires présentés à différentes populations de sujets de
tous âges.
Figure 6 : Exemple d’organisation taxonomique (D’après Collins et Quillian, 1969). ISA
= « est un »
HYPERONYMES
a de la peau
peut se déplacer
mange
animal
respire
ISA
ISA
CATEGORIES INTERMEDIAIRES
a des ailes
oiseau
peut voler
a des plumes
ISA
ISA
peut chanter
canari
a des nageoires
peut nager
a des branchies
poisson
ISA
a des pattes longues
autruche
ISA
peut mordre
requin
est rose
saumon
est grande
est jaune
HYPONYMES
ne peut pas voler
est dangereux
remonte la rivière
pour pondre ses oeufs
Figure N° 7. Représentation des relations ISA (est un) et PROP (a la propriété) dans les
réseaux sémantiques de Collin et Quillian. Chaque nœud (ETRE VIVANT, ANIMAL …) est
relié à un autre nœud par le relation « est un » (un animal est un être vivant) et possède des
propriétés qui lui sont spécifiques (un canari a la propriété d’être jaune).
ETRE VIVANT
ISA
ANIMAL
VOLER
ISA
- VOLER
PROP
PROP
PROP
OISEAU
INSECTE
ISA
ISA
ABEILLE
AUTRUCHE
CANARI
TITI
ISA
PROP
PROP
JAUNE
Selon Collins et Quillian (1969), l’existence d’une telle organisation hiérarchique est
attestée par le fait que le temps de vérification qu’un canari est un oiseau est plus rapide que
le temps nécessaire pour vérifier que le canari est un animal. En effet, si pour procéder à ces
vérifications le système cognitif remonte l’arbre hiérarchique de nœuds en nœuds en partant
du concept canari, le nœud oiseau est rencontré avant le nœud animal, donc la décision est
plus rapide pour oiseau que pour animal.
Outre le système d’organisation, l’exemple présenté sur la figure 6, montre qu’à
chaque nœud ou instance (animal, oiseau, poisson, canari, autruche, requin, saumon) sont
associées des propriétés (forme, couleur, taille…) qui peuvent prendre des valeurs différentes
(carré, rouge, grand…). Le type et la nature des propriétés utilisées (traits sémantiques,
caractéristiques perceptives…) ainsi que les catégories de liens unissant les instances entre
elles et les dimensions entre elles sont l’objet de discussion. Les deux problèmes ont été
parfois liés. Ainsi, les auteurs qui ont distingué les traits définitoires des caractéristiques
étaient amenés à décrire des systèmes de liaisons différents selon que l’on renvoyait à des
éléments de définition ou à des descriptions.
Dès leurs premières études, Collins et Quillian ont distingué les liens de taxonomie
(« x est-un y »), les liens de conjonction (« et »), de disjonction (« ou »), le lien sujet/objet
(sujet du verbe, complément d’objet du verbe, argument d’un prédicat), le lien modification
(« propriété »), les propriétés notées PROP : un oiseau a la propriété de voler, d’avoir des
plumes…
Lorsqu’un concept ne possède pas la propriété de celui auquel il est rattaché, la
propriété est affectée du signe moins (-) ainsi, l’autruche qui est un oiseau n’a pas la propriété
de voler, ce-ci est noté par la propriété – voler. Un exemple de représentation de ce système
de relations est présenté sur la figure N° 7.
La figure N° 7 illustre une autre propriété intéressante du réseau puisque par le biais
de propriétés communes, des objets appartenant à des classes différentes peuvent être reliés.
C’est ainsi que les insectes sont reliés aux oiseaux puisqu’ils ont en commun de voler du
moins certains insectes volent et par ce biais, le canari peut être relié à l’abeille. Ce système
permet ainsi de construire des relations transversales c'est-à-dire de relier des unités qui se
situent au même niveau dans l’arbre taxonomique tout en n’appartenant pas à la même
catégorie (un insecte n’est pas un oiseau).
L’apport des travaux de Quillian, puis de ses collaborateurs (Collins et Quillian 1969
et Collins et Loftus 1975) est important. Ils ont proposé un principe d’organisation des
connaissances doté d’une méthode de résolution. Carbonnel apportera une modification au
réseau de Quillian en ajoutant la notion d’instance, et en multipliant les types de relations.
Shapiro (1971) distinguera entre les relations structurelles, internes et les relations
conceptuelles, externes. Les unes sont dépendantes du modèle, et conditionnent ses
traitements. Pour chaque relation, le système doit définir la procédure agissant sur les nœuds
mis en relation. Les autres dépendent des connaissances que l’on veut modéliser. Ainsi, la
relation « aimer quelqu’un » n’est pas une relation interne au système (primitive), mais une
relation que le modèle doit décrire, à partir des relations primitives (muni de règles de
transformation, ou opérateurs), et des objets/concepts déjà décrits. En revanche, la relation
« est un » est interne au système qui doit en établir les procédures de traitements. En un sens,
les relations internes sont des relations premières, primitives, déclenchant un traitement qui
leur est lié, les externes sont secondes et s’appuient sur les premières. Petit à petit les réseaux
sémantiques se rapprochent de la logique des prédicats. Wood (1975) notera par exemple que
la représentation par réseau est logiquement intentionnelle par opposition à extensionnelle.
D’autre auront à cœur de concevoir des réseaux dont le pouvoir d’expression est le même que
celui du langage des prédicats, en recherchant une notation pour les quantificateurs (il existe,
et quel que soit) et pour les connecteurs (et, ou, implique). Sur cette base, Schubert (1976),
écrit des algorithmes permettant l’unification de réseaux. Enfin, Levesque, (1977) proposera
de développer une sémantique procédurale avec des opérateurs comme « ajout »,
« suppression » d’un nœud.
Les discussions concernant ces réseaux ont porté sur le choix des critères
d’équivalences qui fixent le contour d’une classe donnée. Sur quels critères peut-on estimer
que l’objet A fait partie de la même classe que l’objet B, où s’arrête une classe et où
commence une autre. Quel niveau de précision doit-on prendre en compte pour définir une
classe ? Doit-on distinguer parmi les oiseaux ceux qui sont domestiques et ceux qui ne le sont
pas ? La classe des animaux à sang froid et celle des animaux à sang chaud sont-elles
pertinentes ? Faut-il les distinguer ? La discussion de ces problèmes a été réactualisée
lorsqu’il a été observé que le temps de réponse était plus rapide pour vérifier qu’un canari est
un oiseau que pour vérifier qu’un pingouin est un oiseau. Ces résultats ont amené à introduire
la notion de typicalité et de prototype.
3. Les prototypes
Les expérimentalistes menés par E. Rosch (1970) insistent sur le fait que dans la
dimension horizontale de la hiérarchie, l’accroissement des différenciations tend à faire
émerger des prototypes c’est-à-dire les éléments les plus représentatifs de la catégorie et les
moins représentatifs des autres catégories. Chaque classe est représentée par un ou plusieurs
prototypes. Un prototype est un élément qui possède la typicalité la plus forte de la classe. Il
est défini à la fois par ce qui le différencie des autres classes et par ce qui le différencie des
autres membres de sa classe. Les pigeons sont avec les moineaux les prototypes des oiseaux
alors que le pingouin ou l’autruche sont les animaux les moins représentatifs de la classe des
oiseaux. Ainsi, l’appartenance à une classe est affaire de degré. La catégorie est donc
constituée en référence aux prototypes. Selon Rosch, les caractéristiques perceptives fondent
les catégories et sont centrales dans la définition du prototype. Plus un item est prototypique
plus il possède d’attributs en commun avec les autres items de la classe (Rosch & Mervis,
1975).
De nombreuses données expérimentales ont été recueillies pour montrer l’importance des
prototypes. Trois d’entre elles sont généralement évoquées :
- la désignation de la catégorie à laquelle appartient l’item est d’autant plus rapide que
l’item est prototypique, (Rosch & Mervis, 1975). Le moineau est plus rapidement
classé parmi les oiseaux que l’autruche et le pingouin.
- lors de la production des membres d’une catégorie, le prototype est produit en premier,
(Rosch, 1978). Si l’on demande d’énumérer des oiseaux, le moineau et le pigeon sont
produits bien avant le pingouin et l’autruche.
- l’apprentissage par l’enfant de la catégorie à laquelle appartient un objet est plus
rapide pour le prototype que pour les autres membres de la catégorie, (Rosch, 1973).
Le rattachement du moineau ou du pigeon à la classe des oiseaux est appris bien avant
le rattachement de pingouin et d’autruche.
Ces données constituent un faisceau de présomptions en faveur du rôle des prototypes.
4. Analyse critique de l’organisation taxonomique
L’organisation taxonomique de la mémoire sémantique a été contestée (Cornuejols &
Rossi, 2000 ; Cree, McRae & McNorgan, 1999 ; McRae, de Sa & Seidenberg, 1997 ; Plaut,
1995, 1997 ; Masson, 1995). Quatre critiques principales ont été faites :
a) toute connaissance ne peut être intégrée dans une catégorie. Il est montré
que la catégorisation est une capacité fondamentale du système cognitif qui
est manifestée très tôt puisqu’à six mois le nouveau-né est capable de
former des catégories telles que « être vivants » et « objets ». Ces
catégorisations vont se développer et s’affiner en fonction des
apprentissages. De même, si certaines catégories sont dites naturelles et
partagées par le plus grand nombre, d’autres résultent de la culture et des
connaissances de chaque individu. La finesse des classifications des plantes
connues des botanistes est très éloignée des classifications que peut
produire un non spécialiste. Il n’en reste pas moins que nombre de concepts
n’entrent pas dans une catégorie définie. Certes, il est toujours possible
d’inventer une classe de rattachement mais en dehors du fait que cette
classe sera très artificielle il faut surtout souligner que ce rattachement
n’apportera pas un supplément de signification. Mais surtout, les règles de
regroupement ne sont pas établies et l’on comprend aisément que regrouper
les verbes d’action sous une même catégorie n’est pas équivalent à
regrouper tous les oiseaux dans la même classe ;
b) le principe d’héritage des propriétés n’est pas toujours respecté. Nous
avons vu que l’héritage des propriétés était un principe d’organisation
particulièrement économique. Un nœud (un concept) hérite des propriétés
des concepts auxquels il est rattaché et qui se situent au-dessus de lui dans
la hiérarchie taxonomique. Un canari étant (ISA) un oiseau possède la
propriété des oiseaux à savoir il vole, il a des ailes, des plumes… or, un
nœud, ne possède pas systématiquement les propriétés de sa classe de
rattachement, ainsi, une poule ou une autruche qui sont des oiseaux ne
volent pas. Certes parmi les caractéristiques de l’autruche il est possible de
spécifier que cet oiseau ne vole pas ce qui revient à constituer une sous
classe avec les individus qui tout en étant des oiseaux ne possèdent pas
toutes les qualités de leur famille de rattachement. Il faudrait ainsi
constituer une nouvelle classe intermédiaire distinguant les oiseaux qui
volent des oiseaux qui ne volent pas. On arrive ainsi à multiplier les classes
intermédiaires ;
c) deux items du même niveau ne sont pas connectés directement, leurs
relations passent par l’item sur-ordonné. C’est là une difficulté réelle car si
le pingouin et l’hirondelle font partie de la même classe et se situent au
même niveau on pourrait s’attendre à ce que la présentation du mot
moineau active les mots qui sont de la même classe tels que hirondelle,
pigeon… En fait, il n’en est rien puisque les relations entre nœuds sont
toujours verticales et de type « est un » (ISA). Les liaisons correspondent
uniquement à des emboîtements taxonomiques ;
d) Pour les mêmes raisons, le passage d’une catégorie à l’autre nécessite de
remonter au sur-ordonné de la hiérarchie (pour passer de canari à cage il
faut passer par la catégorie objets inanimés). Concrètement cela signifie
que le lexème cage a peu de chances d’évoquer le canari, or de nombreuses
données indiquent que la présentation d’un mot active souvent un mot
appartenant à une autre catégorie.
Sensibles à cette dernière critique, Collins et Loftus (1975) ont tenté d’atténuer les
difficultés des systèmes hiérarchiques en développant un système prévoyant la propagation de
l’activation entre les éléments ne faisant pas obligatoirement partie de la même catégorie.
Mais avant d’aborder cette question, il est nécessaire de préciser une des caractéristiques
fondamentales du réseau qui est d’associer à chaque nœuds (ou concept) une liste de traits
sémantiques (les traits « peut chanter » et « est jaune » sont associés à « canari »). Que sont
ces traits ?
5. Les traits sémantiques
Ces traits sont issus des théories componentielles du sens. L’approche componentielle
du sens « vise à établir la configuration des unités minimales de signification (composants
sémantiques, traits sémantiques, ou sèmes) à l’intérieur de l’unité lexicale ou mot »
(Dictionnaire de linguistique et des sciences du langage, p. 102). Elle repose sur l’idée que le
mot n’est pas l’unité de sens minimale et donc que le sens d’un mot est donné par un
ensemble de traits sémantiques élémentaires ou sèmes. « Ces unités, en nombre fini, se
combinent de diverses façons pour constituer le sens des différents mots de la langue. »
(Caron, 1983). Le fauteuil est une chaise auquel on ajoute le trait bras ou accoudoir (cf.
tableau 1). Deux catégories de concepts coexistent : ceux qui sont des primitives (traits
sémantiques élémentaires ou sèmes) et ceux dont le sens résulte de la combinaison de
différentes primitives.
Disposant d’un ensemble limité de traits, et de règles de composition, il paraissait
possible de générer tous les concepts existants. Cette analyse reposait sur les trois
propositions suivantes (Lakoff, 1987) :
1) Chaque concept est soit une primitive soit construite à partir de primitives par
l’application de règles de composition sémantique ;
2) Toute structure conceptuelle interne est le produit des règles de composition
sémantique ;
3) Les concepts n’ayant pas de structure interne sont directement significatifs, et
ce sont les seuls (primitives).
La théorie componentielle du sens a consisté à appliquer à la sémantique une méthode
élaborée par les phonologistes qui, comparant les phonèmes, ont dégagé les traits distinctifs
caractérisant chacun d’entre eux. La transposition au champ de la sémantique consiste à
énumérer les traits ou sèmes permettant de distinguer les composants d’un même champ
sémantique. L’exemple proposé par B. Pottier (1963) à propos des sièges est souvent cité. Il
est présenté dans le tableau 1. Au lexème chaise sont associés les sèmes : pour s’asseoir,
matériau rigide, pour une personne, sur pieds, avec dossiers. L’ensemble de ces sèmes
constitue le sémème associé à un lexème. Chaque mot est décrit par son sémème c’est-à-dire
un ensemble des sèmes qui décrivent sa signification. Un trait qui est commun à l’ensemble
des mots de la classe est un trait générique. « Pour s’asseoir » est un sème générique pour les
sièges. Les sèmes génériques constituent le classème, les spécifiques le sémantème.
Les possibilités offertes par la représentation par traits en fait l’une des plus utilisées.
Le modèle de représentation par produit tensoriel de Smolensky (1992) utilise explicitement
la notion de traits, ainsi que le modèle du langage de Waltz et Pollack (1985). Le modèle de
diagnostique du diabète de Carpenter (1995), représente les cas à l’aide de traits comme l’âge,
la masse du sujet, la concentration de glucose dans le plasma… Qu’il s’agisse d’une
modélisation d’un processus physique, physiologique ou psychologique la représentation par
traits est largement utilisée. Le trait sera soit un élément fixe de la perception (en
psychologie), soit une variable identifiée du processus (en physique), soit un élément
constitutif du concept (en sémantique).
Comment dégager ces traits ?
D’un point de vue linguistique, l’analyse componentielle peut prendre deux
formes (Rastier, 1991 ; Antoine, 1994):
1) Approche référentielle, qui analyse le sémème en faisant référence aux
objets du monde ; ainsi, on représentera le concept « tomate » par
/végétal/+/rond/+/rouge/ ; en fait cette approche considère que le sens
provient de la composition de traits sémantiques intrinsèques.
2) Approche différentielle, qui analyse le sémème par rapport à ses différences
avec les autres individus de la même classe. Cette approche donne lieu à
des réalisations type graphe conceptuel de Sowa (1984), où chaque concept
est défini par les relations qu’il a avec les autres. Il s’agit bien d’une
approche componentielle, puisque le sens est décomposé par rapport aux
relations.
Dans l’exemple des sièges, les traits différencient les objets. Les chaises ont des pieds
alors que les poufs n’en ont pas. De ce fait, les sémantèmes, c’est à dire la liste des sèmes
spécifiques, dépendent de la liste des objets qui ont été choisis pour constituer une classe. Si
dans la liste du tableau 1 on enlève le mot pouf, le trait « sur pied(s) » n’a plus de raison
d’être. Notons de plus que dans la liste des sèmes présents sur ce tableau l’un d’entre eux
(« pour s’asseoir ») renvoie à une fonction tandis que les autres correspondent à des
caractéristiques descriptives. Dans la mesure où les traits dépendent de l’échantillon des mots
qui appartiennent au champ sémantique, la délimitation de ce champ est un problème
fondamental. Etant dans l’impossibilité de donner des règles opérationnelles permettant cette
délimitation il devient impossible de régler le problème.
Pour surmonter ce problèmes les chercheurs ont tenté d’établir une liste de traits
correspondant à des propriétés qui seraient en quelque sorte absolues. Cette démarche est
celle de la linguistique structurale. Elle a été reprise par des psychologue tels que Waltz et
Pollack, 1985 ; Sowa, 1984 ; Schanks, 1975. L’exemple développé par M-F. Montureux
(2001) à propos du mot tête montre que pourraient lui être associés des traits comme
« extrémité » et « sphéroïdité » (p. 69). On trouvera dans le tableau 2 un exemple proposé sur
le site web du département d’études française de la Queen’s University at Kingston. Cet
exemple est illustratif de la recherche de primitives à partir de la constitution de champs
sémantiques. Le verbe louer comporte deux lignes l’une correspond à l’acte effectué par le
loueur l’autre à celui réalisé par le locataire : l’un donne, l’autre reçoit. En fait tous les deux
donnent : le loueur un objet, le locataire de l’argent et tous les deux reçoivent l’un la
jouissance d’un objet, l’autre de l’argent en contre partie. De même acheter consiste bien à
donner de l’argent à quelqu’un donc le trait « donner quelque chose » devrait être positif.
Cette classification est donc discutable. Force est de constater que la délimitation des champs
sémantiques, la définition des traits aussi bien que la recherche des universaux constituant des
primitives du sens, n’ont pas abouti.
Les difficultés liées à l’hétérogénéité des traits ont amené les auteurs à proposer
différentes classifications. Précédemment nous avons évoqué la première tentative de Collins
de différencier les traits « ISA » (c’est un, le canari est un oiseau) des propriétés (le canari est
jaune).
Si l’on distingue différentes catégories de traits la question des systèmes de
connexions liant les traits aux concepts est posée. Elle peut-être formulée ainsi : les
connexions liant le concept aux traits varient-elles selon la nature des traits ? Le trait bras
associé au concept fauteuil a-t-il le même statut que le trait pour s’asseoir ? Le bras est une
caractéristique physique perceptive tandis que l’expression pour s’asseoir renvoie à une
fonction. Le réseau doit-il prendre en compte ces différences ? Une solution consisterait à
intégrer les fonctions dans l’arbre taxonomique de sorte que la qualité pour s’asseoir devienne
une sous catégorie de la classe des meubles. Les meubles seraient alors regroupés selon leurs
fonctions. L’organisation de la taxonomie sur la base d’une typologie des traits devient une
question cruciale lorsque aborde les systèmes d’organisations multifactoriels que sont les
réseaux structurés sur la base du partage de traits.
Tableau 1 : Description des sémèmes correspondants aux sièges selon Pottier (1963)
Chaise
Fauteuil
Tabouret
Canapé
Pouf
Banc
Pour
s’asseoir
+
+
+
+
+
+
Matériau
rigide
+
+
+
+
+
Pour une
personne
+
+
+
+
-
Sur pied(s)
+
+
+
+
+
7
Avec
dossier
+
+
+
-
Avec bras
+
0
-
Tableau 2 : traits sémantiques correspondant à des verbes empruntés au département
d’études française de la Queen’s University at Kingston
Acheter
Vendre
Prêter
Emprunter
Louer (1)
Louer (2)
échange
+
+
+
+
+
+
donner qqch
+
+
+
-
recevoir qqch
+
+
+
pour argent
+
+
+
+
Permanent
+
+
-
Les tentatives de catégorisation des primitives sémantiques ont été nombreuses.
S’intéressant aux verbes, Schank8 (1975) décrit les onze actes primitifs permettant de décrire
les actions tout aussi primitives. Ces onze actes sont regroupés en quatre classes :
- les actions physiques : appliquer une force à un objet, déplacer son corps, saisir, ingérer,
expulser ;
- les changements : changement de localisation, changement de relations ;
- les actions instrumentales : produire un son, porter son attention ;
- les actions mentales : créer, imaginer…
A coté de ces actions primitives on trouve un nombre restreint d’autres primitives telles
les producteurs d’images, les états primitifs (santé, colère, émotions…) ou les rôles
conceptuels (acteurs, instruments, bénéficiaires, direction). A chaque verbe est ainsi associée
une action primitive qui porte sur un objet. L’action est effectuée par un acteur et le cas
échéant profitera à un bénéficiaire.
Pour illustrer ce système nous reprendrons l’exemple proposé par Denhière et Baudet
(1992, p. 72), la phrase « Pierre a donné un livre à Marie fournit la description suivante :
Marie
P
Pierre
7
8
Changement relationnel
O
R
livre
Observons que nombre de banc ont un dossier.
On trouvera dans Denhière et Baudet (1992) une description de ces différentes catégories.
Pierre
« Le verbe donner est représenté par l’action primitive CHANGEMENT RELATIONNEL,
Pierre remplit le rôle conceptuel ACTEUR (illustré par une flèche double), P exprime le
temps passé, livre remplit le rôle conceptuel OBJET (O), et l’arc qui va de Pierre à Marie
figure le rôle conceptuel BENEFICIAIRE (R), Marie est bénéficiaire de l’action initiée par
Pierre. Comme cet exemple l’indique, le réseau conceptuel proposé par Schank dépasse le
sens associé au concept pour rendre compte du sens de la phrase. De la sorte le réseau
sémantique contient toutes les primitives permettant de comprendre le langage. Ainsi,
progressivement les conceptions du réseau sémantique vont s’étendre au point de recouvrir
l’ensemble des connaissances.
Cette approche qualifiée de primitiviste ou primitivisme (certains l’appellent
objectivisme) a été maintes fois critiquée. Le premier grief opposé aux primitivistes est le
manque d’unité de l’ensemble des travaux. Schank (1975) décrit 11 primitives de
dépendances : ATRANS (transfert abstrait), PTRANS (transfert de location), PROPEL
(application d’une force), MOVE (déplacer), GRASP (saisir), INGEST (ingérer), EXPEL
(inverse d’ingérer), MTRANS (transfert mental), MBUILD (construction mentale, inférence),
SPEAK (parler), ATTEND (projeter un organe sensitif sur un objet), et trois primitives
conceptuelles (ACT action, PP objets, AA modificateurs d’actions, PA modificateurs
d’objets). Boguraev et Spark-Jones (1987) ont 27 cas, Jakendoff (1990), lui, a huit catégories
ontologiques (chose, état, action, place, chemin, propriété, quantité…). Si autant de
décompositions ont été produites, c’est qu’il n’existe aucune raison théorique ou empirique
qui préside à cette recherche. La seule règle pertinente est la nature du corpus considéré, et les
résultats attendus, ce qui rend peu probable d’existence de primitives universelles. La
deuxième critique développée par Lakoff (1987) est que selon les postulats du primitivisme
exposés ci-dessus9, seuls les concepts primitifs possèdent un sens intrinsèque, par eux-mêmes.
Or, les recherches sur les catégorisations (Rosch et al, 1976) montrent qu’il existe un niveau
de base dont les catégories sont directement perçues et comprises et qui possèdent une
structure interne.
La structure interne des concepts du niveau de base n’est pas le résultat d’application
de règles de composition sur des primitives, ou, si c’est le cas, l’application est a posteriori. Il
semble donc que les trois postulats10 du primitivisme ne résistent pas à l’analyse critique.
Enfin, sur un plan plus pratique, la gestion d’un système à base de primitives limite les
possibilités de l’approche componentielle puisque personne n’a encore trouvé une base de
primitives qui couvre tout l’espace des concepts (Cavazza, 1996).
Les critiques formulées à l’encontre de la décomposition des concepts peuvent résumées
ainsi :
10
Cf. page 42 :
1) Chaque concept est soit une primitive soit construite à partir de primitives par l’application de règles de
composition sémantique ;
2) Toute structure conceptuelle interne est le produit des règles de composition sémantique ;
3) Les concepts n’ayant pas de structure interne sont directement significatifs, et ce sont les seuls
(primitives). (Lakoff, 1987).
(a)
Il n’existe pas de définition claire et non ambiguë des concepts, et puisqu’il
n’y en a pas, il n’y a aucune raison de considérer qu’il existe une structure
interne de ceux-ci (Jackendoff, 1990).
(b)
Si les concepts possédaient une structure interne, les plus complexes
devraient entraîner, chez le sujet, un temps de traitement plus long. Or il
n’existe aucune évidence expérimentale sur ce point (Jackendoff, 1990).
(c)
Lorsqu’on décompose un mot (par exemple, tuer décomposé en causer la
mort), on remarque que la transformation n’est pas inversible (causer la mort
n’est pas tuer (Pinker, 1994), puisqu’il peut aussi renvoyer à assassiner,
abattre, achever, descendre).
(d)
On constate que assassiner devrait se décomposer en « cause la mort +
intention politique ou volonté de nuire » (Pinker, 1994), de même que
achever en « cause la mort + finir (+ « Et on achève bien les chevaux ») », et
cætera. Ces deux exemples montrent que pour la plupart des mots il faut
associer une signification subjective ou un savoir pragmatique à une
signification objective. De même la différence entre chaise et fauteuil ne peut
être réduite au trait « comporte des bras » ou la différence entre canard et oie
à l’existence du trait long bec (Jackendoff, 1990). Les traits sématiques
décrits par Pottier limitent de façon drastique les sens associés à chaque
lexème. Ils n’arrivent pas à épuiser le sens associé.
(e)
Il n’existe aucune règle d’arrêt de la décomposition, ce qui fait qu’on peut
décrire chaise en quatre ou dix traits (Pinker, 1994 ; Rastier, 1991).
(f)
Il n’existe pas de règle de choix de la décomposition (Pinker, 1994).
(g)
Décomposer un concept en traits, c’est décrire un concept par un autre
concept.
Toutes ces critiques ne peuvent pas être opposables à l’élaboration des traits par
similarité. Il s’agit dans ce cas, de calculer une distance, une mesure de similarité entre deux
entités ou entre une entité et un individu ou une instance. Si l’on accepte avec Rosch (1978)
que l’on accède au niveau conceptuel à partir d’un niveau de base et donc qu’il est plus facile
de qualifier « Médor » de « chien » que de dire que c’est « un mammifère ». On peut
concevoir un système qui soit capable de dégager des traits sur la base de mesures de
similarités entre un prototype, représentant typique d’une classe, extension d’un concept, et un
individu. Si le moineau est le prototype de la classe des oiseaux, les traits sémantiques
associés au concept moineau sont extraits par comparaison entre le moineau et les autres
oiseaux ou même les autres êtres vivants. Les traits sont construits sur la base des différences.
Le débat (Goldstone et al., 1998 ; Hanh et al., 1998) porte alors sur la part du jugement
perceptif, par similarité, par rapport à la part du jugement conceptuel, i.e. uniquement fondé
sur les relations entre concepts. Sloman et al, (1998) comme Gentner et al., (1998) dans une
démarche conciliatrice proposent un modèle proche de celui de Jonhson-Laird, où les
comparaisons (dont la comparaison par mesure de similarité) entre les percepts permettent
l’établissement de nouvelles règles. Avant, d’avoir le concept de « chat », il faut avoir détecté
des similarités entre le chat que je vois et la trace mnésique des chats que j’ai vus (Woodfield
in Andler, 1992).
Selon Lakoff (1987), il faut partir du niveau de base, défini par Rosch (1976), pour
décrire une componentialité différentielle. Le trait n’est donc plus une primitive abstraite,
mais une catégorie de base, définie (Edelman, 1997) par une image prototypale ou point de
référence dans un espace de représentation proximale, (par opposition à l’espace distal des
objets). Ainsi, comme l’indique Cavazza (1996) le critère de minimalité est remplacé par un
critère de cohérence interne qui est basé sur l’existence de régularité.
Le but n’est donc plus de décrire un ensemble de traits de base qui soit le plus petit
possible, mais de considérer un ensemble a priori non fini de traits, cohérents entre eux,
construits à partir de la détection des régularités d’une situation, d’un objet, d’une action… La
représentation prototypale (par mesure de similarité) permet la classification des objets du
monde par comparaison au prototype ; les classifications obtenues permettront la construction
de nouveaux concepts par détection de cooccurrences et par la mise en relation avec les
intentions et les moyens (processus généralisateurs et associatifs). Chaque item perçu est
comparé à un prototype. La comparaison permet d’isoler un certain nombre de variables qui
serviront à mesurer la distance entre l’item et le prototype. Ces variables font ainsi figure de
traits. L’introduction des concepts de bases et des représentations modales permet de briser le
cercle vicieux de la définition de concepts par d’autres concepts. On considère en effet que les
concepts de base ne sont pas définis à l’aide d’autres concepts mais par comparaison à un
prototype. Ils sont liés aux représentations modales, aux intentions, aux moyens.
Pour Lakoff (1987), la représentation doit être déterminée par la nature et l’expérience
de l’organisme pensant. Lakoff appelle ce nouveau réalisme, stratégie expérientialiste. Ainsi,
les concepts sont structurés de façon interne et externe (i.e. entre eux), et c’est cette structure
qui nous permet de penser. Cette structure n’a pas de sens en elle-même. Le sens naît de son
incarnation. Le schéma proposé est le suivant : les concepts du niveau de base naissent de la
convergence des perceptions, des activités motrices, et de l’image mentale. De manière
transverse, les concepts du niveau de base sont structurés par des schémas mentaux que
Lakoff appelle kinesthésiques, c’est-à-dire de schémas en relation directe avec l’expérience
corporelle (comme les idées de conteneur, centre/périphérie, haut/bas, devant/derrière…).
L’abstraction est réalisée par la métaphore (du physique vers l’abstrait), la projection sur les
niveaux super-ordonnés, la répétition.
L’intérêt d’une telle approche est qu’elle rend les traits évolutifs. Les sujets élaborent
des traits sur la base de leur expérience du monde. Les traits sont dépendants de l’histoire
individuelle, des contraintes perceptives et fonctionnelles (l’objet de la tâche) imposées par
cette histoire. Les contraintes liées à la tâche (contraintes fonctionnelles) interviennent très tôt
dans la perception. Il existe donc un va et vient entre perception et fonction : la perception
détermine la fonction, la fonction modifie la perception. C’est ce qui expliquerait que dans
des tâches de classification, le temps et le taux d’erreurs varient suivant l’ordre
d’apprentissage (Schyns, 1998).
Dans ce cadre, les critiques développées à l’encontre de l’approche componentielle
peuvent être rejetées. L’objection concernant le caractère flou des concepts ne tient plus
puisque plus un individu connaît un sujet (plus il a d’expériences de ce sujet), plus les
concepts relatifs au sujet ont tendance à devenir des concepts de base. Ainsi, même s’ils sont
complexes pour les uns (et induisent donc une charge cognitive importante), ils peuvent ne
pas l’être pour d’autres (et donc induisent un temps de traitement normal). Les critiques
développées page 46 tombent : la question de la structure interne des concepts ne se pose plus
(critique (b)). Il en est de même des objections concernant l’inversion de la décomposition (c),
la subjectivité de la signification (d), la règle d’arrêt de la décomposition (e) et l’impossibilité
d’établir des règles de décomposition (f).
Cette analyse des constituants du sens ne présente d’intérêt, pour nous, que si elle a
une réalité psychologique c'est-à-dire si le sens est stocké en mémoire sous la forme décrite. Il
s’agit donc d’analyser les données expérimentales susceptibles d’être évoquée à l’appui des
thèses componentielles du sens.
6. Données expérimentales en faveur des approches componentielles du sens
Caron (1989) regroupe en quatre catégories les données obtenues en psychologie en
faveur des théories componentielles du sens : observations portant sur l’acquisition du
langage ; analyse des distances sémantiques ; étude des épreuves de mémorisation et enfin
étude des temps de compréhension de phrases. Nous lui empruntons les données présentées
ci-dessous.
Les études sur l’acquisition du langage montrent que
a) l’utilisation du mot va en se spécifiant. Le mot chien désigne d’abord tous les
animaux à quatre pattes puis au fur et à mesure de l’acquisition de traits
sémantiques spécifiques l’utilisation de ce terme va être restreint à une classe
d’objets très spécifiques. Le trait acquis en premier est le plus général : animal
possédant quatre pattes. L’observation et la confrontation avec différentes
expériences vont amener l’enfant à acquérir de nouveaux traits (animal ayant des
poils, animal possédant un museau, animal familier…). L’acquisition de ces
nouveaux traits va restreindre l’utilisation du mot chien pour désigner une classe
particulière d’animaux. L’utilisation du mot progresse en fonction de l’acquisition
de nouveaux traits sémantiques.
b) les termes ne se différenciant que par un seul trait sémantique sont confondus.
C’est le cas de plus et moins qui pour Clark « ont en commun le trait quantité et ne
diffèrent que par le trait [polarité + ou –] » (Caron, 1989, p. 94). Le trait polarité (+
ou -) ne serait acquis que plus tard. C’est ce qui expliquerait, selon Clark, qu’au
début du développement du langage l’enfant confondrait plus et moins.
Etudes des distances sémantiques. La donnée la plus décisive est obtenue avec les
tâches de classement où les sujets doivent estimer la proximité sémantique de différents
stimuli. Les résultats montrent que les objets sont classés comme étant d’autant plus proches
qu’ils possèdent un plus grand nombre de traits sémantiques communs (Miller, 1969 ; cité par
Caron, 1989). La classification est faite sur la base du recouvrement des traits sémantiques.
Epreuves de mémorisation. Comparant le temps nécessaire à apprendre des listes de
phrases Le Ny et al. (1973) montrent que plus les mots de la phrase comportent de traits
sémantiques, plus le temps d’apprentissage est long. Ils observent aussi au cours du rappel des
effets d’interférences pour les phrases comportant des mots possédant des traits sémantiques
communs. Ainsi, d’une part la difficulté d’apprentissage dépend du nombre de traits
sémantiques et d’autre part les confusions naissent du recouvrement des traits sémantiques.
Etudes de la compréhension de phrases. Caron cite les études de Clark qui montrent
que le temps de traitement des phrases est plus long pour les mots comportant un grand
nombre de traits sémantiques. Ces données confirment les résultats de Le Ny et al. (1973).
Ces données s’avèrent peu convaincantes dans la mesure où elles peuvent être
évoquées à l’appui d’autres approches du sens. De plus, même si l’approche componentielle
du sens présente, en psychologie, un intérêt non négligeable les critiques qui lui sont faites ne
peuvent être ignorée.
7. Critiques de l’approche componentielle
L’approche componentielle a été l’objet de deux catégories de critiques. Les unes
portent sur la constitution de la liste des primitives, les autres concernent la notion même de
concept.
La notion de primitive a été critiquée précédemment. Nous avons proposé d’y
renoncer. Il faut en effet rappeler que les chercheurs ont incapables de s’accorder sur une liste
de traits. En 1975, Schank en dénombrait 14, en 1987 Boguraev et Spark-Jones en
comptabilisaient 27 tandis qu’en 1990 Jakendoff décrivait huit catégories ontologiques. Ces
variations témoignent de la difficulté à définir de façon opérationnelle la notion de primitive.
Dans le même ordre d’idée, il a été noté précédemment que le nombre de primitives associées
à un concept variait selon la taille du champ sémantique. Dans la mesure où une partie des
primitives permettent de différencier un concept par rapport aux autres, le nombre de
primitives dépend directement du nombre des concepts de référence. Les règles de
décomposition n’ayant pas été formulées de manière opérationnelle, l’accord entre chercheurs
sur le nombre de primitives et la nature des primitives associées à un concept reste faible.
Ainsi, faut-il intégrer dans la liste des primitives des informations pragmatiques renvoyant à
des expériences concrètes ou à des composantes subjectives de la signification ? Cette
question n’a pas reçu de réponse. Le passage de l’approche linguistique du sens à la
description des significations que les individus ont stockées en mémoire est posé.
La seconde catégorie de critiques porte sur la notion même de concept et la relation
entre concepts et primitives. Fodor puis Jackendoff (1990) soulignent qu’il n’existe pas de
définition claire et non ambiguë de la notion de concept. Ils proposent donc de renoncer à
utiliser le terme « concept ». Au-delà de cette critique de fond, on peut s’interroger sur le
caractère circulaire de l’approche componentielle. En effet, elle aboutit à définir un mot avec
d’autres mots. Le système est circulaire. Les auteurs affirment que les primitives sont
directement significatives qu’elles possèdent un sens intrinsèque. Qu’est ce que cela signifie ?
A quoi correspond ce sens intrinsèque ? Quelle est sa nature ? Autant de questions qui
relativisent l’attrait que les psychologues peuvent avoir pour les théories componentielles.
Certains d’entre eux ont d’ailleurs proposé de rompre le cercle en introduisant des images, des
expériences, des sensations. Ils en sont restés au stade de l’hypothèse et aucune recherche n’a,
à ce jour, apporté de données sur l’intégration de constituants non verbaux dans la formation
des primitives.
A une approche de la mémoire sémantique reposant sur le partage des traits les
chercheurs tendent à substituer une organisation reposant sur les situations. Cette nouvelle
approche mérite d’être décrite car elle semble porteuse de nouveaux développements.
8. Organisation du réseau sur la base des co-occurrences situationnelles
Les approches taxonomiques aboutissaient à un regroupement des concepts sur la base
des traits partagés. Tous les être vivants possédant la propriété de voler étaient regroupés dans
la classe des oiseaux. Tous les nœuds qui se situent au même niveau partagent théoriquement
les traits de la classe qui leur est supérieure. Ce principe fournit une règle de construction des
champs sémantiques. Un champ sémantique serait constitué des objets qui partagent nombre
(ce nombre n’est pas défini) de traits. L’organisation taxonomique est basée sur le partage des
traits puisque En 1975, Collins et Loftus abandonnent la notion de hiérarchie pour lier les
unités non seulement partageant des traits communs mais ayant des fonctionnalités qui les
associent. C’est ainsi que le pompier est associé à la maison, à la couleur rouge et à
l’ambulance (figure 8 et 9) tandis que le loup l’est à la forêt. La nouvelle organisation tend à
représenter les situations dans lesquelles les objets sont co-occurrents. La co-occurrence
situationnelle devient le principe d’organisation du réseau sémantique. Cette thèse va être
défendue dans des publications récentes : Devlin, Gonnerman, Andersen & Seidenberg, 1998
; Lambon-Ralph, Graham, Patterson & Hodges, 1999; McRae, de Sa & Seidenberg, 1997;
McRae, de Sa & Seidenberg, 1997; McRae & Cree, 2001; Rossi, Campion, Guha et Delcasso,
2003. Elle pose pourtant deux nouvelles catégories de questions :
- l’existence d’un réseau connectant des unités fonctionnellement liées ou
appartenant à la même situation permet-il de faire l’économie des traits
sémantiques ?
- tous les associés sont-ils équivalents ou certains sont-ils plus fortement
associés que d’autres.
Plusieurs réponses peuvent être apportées à la première question. On peut en effet
considérer qu’à chaque unité du réseau sont attachés des traits sémantiques. A pompier
seraient attachés des propriétés décrivant cet individu. En ce sens, le nouveau réseau serait
similaire à ceux décrits par Collin et Loftus. Une autre possibilité, non encore explorée
actuellement serait que le sens émerge de la relation c'est-à-dire de l’association entre les
différents concepts. La situation (le contexte) donne sens. Le sens naît du contexte. Cette
hypothèse est actuellement à l’étude. Elle s’appuie, entre autre, sur le fait que les mots sont
généralement polysémiques et que seul le contexte permet de lever les ambiguïtés et donner
sens : un bidon peut être un récipient ou une bedaine, la moutarde est une plante, un
condiment, une couleur ou un gaz… Le choix d’une interprétation dépend évidemment de la
situation vécue ou décrite. L’hypothèse est donc que seule la situation fait sens. Une position
extrême consiste à faire l’hypothèse que les traits sémantiques sont inutiles puisque le sens
vient de la situation. La répétition des situations permettant de dégager des invariants
constitutifs du sens. Le nourrisson va acquérir le sens associé au biberon par ce que chaque
fois qu’il prend son biberon il satisfait un besoin, il va avoir plaisir. La répétition des
situations (prise du biberon) dans des contextes qui peuvent fluctuer va permettre de dégager
des invariants qui seront associés à l’objet biberon. Ces invariants seront constitutifs du sens.
La seconde question concerne la force des liens unissant les unités du réseau. Si le
pompier est lié à la maison, au feu et à la couleur rouge la force des liens est-elle constante ou
varie-t-elle ? Si c’est le cas, comment rendre compte de cette variation ? Pour illustrer le
propos reprenons la partie du réseau associé à pompier dans la figure 8 et représentons les
deux cas de figure traités précédemment. Sur la figure 9a toutes les unités du réseau sont
associées avec la même force. Sur la figure 9b on représente des variations de force
d’association par la grosseur des traits. La construction d’un tel réseau implique une métrique
spécifiant la force des liens d’association ou rendant compte des distances entre unités
connectées. La vitesse et l’amplitude de l’activation des nœuds pourraient varier avec les
distances et les forces d’associations. Comme précédemment la question de la nature des
relations est posée. Doit-on rendre compte des différences entre les types de relations liant les
concepts ? Au delà de la typologie des systèmes de relations le problème de la symétrie des
liens est posé. Le lien entre pompier et feu est-il symétrique ou orienté ? Cette question
revient à se demander si la lecture du lexème feu active pompier comme pompier active feu ?
Nos connaissances actuelles permettent de dire que la symétrie n’est observée que pour un
nombre de couples restreints, l’asymétrie domine : les relations sont orientées : la présentation
de rue active véhicule mais la présentation de véhicule n’active pas rue. Ainsi, les réseaux
présentés sur les figures 8 et 9 devraient comporter des flèches indiquant les sens des
relations.
Comme il est indiqué dans ce chapitre, la mémoire sémantique a fait l’objet de
nombreuses modélisations. Or les modèles tiennent une place fondamentale dans le
développement des sciences. Pour les psychologues et les cognitivistes les modèles
connexionnistes doivent être privilégiés puisqu’ils sont basés sur l’analogie avec le
fonctionnement des neurones. C’est pourquoi, un des derniers modèles connexionniste de la
mémoire sémantique va être présenté dans le chapitre suivant.
Résumé
A ce jour, les tentatives les plus intéressantes pour modéliser la mémoire sémantique
ont consisté à la représenter comme un réseau composé d’unités interconnectées. La structure
du réseau et les propriétés des unités ont fait l’objet de différentes hypothèses. La première
proposait une organisation des concepts sous forme d’un arbre taxonomique allant de la classe
la plus générale (êtres vivants) à la plus spécifique (canari, moineau…). Cette organisation est
très économique puisque chaque concept hérite des propriétés du concept auquel il est
rattaché et qui lui est supérieur. Le canari faisant partie de la classe des oiseaux hérite des
propriétés de celui-ci. Le rattachement à la catégorie permet d’attribuer les propriétés et évite
ainsi de reproduire pour chaque concept toutes les propriétés de la classe.
Très rapidement, les expérimentalistes observèrent que pour chaque classe un
prototype représentait le mieux la catégorie. La classe des oiseaux était représentée par le
pigeon ou le moineau tandis que l’autruche et le pingouin ne possédaient pas une des qualités
essentielles des oiseaux, ils ne volent pas. Ces observations mettaient en cause le principe
d’héritage des propriétés. La recherche s’est alors attachée à définir les traits sémantiques
associés à chaque concept. Pour ce faire, les psychologues ont emprunté aux linguistes les
théories componentielles du sens.
L’approche componentielle consiste à affirmer que chaque concept, s’il n’est pas un
trait sémantique (primitive), peut être décomposé en une combinaison de traits sémantiques
élémentaires (primitives). Ces traits sémantiques élémentaires sont nommés « primitives ».
Une chaise est un meuble qui sert à s’asseoir et qui possède un dossier mais n’a généralement
pas de bras. Le concept chaise est décrit par les primitives : est un meuble (ISA), sert à
s’asseoir, possède un dossier (PROP) n’a pas de bras. Sur la base de cette décomposition du
sens il était possible de réorganiser le réseau sémantique en regroupant des concepts qui
partagent les plus grand nombre de traits sémantiques.
Pour intéressante qu’elle soit, la décomposition en traits sémantiques (primitives)
n’est pas sans poser de problèmes. Difficultés liées tant à la définition de la notion de concept
qu’à celle de primitive. Faute de pouvoir donner une description opérationnelle des
primitives, leur liste n’est pas stabilisée. Pour le psychologue, la question de l’intégration des
expériences personnelles dans sa mémoire sémantique se trouve d’autant plus posé que
l’approche componentielle aboutit à définir un mot par d’autres mots ce qui rend le système
circulaire.
Les recherches actuelles s’orientent vers une organisation des réseaux sémantiques
basée sur les situations rencontrées et les invariants se dégageant de la répétition de ces
situations.
Figure 8 : Exemple de représentation d’un réseau organisé selon le modèle de Collins &
Loftus (1975) (d’après Abdi in Bonnet et al, 1986).
RUE
VOITUR
VEHICUL
CAMIO
AUTOB
AMBULAN
POMPIE
MAISO
ORAN
FE
ROUG
POMM
JAUN
POIRE
VER
SCOUBIDO
LOU
LILAS
ROSE
FLEUR
CHAPERO
FORE
Figure N° 9 Représentation des forces d’associations reliant les unités connectées avec
pompier. Figure N° 9a Toutes les unités sont associées de façon identique.
AMBULANCE
AUTOBUS
POMPIER
ROUGE
FEU
MAISON
Figure N° 9b L’épaisseur des traits représente la force des associations.
AMBULANCE
AUTOBUS
POMPIER
ROUGE
FEU
MAISON
Pour en savoir plus
DUBOIS D. (1983), Analyse de 22 catégories sémantiques du français : organisation
catégorielle, lexique et représentation. L’Année Psychologique, 83, 465-489.
DUCROT O. (1972), Dire et ne pas dire. Principes de sémantique linguistique, Hermann :
Paris.
LE NY J-F. (1979), La sémantique psychologique. Paris: PUF.
RASTIER F. (1991), Sémantique et recherches cognitives. PUF : Paris.
Mots clés : réseau, taxonomie, traits sémantiques, théories componentielles du sens
Question
1. Qu’est ce qu’une organisation taxonomique
2. Décrivez les réseaux sémantiques développés par Collin & Quillian
3. Qu’est ce qu’un prototype. Sur quelles données s’appuie la théorie des prototypes.
4. Qu’elles sont les critiques qui ont été faites à l’organisation taxonomique des
réseaux sémantiques.
5. Qu’est ce qu’un trait sémantique. Comment les traits sémantiques s’intègrent-ils
dans les réseaux sémantiques ?
6. Décrivez une organisation des réseaux basée sur la notion de traits partagés.
7. Principes de l’approche componentielle du sens.
9. Critiques de l’approche componentielle du sens
Chapitre 4. Les constituants sémantiques associés aux mots: dénotation, connotation et
référence
Quels sont les sens qui sont associés à chaque mot ? A quoi correspondent les notions
de dénotation, de connotation et de référence qui ont été développées par les linguistes ? En
quoi le sens diffère-t-il de la référence ? Ces notions linguistiques ont-elles des corresponds
en psychologie ?
Les représentations mentales du sens comprennent en effet des dénotations, des
connotations et des références. Comment ces trois propriétés qui sont constitutives de la
mémoire sémantique s’articulent-elles alors qu’elles sont acquises à des périodes différentes
de la vie ?
Pour le non spécialiste le sens du mot renvoie à la définition qui se trouve dans le
dictionnaire. Une définition est « un énoncé qui décrit une notion et qui permet de la
différencier des autres notions à l’intérieur d’un système notionnel » (Office de la langue
française). Le but de ce chapitre est de présenter une description des constituants sémantiques
associés au mot en confrontant les approches des linguistes et des psychologues.
La lecture des dictionnaires indique que les définitions sont construites selon des
modèles relativement stables. Les linguistes, distinguent trois types de définitions : les
définitions linguistiques, les métalinguistiques et les définitions par inclusion. Dans les
définitions linguistiques, le mot est défini par une paraphrase. Opérationnellement, dans
l’énoncé, il peut être remplacé par cette paraphrase. De plus, « la définition a la même
fonction grammaticale que le mot à définir : un nom se définit par un syntagme nominal, un
verbe par un syntagme verbal et ainsi de suite. » (Greg Lessard, 1996, p. 3-4). Nous
empruntons à cet auteur (Lessard, 1996) les exemples illustrant ces différentes définitions. Le
dictionnaire Le Petit Robert donne une définition linguistique de chronique, ce mot désigne
« un recueil de faits historiques, rapportés dans l’ordre de leur succession ». Par opposition, la
définition métalinguistique donne une explication qui ne peut remplacer le mot. Le lexème
sous est définit avec la paraphrase suivante : « marque la position en bas par rapport à ce qui
est en haut ». Enfin, la définition par inclusion consiste à inclure le mot dans une catégorie
plus générale (relation d’hyponymie) : le pigeon est un oiseau qui…
La macrostructure des définitions que l’on trouve dans les dictionnaires peut être
décrite sans difficultés. Pour les noms communs les définitions commencent par indiquer la
catégorie à laquelle appartiennent l’objet ou l’être animé : un pigeon est un oiseau (définition
par inclusion) puis à lister les caractéristiques qui font son originalité et le distingue des
hyponymes, formes, couleurs, attributs, lieux… (généralement définition métalinguistique).
Rattachement à la classe (définition par inclusion) puis différenciation par rapport aux autres
membres de la classe constituent le schéma général de la définition des noms communs. Pour
les verbes, le schéma diffère dans la mesure où il commence par la description de l’action ou
de l’état suivie par les caractérisations permettant de différencier tel verbe de ses synonymes.
Les dictionnaires comportent évidemment d’autres éléments tels que des mots désignant des
exemplaires, des expressions dans lesquels le mot est utilisé, des variations d’acceptions, des
synonymes, des antonymes...
Cette description est parfaitement formalisée dans le Dictionnaire de Linguistique et
de Sciences du Langage (1994) qui précise que « La définition recourt dans la paraphrase
synonymique à des termes génériques qui sont des définiseurs… Ces définiseurs sont souvent
des hyperonymes de grandes classes de mots… suivis de la relative qui spécifie le terme
générique… La liste complète, exhaustive, des définisseurs n’a pas été établie, mais elle tend
à être limitée. » (1994, p. 132).
Ces différentes descriptions suggèrent que la définition que l’on trouve dans le
dictionnaire n’épuise pas la totalité des sens que le lecteur ou l’auditeur associe à un lexème.
La définition du dictionnaire est à la fois plus complète et moins riche que celle que connaît le
lecteur dans la mesure où l’homme stocke en mémoire des expériences. Reprenant une
boutade célèbre « l’ordinateur a de la mémoire, l’homme a des souvenirs ». La définition
« mentale » (celle qui est stockée par l’individu) n’est pas stable, elle varie selon les
connaissances et l’âge. L’écolier de 5-8 ans donne des définitions par l’usage (le verre c’est
pour boire) et même à 12 ans les énoncés des enfants sont très éloignés des formes utilisées
par le lexicologue. Or, quelque soit l’intérêt de l’approche linguistique, l’objet du chercheur
en psychologie est de décrire les composants du sens qui sont stockés dans la mémoire de
l’individu et donc de fonder une « sémantique psychologique ». Cette sémantique
psychologique ne peut faire l’impasse sur les connaissances développées en linguistique.
Avec les linguistes (Lyons, 1977) nous posons donc que la dénotation, la connotation
et la référence sont les constituants principaux du sens associés au lexème. Les linguistes ont
défini et étudié ces trois notions. Il est donc nécessaire de revenir aux sources pour les étudier
et préciser si elles présentent un intérêt en Psychologie.
1. En linguistique
1. 1. La dénotation
En linguistique, la dénotation est définie comme « l’élément stable, non subjectif et
analysable hors du discours, de la signification d’une unité lexicale… Par exemple, nuit,
définissable de façon stable comme intervalle entre coucher et lever du soleil, etc. La
dénotation d’une unité lexicale se définit aussi parfois par opposition à la désignation. La
dénotation renvoie à la classe des objets répondant à un concept constituant le signifié de la
classe. Par exemple le signe chaise étant une association du concept « siège à quatre pieds,
avec un placet, avec un dossier »… Alors que, par la dénotation le concept renvoie à la classe
des objets, dans la désignation, le concept renvoie à un objet isolé (ou un groupe d’objets)
faisant partie de l’ensemble. » (Dictionnaire de linguistique et des sciences du langage, 1999,
p. 135). La dénotation est indépendante d’une expression particulière ou d’un contexte.
1. 2. La connotation
La connotation « désigne un ensemble de significations secondes provoquées par
l’utilisation d’un matériel linguistique particulier et qui viennent s’ajouter au sens conceptuel
ou cognitif fondamental et stable, objet d’un consensus de la communauté linguistique, que
constitue la dénotation. » (Dictionnaire de linguistique et des sciences du langage, 1999, p.
111). L’exemple pris par les auteurs de cette définition illustre bien la différence entre
dénotation et connotation : « à coté de cheval, qui est neutre, on dira que destrier connote une
langue poétique, canasson une langue familière ». « Canasson » possède les traits de cheval
auquel on peut ajouter le trait « langue familière ». De même, le lexème « rouge » dénote une
couleur ayant des caractéristiques physiques et perceptives données et comporte pour la
plupart d’entre nous la connotation « feu », « chaleur », « violence »…
Comme le note Kerbrat-Orecchioni (1999, p.17) si « Dans la dénotation, le sens est
posé explicitement, de manière irréfutable… Dans la connotation, le sens est suggéré, et son
décodage est plus aléatoire. Les contenus connotatifs sont des valeurs sémantiques floues,
timides, qui ne s’imposent que si elles sont redondantes, ou du moins non contradictoires,
avec le contenu dénotatif ». Il n’empêche que sur le même signifiant, de simples modulations
de la prosodie permettent d’exprimer différentes connotations. L’intonation, les accents et les
poses au même titre que la construction syntaxique sont autant de moyens de connoter un
message. Kerbrat-Orecchioni (1999, p. 91, 92) propose de distinguer 5 catégories de
connotations :
« 1. Connotations dont le signifié est de même nature, mais non de même statut, que le
signifié de dénotation . » La connotation introduite par la prosodie est un exemple illustrant
cette classe de connotations.
« 2. Connotations « stylistiques » : elles informent sur l’appartenance du message à
telle langue ou sous-langue particulière. » Les exemples sont à trouver dans les manuels de
rhétorique. » L’utilisation du terme destrier indique que l’on se situe dans une langue
poétique.
« 3. Connotations « énonciatives » : elles fournissent des informations sur le locuteur
(et éventuellement sur tel autre élément de la situation de communication), et comprennent les
connotations
« socio-géographiques »…
« émotionnelles »…
« axiologiques »…
« idéologiques ». » Il s’agit des informations concernant non le référent mais l’énonciateur.
L’utilisation de telle expression indique que le locuteur vit à Marseille, Paris ou Lyon. Les
exemples sont nombreux, utilisation du « vé » par les Marseillais, parler verlan pour les
jeunes de la banlieue…
« 4. Connotations « associatives » : cette rubrique regroupe l’ensemble des valeurs
sémantiques additionnelles qui naissent à la faveur des mécanismes associatifs divers, « in
presentia » ou « in absentia ».
5. Les significations implicites comme valeurs connotées. ». Au caviar est
habituellement associé la richesse, le luxe si ce n’est l’opulence.
La variété de ces formes témoigne de l’importance de la connotation dans les systèmes
de communication. Le fait que l’on dispose de différents moyens pour exprimer cette
connotation montre qu’elle joue un rôle non négligeable dans les communications verbales.
1. 3. La référence
A coté de la dénotation et de la connotation, la fonction référentielle du langage11 est
affirmée comme essentielle par les linguistes. Pour Kerbrat-Orecchioni (1999) : « parler c’est
signifier, mais c’est en même temps référer » (Kerbrat-Orecchioni, 1999, p. 62). Comme le
rappelle Ducrot (1972) : « La communication linguistique ayant souvent pour objet la réalité
extra-linguistique, les locuteurs doivent pouvoir désigner les objets qui la constituent : c’est la
fonction référentielle du langage. » (Ducrot, 1972, p. 317).
Référer : « c’est fournir des informations spécifiques à propos d’objets spécifiques du
monde extralinguistique, lesquels ne peuvent être identifiés que par rapport à certains « points
de référence » (Pohl, 1975), à l’intérieur d’un certain « système de repérage » (Culioli,
1973). » (Kerbrat-Orecchioni, 1999, p. 62). La fonction référentielle du langage réside donc
dans sa capacité « à renvoyer à des objets du monde extralinguistique réel ou imaginaire…
Tout signe linguistique, en même temps qu’il assure la liaison entre un concept et une image
acoustique (définition saussurienne du signe) renvoie à la réalité extra-linguistique. Cette
fonction référentielle met le signe en rapport, non pas directement avec le monde des objets
réels, mais avec le monde perçu à l’intérieur des formations idéologiques d’une culture
donnée… La référence n’est pas faite à un objet réel, mais à un objet de pensée. »
(Dictionnaire de linguistique et des sciences du langage, 1999, p. 404). Dans cette définition
le terme de référence désigne aussi bien la fonction que l’objet mental. Un effort de
clarification doit être fait. Le référent est l’entité du monde réel ou imaginaire auquel renvoie
le signe linguistique. Lorsqu’il ne désigne pas la fonction référentielle, le terme référence
désigne l’objet mental correspondant au référent. La référence est une représentation mentale.
On est ainsi amené à distinguer la fonction référentielle qui est une propriété du signe
linguistique, le référent qui est un objet du monde et la référence qui est un objet mental.
11
Nombre de travaux ont été consacrés à la fonction référentielle du langage. Des synthèses récentes sont
disponibles (Kerbrat-Orecchioni, 1999 ; Nyckees, 1998).
1. 4. Comment se situe la référence par rapport aux signifiés ?
Dés 1892 Frege a distingué sens et référence et illustré cette distinction avec l’exemple
désormais célèbre de Vénus. La phrase « L’étoile du soir est l’étoile du matin » est composé
de deux expressions « étoile du soir » et « étoile du matin » qui n’ont évidemment pas le
même sens mais possèdent la même référence à savoir Vénus. Il en est de même de l’exemple
de la « victoire de Iéna » et de la « défaite de Waterloo » qui réfèrent à Napoléon mais
renvoient à des lieux et des circonstances différentes. Dans les deux cas la référence est une
connaissance qui ne se confond pas avec les dénotations des lexèmes.
Dans les deux exemples précédents, la référence est désignée par un nom propre. C’est
un cas particulier, puisque la référence est associée à tout objet réel ou imaginaire. Mais,
même dans ce cas particulier, les lexèmes « Vénus » et « Napoléon » sont associés à des
connaissances stockées en mémoire. « Napoléon » ne peut être référence des expressions « la
victoire de Iéna » et « la défaite de Waterloo » que pour les individus qui savent qu’il fut le
principal acteur de ces deux batailles, qu’il a gagné l’une et perdu l’autre. Evidemment parler
de la victoire de Waterloo modifie le référent qui cette fois n’est plus Napoléon mais Arthur
Wellesley duc de Wellington. En d’autres termes, l’objet mental « référence » est une
connaissance qui peut prendre la forme d’une connaissance verbale, d’une image mentale ou
d’une expérience affective. Elle est, de ce fait, porteuse de sens. Cette connaissance est reliée,
associée aux connaissances véhiculées par l’expression mais ne se confond pas avec les
signifiés des lexèmes. Elle complète, enrichit et ancre le sens des lexèmes et des expressions
sans se confondre avec lui. La référence peut-être partagée, c’est le cas des connaissances qui
viennent d’être évoquées mais elle peut aussi correspondre à une expérience personnelle,
« jour de tristesse et jour de pleurs » fait référence pour moi au 9 décembre 1960. Dans ce cas,
la référence n’est commune qu’aux individus qui ont été marqués par les événements qui se
sont produits ce jour là.
Les relations entre dénotation, connotation et référence sont illustrées sur la figure 19
à partir de l’exemple du lexème empereur. La dénotation d’empereur est : « chef souverain de
certains états… » (Dictionnaire Le Robert, 1995). Pour la plupart des français, la référence de
ce lexème est « Napoléon». La connotation est : « dictature, oppression, guerre» mais aussi
« gloire,victoire, pompe… ». Le fait que sur la figure dénotation, connotation et référence
soient individualisées ne signifie pas qu’ils constituent des entités autonomes et différenciées
dans la mémoire de l’individu.
Figure 19 : Schématisation des relations entre lexème, dénotation, référence et
connotation.
« chef de certains états »
Dénotation
« dictature, oppression… »
Connotation
Lexème
« empereur »
« Napoléon »
Référence
Référent (objet du monde)
2. En Psychologie
Pour le psychologue, la dénotation, la connotation et la référence sont des objets
mentaux, des représentations mentales. C’est à ce titre, qu’ils nous intéressent.
2. 1. La dénotation en Psychologie
La dénotation qu’un individu associe à un mot ne correspond pas toujours à celle qui
est décrite par le linguiste. Si l’on se réfère aux définitions produites par les enfants, force est
de constater des évolutions qui partant de la description de la fonction « la fourchette, ça sert
à manger » peuvent se rapprocher du texte du dictionnaire « ustensile de table (d’abord à
deux, puis à trois, quatre dents) dont on se sert pour piquer les aliments ». (Dictionnaire Le
Petit Robert).
Premier constat, les sens stockés en mémoire ne sont pas stables, ils évoluent, se
transforment au fur et à mesure des expériences et de l’acquisition de nouvelles
connaissances. Ils peuvent aussi se dégrader du fait de l’oubli engendré soit par la non
utilisation soit par le vieillissement.
L’évolution la plus marquante concerne l’apprentissage du langage. Cette acquisition
sera décrite dans le chapitre 6. Notons dès à présent que comme le rappelle Vygotski (1997)
« Les mots de l’enfant coïncident avec ceux de l’adulte dans leurs références concrètes, c’est
à dire qu’ils indiquent les mêmes objets, qu’ils se référent au même cercle de phénomènes
mais qu’ils ne coïncident pas dans leurs significations ». Cette citation de Vygotski situe la
référence au cœur de la construction du sens. Nombre de lexèmes sont utilisés alors même
que les dénotations ne sont pas connues tandis que les références et les connotations sont
parfaitement identifiées. La grande majorité des français connaît et utilise le mot caviar. Ils
sont capables de dire que ce mot désigne des œufs de poisson de couleur noire (les références
sont claires) qui sont mangés par des gens fortunés ou à l’occasion de fêtes exceptionnelles
(connotation) mais peu d’entre eux savent que ce mot désigne en fait des œufs d’esturgeons.
Cet exemple illustre le fait que dans certains cas, les références sont parfaitement identifiées,
les connotations sont connues alors que la dénotation reste imprécise ou confuse.
2. 2. Connotations et références
Pour le psychologue qui s’intéresse au sens il est important de noter que les objets sont
porteurs de sens avant l’acquisition du langage et vont le rester indépendamment de cette
même acquisition. L’enfant sait à quoi sert le biberon bien avant de pouvoir le dénommer.
Des connotations peuvent être attachés à des objets. La connotation agréable/désagréable
apparaît bien avant le développement du langage. La fonction connotative est antérieure à la
verbalisation. Les connotations attachées aux objets sont habituelles. Les connotations
attachées à la «deux chevaux Citroën » et à la « Rolls Royce » illustrent bien notre propos. La
Rolls est signe de richesse, la 2 CV évoque les années 60. Les expressions la voiture des
riches et la voiture des pauvres renvoient à deux référents différents. A chacun de ces
référents sont attachés des connotations. Des connotations peuvent être associées à des
référents et à des références.
Il sera montré dans le chapitre suivant que la manipulation et les mises en
correspondances de ces objets extérieurs que sont les référents seront à la base du
développement cognitif de l’individu. C’est autour des référents, objets ou situations que vont
se construire les premiers sens.
Comme le rappelle les linguistes, le référent peut être aussi bien réel que fictif c’est à
dire non nécessairement perceptible. Selon Ducrot (1972, p. 317) : « Les langues naturelles
ont en effet ce pouvoir de construire l’univers auquel elles se réfèrent ; elles peuvent donc se
donner un univers de discours imaginaire. L’île au trésor est un objet de référence possible
aussi bien que la gare de Lyon.». Le point important est que le référent appartient au monde
extérieur (réel ou fictif) tandis que la référence est un objet mental. Des expressions ou des
phrases peuvent, au même titre que le lexème, renvoyer aussi bien à des référents (objets ou
situations réels ou fictifs) qu’à des références (représentations mentales de ces objets ou
situations).
Avant le langage, l’individu observe des référents (objets ou situations réelle), possède
des représentations mentales de ces objets ou situations mentales (réelle ou fictives) qui sont
des références. Nous insistons sur le fait que des représentations mentales de type référence
existent et sont développées avant l’acquisition du langage. Néanmoins, le rôle et la fonction
des références mentales vont être modifiées par le développement puis la maîtrise du langage.
Pour bien saisir la fonction des références dans les activités mentales il faut rappeler
l’analyse qui en est faite par les linguistes. Ceux qui ont traité de la référence se sont
intéressés aux mécanismes qui mettent « en relation l’énoncé au référent c’est à dire
l’ensemble des mécanismes qui font correspondre à certaines unités linguistiques certains
éléments de la réalité extra-linguistique. » (Kerbrat-Orecchioni, 1999, p. 39). Ces mises en
relation résultent d’activités cognitives plus ou moins complexes. C’est à ce titre qu’elles
intéressent le psychologue.
Les relations référentielles entre énoncés et référents sont classées par KerbratOrecchioni, (1999, p. 39) en trois catégories : référence absolue, référence relative au contexte
linguistique (cotexte), référence relative à la situation de communication.
Les situations de référence absolue renvoient à des énoncés dont la compréhension ne
requiert aucune connaissance supplémentaire relative aux circonstances particulières dans
lesquelles les faits se sont déroulés ou les réalités sont désignées (Nyckes, 1998, p. 241). Dans
l’expression « Une fille blonde » on parlera de référence absolue dans la mesure où « pour
dénommer x, il suffit de prendre en considération cet objet x, sans l’apport d’aucune
information annexe » (Kerbrat-Orecchioni, 1999, p. 39). La représentation de l’objet x existe
dans la mémoire du lecteur, il suffit de l’activer.
A l’opposé, la référence relative est « définie par le fait que des connaissances
supplémentaires sont indispensables pour l’interprétation adéquate des unités considérées
(Nyckes, 1998, p. 242). Dans la phrase « La sœur de Pierre », « le terme « sœur » pour
désigner x, implique que le locuteur envisage, en plus de x lui-même, une personne y, prise
comme élément de référence » (Kerbrat-Orecchioni, 1999, p. 40). La référence est qualifiée
de cotextuelle (relative à un élément explicité dans le contexte verbal).
La référence déictique, quant à elle, est liée à la situation de communication, « Le
choix de l’unité signifiante appropriée et son interprétation référentielle se font alors en tenant
compte des données particulières de la situation de communication… (Kerbrat-Orecchioni,
1999, p. 39). Pour comprendre la phrase « Pierre habite ici », il faut situer ici. Cet ici peut être
situé en référence à la situation de communication. Je parle dans un endroit, je fais référence à
cet endroit dans lequel je communique.
La nécessaire distinction entre ces trois catégories de références est parfaitement
illustrée par les exemples suivants : « « Pierre habite à Lyon » : « référence absolue ». « Pierre
habite au Sud de Paris » : « référence cotextuelle » (relative à un élément explicité dans le
contexte verbal). « Pierre habite ici » : « référence déictique » (Kerbrat-Orecchioni, 1999, p.
39).
La construction de ces trois types de références met en jeu des processus cognitifs
sensiblement différents. Dans le cas de la référence absolue, on peut faire l’hypothèse que le
locuteur possède en mémoire un « objet mental » désigné par le lexème correspondant. Cet
objet mental varie selon le niveau de connaissance du lecteur. Si le lecteur ignore ce qu’est
« Lyon » il peut inférer qu’il s’agit d’une ville ou d’un village. En revanche, s’il connaît un
peu la France il saura au minimum que « Lyon » désigne la troisième ville de France et se
situe au centre du pays. S’il a visité ou vécu à « Lyon » les références seront encore toutes
autres. Soulignons que dans ce cas la référence n’est pas limitée aux connaissances verbales
mais intègre des images, des émotions, bref des souvenirs divers. La référence absolue
correspond à un objet mental stocké en mémoire et dont les constituants dépendent des
connaissances du lecteur. C’est une représentation mentale qui fait partie des connaissances
du locuteur.
Par opposition, la référence relative (Pierre habite au Sud de Paris) est généralement
construite, élaborée au cours du traitement du langage. Elle est en fait constituée en articulant
les connaissances associées à au moins deux lexèmes différents. Dans l’exemple précédent il
s’agit de construire une référence en combinant les connaissances associées à Paris et à sa
localisation et les connaissances correspondant au lexème « sud ». Ces deux connaissances
sont combinées pour construire la représentation correspondant à l’expression « au sud de
Paris ». Si la référence est organisée à partir de ces éléments, il est pertinent de parler de
référence relative. En revanche, s’il existe une entité stockée en mémoire permanente
correspondant à l’expression « sud de Paris », la référence n’est pas relative, elle est absolue.
Ainsi, pour le psychologue la distinction entre référence absolue et référence relative
correspond au fait que la référence est :
- soit une entité présente dans la mémoire du locuteur ;
- soit construite en combinant les connaissances associées à différents lexèmes.
La référence absolue est traitée uniquement par activation de représentations stockées en
mémoire, tandis que la référence relative suppose la construction d’une représentation
occurrente, construite en utilisant des connaissances stockées en mémoire.
La référence déictique (Pierre habite ici) est, elle aussi, relative car dépendante de la
situation. Elle est déterminée par la situation décrite ou vécue, elle « implique une prise en
considération de certains des éléments constitutifs de la situation de communication, à savoir :
- le rôle que tiennent dans le procès d’énonciation les actants de l’énoncé,
- la situation spatio-temporelle du locuteur, et éventuellement de l’allocutaire. »
(Kerbrat-Orecchioni, 1999, p. 41).
Si la situation est décrite, la référence est intimement liée à la représentation occurrente
qui est construite. Cette représentation comporte probablement des images mentales.
L’intégration d’images mentales est systématique dans le cas des situations vécues. La
construction de la référence mêle alors différentes connaissances stockées en mémoire,
informations perçues, objets perçus et de façon générale différents composants de la situation
originale qui est vécue à un moment donné. En fait, la référence est partie constitutive du
modèle de situation (Johnson-Layrd, 1983). C’est dire à quel point la référence déictique est
le produit d’une élaboration cognitive complexe.
En conclusion, l’analyse qui vient d’être menée montre que le sens associé au lexème ne se
réduit pas à la dénotation mais comporte des composants référentiels et connotatifs.
Très tôt les objets, les situations et même les individus perçus vont être classés en
agréables, désagréables, attractifs ou répulsifs. Avant même de savoir ce que c’est, l’enfant
fera la grimace lorsqu’on lui donnera à manger quelque chose d’amer. De même l’animal
distinguera ce qui se mange de ce qui ne se mange pas, ce qui fait peur de ce qui est attirant.
Les connotations vont être construites avant même que les dénotations ne soient acquises. On
ne peut donc négliger de prendre en compte les connotations. Elles doivent être intégrées dans
le réseau sémantique.
Comme pour la connotation, l’importance de la composante référentielle est établie.
L’adulte qui maîtrise le langage communique en faisant référence à des objets, à des êtres
animés ou à des situations réelles ou fictives. La fonction référentielle du langage l’amène à
activer des connaissances stockées en mémoire, à utiliser ces connaissances pour construire
des représentations occurrentes correspondantes à ce qui est lu ou entendu. Cette activité
référentielle est au centre de la compréhension du langage. Les références sont l’objet d’une
activité cognitive importante. La référence et la connotation sont autant constitutives du sens
que la dénotation. Le sens ne saurait être limité à la dénotation.
Le rôle et l’importance de la référence vont être confirmés par la description de la
construction du sens durant les premiers jours de la vie. Dès les premiers moments qui suivent
la naissance, certains objets associés systématiquement à des situations deviennent des
signaux annonçant des événements. Durant les premières semaines la répétition du fait que la
mère équipe l’enfant du bavoir avant de procéder au repas va aboutir au fait que le bavoir va
devenir signal de la prise d’aliments. Bien avant de savoir que le bavoir est « une pièce de
lingerie qui protège la poitrine des bébés » (dictionnaire Le Robert, 1995) l’enfant saura que
la présence du bavoir est liée à la situation de prise alimentaire. La perception de l’objet
renvoie à une situation qui fait référence. Une perception (la vue d’un objet, l’audition d’un
son…) est donc susceptible d’activer des connaissances qui sont des références. Ces
références, sont constitutives du sens. Elles vont, souvent, être construites avant l’acquisition
des dénotations : le bavoir sera signal d’un événement avant que l’on sache à quoi il sert.
Le développement de l’acquisition du sens et surtout du langage va permettre de se
détacher de l’objet référent de sorte que la dénotation tendra à prendre son autonomie par
rapport aux références. Mais il est fort probable que les références serviront de base aux
constructions des dénotations. La dénotation va pouvoir émerger à partir de traitements qui
auront été appliqués aux références. C’est une hypothèse que sera analysée lors de la
description de l’acquisition du langage. Mais il faut maintenir présent à l’esprit que comme le
souligne les linguistes, la fonction référentielle du langage est centrale dans tous les actes de
communication.
Indépendamment du fait qu’une des fonctions essentielles du langage est « de fournir
des informations spécifiques à propos d’objets spécifiques du monde extralinguistique,
lesquels ne peuvent être identifiés que par rapport à certains « points de référence » (Pohl,
1975), à l’intérieur d’un certain « système de repérage » (Culioli, 1973). » (KerbratOrecchioni, 1999, p. 62) et donc que la référence joue un rôle déterminant dans la
compréhension du langage il faut se demander dans quelle mesure la référence et la
connotation ne sont pas les premier sens ? Dans quelle mesure les premiers apprentissages ne
sont pas marqués par l’acquisition de connotations et de références ? Telle sont les questions
auxquelles il est possible de répondre en analysant la genèse du sens.
L’hypothèse est que le développement des structures sémantiques prend racine dès les
premières tentatives d’interaction du nourrisson avec son environnement. Ces racines vont
marquer de façon déterminante les développements ultérieurs. L’hypothèse d’une continuité
entre communication pré-verbale et communication langagière s’impose. Elle va être explorée
lors de la description de l’acquisition des premiers sens.
Résumé
Pour les linguistes, à chaque mot sont associés des dénotations, des connotations et des
références.
La dénotation est définie comme « l’élément stable, non subjectif et analysable hors
du discours, de la signification d’une unité lexicale… Par exemple, nuit, définissable de façon
stable comme intervalle entre coucher et lever du soleil » (Dictionnaire de linguistique et des
sciences du langage, 1999, p. 135).
La connotation « désigne un ensemble de significations secondes provoquées par
l’utilisation d’un matériel linguistique particulier et qui viennent s’ajouter au sens conceptuel
ou cognitif fondamental et stable, objet d’un consensus de la communauté linguistique, que
constitue la dénotation. » (Dictionnaire de linguistique et des sciences du langage, 1999).
A coté de la dénotation et de la connotation, la fonction référentielle du langage est
affirmée essentielle. « Tout signe linguistique, en même temps qu’il assure la liaison entre un
concept et une image acoustique (définition saussurienne du signe) renvoie à la réalité extralinguistique ». En d’autres termes, l’objet mental « référence » est une connaissance qui peut
prendre la forme d’une connaissance verbale, d’une image mentale ou d’une expérience
affective. Elle est, de ce fait, porteuse de sens.
La référence est une représentation mentale qui s’est développée avant l’acquisition du
langage. Avant de savoir parler le nourrisson manipule des références et manifeste la façon
dont il connote aussi bien les objets ou les personnes qui l’entourent que les événements
auxquels il participe. Référence et connotation des objets ou des événements sont acquis avant
la dénotation et la dénomination de ces mêmes objets ou événements. Même si leurs rôles et
leurs fonctions cognitives seront modifiés par l’acquisition du langage, on peut faire
l’hypothèse qu’ils continueront à jouer un rôle prépondérant dans la construction de la
mémoire sémantique puisqu’ils en constituent la matrice.
Pour en savoir plus
DUCROT O. (1972), Dire et ne pas dire. Principes de sémantique linguistique, Hermann :
Paris.
FREGE G. (1892), Sens et dénotation. In C. Imbert (Eds.), Gottlob Frege: Ecrits logiques et
philosophiques (pp. 102-126), Paris : Seuil, 1971.
KERBRAT-ORECCHIONI C. (1986), L’implicite. Armand Colin : Paris.
KERBRAT-ORECCHIONI C. (1999), L’énonciation. Armand Colin : Paris.
MORTUREUX M-F. (2001), La lexicologie entre langue et discours. Armand Colin : Paris.
NYCKEES V. (1998), La Sémantique. Belin : Paris.
POHL J. (1968), Symboles et langages, 1 , Sodi, Paris, Bruxelles.
POTTIER B. (1963), Recherches sur l’analyse sémantique en linguistique et en traduction
automatique. Nancy: Publications de la Faculté des Lettres et Sciences Humaines de Nancy.
RASTIER F. (1991), Sémantique et recherches cognitives. PUF : Paris.
Mots clés : dénotation, connotation, référence
Questions
1. Définissez dénotation, connotation et référence.
2. Distinguez sens et référence.
3. Comment les dénotations, les connotations et les références sont elles
représentées dans la mémoire sémantique ?
Chapitre 5. L’origine du sens
Les premiers sens sont construits avant l’apparition du langage. Les premières
reconnaissances, les premières catégorisations, l’organisation de l’espace, la perception et la
manipulation des objets sont autant d’activités qui seront à la base du sens. Les
reconnaissances des émotions, l’utilisation de ces émotions, les différentes modalités de
communication ainsi que les premiers actes intentionnels témoignent de l’importance du sens
dans l’activité du jeune enfant.
Ainsi, durant les dix huit premiers mois, les interactions entre l’enfant et son
environnement et entre l’enfant et son entourage vont permettre le développement d’une
sémantique pré-verbale : sémantique des objets, sémantique des situations, sémantique de
l’espace, sémantique des émotions, sémantique des actions…. La description de cette
sémantique est importante puisqu’elle va servir de matrice à la construction du langage et de
ce que l’on pourrait nommer la sémantique verbale.
Le but de ce chapitre est de tenter de décrire comment se construisent les premiers
signifiés avant l’apparition du langage. Par langage on entend bien « la capacité, spécifique à
l’espèce humaine, de communiquer au moyen de signes vocaux (ou langue) mettant en jeu
une technique corporelle complexe et supposant l’existence d’une fonction symbolique et de
centres corticaux génétiquement spécialisés. Ce système de signes vocaux utilisé par un
groupe social (ou communauté linguistique) déterminé constitue une langue particulière. »
(Dictionnaire de linguistique et des sciences du langage, 1999). Ne sont pas, assimilés au
langage les premiers babillements produits par le nouveau-né. Ces babillements, encouragés
par l’entourage, sont parfois interprétés, à tord, comme étant la production des premiers mots.
Il n’en est rien.
Avant même l’acquisition du langage, l’enfant va construire une première sémantique
des objets, des actions, des intentions, et des émotions. Il va communiquer avec son
environnement au moyen de signes et d’actions. Ces premières constructions de sens vont
fonder la mémoire sémantique. Pour la commodité de l’exposé on distinguera les
constructions liées à la manipulation des objets de celles qui reposent principalement sur la
communication avec autrui. Il va de soi que les deux vont de pair et que la relation avec
l’objet est utilisée pour la communication, mais cette distinction permet de caractériser les
propriétés des deux classes de construction du sens. Ce n’est pas par hasard que parmi les
psychologues qui ont observé le nouveau-né certains ont plus insisté sur la description des
systèmes de communications (Tourrette, 2001) tandis que d’autres se sont centrés sur la
manipulation des objets (Stréri, 1996).
Cette présentation est complétée par une analyse de la construction du sens telle
qu’elle apparaît dans les échelles de développement. La description du développement mental
intègre bien évidemment les progrès effectués dans la maîtrise du sens.
1. Le nourrisson et les objets
L’observation des nouveaux-nés indique que le sens se construit au cours des premières
perceptions et reconnaissances de signaux, des premières actions sur les objets et
particulièrement celles qui manifestent une réelle intention. L’efficacité de cette construction
sera évidente lorsque apparaîtront les premières catégorisations.
1. 1. Le début de la perception et les premières reconnaissances
La perception est à la base des premières activités cognitives développées par les
nouveau-nés. Les réactions à diverses stimulations sont enregistrées chez le fœtus. Poser les
mains sur le ventre de la mère va, dans les dernières semaines de la vie fœtale, provoquer des
mouvements du fœtus. Les psychologues ont mis au point différentes méthodes pour étudier
aussi bien les réactions du fœtus à différentes stimulations que les capacités perceptives du
nouveau-né12.
Pour ce qui est de l’activité du fœtus, le développement des méthodes d’échographie a
permis de décrire ses principaux comportements. Comme le rappellent Streri et Lécuyer (p.
88, Rossi et coll. 1999) « Jusqu’à la 22° semaine il est possible d’identifier 15 à 16 patterns de
mouvements distincts (de Vries, Visser et Prechtl, 1984). Ces mouvements semblent bien
coordonnés et organisés. Les mouvements spontanés du corps commencent à la fin du second
mois et augmentent jusqu’à la fin du premier trimestre. La fréquence des grands mouvements
décroît en fonction de l’âge gestationnel, du fait de la situation écologique naturellement
étroite du fœtus. » Les mouvements des yeux observés vers la 16° semaine deviennent plus
rapides dès la 23° semaine (cf. tableau récapitulatif dans Lécuyer, Pêcheux et Streri, 1994).
Les enregistrements de l’activité motrice du fœtus permettent de visualiser ses
réactions à différentes stimulations vibratoires. Sans utiliser des procédures aussi complexes
que l’échographie il est possible d’étudier les réactions du fœtus en enregistrant les variations
du rythme cardiaque ou du rythme respiratoire. « Le rythme cardiaque varie de 120 à 160
battements par minutes (BPM). Ce rythme peut diminuer jusqu’à 110 BPM, lorsque le fœtus
est calme, ou atteindre une valeur de 180 BPM dans des périodes de grande activité. Une
accélération et une décélération spontanée du rythme cardiaque s’observent environ dès la 25°
et la 20° semaine AG13. Il y a une relation étroite entre la modification du rythme cardiaque,
l’état de vigilance du fœtus et les mouvements spontanés du corps (Kisilevsky et Low,
1998)… Le rythme respiratoire est influencé par l’activité fœtale mais également par de
nombreux autres facteurs internes et externes, comme la prise de boisons alcoolisées ou de
café, le travail de la mère ou des excès de dioxyde de carbone dans le sang. » (Streri et
Lécuyer in Rossi et coll. 1999, p.88). Réagir à une stimulation n’est pas donner sens. Il ne faut
pas confondre réaction et reconnaissance.
La capacité à reconnaître se manifeste dans les dernières semaines de la vie intrautérine. Dès vingt huit semaines, le fœtus réagit à des bruits intenses. Le système auditif est
donc en partie fonctionnel. Sa capacité à reconnaître des sons se manifeste par des variations
du rythme cardiaque ou respiratoire. C’est alors que l’on peut observer que le fœtus réagit de
façon privilégiée à la voix maternelle. Cette différenciation correspond à la reconnaissance
d’un déjà entendu. Dés cette période le système nerveux va stocker certaines caractéristiques
des sons. Tout porte à croire que cet enregistrement et la capacité à reconnaître les mélodies
fréquemment entendues ne sont pas associés à des sens.
Après la naissance, dés les premiers jours de la vie le nouveau-né manifeste une
attention particulière pour la voix de sa mère. Il reconnaît la mélodie et le ton qu’il a entendu
durant la fin de sa vie fœtale. Ultérieurement l’enfant mettra en relation ces sons et mélodies
avec des visages, des personnes. La multi-modalité va se construire. Mais reconnaître ne
signifie pas systématiquement attribuer un sens.
La fonction de reconnaissance peut être plus ou moins complexe. Cinq niveaux de
reconnaissance peuvent être décrits :
a) conscience d’un déjà vu ou d’un déjà entendu. Ce stimulus est familier, je
l’ai déjà rencontré, j’ai stocké en mémoire certaines de ses propriétés, le
stimulus perçu active les traces stockées en mémoire. Le fœtus reconnaît la
voix de sa mère.
b) mise en relation d’un déjà vu ou déjà entendu avec une nouvelle
perception. L’enfant reconnaît la voix de sa mère, il la voit et va donc
12
Toutes ces méthodes sont présentées en détail in « Jean Pierre Rossi et Coll., Les méthodes de recherche en
Psychologie, 1999, Dunod : Paris.
13
AG = Age Gestationnel
associer une image auditive à une image visuelle. La reconnaissance va se
développer dans l’inter-modalité de sorte qu’un stimulus pourra se
substituer à un autre. Plusieurs stimuli renvoyant à un référent (ou référence
mentale) unique.
c) reconnaissance de l'objet comme annonciateur d’événements, l’objet
devient signal. Le bavoir est reconnu mais il devient aussi signe de
l’avènement d’une situation : le repas.
d) reconnaissance de l’objet mais aussi de ses propriétés et caractéristiques.
Le bavoir est reconnu, il est signe du repas et il sert à essuyer la bouche et
le visage et à protéger mes vêtements.
e) la reconnaissance des intentions et l’ensemble des interprétations portant
sur les sens véhiculés par l’objet, la situation, l’événement ou des
caractéristiques des objets, situations, événements. L’intention de ma mère
en me mettant un bavoir est bien de m’empêcher de salir mes vêtements
Le sens n’intervient pas à tous les niveaux de reconnaissance. La reconnaissance la
plus élémentaire correspond à la capacité d’affirmer ou de manifester que l’on a déjà
rencontré un objet. Cette conscience d’un déjà vu ou d’un déjà entendu n’implique pas
l’attribution d’un sens. Elle repose sur le stockage en mémoire d’informations puis
l’activation de ces informations lors de leur présentation. Je reconnais avoir déjà vu un objet
mais je ne connais pas sa signification.
La mise en correspondance d’un déjà entendu (ou d’un déjà vu) avec une nouvelle
perception, tout en étant plus complexe, n’implique toujours pas la construction d’une
signification. A la naissance le nouveau-né va percevoir sa mère. L’entendant parler il va
reconnaître les tons de la voix qu’il a perçu durant les dernières semaines de sa vie fœtale.
Nous avons vu qu’il va manifester un intérêt pour cette voix, il va donc être amené à associer
une perception visuelle (la vue de sa mère) avec l’audition de sa voix et la mémoire de cette
voix. Le même « objet » va posséder des caractéristiques auditives et visuelles. Il n’est pas
immédiatement significatif pour autant. Pourtant à ce stade, se construisent les premières
références mentales. Il est plus exact de dire qu’à ce stade, se construit un système qui permet
à différents stimuli de renvoyer à une même représentation.
Le sens va apparaître lorsque l’objet perçu va devenir signe annonciateur d’un
événement, lorsque la vue du biberon va signifier repas, satisfaction du besoin alimentaire ou
plaisir donné par la nourriture. De même, le sens est au centre aussi bien de la reconnaissance
des propriétés des objets et des événements que de la reconnaissance des intentions et
l’ensemble des interprétations portant sur les sens véhiculés par l’objet, la situation,
l’événement ou des caractéristiques des objets, situations, événements. Si certaines
reconnaissances sont associée à l’attribution d’une signification, toute reconnaissance n’est
pas porteuse de sens. Ce point étant établit les psychologues se sont intéressés aux différentes
capacités du nourrisson. Ne pouvant l’interroger verbalement, les chercheurs ont élaborés des
méthodes de recueil de données permettant de faire un tableau à peu prés exhaustif des
capacités et des aptitudes du nouveau-né. Ils ont pu en décrire les évolutions dans les
premières semaines et les premiers mois de la vie.
Méthodes d’études de la perception du nourrisson.
Ces méthodologies spécifiques ont été décrites par Streri et Lécuyer (Rossi et coll.
1999), nous les rappelons ici pour indiquer au lecteur comment ont été acquises les données
qui vont être présentées.
Pour étudier la perception visuelle il est commun d’utiliser la technique
d’habituation et la méthode de préférence visuelle. La technique d’habituation consiste à
analyser l’évolution de l’attention portée par le nouveau-né à des stimulations répétées. Elle
peut être décomposée en deux phases :
-
étude de l’habituation à un stimulus A ;
analyse de la réaction de nouveauté à la présentation du stimulus B.
Dans la première période on présente de façon répétée au bébé le stimulus A. Le temps
pendant lequel ce stimulus est regardé est enregistré à chaque présentation. Pendant les
premiers essais ce temps peu approcher si ce n’est dépasser la minute. Puis il tend à diminuer,
las, le bébé cesse de regarder le stimulus. Lorsque l’habituation est atteinte c’est-à-dire
lorsque l’enfant se désintéresse de l’objet A on lui présente le stimulus B. Si le nourrisson ne
voit pas de différences entre A et B il n’accorde aucune attention au nouveau stimulus. En
revanche, s’il perçoit des différences il va porter son attention sur le stimulus B et donc le
regarder longuement. C’est une réaction de nouveauté. Un exemple de réaction de nouveauté
est présenté sur la figure 20. Cette méthode permet de préciser ce que le nouveau-né perçoit
comme nouveau et donc différent de ce qu’il vient de voir.
La préférence visuelle consiste à présenter simultanément deux stimuli et à enregistrer le
temps de fixation de chacun d’entre eux. Un temps d’observation plus long pour l’une des
figures est interprété comme témoignant que l’enfant différencie les deux figures. Cette
technique, mise au point par Fantz permit entre autre de montrer que l’enfant est attiré par les
figures qui sont complexes ou significatives (visage).
Dans l’étude des stimulations auditives, trois méthodes sont les plus couramment
utilisées : enregistrement des variations du rythme de succion ou du rythme cardiaque,
manifestation d’une réaction d’orientation.
La succion est un des réflexes fondamentaux que manifeste le nouveau-né dès la
naissance. Bien que ce réflexe soit destiné à permettre de s’alimenter, au cours de la journée
l’enfant développe une activité de succion non nutritive. Lors de l’éveil actif, la présentation
d’une stimulation sonore va produire une augmentation des succions de haute amplitude
suivie d’une baisse. Ces variations du rythme de succion témoignent d’une perception
auditive. On peut ainsi savoir si un son est perçu.
Sur le même principe les variations du rythme cardiaque sont enregistrées pour étudier ce
que perçoit et discrimine le nouveau-né. Si l’introduction d’une stimulation auditive
déclenche une modification du rythme cardiaque c’est que l’enfant a entendu ce son.
La réaction d’orientation est un des réflexes qui sont testés dès la naissance.
Spontanément, l’enfant tourne la tête en direction du bruit qu’il entend. Malheureusement, ce
réflexe tend à s’atténuer et même à disparaître entre six et huit semaines. Mais le fait de
tourner la tête en direction du bruit montre que le bruit a été perçu.
Figure N° 20. Exemple de résultats obtenus lors de la mise en œuvre du paradigme
d’habituation. Les durées d’explorations visuelles des stimuli A et B sont mesurées et
représentées en fonction des rangs de présentation. Durant les sept premiers essais le stimulus
A est regardé pendant environ une demie seconde, au-delà, le temps d’exploration décroît
systématiquement au point qu’à l’essai 19, l’enfant ne regarde plus le stimulus. On lui
présente alors le stimulus B. Au premier essai, la durée d’exploration atteint 30 secondes ce
qui témoigne de l’intérêt que l’enfant porte à ce nouveau stimulus (réaction de nouveauté).
Cette réaction dite de nouveauté montre que B est perçu comme étant différent de A.
Durées de fixations en secondes
35
30
25
20
15
10
5
0
1 3 5 7 9 11 13 15 17 19 21 23 25
Rang des essais
En utilisant ces méthodes, il a été établi que dès la naissance l’équipement sensoriel du
jeune enfant lui offre de grandes possibilités de perception et de discrimination aussi bien en
vision qu’en audition. S’ils sont supérieurs à 60 décibels les sons sont perçus et discriminés.
Les formes sont perçues avec netteté si elles sont proches. Faute d’une bonne
accommodation14 les objets éloignés sont perçus flous.
L’étude des capacités perceptives du nourrisson indique que dés le premier mois il est
capable de discriminations fines lui permettant d’extraire certaines caractéristiques du
stimulus et donc d’isoler des traits perceptifs qui serviront de base à la constitution des
traits sémantiques. La capacité à discriminer certains paramètres du stimulus est attestée par
les préférences que manifeste le nouveau-né pour les visages, les yeux, les lèvres et les objets
complexes. Ces discriminations n’impliquent pas que l’enfant donne sens aux stimuli qu’il
reconnaît ou à ceux auxquels il s’intéresse. Mais ils témoignent de la capacité à isoler des
propriétés du contexte : les yeux sont l’objet d’un intérêt particulier indépendamment du
visage dans lequel ils s’intègrent. L’œil est isolé de son contexte, il devient un objet digne
d’intérêt. L’enfant est attiré par le mouvement. Tout ce qui bouge est l’objet d’une attention
particulière.
Tout aussi complexe est l’association entre des informations sonores et des informations
visuelles. Elle témoigne non seulement de la possibilité de représentations complexes mais de
plus, elle sera à l’origine du processus d’attribution : l’adulte ou l’objet que je vois est à
l’origine du son que j’ai entendu. La mère dont il a entendu la voix durant les dernières
semaines de la vie intra-utérine est cette personne qu’il voit et avec laquelle il va nouer des
relations privilégiées.
Les capacités de traitement du jeune enfant sont manifestes lors de la construction de
l’inter-modalité. Le développement de l’inter-modalité témoigne de la capacité à isoler
certains paramètres de la stimulation, à les stocker en mémoire puis à procéder à des
comparaisons aboutissant à des appariements. Citées par Streri (in R. Lecuyer. A. Stréri & MG Pêcheux, 1996), les recherches de Meltzoff et Borton (1979) indiquent qu’à un mois, les
enfants sont capables de reconnaître visuellement la texture des objets qu’ils ont explorés
oralement. Au début de l’expérience, les enfants sucent des tétines lisses ou des tétines
comportant des aspérités. Dans une seconde phase, des boules lisses ou comportant des
aspérités leurs sont présentées. Les bébés de un mois manifestent une préférence pour l’objet
qui présente le plus de similitudes avec celui qu’ils ont tété. A un mois, ils seraient donc
capables d’extraire la propriété lisse/rugueux, de stocker en mémoire cette propriété et
d’assimiler l’objet vu à l’objet tété. Extraire une propriété et être capable d’utiliser cette
information afin de la transposer à un autre objet est une des propriétés fondamentales du
système cognitif qui participe évidemment à la construction du sens. Cette activité est
similaire à l’extraction d’un trait sémantique. Cette propriété extraite va constituer un trait
caractéristique. L’appliquer à d’autre stimulus revient à généraliser son utilisation. Dès deux
mois, les enfants reconnaissent visuellement un objet qu’ils n’ont jamais vu mais qu’ils ont
simplement manipulé. Ils mettent donc en correspondance des informations liées au toucher
avec des informations visuelles dans des séquences où l’objet est vu puis touché. En revanche,
il faut attendre cinq mois pour qu’ils reconnaissent par le toucher l’objet qu’ils ont vu au
préalable (Streri, 1987).
Nombre d’objets deviennent signaux d’événements à venir.
Dès les premiers jours de la vie, des objets, des êtres vivants ou des caractéristiques de
situations ou d’événements vont devenir autant de signaux annonciateurs. La présentation des
objets qui sont utilisés lors de la tétée ou de la toilette vont devenir signe de la réalisation
proche de ces événements. Il est intéressant d’analyser le processus sous-jacent à ces
14
L’accommodation est l’ajustement qui par variation de la courbure du cristallin permet
d’assurer une vision nette de l’objet.
premières acquisitions du sens. L’objet biberon en lui-même n’est pas porteur de sens. Il ne
prend sens que lorsqu’il est associé à la prise alimentaire et à la satisfaction de ce besoin.
L’enfant a faim, il pleure. Ces pleurs sont interprétés par la mère comme le fait qu’il a faim.
Ils déclenchent donc l’enchaînement des comportements aboutissant à la prise du biberon.
Cette prise d’aliment va procurer différentes sensations qui vont être associées à l’objet
biberon. Donner sens au biberon consiste donc à le situer dans une situation et à mettre en
relation l’objet biberon avec les sensations dont il est à l’origine, la fonction qu’il remplit et
l’événement auquel il participe. Le sens est une mise en relation. La vue du biberon va activer
le souvenir de ce qu’il produit. L’intégration du biberon dans la situation crée sens. Dans ce
cas, la reconnaissance sera associée à l’attribution d’une signification. Elle sera à l’origine des
anticipations : l’objet perçu permet d’anticiper les événements à venir. On peut ainsi
considérer que les premières attributions de sens sont liées au fait que les objets ou personnes
deviennent signaux d’événements.
La reconnaissance des mimiques.
Plus compliquée à interpréter semble la reconnaissance et la production des mimiques de
plaisir ou de détresse qui, comme l’observe Bénédicte de Boysson-Bardies (1996), fondent la
communication. La production de ces mimiques ne doit rien à l’imitation puisque lorsque l’on
donne au nourrisson de l’eau sucrée ou amère il produit une grimace typée commune à
l’ensemble des civilisations. L’enfant aveugle de naissance produit les mêmes mimiques que
le voyant. Donc, l’expression des émotions fait partie des aptitudes du nouveau-né. Leur
reconnaissance pose problème car soit elle est due à un phénomène de mimétisme, l’enfant
percevant une mimique la reproduit et cette reproduction déclenche l’émotion correspondante
(interprétation compatible avec la théorie des émotions proposée par Darwin) soit les traits du
visage sont porteurs de sens et compris par le nouveau-né comme manifestation de plaisir ou
de désagrément. Or, à cinq mois, le comportement de l’enfant dépend des mimiques de la
mère. Ainsi, il va s’aventurer en rampant sur une surface vitrée recouvrant un vide si la mère
l’encourage par des mimiques appropriées. En revanche, il refusera de se déplacer si le visage
de la mère manifeste de l’inquiétude. Les mimiques, les sentiments exprimés par le visage
sont interprétés comme autant de signes d’encouragements, d’incitations ou à l’opposé de
danger et d’inquiétude. L’émotion est comprise très tôt puisque dès le second mois, elle est
communiquée de façon réciproque (Trevarthen, 1977, 1979). Les mimiques, les gestes, les
jeux de physionomie, les regards aussi bien que le ton de la voix vont être utilisés pour
communiquer son plaisir, son désagrément, ses premières intentions et volontés. La
communication des affects est sans conteste la base de tout un système d’acquisition du sens.
Elle sera analysée ultérieurement, il faut pourtant retenir que la reconnaissance des émotions
est une des premières aptitudes manifestée par le nourrisson.
Avant de traiter de la communication il faut rappeler que l’activité perceptive du
nouveau-né va probablement15 être à l’origine des premières catégorisations. Or catégoriser
consiste à extraire des propriétés et à regrouper les objets sur la base de ces propriétés. La
catégorisation est donc une activité fondamentale dans la construction du sens.
1. 2. Les premières catégorisations
« La catégorisation est la conduite adaptative fondamentale par laquelle nous
« découpons » le réel physique et social. Sa fonction cognitive est la création de catégories
15
La plupart des auteurs considèrent que les premières catégorisations reposent sur l’activité perceptive. Cette
thèse dominante a été remise en question par Bower et plus récemment par Mandler (2001) dont les recherches
semblent indiquer que les enfants sont, très tôt, capables de catégorisations aussi abstraites que la distinction
« être vivant », « objets ». Cette polémique sera présentée dans les lignes suivantes.
(d’objets, d’individus, etc.) nécessaires à la transition du continu au discret. La conception
classique de la catégorisation, dite « aristotélicienne », suppose l’équivalence logique des
éléments d’une même catégorie, dans le sens où ces éléments partagent tous l’ensemble des
traits nécessaires et suffisants qui définissent la catégorie» (Dictionnaire de linguistique et des
sciences du langage, 1999, p. 66-67). Catégoriser, c’est constituer des classes d’équivalences,
c’est être capable d’extraire des invariants tout en négligeant des caractéristiques non
pertinentes. La capacité à catégoriser peut être considérée comme une propriété de base de la
plupart des êtres vivants. Identifier ce qui est mangeable de ce qui ne l’est pas, distinguer les
partenaires des adversaires, les dangers des non dangers… revient à constituer des classes qui
conditionnent la vie des êtres vivants les plus évolués. En bref, les catégorisations sont
antérieures au langage même si la maîtrise de la langue va permettre un développement
considérable de cette faculté.
L’importance des catégorisations dans la construction du sens est soulignée par le fait
qu’elles sont à l’origine de la formation des concepts. Extraire les invariants, négliger les
différences pour regrouper les objets, individus ou événements qui présentent des similitudes
et donc constituer des classes sont des activités cognitives qui participent directement à la
construction du sens. La construction d’un concept repose sur la catégorisation. Le concept
chaise est construit en constituant la classe des objets qui sont des chaises. Pour cela, je dois
extraire les invariants de toutes les chaises que j’ai rencontrées dans ma vie.
La mise en place de cette activité complexe c’est à dire la maîtrise de l’outil logique
permettant la catégorisation va être progressive et s’étaler sur les dix premières années de la
vie. Si nous sommes essentiellement intéressés par la construction des premières catégories et
l’analyse de leurs places dans l’acquisition du sens, avant le développement du langage,
l’approche logique de la catégorisation telle qu’elle a été entamée par Piaget puis reprise par
les auteurs contemporains éclaire singulièrement le propos.
L’approche Piagétienne
Adoptant une conception logique de la catégorisation, Piaget considère que la réussite
complète aux épreuves de catégorisations se situe à 10 ans. Concrètement c’est à cet âge que
l’enfant répond correctement aux épreuves d’inclusions. Le modèle des épreuves d’inclusions
est formalisé de la façon suivante : Y a-t-il plus de A ou plus de B ?, en présence d’un
système de A, A’ et B avec A>A’, A⊂B et A’⊂B. A la question : « J’ai 7 marguerites et 3
roses, ai-je plus de marguerites que de fleurs ? » l’enfant de moins de six ans répond qu’il y a
plus de marguerites que de fleurs alors même qu’il sait parfaitement que la marguerite est une
fleur. Ce n’est qu’à partir de 7/8 ans, que les enfants répondent qu’il y a plus de fleurs que de
marguerites. Mais à cet âge leur réponse repose sur des données empiriques puisqu’à la
question : « que faut-il faire pour avoir plus de marguerites que de fleurs? » ils répondent « il
faut ajouter des marguerites ». L’épreuve ne sera complètement réussie que vers 10 ans. A ce
moment, l’enfant passe des inclusions empiriques correspondant à la contiguïté au
substituable (Houdé, 1992). De quoi s’agit-il ?
Dans le développement de la catégorisation les cognitivistes distinguent les premières
catégories qui sont construites sur la base de la contiguïté spatiale, temporelle ou
fonctionnelle des catégories autorisant la substituabilité. La contiguïté est liée à des
proximités perceptives ou fonctionnelles qui seront utilisées dans les schémas16. Il s’agit de
trouver des similitudes et des différences donc d’élaborer des traits sémantiques. Le serpent,
l’ours et l’oiseau ont en commun d’être vivants et donc animés par opposition à la chaise, au
crayon et à l’armoire qui sont des objets manufacturés. L’analyse des ressemblances et des
différences sera créatrice de traits sémantiques.
16
Les schémas seront présentés dans le chapitre 9.
La substituablité17 est la possibilité de procéder à des substitutions. Non seulement les
éléments de la catégorie ont des ressemblances mais les uns peuvent être remplacés par les
autres. La substituabilité sera introduite par Mandler et Nelson dans les scènes (scripts)
comme une étape de transition précédant l’organisation des catégories taxonomiques. Dans le
problème des fleurs, le passage de la réponse empirique (« il y a plus de fleurs que de
marguerites mais pour avoir plus de marguerites que de fleurs il faut ajouter des
marguerites ») à la réponse des enfants de 10 ans pour qui il n’est pas possible d’avoir plus de
marguerites que de fleurs, revient au passage du contiguë au substituable (Houdé, 1992). Les
règles d’inclusions sont alors parfaitement maîtrisées. On considère qu’à l’intérieur d’une
catégorie les éléments sont équivalents, on peut substituer quelque chose ou quelqu’un à un
autre élément appartenant à la même classe. Les éléments de la catégorie ne sont pas
seulement ressemblants (possédants des caractéristiques communes) mais sont aussi
substituables.
Cet exemple illustre bien les relations entre logique et construction du sens. Le
développement de la maîtrise des relations d’inclusion affecte directement la construction du
sens. Le fait que l’enfant de moins de 6 ans construise des catégories et raisonne sur la base de
la contiguïté limite considérablement les traits sémantiques qu’il va associer aux objets.
L’acquisition de la substituabilité va modifier les relations entre les objets appartenant à une
même catégorie et donc restructurer les premières catégorisations.
Comme le rappelle Houdé (1992), la réussite à l’épreuve de classement (problème des
marguerites) de Piaget et Inhelder (1959) est interprétée « à trois niveaux difficilement
dissociables : logique, structural et fonctionnel. Au niveau logique, la réponse correcte «plus
de fleurs (B) que de marguerites (A) par ce que les roses (A’) sont aussi des fleurs»
correspond à… l’inclusion des sous-classes A et A’ dans la classe emboîtante B. Au niveau
structural, elle témoigne d’une organisation cognitive isomorphe au groupement additif des
classes ; composition des opérations directes A + A’ = B et inverse B – A’ = A… Au niveau
fonctionnel, ce sont les mécanismes d’anticipation (méthode ascendante : réunion de petites
collections en un tout qui les inclut) et la rétroaction (méthode descendante : dissociation
d’une collection en sous collections) qui sous-tendent la structure additive des classes. Du
double jeu complémentaire de ces mécanismes procède la réversibilité opératoire nécessaire à
la structuration logique des conduites de catégorisation. » (Houdé et Miéville, 1993, p. 59/60).
L’acquisition de la logique décrite par Piaget et ses successeurs s’accompagne de
réorganisations de la mémoire sémantique. Nous l’avons vu lors de la description des stades
de développement qui couvrent les deux premières années, il en sera de même pour les
périodes ultérieures. Mais avant d’être capable d’opérations logiques aussi complexes que
celles qui sont impliquées dans l’épreuve des marguerites le nourrisson semble capable de
catégorisations élémentaires.
Les premières catégorisations observées chez le nouveau-né
L’approche logicienne de la catégorisation diffère des travaux sur l’émergence des
« catégories naturelles » (Rosch, 1973). Dans ce cadre, les auteurs décrivent comment le
nourrisson procède à des classifications. Les données produites par Rosch montrent que ni les
classes ni les éléments constitutifs des classes ne sont pas équivalents. Le niveau de base est
psychologiquement plus prégnant que les classes supérieures. Les études de la typicalité
indiquent que les exemplaires d’une même catégorie ne sont pas équivalents mais sont
ordonnés selon un degré de typicalité. La distinction entre la période où l’enfant constitue des
catégories par contiguïté perceptive ou fonctionnelle et le moment où la substituabilité devient
17
Néologisme correspondant à la qualité d’être substitué. Substituer : « mettre (qqch.,qqn) à la place de (qqch.,
qqn d’autre) pour faire jouer le même rôle. » (Dictionnaire Le Petit Robert, 1967)
déterminante reste pertinente (Houdé, 1992). Dans la première période, le regroupement des
exemplaires se fait sur la base de ressemblances.
La description des premières catégorisations manifestées par le nouveau-né a intéressé
plus d’un chercheur. La discussion a essentiellement porté sur leur nature. Pour les uns, les
premières catégories sont perceptives, pour d’autres elles seraient plus générales et ne
dépendraient pas des propriétés perceptives des objets. Pour les uns le nouveau-né construit la
catégorie à partir des similitudes et différences physiques, pour les autres, ces catégories
reposent sur des similitudes conceptuelles.
Affirmer qu’un nouveau-né est capable de constituer des catégories c’est dire qu’il est
capable d’extraire les caractéristiques communes à un ensemble d’objets, de constituer des
classes sur la base de ces similitudes en faisant abstraction des différence et d’avoir des
représentations mentales de ces classes. Deux types de catégories doivent être distingués : les
catégories les plus générales dites aussi catégories abstraites (être vivants, objets
manufacturés, meubles…) et les regroupements d’objets se situant au niveau de base c'est-àdire constitution de la classe des chiens (tous les races de chiens sont des chiens), des chats….
A trois mois le nourrisson différencie des sous-classes : le cheval est distingué du
zèbre et de la girafe, les tables des chaises, les mammifères des oiseaux (Behl-Cahdna, 1996).
Pour cet auteur, ces premières catégorisations sont perceptives. A six mois Thibaut (1999)
montre que les quantités de deux et de trois sont déjà discriminés. Mandler (1999) établit que
le jeune enfant est capable de catégoriser les objets sur la base du rôle qu’ils jouent dans les
événements et non seulement sur leur apparence. Pour cet auteur la première catégorie
constituée serait celle des animaux. Cette catégorie serait construite à partir de la perception
du mouvement. L’enfant serait capable de distinguer le mouvement biologiquement correct
du mouvement robotisé des objets (Berthental, 1993). A 8 mois, la distinction entre contours
droits et courbes pourrait, selon Walle, Spelke et Carrey (1997), fonder la distinction entre
animaux et objets manufacturés. A partir de 7/11 mois, l’enfant arrive à distinguer les oiseaux
aux ailes déployées des avions.
Pour Mandler, des catégories abstraites seraient construites avant l’acquisition du
langage. Par induction, à partir d’observations sur un nombre limité d’exemplaires, l’enfant
procéderait à des généralisations fondatrices de catégories conceptuelles. Elle oppose
similarité physique à similarité conceptuelle. Ce phénomène de généralisation est décrit par
Mandler à partir d’une méthode d’observation originale. La psychologue apprend à l’enfant à
donner à manger (il s’agit de faire semblant de donner à manger) à l’aide d’une cuillère à une
peluche d’ours par exemple. Puis elle procède à une première généralisation avec une peluche
représentant un chien par exemple. Enfin, elle propose à l’enfant de donner à manger à des
animaux qu’il n’a jamais observés ou à des objets. Elle observe, alors que l’enfant accepte de
donner à manger à ces nouveaux animaux mais refuse de le faire lorsqu’on lui présente des
objets tels qu’un train ou une table. Selon Mandler, l’enfant par généralisation a constitué la
classe des animaux opposée à celle des objets. Selon la thèse classique la similitude
perceptive permettait par gradient de constituer la classe « animal ». Pour Mandler, l’enfant
attribue des propriétés aux premiers animaux auxquels il est confronté puis va les assigner à
tous les animaux. Le fait est que perceptivement le serpent a peu de points communs avec
l’ours. Classer le serpent dans la même classe que l’ours ne peut se faire que sur la base d’une
généralisation de type conceptuel. Pour Mandler, le développement irait du général au
spécifique : l’enfant possèderait les catégories générales telles que animal, plante, véhicule,
meuble… et progressivement apprendrait à les subdiviser en sous-catégories.
L’expérience de Mandler (ne donner à manger qu’aux animaux) mérite d’être
analysée. Comme le remarque Campion (1999), deux mécanismes différents peuvent être à
l’origine de la création des classes :
a) soit l’enfant a extrait le trait « manger » et sait qu’il caractérise les
animaux ;
b) soit il ignore cette propriété. Dans ce cas, deux explications sont
possibles, l’enfant procède à sa classification selon une de ces deux
modalités : 1) à partir d’autres propriétés communes (qui n’ont pas été
identifiées par l’expérimentateur) et qu’il attribue aux différents
exemplaires qui lui sont présenté. A titre d’exemple l’enfant pourrait
considérer que sont des animaux les objets ayant des poils, ou un bouche,
ou un nez… ; 2) soit il se fonde sur une propriété du distracteur que les
animaux n’ont pas. Exemple, les animaux n’ont pas de roues, sont donc
regroupés dans la même classe tous les objets n’ayant pas de roue.
Cette remarque de Campion attire l’attention sur le fait que les classifications effectuées par
l’enfant peuvent être faites sur d’autres critères que les nôtres et que faute de connaître
précisément le critère de classification, il n’est pas possible d’apprécier les qualités des
catégorisations effectuées dans les premiers mois de la vie. Mandler consciente de cette
difficulté émet l’hypothèse que, pour catégoriser, l’enfant se fonde aussi bien sur des
propriétés générales que sur des propriétés que nous ignorons. Elle défend la thèse de
l’existence d’une similarité conceptuelle qui serait opérante dès 7 mois. Malheureusement,
elle ne nous dit rien sur le contenu de cette « similarité conceptuelle ». On peut faire
l’hypothèse que soit certaines catégories sont pré-existantes et d’une certaine manière innées,
soit que la catégorisation est une propriété fondamentale du système cognitif. Cette capacité
ne consisterait pas seulement à constituer des classes d’objets ayant des propriétés similaires
mais aussi à favoriser l’extraction et la généralisation de propriétés fondamentales telle que
« animaux », « objets »…
Quelque soit la thèse, toutes les études indiquent que durant la première année l’enfant
manifeste une réelle capacité à catégoriser. Que nous apprend cette capacité sur la la
construction de la sémantique ?
Catégorisation et sémantique
Catégoriser consiste à extraire des invariants permettant de regrouper les objets sur la
base de caractéristiques communes et donc à faire abstraction de nombres de différences.
Lorsqu’à 6/7 mois, le nourrisson est capable de classer dans la même catégorie toutes les
représentations de chats qui lui sont présentées et de les distinguer des chiens on peut dire
qu’il a acquis les concepts chat et chien, qu’il a extrait les propriétés permettant de les
caractériser avant même d’être capable de les dénommer c'est-à-dire avant même l’acquisition
du langage. Ces catégorisations fondent la sémantique. Aussi bien en termes de contenus :
traits permettant de caractériser les chats ; qu’en terme de méthode : méthode permettant de
catégoriser.
L’intérêt est accru lorsque la catégorisation ne se fait pas uniquement sur des traits
perceptifs mais s’établit sur la base de propriétés ou de systèmes de relations. Même si les
premières catégorisations sont essentiellement perceptives, la capacité à extraire des
propriétés de leur contexte et à considérer comme équivalents certains objets (alors que les
objets sont perceptivement très différents) sont des processus fondateurs du sens. Désormais,
des groupes d’objets ont des propriétés communes. Il est possible de faire abstraction de
propriétés perceptives pour dégager des fonctions communes. Les études sur la catégorie
« êtres vivants » opposée « aux objets manufacturés » illustre ce fait. La capacité, dés 11 mois
à maîtriser les catégories « animal », « meubles », « véhicules »… témoigne d’une aptitude
fondamentale dans le développement d’une sémantique psychologique pré-verbale. Ces faits
plaident en faveur d’une organisation catégorielle de la sémantique psychologique. Les bases
de la sémantique élaborées durant les premiers mois de la vie joueront un rôle déterminant
dans ce qui sera la mémoire sémantique. Tout porte à croire qu’elles serviront de matrice.
Les données de Mandler (2001) et de Barsalou (1999) indiquent clairement que
l’enfant constitue des catégories stables en fonction de propriétés et non sur la base d’un
gradient de similarité. Il s’agit donc bien, d’extraire ou de construire des traits sémantiques.
La connaissance de la nature de ces traits est évidemment fondamentale pour la
compréhension des premières acquisitions de sens. Concrètement il s’agit de savoir, par
exemple, si les catégories animés/inanimés sont établies indépendamment d’indicateurs tels
que la présence de poils ou d’oreilles... Le serpent qui perceptivement se présente comme très
différent du cheval mais ressemble plutôt à la ficelle est classé dans la catégorie des êtres
animés alors que la ficelle est classée parmi les objets. Certes, l’intérêt manifesté par le
nourrisson pour le visage et pour le mouvement, sa capacité à distinguer le mouvement des
êtres vivants du mouvement des objets constituent autant de traits à la base de ces premières
catégorisations. Mais le fait que dés 6 mois l’enfant manifeste un intérêt particulier pour ce
qui cause le mouvement, ce qui le provoque témoigne d’une activité de mise en relation et de
structuration des informations perçues qui dépassent la simple différenciation entre objets
perçus. Au-delà de l’observation, l’action sur les objets va participer directement au
développement d’une sémantique pré-verbale.
1. 3. L’action sur les objets comme fondement de la sémantique
Les actions sur l’environnement, la découverte des objets et de leurs propriétés sont
créatrices de sens. Pour Piaget, la découverte de l’objet sera à l’origine du développement de
l’intelligence. Entre la naissance et deux ans, cette conquête des objets correspond à ce que
Piaget nomme l’intelligence sensori-motrice18. Cette période est décomposée par le
psychologue Genevois en 6 sous stades.
Le premier qui couvre le premier mois correspond à une période où les réflexes dont,
est doté tout enfant à sa naissance, vont être consolidés et adaptés. Le mécanisme du
développement cognitif repose, chez Piaget, sur les processus d’assimilation et
d’accommodation. Affronté à une situation, l’individu fait appel aux schèmes dont il dispose
pour résoudre les problèmes qu’elle lui pose. C’est l’assimilation. S’il ne possède pas le
schème parfaitement adapté à la situation, l’individu sera amené à modifier ses schèmes et
donc à les accommoder. Le réflexe de succion et son évolution durant le premier mois est
détaillé par Piaget comme exemple du processus d’assimilation. L’assimilation va prendre
plusieurs formes :
- « L’assimilation fonctionnelle (ou reproductrice) correspondant à un besoin de
reproduction de l’action, permettant la consolidation de cette action. » (Tourrette et
Guidetti, 1994, p. 51). La répétition de l’acte de succion consolide le réflexe.
- « L’assimilation généralisatrice se manifeste lorsque l’enfant incorpore dans cette action
réflexe des objets différents (par exemple le sein et le pouce), provoquant ainsi un
élargissement du schème réflexe.
- L’assimilation devient ensuite recognitive (ou discriminative) lorsqu’elle donne lieu à des
distinctions entre ces objets différents qui sont incorporés dans le schème. Le bébé peut
sans peine distinguer son pouce du sein, surtout quand il a faim car ils ne reproduisent pas
le même effet en retour de son action.
- Il existe en outre une quatrième forme d’assimilation qui est l’assimilation réciproque des
schèmes, elle se manifeste un peu plus tard par exemple au moment de la coordination de
la vision et de la préhension. » (Tourrette et Guidetti, 1994, p. 51).
18
Une description précise des thèses de Jean Piaget et de façon générale du développement de l’enfant sera
trouvée dans l’ouvrage de C. Tourrette et M. Guidetti, (1994), Introduction à la Psychologie du développement.
Armand Colin : Paris.
L’assimilation aura donc 4 fonctions : consolider une action par la répétition, la
généraliser en l’appliquant à différents objets, cette généralisation aboutira à de nouvelles
discriminations puis, in fine, l’action sera intégrée dans un comportement plus complexe
intégrant différents schèmes.
L’assimilation généralisatrice, l’assimilation recognitive et l’assimilation réciproque des
schèmes participent à la construction du sens. La généralisation d’une réponse réflexe à
d’autres objets que celui auquel elle est habituellement associée peut être considérée comme
une première tentative de constituer des classes d’objets équivalents : le pouce est l’objet de la
même action que le sein ou la tétine. Le pouce, le sein et la tétine sont des objets que l’on
suce. Cette relation d’équivalence ne supprime les différences puisque l’enfant distingue
parfaitement le pouce et le sein.
L’assimilation génératrice s’accompagne d’une assimilation recognitive. L’enfant est donc
capable de différencier les caractéristiques des objets. Il est capable d’identifier certaines de
leurs fonctions et de leurs propriétés. L’exercice du réflexe et l’évolution qu’il détermine
amènent donc l’enfant à découvrir les propriétés des objets et donc à leur donner sens. La
construction du sens liée à la découverte du corps va se développer au cours du second sousstade.
Le second sous stade qui s’étale entre un et quatre mois voit se développer les premières
adaptations et les réactions circulaires primaires. La mise en place de nouveaux
comportements est liée aux réactions circulaires primaires. Piaget nomme ainsi les actions
fortuites qui sont renouvelées par ce qu’elles ont produit un effet jugé intéressant. Ces
réactions sont qualifiées de primaires par ce qu’elles concernent essentiellement le corps de
l’enfant. A l’occasion de vocalisations l’enfant produit des sons qu’il trouve intéressants et
répète en les modifiants. L’enfant devient donc attentif aux résultats de ses actions. L’intérêt
de l’action va provoquer la répétition et les modulations. Mais à ce moment, selon Piaget,
l’action n’est toujours pas intentionnelle. Elle ne le deviendra que durant le troisième sous
stade.
Le troisième sous stade (4 mois à 8/9 mois) voit se développer les réactions circulaires
secondaires et est caractérisé par l’intentionnalité qui va se manifester, entre autre, par la
saisie volontaire et donc la manipulation des objets. Ces réactions sont qualifiées de
secondaires parce que l’action de l’enfant s’exerce non plus seulement sur son corps mais sur
les objets qu’il saisit. L’enfant tire la ficelle pour déclencher le mouvement du mobile qui est
suspendu au-dessus de son lit ou la mélodie qui est émise par un objet. Le lien entre l’action et
la conséquence est établi. L’action devient intentionnelle, ce ne sont plus seulement les
propriétés des objets qui sont apprises ce sont aussi les propriétés des actions et leurs
conséquences immédiates. L’action devient significative elle est effectuée pour obtenir un
résultat. Ce point est important. L’action qui à l’origine a été fortuite a provoqué un résultat
que l’enfant va vouloir reproduire. Ce résultat est évalué, le lien entre l’action et le résultat est
établi.
Pour la construction du sens, l’autre intérêt de cette période réside dans l’augmentation de
l’activité exploratoire qui va se manifester par la manipulation des objets. Cette manipulation
va permettre la découverte de nombre des propriétés de chaque objet. Après l’exploration
visuelle, la manipulation va fonder la sémantique de l’objet.
Ces premiers traits sémantiques vont être complétés par l’intégration de l’objet dans
l’action. Ainsi, vont être constitués des traits sémantiques correspondants aux caractéristiques
perceptives (visuelle, tactiles, auditives…) des objets, à certaines de leurs fonctions (fonctions
intégrées dans des actions élémentaires) et aux causes provoquées par des manipulations et
des actions. Dès ce stade, les bases élémentaires de la sémantique des objets sont en cours de
constitution.
Le quatrième sous stade est celui qui va voir la coordination des schèmes secondaires et
leur adaptation à des situations nouvelles. Il correspond à une période qui va de 8/9 mois à
11/12 mois. Les schèmes qui dans le stade précédent étaient liés à des situations spécifiques
vont maintenant acquérir une certaine autonomie et pouvoir être combinés dans des actions
complexes. Cela devient possible du fait de la dissociation entre buts et moyens : le même
moyen permet d’atteindre différents buts ou même différents moyens permettent d’atteindre le
même but. Cette étape est évidemment fondamentale dans la construction du sens. Cela
signifie que les moyens ne sont plus directement dépendants des situations dans lesquels ils
ont été mis en œuvre. Tirer la ficelle permet de déclencher le mouvement, de produire un son
ou d’atteindre un objet. Le sens de l’action « tirer » devient indépendant de la situation dans
laquelle elle a été mise en œuvre la première fois. Ce que l’on pourrait nommer un « concept
action » est crée, l’action de tirer peut s’appliquer à une classe d’objets et se développer dans
nombre de situations. Une sémantique des actions est en cours d’élaboration, elle
s’accompagne d’un sémantique des moyens et d’une sémantique des buts. Je peux atteindre le
même but par différents moyens. Une action particulière peut être exercée pour atteindre
différents buts.
Cette évolution va rendre l’enfant capable d’anticipations c’est à dire capable de prévoir le
résultat d’une action et de la situer dans le temps. C’est évidemment durant cette période que
les capacités de localisations temporelles et spatiales vont faire de gros progrès. L’enfant
arrive à se situer dans un présent, un passé et un futur proche et s’orienter dans les lieux qui
lui sont familiers. Une sémantique de l’espace et une sémantique du temps sont en cours
d’élaboration alors même que l’enfant ne possède pas le vocabulaire correspondant. La
chronologie des actions, le souvenir du passé et les anticipations seront la base d’une
sémantique du temps. La construction du schéma corporel19, la capacité à situer ses propres
membres et à localiser les objets par rapport à soi sont autant d’actes marquant la conquête de
l’espace et fondant une sémantique de l’espace.
Les explorations et les manipulations vont être systématisées de sorte qu’une sémantique
des objets couvrant de larges catégories va se construire. Par sémantique de l’objet on entend
la découverte des propriétés des objets. Ces propriétés peuvent être fonctionnelles (il sert à, il
permet de…), perceptives (forme, couleur, taille, odeurs…), ou correspondre à des qualités
telles que lent, rapide, coupant, dangereux…
Au cinquième sous stade apparaissent les réactions circulaires tertiaires et
l’expérimentation permettant la découverte de moyens nouveaux. Ce stade couvre la fin de la
première année et le premier semestre de la seconde (11/12 mois à 18 mois). Cette période est
marquée par des découvertes liées à des effets indirects. Pour obtenir un objet éloigné l’enfant
va tirer sur la couverture sur laquelle il repose. L’intention est claire. La recherche de
l’intermédiaire est efficace. Mais surtout, lorsque la découverte est faite, elle est rapidement
généralisée, l’enfant a découvert un moyen pour atteindre un objet, il l’utilisera chaque fois
qu’il sera nécessaire. La capacité de généralisation fait partie des aptitudes de l’enfant d’un
an. L’expérimentation, comporte non seulement la mise en œuvre d’actions dans un but
déterminé et donc à la fois intention et anticipation mais aussi l’évaluation des résultats afin
de modifier l’action, de l’ajuster et d’améliorer son efficacité. Dans le développement cognitif
une étape fondamentale est franchie.
Le sixième sous stade (de 18 à 24 mois) va être caractérisé par la capacité à résoudre de
nouveaux problèmes par « insight » c’est à dire intuitivement et brutalement on dira par
illumination soudaine. L’espace et le temps sont de mieux en mieux maîtrisés. Mais, surtout,
les relations de cause à effet (sur les objets) commencent à être perçues. L’identification de
19
L’expression schéma corporel désigne l’image que l’on a de son corps, comment on se situe et on situe ses
membres dans l’espace. Le développement de la préhension et donc de l’adaptation du mouvement aux
caractéristiques de l’espace sont des éléments fondamentaux de la construction du schéma corporel.
ces relations indique que l’enfant commence à se décentrer, à prendre du recul par rapport à
l’objet et à penser des relations entre objets. Ainsi, durant cette période, la construction du
sens est marquée par le développement des relations : relations temporelles, relations spatiales
relations causales. L’objet continue, selon Piaget, à jouer un rôle déterminant mais le jeune
enfant arrive progressivement à s’en détacher pour s’intéresser aux relations. Dans ce
système, la recherche des causes devient fondamentale. On identifie les conséquences mais on
est aussi capable de les relier à leurs causes.
Cette période va permettre à l’enfant de passer de l’intelligence sensori-motrice à la
période pré-opératoire et aux opérations concrètes. L’apparition et le développement du
langage vont accentuer les décentrations amorcées précédemment et permettre le
développement d’un nouveau type de représentations. Pour Piaget : « Les conditions du
passage du plan sensori-moteur au plan réflexif sont donc au nombre de trois essentielles.
D’abord une augmentation des vitesses permettant de fondre en un ensemble simultané les
connaissances liées aux phases successives de l’action. Ensuite une prise de conscience, non
plus simplement des résultats désirés de l’action, mais de ces démarches mêmes, permettant
de doubler la recherche de la réussite par la constatation. Enfin une multiplication des
distances, permettant de prolonger les actions relatives aux réalités mêmes par des actions
symboliques portant sur les représentations dépassant ainsi les limites de l’espace et du temps
proches. » (J. Piaget. La Psychologie de l’intelligence. Armand Colin : Paris, 1964 ; p. 145).
Le développement de la fonction symbolique va marquer les périodes qui vont suivre.
Pour Piaget le langage n’est qu’une partie de la fonction symbolique. L’imitation différée et le
jeu symbolique constituent des éléments fondamentaux de la distanciation par rapport à
l’objet. Jouer avec une boite d’allumettes en faisant de celle-ci une voiture c’est être capable
de prendre ses distances par rapport à l’objet. Le jeu symbolique témoigne du développement
des représentations et de la capacité de distanciation.
L’action sur les objets sera modifiée dès que l’enfant sera capable de penser l’objet en son
absence, c’est ce que les psychologues nomment la permanence de l’objet. L’expérience la
plus simple consiste à voir si l’enfant va chercher l’objet que l’on a caché derrière un coussin.
La disparition de l’objet déclenche une conduite de recherche. Les données sur ce
comportement sont aussi nombreuses que contradictoires. Les chercheurs ont mis au point des
situations ingénieuses et souvent très pertinentes. Ne se contentant pas de voir si l’enfant
cherche l’objet caché par un mouchoir ils ont étudié sa capacité à prévoir le résultat du
mouvement. On déplace un objet qui à un moment de la trajectoire va passer derrière un
coussin, il s’agit alors d’observer si le regard de l’enfant reste figé à l’endroit où l’objet a
disparu ou si l’enfant attend la réapparition de l’objet de l’autre coté du coussin. Si c’est le
cas, on a la preuve non seulement que l’objet continue d’exister alors qu’il n’est plus vu mais
aussi que l’enfant imagine que le déplacement se continue alors même qu’il n’est pas visible.
Les épreuves ont été compliquées en utilisant des caches comportant des créneaux (cf. figure
21). Là aussi, l’observation porte sur les lieux où se pose le regard de l’enfant : arrive-t-il à
imaginer la trajectoire de l’objet, prend-il en compte la hauteur des créneaux pour savoir que
certains permettront la vision de l’objet alors que d’autres la cacheront. Si Piaget fixe à 1 an la
maîtrise totale des épreuves mettant en évidence la permanence de l’objet d’autres données
indiquent qu’elle est manifeste bien avant.
La permanence de l’objet est bien évidemment au centre de la construction du sens. Le
problème de base est de préciser à quel moment l’objet constitue une entité, a une
existence même lorsqu’il n’est pas vu? Dès le premier mois, l’enfant suit un objet en
déplacement, s’il est proche, rapidement l’enfant va tendre la main pour tenter de le saisir.
Donc l’objet a une existence. Est-il pour autant l’objet d’une représentation mentale support
d ‘une activité de pensée lorsqu’il n’est pas vu ? Le fait que l’enfant soit capable de tirer le
mouchoir sous lequel l’objet est caché montre que l’objet continue à exister alors même qu’il
n’est pas visible. Cela suggère que l’enfant s’est construit une image mentale de cet objet. Le
fait que l’enfant anticipe le résultat des déplacements témoigne de sa capacité à se représenter
les résultats des actions que l’on exerce sur cet objet. Les conséquences du déplacement sont
anticipées. La notion même de déplacement est acquise. En présence d’un mur crénelé dont la
taille des créneaux varie et derrière lequel on déplace un objet, l’enfant adapte sa poursuite
oculaire en fonction des caractéristiques de taille des créneaux. Cette adaptation montre la
capacité à imaginer le déplacement dans cette situation complexe et donc à mettre en relation
taille des objets, taille des créneaux et localisation du déplacement (cf. figure N° 21). Après
avoir été capable d’imaginer que l’objet existe lorsqu’il n’est pas vu l’enfant se représente les
résultats de ses déplacements. Ces acquisitions aboutissent à la constitution de traits
sémantiques liés à l’objet et aux déplacements. Ils sont constitutifs d’une sémantique de
l’objet et du déplacement.
Figure N° 21. Exemple de matériel permettant de mettre en évidence la permanence de
l’objet. Un écran crénelé est placé devant l’enfant. Un objet est déplacé derrière l’écran. Le
déplacement est représenté par un trait rouge. Ce dispositif permet d’observer si l’enfant
attend la réapparition de l’objet après son passage derrière chacun des créneaux et en
particulier s’il prend en compte la taille du créneau.
A l’approche Piagetienne de la permanence de l’objet, Bower (1989) oppose une
description de la construction de l’objet. A la notion de permanence il préfère celle d’identité
de l’objet. Il s’agit alors de décrire comment l’objet acquiert son identité. C’est dire à quel
point cette approche intéresse l’élaboration d’une sémantique de l’objet. Trois moments de
construction sont proposés par Bower. A la première période, l’objet est identifié comme un
volume « limité dans l’espace, situé dans un lieu particulier ou ayant une trajectoire
particulière. » (Lécuyer et all., 1996, p. 47). L’intérêt que porte l’enfant pour les objets en
mouvements, la façon dont il les suit du regard illustrent cette période. Selon Bower, à cette
période l’objet a une forme, est fixe ou en mouvement et peut suivre une trajectoire définie.
L’objet est extrait de son environnement, il se constitue en entité autonome. Dans la seconde
période, l’enfant prend en compte la taille, les couleurs, les formes, identifie différentes
trajectoires mais surtout réalise que le même objet peut être déplacé et avoir une trajectoire
identique à celle d’un autre. La propriété type de trajectoire devient autonome, elle n’est plus
liée à un objet particulier, des objets classés comme immobiles peuvent être déplacés.
Dans la dernière période vont être mise en place les relations spatiales. La construction de
l’identité de l’objet consiste à identifier les traits qui vont le caractériser : volume, forme,
couleur, taille déplacement… Bower décrit ainsi les débuts d’une sémantique de l’objet.
L’intérêt de cette description des premiers mois de la vie est de montrer qu’avant
l’acquisition du langage, une sémantique des objets et des actions va se constituer. Bower,
comme Piaget insistent sur le fait que l’action sur les objets est le moteur du développement.
L’action sur les objets va avoir pour effet de permettre à l’enfant de :
- s’approprier l’objet, de le découvrir et donc d’apprendre à discriminer ses premières
propriétés. L’identification des propriétés des objets aboutit à constituer un catalogue de traits
descriptifs qui seront autant de traits sémantiques ;
- de mettre en rapport les différents systèmes sensoriels (toucher, vision, audition…) et
donc construire l’intermodalité. La mise en correspondance des systèmes sensoriels va
permettre de dégager les traits communs au toucher, à la vision, à l’audition… mais surtout
elle va créer les relations permettant de comprendre, par exemple, que ce qui est rugueux au
toucher comporte des aspérités visibles, que ce qui pique au toucher comporte des pointes
visibles… et qu’ainsi, le rugueux et le pointu ont des caractéristiques perceptibles autant par
le toucher que par la vue.
- d’élaborer les premières catégorisations et donc de créer des classes d’équivalences
regroupant des objets possédants des caractéristiques communes : être vivants opposés à
objets, objets naturels opposés à objets manufacturés… Les propriétés des catégorisations ont
été décrites précédemment. Rappelons que la catégorisation est un principe d’organisation de
base de la mémoire sémantique.
- d’intégrer l’objet dans l’action et donc de découvrir certaines de ses propriétés et de
ses fonctions. Apprendre à quoi servent les objets, découvrir les actions qui peuvent être
développées aboutit à stocker en mémoire d’une part des propriétés essentielles des objets et
d’autre part les rôles et fonctions des actions. Tous ces éléments sont constitutifs d’une
première sémantique de l’objet et des actions.
Le développement des actions volontaires va fonder l’intentionnalité. C’est elle qui va
donner sens à l’action.
1.4. Les premiers actes intentionnels
Linguistes, psychologues et philosophes usent des termes d’intention, d’intension et
d’intentionnalité dans ces acceptions très précises. Il faut donc rappeler les définitions qui en
sont données.
Rappels : Intention, intension et intentionnalité
Intentionnalité : « … désigne une propriété de la conscience. Pour F. Brentano et E.
Husserl, la conscience n’est jamais identifiable en tant que telle (comme processus général ou
comme contenu), mais elle est toujours relative à un acte de visée, d’intention à l’égard d’un
objet. L’acte intentionnel est constitutif à la fois de l’objet et de la conscience, et
l’intentionnalité peut alors se définir comme la relation d’orientation de la seconde vers le
premier. Pour les psychologues d’inspiration phénoménologique, l’intentionnalité est le
rapport de signification, de nature existentielle (et non rationnelle) que le sujet entretient avec
le contexte de ses actes (objets de l’environnement et relations sociales) ; elle peut être définie
comme la structure significative de l’activité, d’un point de vue subjectif. Pour les tenants de
cette école, toute activité d’un sujet (conduites expressives, perceptives, et même processus
physiologique) doit être analysée dans son intentionnalité… » (Dictionnaire de Psychologie,
Doron, Parot, 1991). Cette définition illustre le fait que l’intentionnalité donne sens aux actes,
aux actions sur les objets. Le développement de l’intentionnalité est indissociable de la
construction du sens.
Intension : « En logique l’intension d’un concept (ou compréhension) s’oppose à son
extension (ou dénotation). L’intension du concept /livre/ peut être définie comme l’ensemble
des propriétés qui circonscrivent ce concept, alors que son extension est définie par
l’ensemble de tous les objets réels ou idéaux auxquels il s’applique. » (Dictionnaire de
Psychologie, Doron, Parot, 1991). L’intension du concept chaise est formé de l’ensemble des
traits sémantiques qui lui sont associés : pour s’asseoir, matériau rigide, pour une personne,
sur pied, avec dossier (cf. tableau 1, page 42). En revanche, l’extension du concept
correspond à l’énumération des différentes chaises : la chaise de cuisine la chaise Louis XV,
la chaise en paille ou la chaise de bistrot.
Intention : «Evoquant un état implicite, non observable, la notion d’intention est
utilisée en psychologie avec deux significations différentes.
La première du langage commun : l’intention est le fait de se proposer un certain but,
elle correspond à une volonté ou un désir qui précède l’action. Cette première définition
s’inscrit dans un modèle mécaniste ou biologique dans lequel l’intention est une
représentation préalable (consciente ou inconsciente) de l’acte…
La seconde définition correspond à un courant qui considère que toute action est en
elle-même intentionnelle, c'est-à-dire que l’intention, le désir, la volonté, font partie intégrante
de l’action… » (Dictionnaire de Psychologie, Doron, Parot, 1991).
Dans les lignes qui suivent le terme d’intentionnalité renvoie au fait que l’action est
dirigée dans un certain but. Il s’agit donc de décrire à quel moment les actions du nourrisson
sont guidées par la volonté d’atteindre un but. Pour le chercheur en psychologie la difficulté
vient toujours de la recherche des indicateurs pertinents de la fonction qu’il souhaite étudier.
Les études du nourrisson ont été marquées par l’élaboration de ces indicateurs et la mise au
point de méthodologies strictes. Etablir de façon indiscutable que l’acte d’un nourrisson
marque une intention n’est pourtant pas aisé. Compte tenu de la prudence des auteurs et de la
rigueur des méthodologies, s’il y a erreur de datation des premiers actes intentionnels c’est
plus une post-datation qu’une pré-datation.
Pour étudier les intentions des actes du nourrisson les psychologues utilisent encore un
cadre défini par Bruner en 1981. A cette époque, comme le rappellent Lécuyer et all., (1996,
p.118) Bruner avait proposé une définition restrictive mais opérationnelle de l’intention. Il y a
intention « quand un individu fonctionne pour atteindre un but, choisit parmi les moyens
et/ou les voies alternatives pour arriver à ce but, persiste dans la mise en œuvre de ces
moyens, corrige ses stratégies pour se rapprocher du but, et enfin cesse son activité quand des
caractéristiques précises du but sont atteinte ». Si l’on se réfère à cette définition, les critères
permettant de qualifier d’intentionnelle une action sont donc au nombre de trois :
- il faut pouvoir identifier le ou les buts. Première difficulté : lorsqu’on observe une action,
comment dire si elle est effectuée dans un but précis ? Le fait que l’enfant attrape un objet
permet-il de penser que l’enfant avait le but de l’attraper ? Cette saisie peut être le fait du
hasard. Si, dans le comportement de l’enfant il est possible d’identifier des gestes
manifestant le souhait d’atteindre un but, dans nombre de cas le but de l’action du
nouveau-né n’est pas évident.
- Il faut pouvoir identifier le ou les moyens. Cette identification est aisée lorsque l’enfant
est amené à répéter, modifier et adapter les moyens aux difficultés rencontrées. Lorsqu’il
cherche à attraper un objet qui n’est pas à portée et qu’après différentes tentatives
infructueuses il a l’idée de tirer la couverture sur lequel l’objet est posé, le but et les
moyens sont parfaitement identifiés mais toutes les situations ne sont pas aussi simples à
interpréter. Dans l’exemple précédent, lorsque l’enfant atteint l’objet sans tirer sur la
couverture mais simplement en tendant la main, ce geste est-il suffisant pour qualifier
l’intention ? De façon générale, comment identifier le but lorsque l’enfant ne possède pas
les aptitudes permettant de mettre en œuvre la stratégie nécessaire à son atteinte ?
L’intention précède-t-elle l’action ou est-ce l’inverse et dans ce cas, l’apparition des
intentions serait-elle dépendante de l’acquisition des habiletés ?
- Il faut que l’activité cesse quand le but est atteint. Ce critère permet, entre autre, de
confirmer que le but qui a été assigné à l’action était bien celui de l’enfant.
L’application de ces critères permet d’identifier quelles actions sont intentionnelles. A
l’origine, les pleurs déclenchés par la faim ne sont pas intentionnels. Les pleurs, la colère
deviendront intentionnels lorsque le nourrisson aura compris qu’ils sont des moyens efficaces
d’actions sur les personnes qui l’entourent. Cette utilisation des cris va être manifeste à
l’époque où les répétitions des actions marqueront le comportement. Qui n’a pas observé
l’enfant jetant un objet par terre criant pour que sa mère le ramasse et recommençant la scène
avec un plaisir évident. Dans ces séquences, on observe de nombreuses marques
d’intentionnalités. Tendre la main vers un objet en est une des plus manifestes.
Vers 9/10 mois l’enfant tend la main ouverte vers les objets (Cyrulnik, 1995). Il
montre ainsi, son désir de saisir l’objet vers lequel il dirige son bras. Son intention est claire.
Cette manifestation a un sens : l’enfant veut quelque chose et il a trouvé le moyen de le
manifester. A partir de 10/11 mois chez la fille et 13/15 mois chez le garçon (Cyrulnik, 1995)
il va pointer l’index (et non plus la main ouverte) vers l’objet, tout en regardant sa mère et en
émettant des babils. Comme le note Cyrulnik : « le langage ne commence à apparaître que sur
la base d’un ensemble comportementatif désignatif… double référence affective à la chose et
à la personne ». L’intention va évidemment se développer dans le cadre de la communication
et donc des interactions entre le nourrisson et ses partenaires.
Cyrulnik (1995) note que le singe ne comprend pas et n’exécute pas le geste consistant
à désigner l’objet avec le doigt. Lorsqu’on lui montre l’objet du doigt, il se comporte comme
l’imbécile de la fable chinoise qui au lieu de regarder la lune fixe le doigt qui la désigne. Cette
rupture est d’autant plus intéressante que l’intentionnalité marque le comportement des
oiseaux et des mammifères. Mais chez l’animal, la plupart du temps l’intention est la source
de l’action plus que la marque de la communication. L’utilisation par l’animal d’outils et la
mise en œuvre de conduites de détours complexes témoignent de la capacité à planifier des
actions dans un but. Ces exemples indiquent que l’intentionnalité peut se manifester dans des
conduites qui ne sont pas liées à la communication mais à des modalités d’actions sur les
objets de l’environnement.
En revanche, l’enfant tourné vers la mère pleure en montrant le biberon. Le biberon a
pris sens. L’enfant indique à la mère qu’il veut le prendre. L’intention est claire, la
communication est intentionnelle. Elle reste, au début, unidirectionnelle : l’enfant manifeste
ses intentions. Le progrès suivant sera marqué par la réciprocité qui fondera le dialogue :
l’enfant manifeste ses intentions et répond (c'est-à-dire comprend) aux intentions de ses
partenaires.
Comme le note Bénédicte de Boysson-Bardies (1996), « l’enfant dispose d’une
panoplie de gestes ou de formes particulières d’expressions verbales qui lui permettent de
communiquer avec l’adulte ou d’exprimer ses émotions. Un enfant de neuf à dix mois montre
du doigt, agite la main pour dire au revoir, tourne la tête pour refuser, enfin dispose d’une
série de gestes « socialisés » ou personnels qui lui permettent d’exprimer désirs, intérêts,
refus » (p. 142).
Si, comme il a été précisé précédemment (Piaget), l’intentionnalité est marquée par la
distinction du but et des moyens, l’autonomie des moyens par rapport aux buts n’est manifeste
qu’à partir du troisième sous stade le l’intelligence sensori-motrice. A partir de 6/7 mois, les
activités intentionnelles se multiplient leurs interprétations ne posent plus de problème. Cette
date apparaît bien tardive au vue des observations faites par les spécialistes du nouveau-né qui
identifient des actions intentionnelles dès les trois premiers mois. Certains vont même jusqu’à
affirmer que les comportements finalisés, dirigés vers un but sont innés mais que leurs
manifestations sont retardées par la capacité à mettre en œuvre les comportements
correspondants. L’intention existerait mais ne pourrait être manifestée faute d’une maîtrise
suffisante des modes d’expressions. Un exemple illustre les discussions qui peuvent opposer
les chercheurs. Le fait que l’enfant tende le bras vers l’objet et qu’il le fixe visuellement
témoigne de son intention de le saisir. En revanche, comment interpréter le fait que
simultanément il remue les lèvres comme s’il allait sucer l’objet ? Cette activité de la bouche
témoigne-t-elle de son intention de sucer l’objet désigné ? C’est probable mais on peut aussi y
voir l’embryon d’une manifestation vocale. La marque de l’intention « je veux sucer cet
objet » n’est pas flagrante. La discussion reste possible.
En tout état de cause il apparaît que des 3 mois mais surtout après 5/6 mois, alors que
l’enfant n’a pas acquis le langage il est capable d’actes intentionnels. Pour ce qui concerne la
construction du sens, l’identification du but et sa dissociation par rapport aux moyens
semblent les deux critères pertinents. Ainsi très tôt, le nourrisson serait alors capable d’avoir
une représentation des conséquences de ses actes, d’anticiper ses conséquences et de se
représenter les buts qu’il recherche. Avant l’apparition du langage l’enfant est capable de
construire une sémantique des buts. Cette construction est élaborée à partir de ce qui satisfait
des besoins de plus en plus élaborés. Il est regrettable que nous ne disposions pas
actuellement d’études systématiques sur les caractéristiques de ces buts. Les traits
sémantiques construits à partir des buts poursuivis et des actions qui doivent être mises en
œuvre pour les atteindre sont constitutifs de la mémoire sémantique. La poursuite d’un but
témoigne d’une capacité de représentations et d’anticipations liées aux contenus de la
mémoire sémantique. La réalisation de ces comportements va participer à la construction de
cette mémoire.
Même si nous avons souligné que les premiers actes intentionnels n’impliquaient pas
la réciprocité, les manifestations des intentions vont se développer dans le cadre de la
communication avec les partenaires. C’est en communiquant que l’on va manifester ses
intentions. A ce stade la communication est évidemment pré-verbale.
2. Les débuts de la communication pré-verbale
Dans les communications pré-verbales qui marquent le début de la vie il faut
distinguer les interactions adultes/enfants habituelles des émotions qui sont un mode
particulier de communiquer. Même si cette séparation peut paraître arbitraire, la spécificité de
la communication des émotions autant que l’importance qui lui a été accordée dans la
recherche méritent de traiter les émotions comme un cas particulier.
2. 1. Les interactions adultes/enfants
Vygotski (1997) attache une importance primordiale à la communication. Pour lui les
interactions sociales sont le moteur essentiel des apprentissages. La conquête des objets, leur
découverte se fait à travers les interactions de l’enfant et des personnes de son environnement.
Les capacités individuelles ne pourront se développer que dans le cadre des systèmes de
relations tissées avec autrui. C’est ainsi que les significations vont être acquises.
La mère ou la personne qui fait fonction de mère est généralement le principal
interlocuteur de l’enfant. Elle provoque l’échange, interprète les réactions du nourrisson et lui
répond. Mais, progressivement, les échanges vont aussi concerner les autres enfants et les
adultes familiers. Le cercle de la communication s’élargit.
Il faut pourtant se souvenir que dés la période intra-utérine, les échanges avec la mère ont
été nombreux. Si durant les dernières semaines de la vie intra-utérine, le fœtus a perçu des
sons, des odeurs et des vibrations, à la naissance il est affronté à un monde d’objets et de
personnes. Nous venons de voir comment ses relations avec les objets vont servir de bases à la
construction de la mémoire sémantique, il ne faudrait pas pour autant négliger les relations
que le nouveau-né va tisser avec les autres êtres vivants qui l’entourent. C’est à la description
de ces relations que sont consacrées les lignes suivantes. Les sons émis ou écoutés, les babils,
les cris, les pleurs, les sourires, les gestes mais aussi les mimiques produites ou vues sont
autant d’outils de cette communication pré-verbale.
Dans les semaines qui suivent la naissance, l’enfant s’exprime essentiellement par le
regard, les gestes, les cris, les pleurs, les babils. Nombre de ces manifestations sont
asymétriques c’est à dire sans attente de réponse et probablement aussi non intentionnelles. Si
l’enfant manifeste ainsi sans intention d’agir sur son environnement, la mère elle interprète
ces comportements, leur donne sens. Ces cris, ces pleurs, ces gestes vont être interprétés
comme des signes et vont déclencher des réponses de l’entourage.
Dès deux mois, le nourrisson vocalise en présence de l’adulte. Il tente de provoquer des
réactions de l’adulte en bougeant, en vocalisant, en souriant ou même au moyen de son
regard. La répétition de ces comportements et les réponses qui lui sont données par
l’entourage, vont apprendre à l’enfant à agir sur son environnement. C’est entre 15 et 18 mois
que vont se multiplier les activités conjointes et coordonnées avec la mère puis avec les autres
enfants, ses pairs.
Durant la première année, les interactions entre l’enfant et les personnes qui l’entourent
vont être centrées autour de l’objet. A 4 mois l’enfant regarde l’objet qui est fixé par la mère.
A 6 mois il demande à la mère de lui donner l’objet. Cette demande est accompagnée de
vocalisations entre 15 et 18 mois.
Montagner (1978) a observé les comportements de communication des enfants de 5 mois
à 3 ans. Il distingue 90 comportements qu’il classe en 6 catégories :
- « Les offrandes : tendre un objet à l’autre, en lancer un, en apporter un, etc. Les
comportements d’offrande permettent d’établir et de maintenir le contact avec un
partenaire ou sont une réponse possible aux manifestations de détresse produites par
l’autre. Les offrandes représentent 9.5 % des comportements observés entre 9 et 12 mois
et 7 % entre 24 et 36 mois. Dans la période considérée, 37 % des comportements
d’offrande s’accompagnent de vocalisations.
- Les sollicitations : avancer la main vers l’autre avec ou sans vocalisations, pointer du
doigt, regarder l’objet et chercher l’autre du regard ou inversement, etc. Là aussi, ces
comportements déclenchent une réponse positive de l’autre enfant qui accepte que celui
qui sollicite reste à proximité. Ces comportements représentent 22 % des comportements
observés entre 9 et 12 mois et 25.5 % entre 24 et 36 mois.
- Les menaces : mimiques, gestes avec ou sans vocalisations, regard dirigé vers l’autre
dents serrées et sourcils froncés, etc. Ces comportements apparaissent dans les situations
de conflits et correspondent à des situations de défense, en particulier après des tentatives
de saisie de la part d’un pair (13 % des comportements observés entre 9 et 12 mois et 17
% entre 24 et 36 mois).
- Les agressions : taper, mordre, griffer, lancer un objet sur l’autre, etc. (11.5 % des
comportements observés entre 9 et 12 mois et 18 % entre 24 et 36 mois). Ces
comportements semblent survenir de façon impulsive, sans être une réponse directe au
comportement de l’autre.
- Les saisies ou tentatives de saisies : comportements destinés à s’emparer de l’objet de
l’autre sans avoir effectué de sollicitations (18 % des comportements observés entre 9 et
12 mois et 9 % entre 24 et 36 mois).
-
Les isolements et les pleurs dont les auteurs estiment qu’ils peuvent être regroupés car
apparaissant dans les mêmes contextes de conduites de retrait social alors que dans un
certain nombre de cas les pleurs peuvent uniquement signifier un désir de se reposer ou un
état de malaise en relation avec la condition physique de l’enfant (26 % des
comportements observés entre 9 et 12 mois et 23.5 % entre 24 et 36 mois » (Cartron et
Winnykamen, 1995, p.41-43).
Les repères chronologiques qui accompagnent cette énumération indiquent qu’à partir
de 9 mois l’enfant agit sur son environnement au moyen d’une palette de comportements
élaborés. Si l’on reprend les intitulés de classes regroupant les comportements décrits il est
possible de constater que l’enfant construit les sens associés à l’offrande (donner un objet…),
aux sollicitations (vouloir un objet, le prendre…), aux menaces (mimiques et gestes
significatifs…), aux agressions (frapper…), aux saisies ainsi qu’aux isolements et pleurs. La
gestuelle de ces différents comportements va se développer et s’affiner à partir du 9° mois.
Certes, ces comportements vont au cours des années s’accompagner de vocalisations mais
nous sommes loin des mots qui permettront de les exprimer quelques années plus tard.
Retenons que le sens d'une multitude d’actions, permettant de communiquer avec autrui, se
construit très tôt et se manifeste clairement dès le 9° mois de la vie. Dans ce cadre, la
communication et la compréhension des émotions joue un rôle déterminant.
2. 2. Les émotions
Les émotions constituent une partie importante des interactions enfant/adulte et à ce titre
devraient être traitées dans les paragraphes précédents. Pourtant, l’importance des recherches
qui leur ont été consacrées fait qu’elles méritent un traitement particulier. En effet,
l’universalité de l’expression des émotions et la description de leurs genèses ont été l’objet de
nombreuses observations.
La première question concerne évidemment la définition de ce que les auteurs ont nommé
les émotions de base20. Ekman (1992) décrit les 9 caractéristiques qui selon lui permettent
d’identifier ces émotions fondamentales.
« Une émotion fondamentale :
1) possède un signal universel distinctif
2) est présente chez d’autres primates que l’humain
3) a son propre patron de réactions physiologiques
4) est associé à des événements déclencheurs universels distinctifs
5) a des composantes convergentes
6) est rapidement déclenchée
7) est de durée brève
8) est évaluée automatiquement
9) apparaît spontanément » (Richelle, Requin, Robert, Traité de Psychologie
Expérimentale, 2, 1994, p.7)
Sur la base de ces critères, Ekman classe les émotions en trois catégories :
- les émotions qualifiées de fondamentales. Elles sont au nombre de quatre : la colère, la
peur, le dégoût, et la tristesse.
- les émotions dont le statut n’est pas clair, il n’est pas certain qu’elle soient fondamentales.
Elles sont au nombre de six. Il s’agit de la joie, l’intérêt, le mépris la surprise, la
culpabilité et la honte. La joie doit pouvoir être décomposée en différentes émotions.
1)
20
Pour une analyse succincte mais complète de l’état des connaissances on se
reportera au chapitre de Gilles Kirouac intitulé « Les émotions » dans Richelle,
Requin, Robert, Traité de Psychologie Expérimentale, 2, 1994.
-
une dernière catégorie comprend des états affectifs dont l’état de nos connaissances
actuelles ne permet pas de les classer parmi les émotions, il s’agit de l’embarras, du
respect et de l’excitation.
Cette classification est hypothétique, comme le souligne l’auteur, elle mérite d’être
validée expérimentalement. Les hésitations quant aux émotions dont le statut n’est pas clair
sont essentiellement la conséquence du critère numéro 2 : « est présente chez d’autres
primates que l’humain ». Ainsi, les manifestations de joie, d’intérêt, de mépris, de surprise, de
culpabilité et de honte ne sont pas aisées à identifier chez les primates. Reconnaître les
manifestations de culpabilité ou de honte dans le comportement du chimpanzé amène à des
interprétations risquées. En fait, les auteurs ont introduit le critère numéro 2 pour souligner le
caractère universel de ces émotions, sous-entendu, la reconnaissance et l’expression de ces
émotions seraient innées. Sans entrer dans cette discussion, il faut noter que l’expression
faciale des émotions fondamentales et leurs compréhensions semblent universelles. Les
mimiques les exprimant sont identiques et comprises par tous les êtres humains quelque soit
la société à laquelle ils appartiennent. Sont-elles pour autant innées ? Ce qui est certain, c’est
que l’évolution des émotions primaires au cours du développement de l’enfant va consister en
différentes différenciations :
Emergence de nouvelles émotions telles que la timidité par exemple, expression à 7/8
mois du dégoût ou de la tendresse;
- Diversification de l’expression en fonction de l’origine : le sourire de satisfaction après le
biberon sera différent du sourire social ;
- Diversification en fonction de l’interlocuteur : à 6/7 mois le sourire sera de façon
privilégiée destiné à la mère et aux personnes qui sont familières.
L’adaptation de l’expression de l’émotion en fonction du destinataire et de son origine
(sourire social ou sourire de satisfaction) témoigne du rôle de l’émotion dans la
communication. L’attribution de sens à ces comportements est discutable. Il n’est pas évident
que le nourrisson ait conscience de produire deux sourires différents. Le sourire de
satisfaction est lié à un état physique. L’intention manifestée par le sourire social reste à
déchiffrer.
La manifestation des expressions qui vient d’être décrite, s’accompagne d’une capacité
réelle de reconnaissance des signes d’émotions produits par les partenaires. Très tôt l’enfant
est sensible aux émotions exprimées par les personnes qu’il voit. Il est en particulier sensible
à la joie, la tranquillité ou au contraire l’agacement et la colère exprimée par sa mère.
L’enfant répondra aux encouragements, il sera sensible aux mécontentements manifestés par
la mère. Cette compréhension de l’émotion d’autrui, va être marquée au cours des premiers
mois par des effets de mimétisme. Ainsi, l’expression des émotions va devenir un système de
communication qui perdurera après l’acquisition du langage. Progressivement les traits
sémantiques attachés à ces manifestations et à leur compréhension vont être extraits. Une
sémantique des émotions va se construire, de sorte que la peur, la joie ou le plaisir ne seront
plus seulement des réponses à des situations mais deviendront des traits caractéristiques
d’états ou d’événements. Les diversifications qui viennent d’être décrites (émergence de
nouvelles émotions, diversification des expressions et de leurs compréhensions, adaptation à
l’interlocuteur) impliquent modifications et élaborations de nouveaux traits sémantiques.
Soulignons enfin, que cette sémantique des émotions qui va s’élaborer au cours des
premières années de la vie va être intégrée dans le système complexe d’interactions entre
l’enfant et les personnes qui l’entourent. Mais surtout que même à l’âge adulte, alors que le
langage devient un moyen de communication privilégié, la communication des émotions reste
dans bien des cas non verbale. Que d’émotions ne peuvent être traduites par des mots ?
Emotions provoquées par une œuvre artistique, par le partage de plaisirs ou de douleurs. En
bref, la sémantique des émotions restera, au moins partiellement, non verbale.
Si les fondements des premières bases d’une sémantique psychologique et non verbale
viennent d’être esquissés, ils sont aussi confirmés par les descriptions que l’on trouve dans les
échelles de développement élaborées par les psychologues de l’enfant. C’est à ces
descriptions que sont consacrées les lignes suivantes.
3. La construction du sens à travers les échelles de développement
Les échelles de développement des jeunes enfants donnent évidemment une
description plus ou moins précise de la construction du système cognitif. Chaque moment de
ce développement est lié à la construction du sens. Pour illustrer notre propos nous prendrons
comme exemple l’Echelle du Développement Cognitif Précoce (Nader-Grobois, 2000) 21 qui
porte sur les 24 premiers mois de l’enfant. Ce test se compose de 6 échelles :
- La première évalue à la fois le développement de la capacité à poursuivre visuellement
une cible et la permanence de l’objet. Ces deux aptitudes ont été décrites précédemment.
Il a été souligné que l’intérêt des recherches sur la permanence de l’objet résidait dans le
fait de déterminer à partir de quel moment l’enfant construit et stocke en mémoire des
représentations des objets, à quel moment l’objet continue à exister alors qu’il n’est pas
vu. La capacité à stocker en mémoire les caractéristiques et propriétés des objets à
considérer que l’objet placé sous le coussin continue d’exister est un préalable à la
construction d’une mémoire sémantique efficace. La permanence de l’objet est une
propriété constitutive des références stockées en mémoire.
- La seconde échelle décrit les comportements mis en œuvre pour atteindre un but :
recherche et utilisation d’intermédiaires, élimination des obstacles... Ces stratégies
témoignent des intentions de l’enfant. Elles montrent que très tôt celui-ci va développer
des comportements dirigés vers un but. Il s’agit bien d’actions significatives.
- La troisième échelle décrit les progressions de l’imitation. Pour Piaget, l’imitation est au
cœur de la fonction symbolique. Le premier mois est marqué par l’absence d’imitation.
Au second mois, dans le cas de la phonation, une imitation sporadique est possible,
l’enfant est capable de percevoir l’identité entre ce qu’il fait et ce que fait le modèle. A
partir de 4 mois l’imitation des sons est systématique, celle des mouvements n’est possible
que s’ils sont perçus visuellement. « Les mouvements relatifs à la bouche, par exemple,
sont perçus visuellement sur la personne d’autrui, alors que seules les sensations
kinesthésiques et gustatives permettent d’en prendre conscience sur soi-même » (Piaget,
1964, La Formation du Symbole chez l’Enfant, p. 35). A ce stade l’imitation n’est pas
spontanée, elle se fait en présence du modèle. Au stade 4 l’enfant est capable d’imitation
de mouvements qui sont invisibles pour lui tandis qu’au 5° stade il va être capable
d’imiter de nouveaux modèles. A un an et quatre mois, au stade 6 l’enfant est capable
d’imitation différée et même d’imitation en l’absence du modèle. C’est dire que l’enfant a
stocké en mémoire des comportements qu’il peut activer à tout moment y compris en
absence des stimulations externes. Ils font partie de la vie privée de l’individu. L’enfant
s’est construit une vie privée. C’est-à-dire possède des représentations mentales qu’il peut
activer à tous moments et utiliser pour évoquer ce qui n’est pas présent.
- L’échelle quatre décrit la compréhension des relations de causes à effets. Etre capable de
relier un effet à sa cause, de comprendre que le fait de pousser un objet au bord de la table
aboutit à le faire tomber consistent à donner sens à des actes. La capacité à anticiper les
conséquence des actes et donc à se représenter la conséquence des actions nécessite non
seulement la construction d’une sémantique de l’action mais aussi l’enregistrement en
mémoire de connaissances sur les objets et les actions. La genèse de la causalité est un
21
Cette échelle est une révision de « Infant Psychological Scales » de Uzgiris et Hunt (1975).
moment primordial dans la construction du sens. Elle se développe bien avant la maîtrise
du langage. La conséquence, l’effet deviennent des constituants du sens des actions.
- L’échelle cinq analyse les stades de développement des relations spatiales entre objets.
Qu’il s’agisse de relations simples (endroit et envers), de la combinaison des objets ou de
leurs localisations (contournement…) l’enfant acquiert des compétences liées aux
propriétés des objets et de l’espace. Il construit ainsi une sémantique des relations
spatiales.
- La dernière échelle est centrée sur l’exploration, la manipulation, l’usage social des objets.
Là aussi les auteurs décrivent comment l’enfant s’approprie l’objet découvre ses
propriétés ainsi que la façon dont il peut l’utiliser dans son monde social.
Cette description montre que le développement cognitif du jeune enfant se caractérise par la
construction et l’acquisition de nouvelles significations.
Les données qui viennent d’être présentées indiquent que, dans cette période qui
précède et accompagne les débuts du langage, la construction du sens se fait autour des objets.
La fonction de référence est patente, elle est à l’origine de l’acquisition du sens. Le sens se
construit à partir des multiples interactions du nouveau-né avec son environnement. Les
débuts de la communication en sont un lieu privilégié.
Résumé
Les données présentées dans ce chapitre ont permis d’établir l’importance et la variété
des structures sémantiques construites durant les premiers mois de la vie et donc avant
l’apparition du langage. Les activités perceptives marquées par l’exploration et la construction
de représentations débouchent sur la reconnaissance des objets. La reconnaissance et les
premières manifestations d’intermodalité c'est-à-dire la mise en correspondance de la chose
vue avec la chose touchée ou entendu témoignent de la capacité à extraire des caractéristiques
et des propriétés des objets. Cette capacité se manifestera aussi par l’aptitude à procéder à des
catégorisations et donc à construire des classes d’équivalences qui seront un des éléments de
base de l’organisation de la mémoire sémantique.
La manipulation et l’action sur les objets vont aider l’enfant à extraire non seulement
les caractéristiques de ces objets mais aussi à comprendre leurs rôles et fonctions. L’action sur
les objets débouche sur la construction d’une sémantique des actions et des fonctions. Elle
permettra le développement des premiers actes intentionnels qui seront manifestes dés le
troisième mois. L’identification des buts de l’action et la recherche des moyens permettant de
les atteindre vont marquer l’activité des enfants de 5/6 mois. Les marques d’intentionnalité
témoignent de la capacité à anticiper les résultats des actions, de se représenter les buts et de
mettre en œuvre les actions appropriées.
L’intentionnalité va se développer dans la communication. Pour Nuttin (1980), la
communication est un besoin fondamental. Les interactions mère/enfant seront le lieu de
modes de communications pré-verbales aussi variées qu’efficaces. Les gestes d’offrande, les
sollicitations, les menaces et les agressions seront les premiers moyens de communication du
nourrisson. Mais surtout, à l’aide de mimiques et d’attitudes l’enfant non seulement exprime
ses sentiments mais est capable de reconnaître les émotions en lisant les mimiques produites
par ses partenaires.
La communication des émotions c'est-à-dire aussi bien la reconnaissance des émotions
que la production des patterns de mimiques et de comportements qui les manifestent sont au
centre de la communication non verbale. Si les émotions fondamentales sont exprimées par
les mêmes patterns de mimiques et d’attitudes dans toutes les sociétés humaines, elles vont
progressivement se différencier de sorte que le sourire de satisfaction qui suit le biberon sera
différent du sourire qui sollicite l’intérêt de la mère. Les interactions mère/enfant seront à
l’origine de ces développements.
Ainsi, avant l’apprentissage du langage, on voit se construire durant les premiers mois
qui suivent la naissance de l’enfant une sémantique des objets, une sémantique des fonctions,
une sémantique des actions, des buts et des moyens et une sémantique des émotions. On
pourrait aussi parler d’une sémantique de la communication puisqu’on voit apparaître les
premières règles qui structurent l’échange et le « dialogue » pré-verbal c'est-à-dire la
réciprocité marquée par l’alternance de l’échange.
Ainsi, durant si ce n’est les six premiers mois du moins durant la première année de
l’enfant vont s’élaborer ce que seront les fondements de la mémoire sémantique. Les premiers
contenus (caractéristiques des objets, leurs propriétés, leurs fonctions ; caractéristiques et
propriétés des actions, des buts, des moyens ; communication et fondement des échanges ;
communication et reconnaissance des émotions et des sentiments) et les premières structures
d’organisation avec le développement de cette capacité fondamentale du système cognitif : la
capacité à catégoriser c'est-à-dire à regrouper dans de mêmes classes des objets équivalents en
faisant abstraction de certaines différences et en ne prenant en compte que certaines
similitudes. On peut faire l’hypothèse que l’acquisition de ces premiers sens servira de
matrice au développement ultérieur de la mémoire sémantique.
Pour en savoir plus
CARON J. (1989), Précis de psycholinguistique. P.U.F. :Paris.
CARTRON A. & WINYKAMEN F. (1995), Les relations sociales chez l’enfant : Genèse,
développement, fonctions. Armand Colin : Paris.
CYRULNIK B. (1983), Mémoire de singe et paroles d’homme. Hachette : Paris.
CYRULNIK B. (1995), La naissance du sens. Hachette : Paris.
HOUDE O. (1992), Catégorisation et développement cognitif. PUF : Paris.
LECUYER R. (1990), Bébés psychologues, bébés astronomes : l’intelligence de la premières
année. Bruxelles : Mardaga.
LECUYER R., STRERI A. & PECHEUX M.-G. (1996), Le développement cognitif du
nourrisson, tome 2. Nathan Université : Paris.
NOETLING G. (1982), Le développement cognitif et le mécanisme de l’équilibration.
Chocoutimi, Canada : Gaétan Morin.
NUTTIN J. (1980), Théories de la motivation humaine. PUF : Paris.
PIAGET J. (1964), La Psychologie de l’intelligence. Armand Colin : Paris.
PIAGET J. (1964), La Formation du Symbole chez l’Enfant. Neuchatel : Delachaux et
Niestlé.
PIAGET J. & INHELDER B. (1959). Le genèse des structures logiques élémentaires,
Neuchâtel: Delachaux et Niestlé.
RICHELLE M., REQUIN J. & ROBERT M. (1994), Traité de Psychologie Expérimentale.
PUF : Paris.
TOURRETTE C. & GUIDETTI M. (1994), Introduction à la psychologie du développement :
Du bébé à l’adolescent. Paris : Armand Colin.
TOURRETTE C. (2001), L’évaluation psychologique des très jeunes enfants. Dunod : Paris.
VYGOTSKI L. (1997), Pensée et langage. La Dispute. SNEDIT : Paris.
Mots clés : reconnaissances, catégorisations, intentions, émotions, communication préverbale
Questions
1. Peut-on reconnaître sans attacher un sens à l’objet reconnu ?
2. Décrivez les premiers actes qui témoignent de la reconnaissance.
3. Décrivez les méthodologies qui permettent de savoir ce que l’enfant perçoit et
reconnaît.
4. Décrivez les premiers actes qui témoignent de l’intention.
5. Qu’est ce que la permanence de l’objet ? Comment se développe-t-elle ?
6. Comment la manipulation des objets permet-elle de construire les premiers
sens ?
7. Décrivez les débuts de la communication pré-verbale.
8. Décrivez les premières émotions et la compréhension de ces émotions.
9. Que nous disent les échelles de développement sur la construction du sens ?
Chapitre 6. Le développement du langage
Le développement du langage va modifier et accélérer la construction de la mémoire
sémantique. Aux cris vont succéder le babillage puis le « motheress » qui est le langage
utilisé par les adultes pour communiquer avec les nourrissons.
A partir de 9, 10 mois les premiers mots vont être émis dans des contextes précis. Dés
la fin de première année une trentaine de mots est reconnue. L’acquisition du vocabulaire va
s’accélérer de sorte que vers 15 mois 130 mots seront utilisés.
Disposer de mots pour communiquer, pour désigner et dénommer des objets, des
actions, des intentions et des sentiments, pour évoquer ce qui n’est pas présent, pour se situer
dans l’espace et dans le temps va donner de nouvelles possibilités d’action sur le monde et
sur les autres.
Cette acquisition du vocabulaire va nécessiter l’élaboration des premiers éléments
d’une grammaire nécessaires à la construction des premières phrases. Bref, le développement
du langage n’est pas limité à l’acquisition d’un code de communication il va modifier les
capacités cognitives de l’individu et donc ré-organiser sa mémoire à long terme. L’histoire du
développement de cet outil fondamental mérite d’être décrite.
On trouvera dans les ouvrages de Bénédicte Boysson-Bardies (1996) et de Michel Kail
et col. (2000) une description précise du développement du langage. Nous ne retiendrons pour
notre part que les aspects du développement qui concernent la construction du sens.
Une première ambiguïté doit être levée, ne doit pas être qualifié de langage toute
activité vocale. « Le langage est la capacité, spécifique à l’espèce humaine, de communiquer
au moyen d’un système de signes vocaux (ou langue) mettant en jeu une technique corporelle
complexe et supposant l’existence d’une fonction symbolique et de centre corticaux
génétiquement spécialisés. Ce système de signes vocaux utilisé par un groupe social (ou
communauté linguistique) déterminé constitue une langue particulière. » (Dictionnaire de
linguistique et des Sciences du Langage, 1999). Les activités vocales telles que le babillage et
les jeux vocaux ne sont pas du langage alors même qu’ils vont servir de base à la production
du langage.
L’acquisition du langage se fait évidemment dans le cadre du développement de la
communication. Tous les auteurs qui ont étudié les capacités du nourrisson ont été frappés de
sa capacité à communiquer. Il a été souligné que dès la naissance, l’enfant dispose d’un
formidable répertoire d’expressions faciales, de gestes, d’attitudes, de curiosités qui
constituent les formes élémentaires de la communication. La façon dont l’enfant et la mère
adaptent leurs mouvements, positions et attitudes durant l’allaitement témoignent d’échanges
qui bien que primaires n’en sont pas moins réels. Nombre de productions vocales vont être
utilisées pour communiquer. A ces premières productions vocales vont succéder la
compréhension puis la production des premiers mots. Cette production nécessite des prérequis indispensables au développement du langage.
Différents modes de communications verbales se mettent en œuvre bien avant
l’apprentissage du langage.
1. Babillage et Motheress, les premières communications verbales
Dès la naissance, l’enfant porte son attention sur les lèvres de l’adulte lorsqu’il parle.
La voix est déjà un mode de communication privilégié puisqu’elle provoque l’intérêt et
déclenche le sourire et les mimiques. L’enfant va développer ses capacités d’imitation dans le
cadre de ce que Piaget nomme la fonction symbolique : imitation en présence du modèle puis
imitation en son absence et enfin jeux symboliques. L’imitation sera un des moyens
d’apprentissage de la production du langage.
Dans les premiers jours, ses productions vocales sont limitées à des cris, des pleurs et
quelques sons. Puis vont apparaître les premières vocalisations qui entre deux et cinq mois ne
se feront qu’en position allongée. Entre quatre et cinq mois l’enfant acquiert une bonne
maîtrise des vocalisations allant jusqu’à des jeux vocaux. A cette époque le rire et les cris de
joies vont permettre de manifester son plaisir.
A 3/4 mois, les échanges avec la mère commencent à s’organiser de sorte à alterner les
vocalisations comme dans un dialogue, l’enfant « prend la parole » puis la « cède » et attend
comme pour permettre à la mère de répondre.
A cinq mois, l’enfant maîtrise une série de vocalisations stéréotypées telles que
« areuh, agueu… ». Le babillage va devenir un jeu et entre six et dix mois, l’enfant va
produire et répéter des syllabes simples /ba/, /ma/… L’adulte à l’affût des premiers mots de sa
progéniture va en déduire que l’enfant dit papa et mama. En fait, il s’agit de la production et
de la répétition des syllabes les plus simples.
Il faut se rappeler que jusqu’à un an, un an et demi, la morphologie du conduit vocal
ne permet pas l’émission de sons complexes. L’enfant naît, en effet, avec un conduit vocal
identique à celui du singe. Le larynx est situé haut dans le cou de sorte que le bébé peut boire
et avaler tout en respirant. A partir d’un an, un an et demi le larynx va prendre une position
basse, les voies respiratoires et alimentaires vont se croiser de sorte que la prise de boisson ou
de nourriture ne peut se faire en respirant. Mais cette descente du larynx va aboutir à la
constitution d’une chambre de résonance permettant la modulation de sons complexes (cf.
FigureN° 22). Ceci ne se produira jamais chez l’animal même s’il est entraîné à « parler ».
Pratiquement la prononciation de sons complexes n’est possible qu’à partir d’un an, un an et
demi.
Dès quatre mois, le prénom est reconnu. A cinq mois, l’enfant tente d’imiter les
vocalisations de la mère. A partir de dix mois la gamme des syllabes produites devient plus
variée mais elles sont spécifiques de la langue parlée par la mère et son entourage.
Pour communiquer avec leur enfant, les parents vont créer une forme particulière de
langage nommée par les anglo-saxons « motheress ». Jusqu’à trois ans, le langage utilisé par
les parents présente une vingtaine de caractéristiques que Ferguson (1977) considère comme
universelles. L’adulte, lorsqu’il s’adresse à l’enfant répète les mots ou expressions, exagère
les intonations, ralenti la prononciation, accentue les consonnes ou voyelles importantes,
utilise un langage « petit nègre », bref met en oeuvre un langage simplifié orienté par la
volonté de se faire comprendre par quelqu’un qui ne possède pas de vocabulaire. Il favorise
d’ailleurs les formes interrogatives, négatives et impératives. Rentrant dans ce dialogue,
l’enfant de trois ans saura alterner les « prises de paroles » laissant à l’adulte la possibilité de
s’exprimer et « prenant la parole » à son tour.
La compréhension et la production du langage oral supposent la capacité à découper et
reconnaître des syllabes et des mots. Durant les premiers mois le nouveau-né va développer
des capacités discriminatives lui permettant de distinguer les contrastes vocaliques des
contrastes consonantiques. Il sera sensible aux débuts et aux fins de syllabes. Dans la période
intra-utérine il a été sensibilisé au langage de sa mère. Il va manifester maintenant une
préférence pour celui-ci. Les apprentissages aboutiront à ce que ses capacités discriminatives
soient spécifiques de la langue maternelle de sorte que les aptitudes du petit coréen diffèrent
de celles du français.
Figure N° 22. Schéma du conduit vocal de l’adulte et du nourrisson.
Figure N° 22a représentation du conduit vocal du nourrisson : l’épiglotte vient
recouvrir le voile du palais de sorte que le nourrisson peut respirer et avaler simultanément.
Voile du palais
Pharynx
Epiglotte
Larynx
Cordes vocales
Figure N° 22b représentation du conduit vocal de l’adulte : l’épiglotte ne recouvre plus
le voile du palais, une chambre de résonance permettant la modulation des sons est constituée.
Voile du palais
Epiglott
Laryn
Langu
2. Les premiers mots
Pour comprendre les mots il faut pouvoir les isoler dans la phrase. L’intonation et la
prosodie sont des indicateurs de la frontière des mots. Nos difficultés à comprendre les
machines « qui parlent » sont dues au fait que ce langage de synthèse ne possède pas ces
qualités fondamentales que sont l’intonation et la prosodie. L’exemple repris par B. de
Boysson-Bardies est illustratif, si le locuteur n’adapte pas sa prosodie il sera difficile à
l’auditeur de différencier les phrases « J’ai admiré le chapeau élégant » et « j’ai admiré le
chapeau et les gants ». Chaque langue utilise des procédés spécifiques pour marquer les
débuts et les fins de mots. Des régularités orthographiques sont couplées avec des
modifications d’intonation. En français par exemple la dernière syllabe est allongée. Dans
chaque groupe linguistique l’enfant va manifester une capacité exemplaire à identifier les
syllabes, les débuts et les fins de mots.
Lorsqu’il devient capable d’isoler les premiers mots, le jeune enfant va pouvoir les
reconnaître. Mais reconnaître un mot ne signifie pas forcément lui donner un sens. Si à quatre
mois il réagit à l’audition de son prénom et porte son regard sur celui qui le prononce, cela ne
signifie pas qu’il comprenne que ce mot le désigne. Réagir à l’audition de son prénom et
même produire ce prénom ne signifie pas comprendre que ce prénom le désigne. On date à 9
mois le début de l’aptitude à donner un sens au mot.
Schématiquement, le développement du langage comporte quatre phases :
Première Phase, à partir de 8/9 mois, compréhension des premiers mots.
Seconde Phase, à partir de 11/13 mois production des premiers mots.
Troisième Phase, à partir de 18 mois accélération du développement du
vocabulaire.
Quatrième Phase, à partir de 18/20 mois développement de la
grammaire, utilisation des articles, construction des premières phrases, début de la maîtrise de
la morphologie (conjugaison des verbes…).
Les indications temporelles sont des moyennes, les variations d’un individu à l’autre
sont non négligeables. Généralement, les filles sont plus en avance que les garçons.
Hallé et de Boysson-Bardie (1994) montrent que les enfants de 11 et 12 mois
manifestent un intérêt particulier pour des mots familiers. Mais ce n’est que vers 13 mois,
selon les mêmes auteurs, que l’enfant regarde plus longtemps l’objet que l’on nomme. Encore
faut-il noter que cet objet n’est regardé que s’il se situe dans un contexte familier, le contexte
dans lequel il a été rencontré habituellement. Deux faits doivent être soulignés : 1) les
premiers mots appris désignent des objets ou des êtres vivants ; 2) la reconnaissance de l’objet
ou de l’être vivant dénommés est dépendante du contexte. Hors du contexte le mot semble
n’avoir plus de sens. C’est tout le problème de la généralisation : dégager le sens du contexte,
utiliser le mots pour désigner des objets d’apparences différentes. Le mot chaise doit désigner
la chaise où qu’elle se trouve, la chaise reste chaise quelle se trouve à la cuisine, dans la
chambre ou le living-room. Mais de plus, le mot chaise désigne des choses apparemment
aussi différentes que la chaise de cuisine, la chaise Louis XVI ou la chaise de bébé. Or, les
généralisations ne se développent qu’à partir de 16 mois. A cette date l’enfant utilise le mot
oreille aussi bien pour désigner l’oreille de sa mère que celle de l’épagneul. Avouons que les
similitudes perceptives sont limitées (cf. Figure N° 23).
Figure N° 23. Dessin d’une oreille d’homme et d’une oreille d’épagneul
La composition de ce premier vocabulaire est intéressante car elle ne résulte pas du
hasard. Pour l’essentiel les premiers mots désignent des objets ou des actes sociaux (au
revoir…). La place des verbes est faible. Elle oscille, selon les enquêtes entre 3% et 13% du
vocabulaire. Le premier vocabulaire est référentiel.
Le développement du vocabulaire, angoisse permanente des familles, a fait l’objet de
diverses évaluations. Encore faut-il distinguer compréhension du mot et articulation de ce
même mot. Entre 7 et 10 mois l’enfant semble comprendre des mots tels que maman, au
revoir… Il est capable de répéter des syllabes simples /baba/, /mama/… Il est actuellement
admis que les premiers phonèmes ressemblant à des mots apparaissent entre 9 et 10 mois. Ils
sont émis dans des contextes particuliers. En moyenne, les premiers mots sont acquis entre 11
et 14 mois. A la fin de la première année une trentaine de mots sont reconnus s’ils sont
entendus dans des contextes spécifiques. Ces premiers mots sont majoritairement des noms
communs ou des unités para-lexicales telles que en plus, ah… Ces catégories de mots sont les
plus nombreux jusqu’à vingt mois.
Cinq à six mois après la taille du vocabulaire atteint généralement 50 mots. Pour les
enfants dits avancés c’est-à-dire les enfants qui possèdent le vocabulaire le plus riche on
assiste à une forte accélération à partir de 13 mois. Selon Bates (1995) leur vocabulaire qui
était d’environ 30 mots à 13 mois passe à 70 mots à 14 mois, à 130 à 15 mois, soit un
doublement du vocabulaire chaque mois. A contrario, certains enfants ont à 16 mois le même
vocabulaire que celui qu’ils possédaient à 8 mois. Mais, durant ces premières années, les
capacités de compréhension semblent indépendantes de la taille du vocabulaire : les enfants
possédant un vocabulaire pauvre peuvent avoir un niveau de compréhension équivalent à ceux
qui possèdent un vocabulaire riche. Le décalage entre taille du vocabulaire et capacités de
compréhension est important. C’est dire qu’à cet âge le langage n’est pas le support privilégié
de la compréhension.
Le contenu du vocabulaire qui va se développer à partir de 14 mois dépend des
enfants. Deux types d’individus sont distingués : les enfants référentiels et les enfants
expressifs. Les premiers sont intéressés par les objets et manifestent des aptitudes à l’analyse
tandis que les seconds privilégient l’expression de leurs sentiments ainsi que les relations
sociales.
A partir de 18 à 24 mois le vocabulaire va rapidement s’accroître, la prononciation
s’améliorer, les mots vont être combinés. Cette période va, en effet, être caractérisée par le
développement des systèmes d’analyse phonologiques. Les zones du cerveau responsables de
l’analyse phonologique du langage vont se spécialiser, s’organiser et se développer.
Parallèlement, les capacités d’articulation vont croître, l’enfant deviendra capable d’articuler
des syllabes complexes et de maîtriser avec plus d’efficacité ses productions. Le langage va
devenir plus compréhensible.
A partir de 20 mois les prédicats (essentiellement les verbes) ainsi que les mots
grammaticaux (pourquoi, comment…) vont devenir de plus en plus nombreux de sorte qu’à
deux ans ces mots seront aussi nombreux que les noms communs et les unités para-lexicales.
A partir de 20 mois l’enfant va combiner les mots et progressivement les premières
phrases vont apparaître. La grammaire va être maîtrisée avant d’être apprise. Vocabulaire et
grammaire vont progresser parallèlement.
3. Les mots et le sens
Pour décrire la construction du sens chez le jeune enfant il est utile de faire référence aux
notions d’extension et de compréhension. L’extension renvoie à l’ensemble des objets que le
mot désigne tandis que la compréhension désigne les propriétés de ces mêmes objets. Une
définition par extension consiste à énumérer les éléments qui appartiennent à un ensemble.
Tandis qu’une définition par compréhension consiste à énumérer les propriétés que possèdent
les éléments. Une définition par extension de fleur est constituée de tous les végétaux qui sont
des fleurs : roses, coquelicots, géraniums, marguerites… tandis que la définition par
compréhension aboutit à rappeler les propriétés des fleurs. Si l’on en croît Le dictionnaire Le
Petit Robert la définition par compréhension du mot fleur est : « Production colorée, parfois
odorante, de certains végétaux (souvent considérée avec la tige) ».
Sur la base de cette distinction (extension et compréhension) l’acquisition du langage peut
donc être appréhendée aussi bien sous l’angle de la compréhension que sous celui de
l’extension. Dans un cas, il s’agit d’acquérir les traits sémantiques associés à un lexème, dans
l’autre il s’agit d’inventorier tous les objets qui sont désignés par le même lexème.
Sachant que les premiers mots appris permettent de désigner des objets familiers, les
progrès consistent à procéder aux généralisations permettant d’énumérer tous les objets qui
peuvent être désignés par le même lexème (extension) et corrélativement à cet apprentissage
découvrir les propriétés de ces objets, propriétés communes et caractéristiques permettant de
les différencier (compréhension). La catégorisation puis les différenciations permettant
d’extraire les caractéristiques des objets devient le moteur de la construction du sens.
Un exemple simple permet d’illustrer ces développements : le lexème oiseau est utilisé
par la mère pour désigner un animal qui vole. L’oiseau se trouve donc être un « objet » qui est
suspendu dans l’air (on dira plus tard qui vole) et se déplace. Le premier trait sémantique
attaché à oiseau est de type perceptif. Ce lexème désigne un être animé qui se déplace en
suspension dans l’air. L’enfant va apprendre que tout ce qui vole n’est pas un oiseau. Le sac
qui est emporté par le vent n’est pas un oiseau car l’oiseau possède la caractéristique « être
vivant ». Plus tard l’enfant apprendra que l’oiseau a des plumes, qu’il couve des œufs, etc. De
nouveaux traits vont être acquis. L’enfant apprendra aussi que parmi les oiseaux il y a des
pigeons, des merles, des étourneaux, etc. On peut ainsi concevoir un apprentissage du langage
partant de la désignation de la catégorie et allant jusqu’à la dénomination des exemplaires en
passant par la découverte des traits génériques et spécifiques. Cette démarche néglige les
catégories constituées aussi bien que les traits appris avant l’apprentissage du langage.
Dans une perspective proche Rosch (1978), conçoit l’acquisition du langage à partir de
l’apprentissage de la dénomination non de la classe (oiseau) mais du prototype (moineau).
Rappelons que le prototype possède tous les traits de la catégorie. Partant du lexème moineau
et compte tenu des ressemblances avec le pigeon l’enfant constituerait la classe oiseau. Dans
toutes les conditions, on fait l’hypothèse qu’avant l’acquisition du langage, l’enfant ne
possède pas la classe « oiseau » et donc que certaines catégories ne pourraient être construites
que grâce à l’apprentissage du langage. Cette position ne peut pas être tenue. Certes,
l’apprentissage et la maîtrise du langage vont permettre une réorganisation des catégories, un
développement et un approfondissement des traits sémantiques mais l’acquisition de cet outil
fondamental qu’est le langage ne peut se faire que parce que le système cognitif s’est structuré
et qu’une première organisation sémantique est déjà mise en place : sémantique des objets,
sémantique des actions, sémantique des émotions, sémantique des relations inter-personnelles.
Même embryonnaires, ces différentes sémantiques serviront de base à la mémoire qui va
pouvoir se développer dans les années qui seront marquées par l’apprentissage du langage.
A la fin de la première année l’enfant va utiliser quelques mots généralement bisyllabiques. Le mot papa va être utilisé pour désigner l’ensemble des hommes.
Progressivement cet ensemble va se réduire. L’extension va se faire par diminution ou
restriction de l’ensemble. L’enfant de 13 mois qui a appris à désigner la poule par le vocable
« cocote », l’utilise en montrant des oiseaux. « Cocote » désigne l’animal ayant des plumes.
Est-ce pour autant un oiseau c’est-à-dire un animal qui vole ? Probablement non puisque la
poule ne vole pas. Le trait « vole » ne sera acquis qu’ultérieurement. Spontanément
l’extension couvre tous les objets possédant une qualité. L’apprentissage va consister dans
l’acquisition de nouveaux traits sémantiques. Dans l’exemple acquisition du trait « vole ».
Comme le souligne Vygotski (1997) « Les mots de l’enfant coïncident avec ceux de
l’adulte dans leurs références concrètes, c’est à dire qu’ils indiquent les mêmes objets, qu’ils
se référent au même cercle de phénomènes mais qu’ils ne coïncident pas dans leurs
significations ». Cette remarque (déjà citée) est fondamentale si l’on veut apprécier la distance
entre la sémantique de l’enfant et celle de l’adulte cultivé. Référer aux mêmes objets ou
phénomènes et événements ne veut pas dire posséder les mêmes significations. Cela est aussi
vrai pour le jeune enfant que pour l’adulte. L’existence de différences de cultures et de
connaissances amène à faire que les significations attachées aux mots varient d’un individu à
l’autre. Mais surtout cette remarque de Vygotski attire l’attention sur le fait que la fonction
essentielle du langage du jeune enfant est de type référentiel. Il permet de renvoyer à des
objets du monde. « Cette fonction référentielle met le signe en rapport, non pas directement
avec le monde des objets réels, mais avec le monde perçu à l’intérieur des formations
idéologiques d’une culture donnée… La référence n’est pas faite à un objet réel, mais à un
objet de pensée. » (Dictionnaire de linguistique et des sciences du langage, 1999, p. 404).
Le mot permet d’évoquer les objets absents. Avant le mot seule l’image et plus
généralement les représentations mentales stockées en mémoire permettaient d’évoquer les
objets ou les situations que l’on ne voyait ou n’entendait pas. Désormais, grâce au mot il sera
possible d’appeler l’objet absent. Progressivement l’affrontement mot / image va aboutir à un
recul sensible du représentatif imagé au profit du conceptuel.
Pour Vigotski l’évolution du langage est un mouvement de l’extérieur vers l’intérieur.
Le langage est d’abord extérieur puis égocentrique et enfin intérieur. Le langage intérieur va
permettre le développement de la pensée. Non que la naissance de la pensée soit liée au
langage, car Vigotski décrit une pensée pré-verbale, mais parce que le langage va transformer
la communication et les modes de la pensée.
Cette réflexion sur la sémantique des mots ne doit pas faire oublier que l’acquisition du
langage ne se réduit pas à apprendre à utiliser des mots. La construction des phrases,
l’apprentissage de la syntaxe, l’utilisation des temps (présent, futur, passé) sont autant de
composants fondamentaux de l’acquisition du langage qui vont modifier aussi bien les
connaissances de l’individu que la façon dont il va appréhender son environnement. Pouvoir
situer aujourd’hui par rapport à hier ou demain ne relève pas de la simple acquisition du
vocabulaire mais me permet d’acquérir les outils avec lesquels je vais me situer dans le temps.
On ne peut réduire l’acquisition du langage à l’apprentissage d’un vocabulaire. Le langage est
un instrument extraordinaire de développement cognitif.
L’acquisition du vocabulaire ne permet pas pour autant la construction de phrases. Si vers
14/18 mois l’enfant utilise des couples de mots, nous sommes encore loin de la construction
de phrases. A cette époque la phrase est construite autour d’un mot pivot qui est couplé avec
d’autres mots. Ainsi, les mots pivots, bonjour, au revoir seront associés à maman, papa,
tata… Il faut attendre la troisième année pour qu’apparaissent des structures ayant quelques
ressemblances avec une phrase. Elles sont généralement composées de trois mots : sujet,
verbe, complément, exemple : papa pris toto pour dire papa a pris la voiture. L’ordre des
lexèmes est correct (sujet, verbe complément) mais les termes sont simplement juxtaposés et
le verbe n’est pas conjugué.
L’apprentissage de la syntaxe aussi bien que la maîtrise des conjugaisons vont modifier la
mémoire sémantique aussi bien que les capacités cognitives de l’individu. Ils vont lui donner
de nouveaux pouvoirs d’abstraction et de manipulation.
Dès la naissance l’enfant affirme un désir de communiquer, d’entrer en contact avec son
environnement. Nuttin (1980) fait de cette tendance la motivation fondamentale de tout
homme. « Avant tout besoin d’objets spécifiques, l’individu a besoin d’entrer en relation avec
l’objet « environnement », c’est à dire qu’il a besoin de stimulations et d’interactions. »
(Nuttin, 1980, p. 136). Les manipulations d’objets décrites dans le chapitre 5 rentrent dans ce
cadre. Les premiers babillages et tentatives d’échanges par le regard, le geste et la posture
témoignent de cette motivation fondamentale. Le comportement de la mère va encourager les
échanges. La manifestation des émotions, les cris, les sourires et les mouvements de l’enfant
vont autant provoquer la mère que lui répondre. Très tôt, et alors même que le langage n’est
pas encore construit, ces échanges vont prendre la forme d’un dialogue. Les premières
communications sont évidemment non verbales. Il serait préférable de les qualifier de non
lexicales car elles sont généralement accompagnées de vocalisations. Avant de pouvoir
produire des mots et des phrases, l’enfant comprend et communique de façon efficace avec
son environnement.
L’acquisition du langage va modifier les relations que tisse l’enfant avec son
environnement. Donnant la possibilité d’évoquer l’objet absent il va modifier les relations
avec les autres. Pourtant, durant ces premiers mois et même ces premières années, les
capacités de compréhension sont bien supérieures aux capacités d’expression. L’enfant
comprend avant de pouvoir s’exprimer. Soulignons, une fois de plus, que la compréhension
non verbale est très développée. Cette compréhension repose sur une sémantique non verbale
qui a été décrites dans le chapitre précédent. Cette sémantique va servir de matrice à
l’acquisition du langage. Les premiers mots vont être prononcés et utilisés dans le cadre des
interactions structurées par l’adulte. Ces mots vont servir à désigner des objets ou des
personnes. Ces premières désignations resteront longtemps marquées par le contexte. Ce
premier vocabulaire est essentiellement référentiel. L’origine du langage est référentielle.
Lentement le mot va acquérir son autonomie et va pouvoir être utilisé hors des contextes dans
lesquels il a été appris. C’est une évolution fondamentale. Gageons que cette origine et les
situations de référence marqueront longtemps le développement, l’utilisation du langage et la
structure des nouveaux signifiés.
Résumé
Les productions vocales du nourrisson sont limitées à des cris, des pleurs et quelques
sons. Les premières vocalisations apparaissent entre deux et cinq mois tandis que les jeux
vocaux se développeront entre quatre et cinq mois. Le babillage va devenir un jeu et entre six
et dix mois, l’enfant va produire et répéter des syllabes simples telles que /ba/, /ma/…
Jusqu’à trois ans, pour communiquer avec leur enfant, les parents vont créer un
langage nommé par les anglo-saxons « motheress ». Lorsqu’il s’adresse à l’enfant, l’adulte
répète les mots ou expressions, exagère les intonations, ralenti la prononciation, accentue les
consonnes ou voyelles importantes, utilise un langage « petit nègre », et favorise les formes
interrogatives, négatives et impératives.
Les premiers phonèmes ressemblant à des mots apparaissent entre 9 et 10 mois. Ils
sont émis dans des contextes particuliers. En moyenne les premiers mots sont acquis entre 11
et 14 mois. A la fin de la première année une trentaine de mots sont reconnus. Cinq à six mois
après la taille du vocabulaire atteint généralement 50 mots. Le vocabulaire des enfants dits
avancés qui était d’environ 30 mots à 13 mois passe à 70 mots à 14 mois, à 130 à 15 mois. A
partir de 18 à 24 mois le vocabulaire va rapidement s’accroître, la prononciation s’améliorer,
les mots vont être combinés.
Entre 1 an et 4 ans le langage de l’enfant se développe en suivant quatre phases :
Première phase, à partir de 8/10 mois, compréhension des premiers
mots.
Seconde phase, à partir de 11/13 mois, premières productions de mots.
Troisième phase, à partir de 18 mois accélération du développement du
vocabulaire.
Quatrième phase, à partir de 18/20 mois développement de la
grammaire.
Les premiers mots acquis sont des noms communs et des unités para-léxicales (ah, de
plus…) puis à partir de 20 mois les verbes et les mots grammaticaux vont être acquis au point
de devenir aussi nombreux que les autres mots.
Comme le remarque Vidgosky les mots de l’enfant désignent les mêmes objets que
ceux de l’adulte ce qui ne veut pas dire qu’ils possèdent les mêmes sens. Dans toutes les
situations de communication, l’enfant s’attache à développer la fonction référentielle du
langage. Il utilise le langage pour référer et pour évoquer les objets absents.
L’acquisition du langage ne se limite pas à l’apprentissage du vocabulaire. Vers 14/18
mois, l’enfant va coupler des mots pivots à d’autres termes familiers au revoir va être associé
à papa ou maman. A partir de trois ans, les premières phrases composées d’un sujet d’un
verbe et d’un complément vont être émises. Les mots vont aider à se situer dans le temps et
dans l’espace. L’acquisition du langage va modifier les capacités de l’enfant, lui donner de
nouveaux outils et de nouvelles compétences.
Parallèlement les zones du cerveau vont se spécialiser et l’on pourra identifier celles
qui sont responsables des traitements phonologiques, celles qui gèrent l’articulation ou celles
dans lesquelles les connaissances sont stockées. C’est à l’apport de ces découvertes à la
connaissance de la mémoire sémantique qu’est consacré le chapitre suivant.
Pour en savoir plus
BRAMAUD DU BOUCHERON G. (1981), La mémoire sémantique de l’enfant. Paris: PUF.
CARON J. (1989), Précis de psycholinguistique. P.U.F. :Paris.
CARTRON A. & WINYKAMEN F. (1995), Les relations sociales chez l’enfant : Genèse,
développement, fonctions. Armand Colin : Paris.
CYRULNIK B. (1983), Mémoire de singe et paroles d’homme. Hachette : Paris.
CYRULNIK B. (1995), La naissance du sens. Hachette : Paris.
LECUYER R. (1990), Bébés psychologues, bébés astronomes : l’intelligence de la premières
année. Bruxelles : Mardaga.
LECUYER R., STRERI A. & PECHEUX M.-G. (1996), Le développement cognitif du
nourrisson, tome 2. Nathan Université : Paris.
NOETLING G. (1982), Le développement cognitif et le mécanisme de l’équilibration.
Chocoutimi, Canada : Gaétan Morin.
PIAGET J. (1964), La Psychologie de l’intelligence. Armand Colin : Paris.
PIAGET J. (1964), La Formation du Symbole chez l’Enfant. Neuchatel : Delachaux et
Niestlé.
PIAGET J. & INHELDER B. (1959). Le genèse des structures logiques élémentaires,
Neuchâtel: Delachaux et Niestlé.
TOURRETTE C. & GUIDETTI M. (1994), Introduction à la psychologie du développement :
Du bébé à l’adolescent. Paris : Armand Colin.
TOURRETTE C. (2001), L’évaluation psychologique des très jeunes enfants. Dunod : Paris.
Mots clés : babillage, « motherless », acquisition du langage
Questions
1. Définissez babillage et « motheress ».
2. A partir de quel moment l’enfant possède-t-il des capacités d’articulation
identiques à celle de l’adulte ?
3. Comparez le pharynx de l’homme adulte à celui du primate.
4. Décrivez le développement du vocabulaire dans les quatre premières années de
la vie.
5. Comment l’acquisition du langage modifie l’activité cognitive de l’enfant ?
.
Chapitre 7. La neuropsychologie du sens22
Plusieurs techniques permettent de localiser les zones du cerveau activées lors du
traitement du langage. Les troubles de la parole et de la compréhension, l’enregistrement de
l’activité cérébrales par les techniques d’électrophysiologie et plus récemment l’imagerie
cérébrale sont utilisés pour localiser les structures cérébrales qui sont activées dans les
différentes activités cognitives.
L’utilisation des modèles issus des recherches expérimentales permet de comprendre
et d’interpréter les résultats obtenus en neurophysiologie.
La distinction entre mémoire à court terme et mémoire à long terme est-elle justifiée ?
Les propriétés et caractéristiques des mémoires qui ont été décrites dans le premier chapitre
sont elles validées par les recherches en neuropsychologie ?
Où sont stockées les formes verbales, où sont stockés les programmes moteurs qui
gouvernent la prononciation, où sont stockées les sens ? Les lieux de stockages varient-ils
selon les propriétés des mots : concret, abstrait ; mots désignant des animaux, des légumes ou
des objets ? Mémoire épisodique et mémoire sémantique sont-elles différentes, sont-elles
localisées dans des zones différentes ? Telles sont les questions qui sont abordées
La confrontation des données obtenues par les différentes méthodes de
neurophysiologie et les résultats obtenus en psychologie permet de répondre en partie à ces
différentes questions. Même si beaucoup reste à faire les résultats sont encourageants.
On trouvera dans les trois ouvrages cités en note une présentation du fonctionnement
du cerveau et de son rôle dans les différentes mémoires. L’objet de ce chapitre est d’analyser
les données de neuro-psychologie susceptibles de fournir des informations sur le contenu,
l’organisation et la structure de la mémoire sémantique. Les données sont regroupées sous
quatre thèmes :
- Données permettant de dissocier les traitements opérant à la réception et à la production
du langage. Il s’agira de montrer que le traitement phonologique qui permet d’identifier ce
qui est entendu est distinct des traitements liés à la production des mots.
- Données permettant de localiser les zones du cerveau où s’opèrent les traitements
sémantiques. Dans ce cadre, la distinction traitement phonologique et traitement
sémantique sera abordée. Le sens est-il stocké en mémoire sous une forme phonologique ?
- Données témoignant d’atteintes catégorielles. Le fait que certaines zones du cerveau
soient spécialisées dans le traitement d’une catégorie de mots est intéressant pour
comprendre l’organisation de la mémoire sémantique.
- Données permettant d’éclaircir les relations entre mémoire sémantique et mémoire
épisodique : est-il pertinent de distinguer ces deux mémoires ? Chacune d’entre elles estelle localisée dans un lieu différent ?
Avant d’analyser les données et observations produites par les neuro-psychologues il
est nécessaire de rappeler les principales méthodes utilisées pour localiser les zones du
cerveau impliquées dans différentes tâches.
1. Rappel sur les méthodes
Pour identifier les zones du cerveau impliquées dans des activités cognitives, trois
méthodes principales sont utilisées : a) autopsie des cerveaux ; b) méthodes
électrophysiologiques ; c) imagerie cérébrale.
22
Pour une présentation détaillée des données de neuropsychologie on se reportera aux trois ouvrages suivants :
La Mémoire, F. Eustache, B. Lechevalier et F. Viader, DeBoeck Université : Bruxelles, 1999.
Cerveau et Psychologie , O. Houdé, B. Mazoyer et N. Tzourio-Mazoyer, PUF : Paris, 2002.
Pourquoi notre mémoire est-elle si fragile ? F. Eustache, Editions Le Pommier : Paris 2003.
La recherche des zones du cerveau spécialisées dans le traitement du langage a été
entreprise dès le XIX° siècle par l’étude des cerveaux de patients présentant des aphasies. Par
aphasies sont désignées « les désorganisations du langage pouvant intéresser aussi bien son
pôle perceptif que son pôle réceptif, ses aspects parlés que ses aspects écrits, et en rapport
avec une atteinte cérébrale spécialisée dans les fonctions linguistiques » (Gil, 1996, p. 23-24).
Dans cette période les chercheurs devaient attendre le décès du patient pour autopsier son
cerveau et mettre en correspondance la description des perturbations du langage avec les
lésions observées au cours de l’autopsie.
Les observations de Wernicke et de Broca furent déterminantes dans le développement
de la neuropsychologie. L’autopsie des cerveaux fut pendant longtemps l’outil principal de la
recherche en neuropsychologie. Les difficultés de ces études ne doivent pas être négligées.
Les quatre principales sont que :
a)
Les lésions varient en taille et en profondeur, elles sont observées et
non provoquées par le chercheur et peuvent donc affecter des zones
du cerveau ayant des fonctions différentes. Ainsi, par exemple,
certaines perturbations de la production du langage peuvent, du fait
des lésions, être associées à des troubles n’ayant rien à voir avec
cette fonction. Ajoutons que de plus l’autopsie ne permet pas
toujours une localisation précise des lésions.
b)
Les observations du comportement des patients sont faites sur des
individus dont le cerveau est lésé c’est-à-dire sur un cerveau malade
dont le fonctionnement est perturbé.
c)
Du fait de la plasticité du système neuronal, des possibilités de
réorganisation tant cognitives que neuro-biologiques, les
observations comportementales peuvent être biaisées. Certains
patients masquant les déficits ou compensant par des stratégies
adéquates.
d)
Difficulté à cerner l’origine du trouble mnésique : difficultés
d’encodage (le patient n’arrive pas à coder le message écrit c'est-àdire à transformer le mot écrit en message nerveux), difficultés de
stockage en mémoire (le patient ne stocke pas en mémoire les
informations encodées) ou difficultés de récupération (le patient ne
peut pas retrouver où l’information a été enregistrée).
C’est pourquoi, les méthodes d’électrophysiologie23 et d’imagerie cérébrales ont
constitué un progrès considérable dans l’étude du fonctionnement du cerveau. Ces
enregistrements sont aussi bien réalisés sur des sujets sains qui sont soumis à différentes
tâches que sur des sujets atteints d’aphasie, d’Alzheimer ou de différentes pathologiques.
L’enregistrement des potentiels évoqués et plus précisément de l’onde P300 qui
représente une partie du potentiel évoqué cognitif, l’étude de la VCN (Variation Contingente
Négative) mais aussi les techniques d’imagerie cérébrale permettent d’enregistrer en continu
l’activité des différentes parties du cerveau.
L’enregistrement des potentiels évoqués cognitifs s’est avéré intéressant lors de
l’étude de certaines pathologies. Le protocole expérimental d’origine consistait à faire
entendre aux sujets un son grave et un son aigu. Les patients devaient compter (mentalement)
les sons aigus (par exemple). Le sujet est confortablement assis les yeux fermés. La
présentation du son sur lequel son attention du sujet a été attirée est à l’origine de potentiels
évoqués qui témoignent de son activité cognitive (cf. Figure N° 24). Les données indiquent
que la latence de ce potentiel varie en fonction de paramètres liés à la situation, à la
23
On trouvera un exposé des techniques électrophysiologiques et d’imagerie cérébrale dans l’ouvrage intitulé
« Les méthodes de recherche en psychologie » Jean Pierre Rossi et coll., 1999, Dunod : Paris.
complexité de la tâche et aux caractéristiques des individus (Rossi, Gil et QuerriouxCoulombier, 1997). Pourtant, les conditions de réalisation de ces enregistrements les rendent
peu utilisables dans les situations où le sujet doit réaliser des tâches complexes et longues. En
revanche, le développement de l’imagerie cérébrale fonctionnelle a constitué une réelle
révolution car elle a permis d’analyser l’activité du cerveau lors de tâches variées.
Figure N° 24. Exemple de Potentiel Evoqué Cognitif (PEC). Sur la courbe du haut
sont représentés les potentiels liés à la détection du son auquel les sujets devaient être
attentifs. On observe une onde P 300 qui correspond au Potentiel Evoqué Cognitif (PEC) ; sur
la courbe du bas sont représentés les potentiels liés à la situation où les sons présentés ne sont
pas pertinents.
L’imagerie qui va être utilisée dans la recherche en psychologie et en
neuropsychologie a pour but de visualiser l’activité du cerveau. Il s’agit donc de mettre au
point des systèmes permettant d’enregistrer l’activité du cerveau. L’augmentation de l’activité
se traduit par des variations de métabolisme : augmentation de la consommation en oxygène
ou du débit sanguin. Dans les années soixante, des chercheurs américains (l’équipe de
Sokoloff) enregistrèrent le débit cérébral d’animaux. Leur technique consistait à injecter un
marqueur radioactif puis à suivre les endroits où ce marqueur ce concentrait. Quelques années
plus tard, une équipe de chercheurs danois (Ingvar, Lassen et Rolland) utilisa un gaz
radioactif (le Xénon 33) qui pouvait être suivi à la trace à partir de capteurs extérieurs. Les
progrès des techniques ont permis de mettre au point la Tomographie par Emission de
Positons (TEP) qui fut à l’origine de nouvelles cartographies cérébrales. Cette technique fur
remplacée à partir des années 1990 par l’imagerie par résonance magnétique (IRM) qui permit
d’analyser l’activité cérébrale sans injection de substances radioactives.
La démarche du neuropsychologue qui utilise l’IRM consiste à analyser l’activité du
cerveau dans une tâche donnée et souvent à comparer l’activité du cerveau au cours de deux
tâches différentes. Les recherches de Price (2001) dont les résultats sont présentés dans les
pages suivantes illustrent cette approche. L’auteur compare l’activité du cerveau lors du
traitement de mots ou de non-mots présentés visuellement ou auditivement. En plus de savoir
quelles zones du cortex sont spécialisées dans le traitement des mots présentés visuellement
par rapport à celles qui le sont par le traitement des mots présentés auditivement, ces
enregistrements permettent de préciser si le traitement sémantique de ces deux catégories de
stimulus (visuels et auditifs) se fait dans la même zone et donc si la mémoire sémantique est
unique et indépendante des modes d’entrées (visuels ou auditifs). De plus, en soustrayant
l’activité enregistrée lors du traitement des non-mots de l’activité enregistrée lors du
traitement du mot Price (2001) peut en déduire les parties du cerveaux qui sont spécialisées
dans le traitement sémantique. Cette dernière technique consiste donc à soustraire l’activité
enregistrée dans une situation A de l’activité enregistrée dans une situation B.
Lors du recueil des données aussi bien qu’au moment de leurs analyses, les difficultés
rencontrées sont liées essentiellement : a) à la stabilité des phénomènes ; b) à leurs
interprétations ; c) à la technique de soustraction. Il est en effet intéressant d’observer que les
messages évoluent avec le temps. Squire (1992) établit par exemple que les informations qui
sont dans un premier temps stockées dans l’hippocampe, migrent et sont stockées
définitivement dans le néo-cortex. Une tâche neuve qui est mise en œuvre pour la première
fois va nécessiter l’activité de structures cérébrales qui au fur et mesure de l’apprentissage
vont varier en localisation.
La seconde difficulté est liée au problème de la dissociation entre différentes structures
mnésiques. Comment dissocier mémoire de travail, mémoire sémantique et mémoire
épisodique. Compte tenu des liens qui relient ces différentes structures il est souvent aléatoire
de les dissocier. Sans oublier que l’organisation de ces mémoires fait référence à des modèles
hypothétiques non encore totalement validés. Même lorsqu’il est possible de décrire un
modèle des processus mis en œuvre pour effectuer une tâche il est difficile d’isoler les
processus cognitifs pour préciser lequel nécessite l’activation de telle zone du cerveau. Pour
prendre un exemple, la lecture d’une phrase implique des processus de décryptage,
d’activation du sens, de traitement de la syntaxe, d’activation de connaissances, de
construction d’un modèle de situation suivis souvent par l’élaboration et l’effectuation d’une
réponse. Cette description est elle-même sujette à discussion. Différents modèles du
traitement de la phrase sont discutés. De plus, pour saisir, dans l’activité du cerveau, ce qui
relève d’un de ces processus il faut procéder par comparaisons. Pour localiser les zones
actives durant le traitement du sens on est amené à comparer l’activité du cerveau lors de la
lecture de syllabes non significatives à celle que l’on peut enregistrer lors de la lecture de
mots. Cette comparaison repose sur le postulat que les zones du cerveau impliquées dans le
décryptage des mots et des non-mots sont identiques. Or, il est établi que les mots fréquents
sont identifiés à partir d’informations globales alors que les non-mots sont découpés en unités
syllabiques (Rossi, 1984).
Comment, au cours de la lecture, différencier ce qui dépend de la mémoire de travail,
de ce qui dépend de la mémoire sémantique ou de la mémoire épisodique ? Toutes ces
questions sont au cœur des données publiées à ce jour. Elles sont sujettes à discussion si ce
n’est à polémiques. C’est dire que les interprétations présentées dans la suite du texte doivent
être considérés avec circonspection.
Les techniques consistant à soustraire d’une activité complexe une autre activité n’est
pas sans risques. Les réserves présentées précédemment le montre. De plus, la pertinence
physiologique de ces soustractions est discutable.
En résumé, les neuro-psychologues disposent de différentes méthodes :
- Observation des modifications des comportements induites par des lésions. Chez l’homme
ces lésions sont dues à des accidents cérébraux mais, dans ce cas, le chercheur ne
détermine pas le lieu de la lésion, il l’observe, la localise, la circonscrit mais ne la
provoque pas. Chez l’animal il est possible de procéder à des lésions dont la localisation
est précise. Dans tous les cas les lésions sont associées à des troubles du comportement.
- Enregistrements des potentiels d’action d’un neurone ou d’un groupe de neurones. Ces
enregistrements sont faits sur les animaux.
- Enregistrement de l’activité cérébrale : ElectroEncéphaloGramme (EEG), imagerie
cérébrale (de nos jours essentiellement IRM). Ces enregistrements peuvent être faits sur
l’homme.
- Modifications des comportements induites par des stimulations électriques du cerveau.
Ces stimulations sont faites sur l’animal.
- Modifications des comportements induites par l’injection de drogues. Dans une certaine
mesure, certaines drogues pourront être utilisées aussi bien chez l’homme que chez
l’animal.
Si les études de l’animal peuvent nous renseigner sur les problèmes liés à l’apprentissage
et à la mémoire elles ne nous apportent aucune information sur le langage et le sens associé au
langage. Pour l’étude du sens les recherches sur l’homme sont donc privilégiées.
2. Zones du cortex responsables de la réception et de la production du langage
Pour faciliter les localisations citées dans le texte une première représentation du
cerveau gauche est proposée sur la figure N° 25. Sur cette présentation sont notées les
numérotations dites de Broadmann. Pour faciliter le repérage des zones du cortex évoquées
dans le texte, les quatre lobes ont été schématisés sur la figure 26. Le lobe frontal est divisé en
quatre zones : F1, F2, F3 et frontale ascendante. Il est séparé du lobe pariétal par la scissure de
Rolando. Trois zones sont décrites : la pariétale ascendante, la P1 et la P2. Ce lobe est séparé
du lobe occipital par la scissure perpendiculaire externe. La base inférieure de cette scissure
sépare le lobe occipital du lobe temporal.
Avec l’observation des aphasies et de l’ensemble des alexies, les neurologues se sont
intéressés à la localisation des zones du cerveau responsables de la compréhension et de la
production du langage. Les premières études datent du XIX° siècle.
Les aphasies de Broca et de Wernicke
L’autopsie des cerveaux permit à Broca de montrer que l’expression du langage
impliquait l’intégrité du pied de la troisième circonvolution frontale du cerveau gauche (aire
de Broca) en relation avec l’insula et les noyaux gris centraux (cf. figure N°27). L’aphasie de
Broca qui se caractérise par un ralentissement de la production du langage qui devient
malaisée est liée à des atteintes du gyrus frontal inférieur gauche, des aires frontales
adjacentes, de l’insula, de la substance blanche sous-jacente et des ganglions de la base.
Treize ans après Broca, Wernicke décrit un sujet présentant un langage fluide sans
troubles de l’articulation mais vide de sens avec perturbation de la compréhension du langage.
Ces troubles sont associés à des lésions du gyrus temporal supérieur gauche (cf. figure N°27).
Wernicke a montré que le codage des mots et des phrases se faisait dans la partie
postérieure de la face externe de T1 et de T2 en dessous des aires auditives primaires (cf.
figure N° 27). Ces deux types d’aphasies ne recouvrent pas l’ensemble des perturbations du
langage observé par les neurologues.
Gil (1996, p. 32 et 33) distingue quatre catégories de troubles :
- la surdité verbale pure liée à un déficit du traitement perceptif de la parole verbale puisque
le patient peut parler, lire et écrire;
- l’aphasie de Wernicke qui comporte soit un déficit du décodage verbale soit des
altérations de la compréhension, chacun de ces symptômes pouvant être prédominant ;
- les déficits de la compréhension de phrases liés soit à la difficulté à comprendre certains
mots abstraits, soit à la perte des connaissances syntaxiques ;
- les déficits catégoriels, certaines catégories verbales (couleurs, objets manufacturés,
verbes d’actions…) faisant défaut.
Depuis Wernicke et Broca, les neurologues ont distingué les zones responsables des
traitements de la réception du langage de celles qui ont en charge la production. Cette
distinction a pu être faite alors même que la difficulté à comprendre les consignes verbales
affecte bien évidemment les réponses des patients. Ainsi, les perturbations du traitement du
langage entendu affectent automatiquement la compréhension des consignes. Il n’en reste pas
moins que le pôle réceptif lié au codage du langage entendu c’est à dire essentiellement au
traitement phonologique permettant la reconnaissance des mots est lié à l’intégrité de la
première circonvolution temporale gauche (T1) dite aire de Wernicke. Cette circonvolution
est voisine des aires auditives primaires et secondaires (41 et 42). Les lésions de l’aire de
Wernicke se traduisent pas des difficultés de compréhension du langage oral alors que d’une
part le système auditif est en parfait état et que la production de ce langage ne pose pas de
problèmes. Ainsi, l’aire de Wernike est directement concernée par le traitement phonologique
du langage.
Sur le versant production, les aires 44 et 45 sont le lieu où la programmation du langage
est effectuée. L’exécution des programmes qui gèrent l’articulation des mots est sous la
dépendance d’une zone allant de la partie basse de la frontale ascendante au faisceau
pyramidal. En revanche, le centre de l’écriture se situe au pied de la F2.
L’ensemble des zones qui viennent d’être décrites concerne essentiellement les
traitements de la réception ou de la production. Cette opposition entre réception et production
a été modérée par les données obtenues au moyen de l’imagerie cérébrale qui ont permis de
mettre en évidence la complexité des systèmes de relations entre les différentes entités et de
préciser leurs rôles respectifs.
Figure N° 25. Face externe du cerveau gauche, localisation des lobes et des principales aires
intéressant le traitement du langage.
Figure N° 26. Face externe du cerveau : localisation des lobes. En vert le lobe frontal (F1, F2,
F3 et frontale ascendante), en jaune le lobe pariétal (P1, P2 et la pariétale ascendante), en bleu
le lobe occipital (O1, O2, O3), en rouge le lobe temporal (T1, T2, T3).
Figure N° 27. Aires de Broadmann et localisation des gyrus cités dans le texte.
3. Traitement sémantique et traitement phonologique
Le développement des différentes techniques d’imagerie cérébrale a permis
d’enregistrer l’activité du cerveau au cours d’activités cognitives plus ou moins complexes24.
Enregistrant l’activité de cerveaux sains, il est possible d’identifier les zones actives, de les
mettre en relation avec les tâches effectuées, d’analyser les évolutions temporelles et de
montrer les modifications dues aux apprentissages. La mise en correspondance des données
obtenues par les différentes techniques d’imagerie cérébrale, d’électrophysiologie ainsi que
les observations cliniques permet de progresser de façon significative dans la connaissance du
cerveau.
Pour l’étude de la mémoire sémantique, l’identification des zones du cerveau
spécialisées dans le traitement du sens est évidemment intéressante. Sachant que nombre de
chercheurs se sont posés la question du mode de stockage du sens à savoir si le sens est stocké
sous une forme verbale, la localisation des zones du cerveau responsables du traitement
phonologique différentes de celles spécialisées dans le traitement du sens est évidemment
cruciale.
Les études de TEP ou d’IRM suggèrent que les parties du Cortex Préfrontal Inférieur
Gauche correspondant aux aires de Broadmann 47 et 45 est actif durant le traitement
sémantique des mots tels que les décisions sémantiques (le sujet doit dire si la suite de lettres
qui lui sont présentées forment un mot, réponse en « oui » c’est un mot ou « non » ce n’est
pas un mot) et la production de mots par association (le sujet doit produire un mot associé à
celui qui lui est présenté ; Poldrack & coll., 1999). Pourtant, les auteurs remarquent que
l’activation varie plus en fonction de la complexité de la tâche que du traitement sémantique.
Cette partie du cortex (Cortex Préfrontal Inférieur Gauche) est aussi active lors de la
catégorisation en « être vivant »ou « non être vivant » de mots ou d’images (Wagner, 1997).
Mais le Cortex Préfrontal Inférieur Gauche est aussi impliqué dans le jugement de phonèmes
et la lecture de non-mots. Pour distinguer ce qui correspond aux différents traitements
(phonologiques et sémantiques) Poldrack et coll. (1999) enregistrent l’activité du cortex
préfrontal au cours de trois tâches : 1) dire si le mot présenté visuellement désigne une entité
abstraite ou concrète ; 2) dire si le stimulus est écrit en majuscules ou en minuscules ; 3)
compter le nombre de syllabes des mots qui sont présentés. La première tâche est une tâche de
catégorisation que l’on peut qualifier de sémantique puisque la réponse oblige le sujet à
recherche si le trait abstrait ou concret peut être attaché au lexème lu. La seconde tâche est
purement perceptive et la troisième est phonologique. Les résultats indiquent que le gyrus
frontal inférieur gauche est actif durant la tâche sémantique. La zone ventrale antérieure du
gyrus est plus active durant le traitement sémantique que durant le traitement phonologique.
La zone postérieure dorsale est active à la fois lors du traitement sémantique et pendant le
traitement phonologique. Dans les tâches utilisées, il est difficile de dissocier ce qui a trait au
traitement sémantique de ce qui a trait au traitement du signifiant. En effet il ne faut pas
oublier que :
a)
Pour décider si un mot désigne un être vivant il faut le lire. Donc la première
tâche qualifiée de sémantique implique la lecture c'est-à-dire le traitement du
signifiant.
b)
Les tâches deux et trois sont effectivement l’une perceptive l’autre
phonologique mais dans la mesure où la présentation du mot déclenche
automatiquement sa lecture (voir l’effet Stroop présenté dans le chapitre deux)
et tout aussi automatiquement l’activation du sens associé au mot, il est clair
que dans ces deux tâches une activation automatique du sens se produit.
24
Un exposé complet des données actuelles sur le fonctionnement du cerveau sera trouvé dans l’ouvrage de
Houdé, Mazoyer et Mazoyer « Cerveau et Psychologie », 2002, PUF : Paris.
Ces raisons amènent Poldrack et col. (1999) à comparer ces données aux observations
faites sur des sujets ayant des lésions cérébrales. Ils constatent que si les patients ayant des
lésions du cortex préfrontal inférieur gauche manifestent des déficits dans certaines tâches
sémantiques, ils ne montrent pas de déficits sévères de connaissances telles qu’elles peuvent
être observées dans le cas de lésions du lobe temporal. Pour mieux cerner les zones actives
durant les différents traitements Poldrack et coll. (1999) comparent l’activité cérébrale des
sujets durant six catégories de tâches :
- Les tâches de production sémantique : produire un verbe par association. Le sujet doit
produire le plus rapidement possible le mot qu’il associe au mot qui lui est présenté.
- Les tâches de décision sémantique : décider si le mot présenté est abstrait ou concret.
C’est une tâche de catégorisation qui oblige le sujet à rechercher si le trait abstrait ou
concret peut être affecté au mot lu.
- Les tâches lexicales. Deux tâches sont proposées, une tâche de décision lexicale, le sujet
doit dire si la suite de lettre qui lui est présenté forme un mot ; une tâche de complétion, le
sujet doit produire un mot complétant la syllabe qui lui est présentée. Exemple : on
présente la syllabe « chap… » la réponse de complétion peut être « chapeau »,
« chapitre »...
- Les tâches phonologiques : compter le nombre de syllabes contenues dans un non-mot25 et
produire des phonèmes.
- La lecture à haute voix : répétition de mots à haute voix.
- La présentation visuelle de mots qui ne doivent pas être dits à haute voix.
Après l’enregistrement de l’activité corticale dans les différentes conditions Poldrack et
coll. (1999) procèdent à des soustractions. Ainsi, pour isoler le traitement sémantique des
traitements phonologiques ils comparent les enregistrements obtenus dans les tâches sémantiques
à ceux enregistrés dans les tâches phonologiques. Puis ils procèdent à des soustractions enlevant
des activations obtenues dans les tâches sémantiques les activations obtenues dans les tâches
phonologiques. Les résultats qu’ils obtiennent sont résumés sur la figure 28. Les résultats des
soustractions permettant (selon les auteurs) d’isoler les traitements sémantiques sont représentés
en vert sur cette figure.
Les données indiquent :
a) que les traitements sémantiques activent une région située dans le gyrus frontal
inférieur gauche ;
b) que les gyrus antérieur et ventral sont plus actifs durant le traitement
sémantique que durant le traitement phonologique ;
c) que la région plus dorsale inférieure (prés du sulcus inférieur frontal) est active
pour les traitements à la fois sémantiques et phonologiques.
Les auteurs insistent sur le fait que les traitements phonologiques sont engagés lors de la
plupart des traitements sémantiques.
Analysant les résultats de Poldrack et al. (1999) et les comparant à leurs propres données
Etard et Tzourio-Mazoyer (2002, p. 454) estiment que l’aire de Broca est le lieu où se
développent des traitements liés à la mémoire de travail « avec deux sous-unités fonctionnelles
l’une postérieure, traitant les informations de type phonologique, l’autre antérieure traitant des
informations de type sémantique. Ces structures ont un rôle de sélection, de contrôle exécutif
pour le langage, ce qui correspond bien au rôle attribué au cortex préfrontal en général. ». Cette
description renvoie au modèle de la mémoire de travail de Baddeley (cf. chapitre 1) qui
comporte un système de contrôle ayant des fonctions de sélection des stimuli, des systèmes de
traitements et des zones de la mémoire qui doivent être activées et deux systèmes esclaves le
25
Par non-mot on entend une suite de lettres non significative.
calepin visuo-spatial et la boucle articulatoire. Rappelons que la boucle articulatoire a pour but le
traitement du matériel verbal. Elle comporte deux composantes :
- « une unité de stockage phonologique » qui aura pour fonction et pour but de
« traiter les informations provenant du langage » (Baddeley, 1993).
L’information y est conservée durant un temps bref (1,5 à 2 secondes) ;
- « Un contrôle articulatoire » qui code phonologiquement les informations
graphiques et gère le langage intérieur utile aussi bien à la répétition subvocale
qu’aux raisonnements complexes.
Selon Poldrack et col. (1999), le cortex préfrontal inférieur gauche serait impliqué
dans les activités de la mémoire de travail gérant :
- l’accès, aux informations stockées en mémoire à long terme.
- le maintien et la manipulation de l’information. Maintien de ces informations en
activité afin de pouvoir les traiter et les utiliser dans la tâche qui est réalisée.
- la sélection à la fois des informations qui doivent être traitées et des procédures qui
doivent être engagées lors des traitements sémantiques.
En revanche, le système exécutif serait géré par des zones cérébrales situées dans
l’hémisphère droit.
Figure N° 28. Activité du cortex frontal gauche lors de différentes tâches. En rouge, la
zone active durant les traitements qui sont à la fois sémantiques, phonologiques et lexicaux.
En vert celles qui sont actives essentiellement durant les traitements sémantiques. Données et
figures de Poldrack, Wagner, Prull, Desmond, Glover & Gabrieli, 1999, NeuroImage, 10 1535, fig.4.
Des lésions du cortex préfrontal entraînent des difficultés à dénommer les objets et à
retrouver les mots à partir d’indices tels que les premières lettres, la catégorie… (Martin &
Linda, 2001). La partie postérieure du gyrus moyen temporal gauche26 est impliquée dans la
dénomination des actions habituellement réalisées avec un objet particulier (enfoncer un clou,
écrire avec un stylo…). Le gyrus angulaire n’est pas activé lors de la lecture rapide de mots
isolés mais il l’est lorsque cette lecture est lente ou lorsque ces mots sont insérés dans des
phrases. La présentation de mots et de dessins, l’audition de listes de noms d’objets et de mots
abstraits activent l’aire 20 de Broadmann (Price, 2000). Les tâches d’association mettent en jeu
le cortex frontal inféro-postérieur.
Il faut souligner que le traitement du sens met en jeu des zones non spécifiques qui gèrent
par exemple la répartition des ressources attentionnelles. Dans nombre de tâches cognitives,
l’activité du cortex pré-frontal gauche décroît en fonction de la familiarité (Raichle, 1994) ;
généralement plus une tâche est familière, plus elle est automatisée, moins elle nécessite
d’attention. Des atrophies du lobe frontal entraînent des déficits de l’attention et des fonctions
exécutives. Ces atrophies peuvent donc affecter l’activité cognitive des patients. En revanche,
dans les démences d’Alzheimer, des altérations du lobe temporal entraînent des déficits de la
mémoire sémantique mais préservent l’attention et les fonctions exécutives (Perry, 2000).
26
Les localisations peuvent être effectuées sur la figure N° 26
Figure 29 : Modèle général de traitement des mots écrits et des mots entendus
Mots Lus
Mots entendus
Traitement
phonologique
Traitement
graphémique
Traitement sémantique
Mémoire sémantique
Activation des schémas articulatoires
Articulation
La compréhension des données obtenues en neuro-psychologie est facilitée si l’on se
place dans le cadre d’un modèle de fonctionnement du traitement du langage. Les discussions sur
ces modèles ne sont évidemment pas closes. Sur la figure 29 est représenté un cadre très général
dans lequel sont distingués les traitements qui sont opérés selon que le mot est présenté
auditivement ou visuellement. Dans le cas d’une présentation auditive, les sons émis activent le
registre phonologique dans lequel les images sonores sont stockées. Le signifiant est alors
reconnu, il pourra être prononcé directement. Lorsque le stimulus est un mot, son audition va
activer les sens qui lui sont associés. Lorsque ce n’est pas un mot il sera prononcé après
activation des schémas articulatoires des syllabes. Pour certains auteurs (Seidenberg et
McClelland, 1989), l’analyse phonologique est directement reliée aux schémas articulatoires.
Dans le cas d’un mot présenté visuellement, le stimulus active le répertoire graphémique.
Par répertoire graphémique on entend le stock des images permettant de reconnaître les lettres,
les syllabes et les mots. Dans certaines conditions, cette lecture permet l’activation des sens
associés au mot lu, dans d’autres conditions, l’activation du sens nécessite un codage
phonologique « interne », ce traitement intermédiaire pouvant seul donner accès au sens. La
prononciation du stimulus présenté peut évidemment (dans le cas des non-mots par exemple) être
directement activée après sa lecture.
Dans la plupart des modèles le réseau sémantique est identique pour les mots lus et pour
les mots entendus. S’inspirant d’un modèle proche de celui qui vient d’être décrit Price (2000),
réalisant des enregistrements de l’activité cérébrale, montre que si le traitement des signifiants
des mots écrits diffère de celui des mots présentés auditivement, les traitements sémantiques
activent des zones spécifiques et des zones communes. Ce modèle est illustré par la figure 30 où
sont regroupées les différentes zones d’activation lors de la lecture de mots présentés
auditivement ou visuellement. Le traitement sémantique consistait à dire si le mot désignait un
être vivant.
Selon Price (2001), les tâches sémantiques impliquent nombre de régions extra
sylviennes pariétales et temporales incluant le gyrus angulaire gauche. Le gyrus angulaire ne
serait pas actif lors de la lecture de mots isolés mais serait impliqué durant la lecture de phrases.
Les lobes pariétaux gauches inférieur et postérieur incluant le gyrus angulaire seraient eux aussi
impliqués dans le traitement sémantique. Ce traitement des mots présentés visuellement ou
auditivement produit des activations bilatérales des régions temporo-pariétale postérieures et du
lobe temporal inférieur antérieur .
Price (2001) résume l’ensemble des données en affirmant que le traitement sémantique
des mots est localisé dans le cortex temporo pariétal postérieur gauche (incluant le gyrus
angulaire) et différentes régions du cortex temporal inférieur et central. Il ajoute que plusieurs
régions du lobe frontal seraient actives dans le traitement spécifique de certaines catégories de
mots. Les données et indications de Price sont résumées sur la figure 30. Sur la figure 30a sont
notées les zones spécifiquement activées (selon Price) par le traitement de mots présentés
visuellement et auditivement. En couleurs foncées sont indiquées les zones responsables des
traitements sémantiques effectués sur chacune de ces deux catégories de stimuli. Sur la figure
30b sont indiquées les zones activées par les traitements sémantiques des deux types de mots.
Ces représentations illustrent le fait que les traitements sémantiques des deux catégories de
stimuli concernent des zones communes et des zones spécifiques.
Comme le remarquait Béatrice Desgranges en 1996 (in La Mémoire, F. Eustache, B.
Lechevalier et F. Viader, p.160-161) « Différentes régions participent probablement au
traitement sémantique… Un des principaux sujets de débat concerne le rôle du cortex préfrontal
gauche dans la mémoire sémantique… La conception du rôle du cortex préfrontal varie selon les
auteurs : la proposition initiale de l’équipe de Peterson (« left-frontal sémantique27) tend à laisser
27
Note de l’auteur. Selon l’équipe Peterson, le cortex préfrontal gauche est spécialisé dans le traitement
sémantique.
place à une conception plus dynamique dans laquelle le cortex préfrontal serait principalement
impliqué dans les stratégies de recherche de l’information sémantique. Pour certains, le cortex
préfrontal pourrait même ne jouer qu’un rôle non spécifique d’accès à des représentations
sémantiques qui seraient ailleurs dans le cerveau (Chertkow et Bub, 1994). Selon ces auteurs, le
cortex préfrontal postérieur serait à cet égard un meilleur candidat que le cortex préfrontal. Pour
d’autres, les représentations sémantiques pourraient être si distribuées qu’il serait vain de
chercher à les localiser (Howard et all., 1992) ».
Figure N° 30 : 30a zones actives lors du traitement de stimuli présentés visuellement ou
auditivement (en clair traitements des signifiants, en foncé traitement sémantique) ; 30b zones
actives lors du traitement sémantique pour les deux catégories de stimuli : mots présentés
visuellement et mots présentés auditivement. Ces figures sont réalisées à partir des données de
Price (2001).
4. Les atteintes catégorielles et leurs localisations
Les observations faites sur des sujets atteints d’aphasies ont incité à faire l’hypothèse que
dans le cerveau, les lieux de stockage et de traitement varient en fonction de la catégorie à
laquelle appartient le lexème. Les mots concrets pourraient être stockés et traités dans des lieux
différents que les mots abstraits, les verbes de mouvement seraient opposés aux autres verbes…
Ces études portent aussi bien sur des sujets sains que sur des aphasiques ou des patients atteints
de la maladie d’Alzheimer. Si ces données étaient confirmées elles témoigneraient en faveur
d’une organisation de la mémoire sémantique qui serait basée sur la nature des traits associés aux
différents lexèmes : aux mots concrets28 étant associés préférentiellement des traits perceptifs
tandis qu’aux mots abstraits seraient plutôt associés des « idées » et des notions.
Les observations effectuées sur les aphasiques indiquent que les mots fréquents résistent
le mieux, c’est-à-dire que les pertes affectent de façon préférentielle les mots rares. Les pertes
des noms de couleurs ont été observées par Hécaen et Angelergues (1963) chez des patients
présentant des atteintes du lobe occipital gauche. D’autres observations (Pick, 1992) rapportent
le cas de sujets incapables de désigner les parties du corps alors qu’ils peuvent désigner leurs
vêtements. Damasio (2001) rapporte que des sujets ayant des lésions du lobe temporal gauche
sont incapables de dénommer les parties du visage. Tyrell, Warrington, Frackowiak et Rossor
(1990) observent des difficultés de la compréhension des noms d’animaux chez des malades
présentant « une petite anomalie métabolique dans le lobe temporal gauche, atteignant son
maximum dans le gyrus temporal » (McCarty & Warrington, 1994, p.162).
L’opposition entre êtres animés et objets manufacturés a été l’objet de nombreuses
études. Les êtres vivants et les parties du corps semblent stockés dans les partie latérales du
gyrus fusiforme. Tandis que les objets manufacturés le seraient dans la partie médiane du même
gyrus fusiforme. Comme le notent Martin et Chao (2001), le cortex temporal occipital ventral
n’est pas une mosaïque de catégories de mots mais se présente plutôt comme un paysage
vallonné comportant des bosses et des creux correspondant à des pics d’activités ou des
dépressions.
Faisant réaliser une tâche de dénomination d’images, Damasio (1996) indique que (cf.
fig.31) :
- le lobe temporal serait impliqué dans la dénomination de photographies de personnes
célèbres ;
- les parties intermédiaires et inférieures du lobe temporal le seraient par la
dénomination des animaux ;
- alors que les parties postérieures et inférieures le seraient dans le traitement des outils.
Comme on peut le constater à la lecture de la figure 31 les lésions situées dans la partie
postérieure du lobe (verte) affectent peu la dénomination des personnalités, alors que les lésions
situées sur la partie antérieure (rouge) perturbent cette dénomination. Pour la dénomination des
animaux, les performances les plus mauvaises sont associées à des lésions de la partie
intermédiaire (jaune) tandis que pour les outils les scores les plus faibles sont associés à des
lésions postérieures (verte).
La perte des verbes désignant des actions et des mots dénotant des relations spatiales
serait imputable (Damasio, 2001) à des lésions de l’opercule frontal gauche et du cortex
associatif pariétal gauche mais aussi des aires pré-motrices gauche, du cortex occipital et de la
substance blanche paraventriculaire située sous les régions temporales.
28
On appelle noms concrets une catégorie de noms qui réfèrent à des objets du monde physique (ou de ce qui
considéré comme tel), par opposition aux noms abstraits, qui dénotent des entités appartenant à l’ensemble
idéologique : ainsi, les noms rocher, chaise, Jean, bière, dieu, etc., sont des noms concrets, ils ont le trait [+
concret], alors que courage, pensée, jalousie, etc., sont des noms non concrets ou abstraits » (Dictionnaire de
Linguistique et des sciences du langage, 1999).
En 1997, Bushell et Martin observent, chez des malades atteints de la maladie
d’Alzheimer, des dissociations entre mots concrets et verbes désignant des mouvements. Ces
observations sont particulièrement intéressantes car elles indiquent que cette divergence est
imputable à la nature des représentations sémantiques qui dans le cas des mots désignant des
objets concrets impliquent des attributs physiques et fonctionnels multiples tandis que dans le cas
des verbes ne concernent que des attributs du mouvement. La représentation des mots concrets
serait plus distribuée dans le cerveau que celle des verbes du mouvement. Cette redondance
expliquerait la résistance des noms concrets.
La dénomination d’une action de mouvement active la région postérieure du gyrus
temporal médian gauche proche de la zone du cerveau spécialisée dans la perception du
mouvement, de même la désignation d’une couleur est associée à l’activité des lobes ventraux
temporaux proches du cortex spécialisé dans la perception des couleurs.
Aussi intéressantes qu’elles soient, les données de Damasio et de Bushell et Martin ne
peuvent être utilisées pour comprendre l’organisation de la mémoire sémantique qu’avec
précaution. En effet, la tâche que doivent effectuer les patients consiste à dénommer des images.
Ce n’est donc pas, à proprement parler, une tâche sémantique. Le déficit de cette dénomination
peut être lié à la rupture du lien entre les représentations stockées en mémoire des personnages et
objets et le mot qui permet de les dénommer. Il serait intéressant d’étudier chez ces patients la
capacité à catégoriser qui elle serait une tâche sémantique. Il faudrait donc demander aux sujets
d’énoncer la catégorie à laquelle appartient l’image présentée : acteurs, chanteurs, outils,
insectes…
Figure N°31. Localisation des déficits dans la dénomination des photos de personnalités,
d’animaux, et d’outils selon Damasio, Grabowski, Tranel, Hichwa & Damasio, Nature, 1996,
Vol 380, p.501.
Pourcentages de dénominations correctes
Photos
Zone Rouge
Zone Jaune
Zone verte
Personnalités
59.8
75.5
91.7
Animaux
93.3
80.1
88.3
Outils
96
84.5
78.5
5. L’opposition mémoire épisodique vs mémoire sémantique
Il a été montré précédemment que nombre d’observations et de données obtenues au
moyen des techniques d’imagerie cérébrale pouvaient être interprétées dans le cadre du modèle
de la mémoire de travail proposé par Baddeley. Etard et Tzourio-Mazoyer (2002, p. 454)
proposaient de localiser dans l’aire de Broca les traitements liés à la mémoire de travail « avec
deux sous-unités fonctionnelles l’une postérieure, traitant les informations de type phonologique,
l’autre antérieure traitant des informations de type sémantique ». L’imagerie fonctionnelle
permet-elle de différencier mémoire épisodique et mémoire sémantique ?
Depuis Tulving (1984) il est habituel d’opposer mémoire épisodique à mémoire
sémantique. La mémoire épisodique stocke nos expériences et nos apprentissages de tous les
jours. La mémoire sémantique est généralement considérée comme un dictionnaire contenant les
significations des lexèmes et nos connaissance encyclopédiques. Si l’on considère que les
éléments de signification sont construits avant l’acquisition du langage on doit admettre que cette
mémoire contient aussi des traits sémantiques non verbaux et même des situations fréquentes.
Il est généralement admis que le fonctionnement de la mémoire épisodique dépend du
cortex préfrontal. « Cependant, cette structure intervient aussi dans les tâches de mémoire de
travail et de mémoire sémantique. Le cortex préfrontal pourrait être impliqué dès qu’une tâche
est nouvelle et pas entièrement spécifiée par le contexte, son rôle diminuant quand la tâche
devient automatique » (Eustache, Lechevallier et Viader, p. 159).
Plusieurs recherches ont tenté de préciser si les structures impliquées dans la mémoire
épisodique sont différentes de celles qui gèrent la mémoire sémantique. De nombreuses données
(Gabrielli, Poldrack et Desmond, 1998, Wagner, 1999) suggèrent que les régions pré-frontales
inférieures et antérieures sont impliquées dans le traitement du sens. Une recherche de Ray,
Kreiter, Zhu et Russo (1998) présente l’intérêt d’enregistrer l’activité cérébrale de sujets sains
dans trois conditions :
a) rappel d’une liste de 80 mots appris précédemment ;
b) reconnaissance d’une autre liste de 80 mots ;
c) enfin tâche d’association classique dans laquelle le sujet doit dire le mot qui
lui vient à l’esprit après la lecture d’un autre mot.
Les deux premières tâches sont censées mettre en œuvre la mémoire épisodique tandis que la
dernière ne concernerait que la mémoire sémantique. Les données montrent que pendant la tâche
de rappel et la tâche d’association le cortex frontal inférieur gauche, les lobes temporaux
inférieurs et postérieurs sont actifs. La différence essentielle porte sur l’importance de l’activité
qui, pour la tâche de rappel est plus importante dans les pôles frontaux et les aires frontales
droites. Ces dernières zones (frontales droites) ne sont pas actives durant la reconnaissance. Ces
résultats montrent la difficulté à dissocier mémoire sémantique et mémoire épisodique à partir de
l’activité du cerveau. Elles sont conformes aux hypothèses de Damasio (1989) et Rousset et
Schreiber (1992) qui font l’économie de la mémoire sémantique considérant que le sens est
contenu dans les épisodes stockés en mémoire en long terme. Les relations entre les éléments de
la mémoire épisodique sont suffisantes pour expliquer les données concernant le stockage du
sens. Nous reprendrons à notre compte cette thèse dans le dernier chapitre de l’ouvrage.
Conclusion
Les données obtenues par les techniques d’imagerie cérébrale témoignent de la difficulté
à isoler une structure dans laquelle seraient stockés les signifiés. Elles semblent plutôt indiquer
que le traitement du sens est distribué dans le cerveau. Ainsi, durant le traitement des mots
concrets non seulement le cortex pré-frontal inférieur gauche est actif mais les zones associatives
du cortex visuel sont à leur tour sollicitées. Tout se passe comme si des traits figuratifs étaient
associés aux lexèmes désignant des objets. De même, l’opposition entre les différentes catégories
de mots semble liée aux types de traits sémantiques auxquels ils sont associés. Cela nous
conforte dans l’affirmation que les réseaux sémantiques comportent des unités (ou des traits) de
type descriptifs et donc référentiels.
Soulignons, enfin, que les données de Damasio (1989) et Rousset et Schreiber (1992)
semblent indiquer que le sens est contenu dans les épisodes stockés en mémoire à long terme et
donc que l’opposition entre mémoire épisodique et mémoire sémantique mérite d’être analysée
plus finement qu’elle ne l’a été à ce jour.
Les analyses qui ont été menées dans les chapitres précédents reposent sur le postulat que
le mot est l’unité de sens pertinente en psychologie. Or, prenant en compte la polysémie du
vocabulaire, nombre de linguistes (Rastier, 2001) soulignent que le contexte donne sens.
L’exemple le plus courant est le lexème couvent. Hors contexte, il est impossible de savoir si ce
lexème désigne : « la maison dans laquelle des religieux ou des religieuses vivent en commun »
(Dictionnaire Le Petit Robert) ou renvoie à la troisième personne du verbe couver. La polysémie
du vocabulaire est telle que le sens ne peut être appréhendé hors du contexte. Cette position a
motivé les chercheurs qui ont travaillé sur les propositions.
Résumé
Les données neuro-anatomiques sont utilisées pour aider à la compréhension du
contenu et de l’organisation de la mémoire sémantique.
Une première série d’observations et d’enregistrements ont permis de dissocier les
zones du cerveau impliquées par le traitement phonologique des messages verbaux entendus
de celles qui sont actives durant la production du langage. Le traitement phonologique des
mots et des phrases se fait au niveau de l’aire de Wernicke (face externe des temporales 1 et 2
en dessous des aires auditives primaires, cf. figure N° 26). L’expression nécessite l’intégrité
des aires de Broca (pied de la troisième circonvolution frontale du cerveau gauche) en
relation avec l’insula et les noyaux gris centraux (cf. figure N°25).
Le pôle réceptif lié au codage du langage entendu c’est à dire essentiellement au
traitement phonologique permettant la reconnaissance des mots est lié à l’intégrité de la
première circonvolution temporale gauche (T1) dite aire de Wernicke. Cette circonvolution
est voisine des aires auditives primaires et secondaires (41 et 42). Les lésions de l’aire de
Wernicke se traduisent par des difficultés de compréhension du langage oral alors que d’une
part le système auditif est en parfait état et que la production de ce langage ne pose pas de
problèmes.
Sur le versant production, les aires 44 et 45 sont le lieu où la programmation du langage
est effectuée. L’exécution des programmes c’est à dire l’articulation des mots est sous la
dépendance d’une zone allant de la partie basse de la frontale ascendante au faisceau
pyramidal. En revanche, le centre de l’écriture se situe au pied de la F2.
Pour ce qui est du traitement sémantique, les études de TEP ou d’IRM suggèrent que les
parties du Cortex Préfrontal Inférieur Gauche correspondant aux aires de Broadmann 47 et 45
sont actives durant le traitement sémantique des mots tels que les décisions sémantiques.
Selon Poldrack et col. (1999) le gyrus frontal inférieur gauche est actif durant les tâches
sémantiques. La zone ventrale antérieure du gyrus est plus active durant le traitement
sémantique que durant le traitement phonologique. La zone postérieure dorsale est active à la
fois lors du traitement sémantique et pendant le traitement phonologique
Selon Price (2001) le traitement sémantique des mots est localisé dans le cortex temporo
pariétal postérieur gauche (incluant le gyrus angulaire) et différentes régions du cortex temporal
inférieur et central. Plusieurs régions du lobe frontal seraient actives dans le traitement
spécifique de certaines catégories de mots. Le traitement du sens semble donc distribué en
différents lieux.
Les études de patients manifestant des atteintes catégorielles montrent :
a) que les mots fréquents résistent mieux que les mots rares ;
b) que des pertes des noms de couleurs sont observées chez des patients
présentant des atteintes du lobe occipital gauche (Hécaen et Angelergues,
1963 ;
c) que des sujets ayant des lésions du lobe temporal gauche sont incapables
de dénommer les parties du visage (Damasio, 2001) ;
d) que des patients éprouvant des difficultés à comprendre des noms
d’animaux présentent « une petite anomalie métabolique dans le lobe
temporal gauche, atteignant son maximum dans le gyrus temporal »
(McCarty & Warrington, 1994, p.162).
e) que la perte des verbes désignant des actions et des mots dénotant des
relations spatiales serait imputable à des lésions de l’opercule frontal gauche
et du cortex associatif pariétal gauche mais aussi des aires pré-motrices
gauche, du cortex occipital et de la substance blanche paraventriculaire
située sous les régions temporales, (Damasio, 2001).
Les tentatives pour différencier la mémoire épisodique et la mémoire sémantique ne sont
pas convaincantes. Les données sont plutôt conformes aux hypothèses de Damasio (1989) et
Rousset et Schreiber (1992) qui font l’économie de la mémoire sémantique considérant que le
sens est contenu dans les épisodes stockés en mémoire en long terme.
Pour en savoir plus
DELACOUR J. (1999), Une introduction aux neurosciences cognitives. De Boeck
Université : Paris Bruxelles.
EUSTACHE F. (2003). Pourquoi notre mémoire est-elle si fragile ? Paris : Le Pommier.
EUSTACHE F. & LECHEVALLIER B. (1993), Langage et aphasie. De Boeck Université :
Paris Bruxelles.
GIL R. (1989), Neurologie pour le praticien. Paris :SIMEP.
GIL R. (1996), Neuropsychologie. Masson : Paris.
HOUDE O. & MIEVILLE D. (1993), Pensée logico-mathématique : nouveaux objets
disciplinaires. Paris : PUF.
HOUDE O., MAZOYER B. & TZOURIO-MAZOYER. (2002), Cerveau et psychologie.
PUF : Paris.
Chapitre 8. Les propositions et le co-texte
Le mot n’est pas la seule unité de sens. La proposition (prédicat + argument (s)) est
une unité à laquelle il est possible d’affecter une valeur de vérité : « ce qui est affirmé est vrai
ou ne l’est pas ». Le développement des analyses prédicatives a permis de décrire différents
types de prédicats ainsi que différentes propositions. Que sont ces propositions qui sont
censées décrire la totalité du sens véhiculé par le texte ? Comment sont-elles constituées ?
Quels traitements permettent d’élaborer les propositions ?
Pour certains spécialistes de la compréhension des textes (Kinsch), la proposition est
l’unité de base des représentations mentales. Cette hypothèse pose la question du rôle du
langage dans la représentation des connaissances. Les connaissances sont-elles stockées sous
forme de propositions ? Quels peuvent être les différents formats sous lesquels les
connaissances seraient stockées en mémoire ? Comment la proposition s’intègre-t-elle dans
la mémoire sémantique ?
Jusque dans les années 1980, le mot était, dans les modèles de la mémoire sémantique,
l’unité de base du sens. Cette position a été contestée par nombre de linguistes qui ont
défendu la thèse selon laquelle le sens était dans le contexte. C’est alors que dans le cadre du
développement de l’intelligence artificielle et de l’analyse logico-mathématique du langage, la
proposition s’est imposée comme l’unité de sens de base. La proposition “est la plus petite
unité du discours à laquelle puisse s’appliquer une valeur de vérité” (Le Ny, 1987, p.27). Par
valeur de vérité, on entend le fait qu’il soit possible de procéder à un jugement de vérité de
type cette affirmation est vrai ou fausse. La proposition est composée d’un prédicat
(généralement un verbe ou un adjectif) et d’un ou plusieurs arguments29. « L’essor récent des
théories qui font appel à un niveau de représentation logico-mathématique a entraîné un
recours fréquent à la notion de prédicat logique : il s’agit d’un opérateur mis en relation avec
divers arguments. Ainsi, la proposition « Paul donne le journal à Sophie » aurait une
représentation logique du sens : donner (Paul, le journal, Sophie) où le verbe est une constante
prédicative, et les arguments des constantes individuelles » (Dictionnaire de linguistique et
des sciences du langage, 1999, p. 376). Dans cet exemple le verbe Donner est un prédicat
tandis que Paul, le journal, et Sophie sont des arguments. L’analyse casuelle de Fillmore
(1968, 1985) a servi de base à la construction des théories propositionnelles de la
compréhension de textes (Kintsch, 1991).
1. La grammaire de cas de Fillmore
Fillmore tente de construire une grammaire de cas décrivant la « structure sous-jacente
mentionnant les rôles sémantiques (cas) qu’assument les syntagmes nominaux (arguments)
avec tel ou tel verbe ou adjectif (prédicat) » (Dictionnaire de linguistique et des sciences du
langage, 1999, p. 77). Cette description aboutit à énumérer, pour chaque verbe, l’ensemble
des cas avec lesquels il est compatible. Ainsi le verbe amuser peut être associé avec un Agent
(instigateur de l’action identifiée par le verbe), un Expérimenteur (entité impliquée dans un
événement psychologique authentique ou dans un état mental) et un instrument (objet étant
cause de l’état ou de l’action identifiée par le verbe). Bien que variant la liste des cas reste
29
Argument : « Emprunté à la logique, le terme d’argument désigne une entité à laquelle s’applique une
fonction et pour laquelle elle possède une valeur. On posera ainsi dans une classification des verbes que Jean
marche et un verbe à un argument, Jean mange une pomme est un verbe à deux arguments, Jean donne une
pomme à André est un verbe à trois arguments, et que il pleut est un verbe qui a sa fonction en lui-même. »
(Dictionnaire de linguistique et des sciences du langage, 1999, p. 49).
limitée. En 1985, Fillmore propose comme cas principaux: l’agent, l’instrument, l’objet, le
but, le factitif, le locatif modal et le locatif propositionnel, la location, la source, le temporel…
Les définitions des principaux cas permettent de comprendre l’intérêt de l’analyse.
- L’agent est animé, il est l’instigateur de l’action. Dans la phrase Pierre casse le verre
Pierre est l’agent.
- L’instrument est la force ou l’objet impliqué dans la cause de l’état ou de l’action du
verbe. Si dans l’exemple précédent l’on remplace Pierre par le marteau (Le marteau casse
le verre) marteau est un instrument. Cet exemple illustre bien la différence entre rôle
syntaxique et cas. Dans les deux phrases (Pierre casse le verre et le marteau casse le
verre), Pierre et marteau sont sujets du verbe casser or le premier est agent le second
instrument.
- L’objet désigne les objets affectés par l’action ou l’état. Dans l’exemple précédent (Pierre
casse le verre) verre est l’objet.
- Le but est l’entité qui reçoit une action ou une offre. Dans la phrase Jean offre les fleurs à
Sabine, Jean est l’agent, fleurs est l’objet et Sabine le but.
- Le factitif ou résultatif est l’objet ou l’être qui résulte de l’action ou de l’état décrit par le
verbe : Pierre fait un bateau, l’objet réalisé est le bateau, Jacques raye sa voiture, l’objet
affecté est la voiture.
- Le locatif précise la localisation ou l’orientation spatiale de l’état ou de l’action. Il est
modal ou propositionnel.
Ces quelques définitions permettent de comprendre l’utilisation qui peut être faite de la
notion de cas et surtout la distinction entre le rôle syntaxique et le cas. Le cas définit une
fonction sémantique et non une fonction syntaxique. On comprend l’utilisation qui peut en
être faite dans l’intelligence artificielle et le traitement automatique des langues.
L’analyse casuelle répond à des règles qui permettent de préciser les formulations qui sont
agrammaticales par rapport à celles qui ne le sont pas. Le premier principe consiste à affirmer
que dans une phrase simple, un même cas ne peut apparaître qu’une seule fois. “La phrase
“Un marteau a cassé la fenêtre avec une clé” est agrammaticale car le “marteau” et la « clé »
y sont tous les deux analysés comme des instruments”(Manuella, 2001).
Cette description permet de classer les verbes sur la base de la similarité de leur structures
casuelles en prenant en compte soit le nombre de cas (de 2 à 6 cas) qui peuvent être affectés à
chaque verbe, soit la typologie des cas. Il est ainsi possible de lister, par exemple, tous les
verbes pouvant être associés à un instrument ceux qui le sont à un agent, etc….
Soulignons que l’approche d’Anderson (1980) puis celle de Fillmore font de l’analyse
casuelle une branche de la sémantique. Dans ce cadre, ces auteurs affirment le rôle central du
verbe qui non seulement gouverne l’organisation de la phrase mais surtout qui va structurer
les réseaux sémantiques. Cette approche diffère de celle des pionniers des réseaux
sémantiques qui plaçaient les noms communs au cœur de l’organisation des réseaux.
L’intérêt d’une telle description a été rapidement compris par les chercheurs qui
travaillent sur le traitement automatique du langage. L’énumération des arguments qui
peuvent être associés à chaque verbe permet de construire une base de données utilisable
comme un lexique. On décrit la structure casuelle de chaque prédicat, exemple au prédicat
casser sont associés un agent, un objet, un instrument… et pour chaque cas on liste les
possibles, dans l’exemple précédent tous les agents sont possibles mais tous les instruments
ne le sont pas seul un objet ayant une certaine dureté peut casser un autre objet, on ne peut pas
casser un verre au moyen d’une éponge donc les objets mous sont exclus de la liste des
instruments associés au prédicat casser. La construction d’une base de données comportant
toutes ces informations est très utile pour le traitement automatique de la langue.
Les analyses de type casuelles se sont multipliées et ont été adaptées aux différentes
langues. Elles ont été utilisées par les psychologues qui se sont intéressés à la compréhension
des textes.
2. De la grammaire de cas à l’analyse propositionnelle
La description des cas a servi de base aux analyses propositionnelles. La proposition
composée d’un prédicat et des arguments qui lui sont associés dans la phrase s’est imposée
comme l’unité de sens minimale. Comme il était rappelé au début du chapitre, le succès de la
proposition est en particulier dû au fait qu’elle constitue la plus petite unité du discours à
laquelle puisse s’appliquer une valeur de vérité. C’est en effet, la plus petite unité du discours
à propos de laquelle il est possible d’affirmer que ce qui est déclaré est vrai ou faux.
S’appuyant sur cette propriété, van Dijk et Kintsch (1983) ont considéré que le sens
véhiculé par un texte peut être décrit par une suite de propositions. Turner et Green (1977)
distinguent trois catégories de propositions : les propositions prédicatives, les propositions
modificatrices et les propositions de connection.
a) « Les propositions prédicatives expriment une relation d’action ou des affirmations
concernant le sujet de la proposition… trois catégories de propositions prédicatives sont
distinguées :
- Les nominales expriment le fait que le sujet fait partie d’une catégorie. …
exemple : « Une truite est un poisson »…
- Les référentielles expriment le fait que le référent d’un argument est le même
que celui d’un second argument. Exemple : «Delon est le tueur »…
- Les propositions qui expriment une action.
b) Les propositions modificatrices changent un concept en le restreignant ou en le
limitant au moyen d’un autre concept… » (Rossi & coll., 1991, p. 58). Quatre cas sont
différenciés :
- La quantification exprimant le nombre, l’étendue.
- La partition (partie de, quelques…).
- La qualification qui peut être décrite par « qualité de » ou « qualifier de ».
- La négation.
c) Les propositions de connexion sont au nombre de huit :
- Les propositions de conjonction : et, aussi… .
- Les propositions de disjonction exprimant l’alternative ou l’opposition : ou,
soit… .
- Les propositions exprimant la causalité : parce que, car… .
- Les propositions exprimant l’intention : raison, dessein… .
- Les propositions exprimant les contrastes : divergences, comparaisons entre
objets, personnes ou actions… .
- Les propositions exprimant des conditions : pré-requis, restrictions,
qualifications… .
- Les propositions exprimant les circonstances : circonstances de temps, de lieu
ou de mode d’action… .
- Les propositions formulant des concessions : acceptation d’un point de vue,
soumission… .
Avec cette liste de propositions il devrait être possible de transcrire tous les textes.
Van Dijk et Kintsch (1983) vont assurer le succès de cette approche en affirmant que
la représentation mentale du contenu du texte est construite à partir de la liste de propositions
qui constituent la base de texte (“text base”). Cette démarche peut être illustrée à partir d’un
exemple emprunté à Isabelle Tapiero (1980). Sur le tableau 4 sont notées les propositions
correspondant à chaque phrase d’un conte. Chaque phrase est décomposée en une suite de
propositions. Le lien entre les phrases est assuré par la reprise des propositions. Ainsi, la
proposition P1 Géant qui apparaît dès la première phrase est reprise dans la description de
toutes les autres phrases. La lecture du tableau 4 amène à faire trois observations :
1) Une proposition peut être argument d’une autre proposition. Ainsi la
proposition 1 Géant est argument des propositions P2, P8, P15 et P16. Cette
répétition des arguments est essentielle pour Kintsch car elle assure la
cohérence des représentations. Les calculs effectués sur le nombre de fois où
une proposition est argument d’autres propositions va permettre à Kintsch de
déterminer les propositions les plus importantes et construire la
macrostructure du texte c'est-à-dire le résumé regroupant toutes les idées
importantes exprimées dans le texte.
2) Des mots isolés sont traités comme des propositions, exemple la proposition
1 ne comporte que le mot Géant. Cette pratique est contraire à l’approche
classique. Le mot Géant ne peut être une proposition puisqu’on ne peut
procéder à un jugement de vérité de type cette affirmation est vrai ou fausse.
3) La base de texte contient des propositions qui sont inférées. Les propositions
P12, P13, P14 et P17 sont inférées. Le lecteur utilise ses connaissances pour
procéder à des inférences. Kintsch adopte une position qualifiée de
minimaliste en affirmant que les seules inférences produites sont celles qui
sont nécessaires à la cohérence de la représentation. Il n’empêche que ces
inférences sont dépendantes des connaissances, des buts de la lecture, des
intérêts du lecteur et des interprétations qu’il fait de ce qu’il lit.
Selon cette approche, la compréhension du texte repose sur l’activation du contenu de
la mémoire sémantique et l’utilisation de connaissances permettant l’élaboration d’inférences
nécessaires à la cohérence du texte. Les procédures d’activation et l’intégration de la mémoire
sémantique dans la compréhension méritent d’être décrites. Avant de procéder à cette
description, il faut rappeler les principales critiques qui ont été formulées à l’encontre de la
construction de la base de texte proposée dans le modèle d’intégration-construction de
Kintsch.
L’ambition de rendre compte du sens du texte à partir d’une liste de propositions s’est
vite heurtée à nombre de difficultés. Elles ont amené les auteurs à prendre quelques libertés
avec la notion de proposition qui progressivement s’est éloignée de la structure prédicat
argument. La principale difficulté vient de ce que la décomposition propositionnelle ne peut
être faite de façon automatique car elle suppose une interprétation du sens. De ce fait, il est
très rare que deux auteurs aboutissent à la même décomposition. Cette difficulté est accrue par
la nécessité d’intégrer dans la base de texte des inférences. Le type, l’importance et le contenu
de ces inférences varient aussi bien en fonction :
- des connaissances du lecteur : dans un texte explicatif, plus le lecteur possède
de connaissances sur le sujet, plus le nombre d’inférences sera grand.
- de ses objectifs de lecture : dans un même texte il est possible de s’intéresser
à des objets différents : description des situations, circonstances d’apparition
des événements, explications des procédures, buts poursuivis…
L’introduction des inférences nécessaires à la cohérence locale et globale de la
représentation augmentent la part de la variabilité inter-individuelles de sorte que l’on pourrait
dire que chaque sujet est amené à élaborer une base de texte qui lui soit propre (Guha et
Rossi, 2001).
Cette approche montre, s’il était nécessaire, que la compréhension du langage met en
jeu la mémoire sémantique et les connaissances que le lecteur a du monde. L’importance de
ces connaissances est mise en relief lors de la production des inférences. Les auteurs ont donc
été amenés à réfléchir aux multiples articulations entre propositions et réseaux sémantiques,
entre réseaux sémantiques et différentes catégories de connaissances.
.
Tableau N° 4. Base de texte, des premières phrases d’un conte, construite en suivant
les règles de Kintsch (I. Tapiero, 1980). Sous chaque phrase sont listées les propositions de la
base de texte. La fonction de certaines propositions est explicité : TEMPS, indique l’existence
d’une marque temporelle ; INF : BUT signifie que l’inférence est fait sur le but de l’action ;
INF : CAUSE signifie que l’inférence est faite sur la cause…
Un jour un géant se promenait dans la forêt
P1 Géant
P2 SE PROMENER [P1]
P3 Forêt
P4 DANS [P2, P3]
P5 TEMPS : UN JOUR [P2]
Le géant vit une vieille dame
P1 Géant
P2 SE PROMENER [P1]
P4 DANS [P2, P3]
P6 Dame
P7 VIEILLE [P6]
P8 VOIR [P1, P6]
La vieille dame ramassait du bois mort
P6 Dame
P8 VOIR [P1, P6]
P9 Bois
P10 Mort [P9]
P11 RAMASSER [P6, P9]
P12 INF30 : UTILISER [P6, P9]
P13 INF : BUT [P11, P12]
P14 INF : RELATIVE [P8, P11]
Le géant décida de l’aider
P1 Géant
P6 Dame
P11 RAMASSER [P6, P9]
P15 DECIDER [P1, P16]
P16 AIDER [P1, P6]
P17 INF : CAUSE [P11, P15]
30
INF signifie Inférence
3. Comment se situent les propositions par rapport aux réseaux sémantiques ?
Les travaux sur l’analyse propositionnelle se sont développés indépendamment de la
réflexion sur les réseaux sémantiques. Théoriquement la structure propositionnelle peut être
soit totalement intégrée dans le réseau sémantique soit construite après l’activation des
signifiés. Dans le modèle d’intégration construction de 1991, Kintsch situe l’analyse
propositionnelle après l’activation des concepts et le choix de l’acception pertinente. Ce choix
fait, les types de cas qui sont associés au prédicat et qui sont intégrés dans la mémoire
sémantique sont activés automatiquement au moment de la lecture.
Les deux exemples proposés par Kintsch (1991) illustrent la démarche. Lorsque le mot
lu est un argument, ici le mot bank qui, en anglais, possède deux acceptions principales :
banque ou berge la première décision consiste à choisir l’acception pertinente. L’acception
banque peut être notée bank1. Cette première acception est associée à money (argent) et First
National Bank (principale banque américaine). La définition est institut financier. La seconde
acception bank2 est définie par bord de la rivière, est associé à river (rivière) et overflow
(inondation). L’activation en mémoire sémantique provoquée par la lecture de bank est
représentée par Kintsch (1991, p. 112) sur la figure 32. Dans cet exemple Kintsch propose
comme associés la définition catégorielle « est un » (ISA), des référents « First National
Bank » ou des associés « money ». Il laisse ouvert la possibilité d’autres associés représentés
par des astérisques. Le choix d’une acception est associé à une définition. Cette définition est
retenue dans la base de texte qui est composée par la liste des propositions qui décrivent le
sens du texte.
Lorsque le mot lu est un prédicat, sa lecture active non seulement la définition mais
déclenche aussi l’analyse prédicative qui permet d’associer au prédicat les arguments qui sont
lus. Ainsi, au verbe BAKE qui signifie CUIRE est associé sa structure prédicative : agent :
une personne, les objets un gâteau (cake) qui est l’objet le plus fréquent mais il est aussi
possible de cuire un dîner (dinner), des briques (bricks), une courge (squash) mais le soleil
(sun) peut aussi faire cuire une région (part of country). Les objets principaux susceptibles
d’être cuits sont ainsi contenus dans la mémoire sémantique. De plus, à chaque argument
peuvent être associés de nouvelles propositions dans l’exemple présenté sur la figure 33 à
PERSON est associé PUT et sa structure casuelle PUT [Ag : PERSON, Obj : CAKE] c'est-àdire qu’au prédicat METTRE est associé un agent qui est une personne et un objet qui est un
gâteau. De même à l’agent PERSON dans la structure casuelle de BAKE (cuire) est associé le
prédicat PREPARE (préparer) qui a pour Agent une personne et pour objet DINNER. Cette
description met en exergue l’intérêt que peut présenter l’analyse propositionnelle et surtout les
descriptions casuelles dans le traitement automatique du langage.
Figure N° 32. Représentation d’une partie des activations provoquées par la lecture du
mot BANK selon Kintsch, 1991, p. 112, in Guy Denhière et Jean Pierre Rossi, Text and Text
Processing, North Holland, Elsevier Science Publishers B. V. : Amsterdam.
Les doubles flèches indiquent les connexions positives, les cercles les connexions
négatives et les astérisques des nœuds qui ne sont pas nommés. Le sigle ISA signifie « est
un », la banque est un institut monétaire.
*
*
FIRST-NTL-BANK
MONEY
ISA[BANK2,RIVERBANK]
o
o
BANK1 o
ISA[BANK1,FINAN.INST]
o BANK2
bank
RIVER
OVERFLOW[RIVER,BANK2]
*
Figure N° 33. Représentation d’une partie des activations provoquées par la lecture du
mot BAKE selon Kintsch, 1991, p. 113, in Guy Denhière et Jean Pierre Rossi, Text and Text
Processing, North Holland, Elsevier Science Publishers B. V. : Amsterdam.
Les doubles flèches indiquent les connexions positives, les cercles les connexions
négatives et les astérisques des nœuds qui ne sont pas nommés.
LIKE [Ag : PERS, Obj :[EAT[PERS,CAKE]]]
BAKE [Inst : SUN,
Obj : PART-OF-COUNTRY]
O
O
PUT [Ag : PERS, Obj :CAKE, Loc :IN-OVEN]
O
BAKE [Ag : PERSON, Obj : CAKE]
*
O
RESULT [BAKE[…], HOT[CAKE]]
PREPARE [Ag :PERS , Obj : DINNER]
O
BAKE [Ag :PERS,Obj :SQUASH]
O
O
O
BAKE [Ag :PERS,Obj :BRICKS]
La proposition est un système d’organisation du sens activé par le mot lu. La structure
casuelle est constitutive du sens. Les cas attachés aux lexèmes sont parties intégrantes du
sens. Or, force est de constater qu’actuellement réseaux sémantiques et structures casuelles
sont traités indépendamment. Même dans les travaux de Kintsch, l’analyse propositionnelle
suit le choix du sens. Il est affirmé que l’analyse propositionnelle permet de décrire le sens du
texte, que la construction de la base du texte fait intervenir des inférences mais on sépare
activation du sens et analyse propositionnelle. Affirmer que tel argument est un être animé
c’est activer un de ses traits sémantiques. Affirmer qu’à tel prédicat sont associés des agents
(êtres animés) c’est rendre disponibles les arguments qui possèdent cette propriété. Ces
remarques posent la question de l’articulation entre les traits sémantiques et la structure
casuelle. Deux positions extrêmes doivent être distinguées : les systèmes pour lesquels la
structure casuelle se suffit à elle-même c’est à dire est seule constitutive de la mémoire
sémantique et les systèmes dans lesquels la structure casuelle est intégrée dans le réseau
sémantique à coté d’autres constituants : traits sémantiques, situations, scripts, schémas...
Dans le premier cas, habituellement rencontré dans le traitement automatique de la langue,
l’organisation casuelle est seule porteuse de sens, elle se suffit à elle-même, elle structure la
mémoire sémantique. Cette mémoire est constituée de lexèmes auxquels sont associés des
cadres (frame) qui décrivent leurs structures casuelles. Le lexème et son sens ne font qu’un.
Une telle approche n’est pas compatible avec les théories psychologiques du sens d’une part
parce que la séparation signifiant (forme du mot) et signifié (contenu) prônée par de Saussure
a reçu de multiples validations, d’autre part parce que les théories componentielles du sens
nous ont convaincu que le sens d’un lexème est représenté par une configuration complexe
qui ne se réduit pas à l’énoncé des cas. Reste alors à imaginer un système qui intègre la
structure casuelle dans les réseaux sémantiques. Comment intégrer connotation, dénotation,
référence et structure casuelle ? Sur la figure N° 31 on peut observer que Kintsch prévoit
d’associer au lexème des unités ne décrivant pas des structures casuelles. A chaque lexème
serait donc associés deux catégories d’unités : des structures casuelles (unités comportant les
cas qui leurs sont associés) et des lexèmes simples c'est-à-dire non associés à une structure
casuelle. La question est alors quels liens unissent un concept aux autres concepts ? comment
est organisé le réseau inter-conceptuel ? En d’autres termes, les liaisons sont-elles inter
prédicats, inter arguments, inter lexèmes ou mixtes ? La structure du réseau lie-t-elle acheter à
vendre et à payer ou associe-t-elle les agents possibles de ces différents verbes ? Nous avons
vu que l’analyse casuelle met le verbe au centre du système. Elle aboutit à ce que les
arguments soient organisés autour du verbe. Il s’ensuit que les verbes devraient structurer la
mémoire sémantique. Toute la mémoire sémantique serait organisée autour des verbes
puisque les noms communs par exemple ne seraient que des arguments susceptibles d’être
associés aux verbes. Or force est de constater que la plupart des réseaux sémantiques
développés à partir de Collins et Quillian (1969) comportent essentiellement des noms
communs. Schématiquement trois solutions sont envisageables :
- soit la structure propositionnelle est une organisation qui est extérieure au
réseau sémantique ;
- soit la structure propositionnelle est intégrée dans le réseau sémantique ;
- soit enfin l’organisation du réseau ne se fait pas autour de lexèmes mais
autour de situations.
Dans les deux premiers cas, on place la proposition qui est essentiellement une unité logicolinguistique, au centre des représentations des connaissances. Cela aboutit à affirmer que le
langage structure les connaissances stockées en mémoire. Dans le dernier cas, la situation
devient centrale, les structures de connaissances stockées en mémoire le sont sur le modèle de
ce qui est vécu et expérimenté dans la vie quotidienne. La mémoire serait organisée autour
des connaissances que constituent les différentes catégories de schémas. Les différents
schémas constitueraient des superstructures intégrant les différents constituants du sens et ne
rendant pas l’organisation des connaissances dépendantes de structures linguistiques. Le sens
du mot procéderait, serait déduit des schémas de situations dans lesquels objets, états ou
actions seraient représentés. C’est l’hypothèse qui va être explorée en décrivant les différents
schémas de connaissance qui sont stockés en mémoire.
Résumé
Remarquant que le sens d’un lexème est dépendant du contexte, les informaticiens
intéressés par le traitement automatique de la langue ont proposé de faire de la proposition
l’unité minimale de sens. Une proposition est une unité constituée d’un prédicat
(généralement un verbe ou un adjectif) et d’arguments (noms communs..). A cette proposition
il est possible d’attribuer une valeur de vérité c'est-à-dire de décider si l’affirmation est vraie.
Jean mange une pomme est une proposition composée du prédicat MANGE et des arguments
JEAN et POMME. JEAN est l’acteur, POMME l’objet qui est mangé. Le lecteur peut décider
si l’affirmation Jean mange une pomme est vraie.
La décomposition propositionnelle est inspirée de l’analyse casuelle qui consiste à
décrire les arguments (ou cas) associés à chaque prédicat. Exemple, le prédicat MANGER
peut être associé à un acteur (tout être vivant) et à des objets (ce que l’on mange), tout objet
n’étant pas mangeable et tout acteur ne mange pas tout ce qui est mangeable : le lion ne
broute pas et à l’inverse le mouton n’est pas carnivore. On peut aussi prévoir certaines
utilisations telles que mange disque…Cette analyse permet de constituer un dictionnaire utile
au traitement automatique du langage.
L’utilisation de l’analyse propositionnelle pour décrire le contenu des textes s’est
heurtée à de multiples difficultés : nécessité d’intégrer dans cette description des unités qui
n’étaient pas propositionnelles, ajout de propositions inférées construites en utilisant les
connaissance du lecteur.
L’intégration de l’analyse casuelle dans la mémoire sémantique pose le problème de
l’organisation de cette mémoire. D’abord parce que le verbe devient alors l’élément autour
duquel s’organise le sens ensuite parce qu’il faut définir sur quelle base s’organisent les
relations entre les unités : associations entre prédicats, associations entre arguments ou
associations entre lexèmes. Ces questions amènent à réfléchir à des superstructures qui ne
seraient pas des structures verbales mais des structures de connaissances. Les différentes
catégories de schémas correspondent à ces superstructures.
Pour en savoir plus
DENHIERE G. & BAUDET S. (1992), Lecture compréhension de textes et sciences
cognitives. PUF : Paris.
DENHIÈRE G. & ROSSI J. P. (1991), Text and text processing. North-Holland : Amsterdam.
RICHARD J. F., (1990), Les activité mentales : comprendre, raisonner, trouver des solutions.
Armand Colin : Paris
Mots clés : analyse prédicative, proposition, prédicat, argument.
Questions
1. Qu’est ce qu’une proposition ?
2. En quoi consiste l’analyse prédicative ?
3. Décrivez les différents types de propositions ?
4. Quel pourrait être le rôle du langage dans le stockage des connaissances ?
5. Comment intégrer la proposition dans la mémoire sémantique ?
Chapitre 9. Les schémas, schèmes scripts et MOPs
Les schèmes, scripts, scénarios, plans, frames et MOPs sont des schémas de
connaissances stockés en mémoire. Ils correspondent à des invariants décrivant des classes
de situations ou de connaissances. Ils comportent des constantes et des variables. Comment
sont-ils formés ? Quelle est leur utilité ? Quelles sont leurs caractéristiques ? Comment sontils intégrés dans la mémoire à long terme ?
Leur connaissance est aussi utile pour comprendre que pour produire. Comment sontils utilisés lors de la compréhension et de la production de textes ? Constituant une catégorie
de connaissances stockées en mémoire ils permettent entre autre d’inférer des informations
ou des éléments de situation qui n’ont pas été explicités dans le message alors qu’ils sont
nécessaires à leur compréhension. Quels rôles jouent-ils dans les processus d’inférence ?
Comment sont-ils utilisés pour compléter une information incomplète?
Quelles relations existent entre les connaissances schématiques et les autres
catégories de connaissances.
Bartlett (1932) suggère que la mémoire sémantique n’est pas limitée au sens des
lexèmes mais doit comprendre des structures de connaissance de type schématique. Cette
approche pose le problème des relations entre sens et connaissances et donc la question des
relations entre mémoire du sens et représentations de différentes catégories de connaissances.
On peut même se demander si la mémoire du sens est autonome et différente des structures de
connaissance ? On peut, en effet, s’interroger sur la nécessité d’une structure dans laquelle
seraient stockées les sens dans la mesure où ceux-ci peuvent être inférées à partir des
connaissances. Telles sont les questions qui sont au centre des discussions sur les structures de
connaissances que sont les différentes catégories de schémas.
Dans ce chapitre, les différents types de schémas et leurs propriétés seront décrits
tandis que les questions relatives aux liens unissant schémas et mémoire sémantique seront
abordées dans le chapitre 11.
1. La notion de schéma
Oubliant que dans la critique de la raison pure Kant (1787) parlait déjà de schéma, les
psychologues attribuent à Bartlett (1932) les premières réflexions sur ce thème. Depuis le
concept a connu un succès amplifié par le développement des approches cognitivistes. « Un
schéma est une structure cognitive qui spécifie les propriétés générales d’un objet ou d’un
événement, et abandonne tout aspect spécifique ou contingent. Il permet à des objets d’être
rattachés à des catégories générales, et, par suite, d’en hériter les propriétés » (Dictionnaire de
Psychologie, p. 615). Un schéma est donc une structure de représentation constituée des
invariants d’une classe de connaissances. Un schéma représente des connaissances et non des
définitions (Rumelhart et Orthony, 1977). Le schéma ne va pas représenter un objet particulier
mais le prototype d’un objet c’est à dire les traits communs aux objets qui constituent la classe
de référence. Le schéma de récit va représenter les séquences dont un récit est habituellement
constitué : événement initial, complication, résultat…. Ces séquences vont être instanciées31
dans un récit particulier.
Les schémas permettent de représenter des connaissances ou des savoir faire
(procédures) à tous les niveaux d’abstraction : textes, connaissances déclaratives, procédures
cognitives (comment je fais pour comprendre, pour lire…) ou schémas d’actions (comment je
31
Le terme instancié est un néologisme utilisé en psychologie pour signifier « prendre une forme particulière ».
Un schéma va être instancié dans une situation particulière. Les composantes du schéma vont alors prendre des
valeurs correspondantes à une situation. Le protagoniste du schéma sera par exemple Pierre, la scène initiale sera
la rencontre de Pierre avec Sabine…
fais pour démarrer la voiture, comment je fais pour créer une table des matières avec le
logiciel Word…). Les schémas peuvent s’emboîter les uns dans les autres.
Rumelhart et Ortony (1977) puis Rumelhart et Norman (1985) énumèrent les cinq
principales caractéristiques des schémas :
a) Les schémas comportent des éléments fixes et des variables. Vendre un
objet comporte des éléments stables : échanger un objet contre de l’argent.
La nature de l’objet aussi bien que la somme d’argent demandée sont des
variables qui peuvent prendre différentes valeurs. A chaque variable
peuvent être associées des valeurs. La valeur est une instance de la variable.
Dans la phrase : j’achète un livre 25 Euros, livre et 25 Euros sont des
valeurs associées aux variables « objet acheté » et « somme d’argent
versée ».
b) Les schémas peuvent s’emboîter. Rumelhart et Ortony (1977) donnent
l’exemple du schéma œil qui peut être emboîté dans celui du visage tandis
que les schémas représentant l’iris et la cornée sont emboîtés dans le
schéma de l’œil.
c) Les schémas peuvent être utilisés à tous les niveaux d’abstraction :
concepts concrets (la voiture) ou concepts abstraits (la liberté).
d) Les schémas sont utilisés pour représenter des connaissances plutôt que des
définitions. En cela le schéma se distingue des unités habituellement
représentées dans les réseaux sémantiques.
e) Les schémas sont des mécanismes actifs de reconnaissance. Posséder le
schéma de l’œil facilite sa reconnaissance. Chacun a pu faire l’expérience
du microscope avec lequel on arrive à voir l’objet dont on possède le
schéma. Il est en de même dans la vie de tous les jours, posséder le schéma
d’un objet, d’une situation, d’un événement… facilite sa reconnaissance.
On ajoutera que la connaissance du schéma facilite aussi bien la
compréhension que la production. La connaissance de la structure d’une
narration facilite aussi bien sa compréhension que sa production.
Le schéma d’un verbe correspond à la structure prédicative décrite par Fillmore, il
comporte au minimum un agent, et un objet pour les verbes transitifs. Les variables agents et
objets peuvent prendre différentes valeurs, zéro en cas d’absence, ou pour l’agent un être
animé : Jean, je, il… Le schéma d’une narration comporte une série d’épisodes qui sont décrit
dans les grammaires de textes.
Les schémas sont souvent organisés hiérarchiquement et peuvent prendre la forme
d’un organigramme. La grammaire de récit décrite dans la figure N° 35 illustre ce fait. Un
récit comprend un cadre et une structure événementielle. La structure événementielle se
décompose elle même en épisodes. Chaque épisode est formé d’un début, d’une cause, d’un
développement et d’une fin.
Comme cela était souligné précédemment, le schéma est une structure de
représentation des connaissances. La présentation des différentes catégories de schémas
témoigne de la variété des connaissances auxquelles s’applique cette notion.
Le succès de la notion de schéma a amené la création d’un vocabulaire permettant de
spécifier les différentes catégories des structures de représentations. Les schèmes, les scripts,
les scénarios, les plans et les MOPS sont les dénominations les plus fréquentes.
2. Schèmes, scripts, scénario, plans, frames et MOPS
Le terme de schème doit son succès aux travaux de Piaget qui l’a utilisé dans sa
description des stades de développement de l’enfant. Ainsi, par exemple, utilisera-t-il
l’expression schème « sensori-moteur » pour décrire les habiletés motrices du nourrisson. Les
actions qui permettent à l’enfant de se saisir d’un objet sont décrits dans le schème de
préhension : tendre le bras vers l’objet, ajuster le mouvement en fonction des perceptions,
déclencher la commande motrice de saisie, adapter la force de cette saisie et la forme de la
préhension en fonction des caractéristiques de l’objet sont autant d’éléments constitutifs du
schème de préhension. Toutes ces actions sont en quelque sorte génériques, elles s’appliquent
à toutes les situations dans lesquelles un objet est saisi. Ce schème, qui est général par
définition, va devoir être adapté aux situations rencontrées : prendre un stylo ne nécessite pas
la même force que prendre un paquet de cinq kilos de lessive. Si, dans les deux cas les
schémas moteurs sont semblables, chaque situation nécessite une adaptation. Dans ce cas
particulier, le schème renvoie à un savoir faire, à un programme d’action.
Pour clarifier et préciser le vocabulaire, Richard (1990) propose de distinguer les
schèmes des schémas d’actions. Les schémas d’action décrivent les séquences d’actions qui
sont réalisées pour effectuer une tâche. Il propose d’intégrer dans les schémas d’actions la
description des opérations associée aux verbes d’actions. Ainsi, décrit-il par le schéma
représenté sur la figure N° 34 les actions impliquées par le verbe déplacer. En effet, déplacer
un objet implique de le prendre et le cas échéant d’aller vers l’endroit où il se trouve, de le
saisir et le cas échéant d’enlever ce qui est au-dessus de lui puis de poser l’objet à un nouvel
endroit avec pour ce faire la nécessité, si besoin est, de se déplacer et de faire de la place à
l’endroit où l’on souhaite poser l’objet. Cette description est d’autant plus intéressante que
comme nous l’avons rappelé dans le chapitre 7, Damasio (2001) a observé chez certains
malades une perte spécifique des verbes d’actions. Cette perte semble liée à des lésions se
situant dans les zones du cerveau autant responsables de l’activité motrice que du traitement
sémantique : l’opercule frontal gauche, le cortex associatif pariétal gauche et les aires prémotrices gauches du cortex occipital ainsi que de la substance blanche paraventriculaire située
sous les régions temporales. Ces observations suggèrent l’existence d’un lien étroit entre les
signifiés associés aux lexèmes et les actions ou comportements moteurs qu’ils décrivent. Le
schéma moteur serait associé aux lexèmes désignant des actions.
En revanche, rien ne permet de dire que tous les schémas moteurs sont aussi stockés
sous une forme verbale. Nombre de nos schémas d’action sont tellement automatisés que nous
sommes incapables de les décrire verbalement. Le bon skieur adapte automatiquement ses
attitudes corporelles sans être capable de décrire verbalement dans le détail comment il
procède. Toute la difficulté des systèmes experts repose sur la description verbale du savoir
faire des opérateurs. La plupart « font » mais sont incapables de dire comment « ils font ». Le
problème du statut (verbal ou non) des représentations stockées en mémoire est posé.
Déplacer
(X Y Z)
puis
surPoser
Z X sur
Prendre
PrendreXXenenY
Aller vers X
Etre à coté de
Faire de la place
en Z
Enlever ce qui est
au-dessus de X
Rien au-dessus
Aller à coté de
Z
Figure 34 : Réseau procédural pour l’action déplacer (Richard, 1990, p. 78). Description
verbale du schéma d’action correspondant au déplacement d’un objet X situé en Y et
devant être déposé en Z. Une des actions consiste à prendre X en Y et pour cela il faut
soit être déjà à coté de X soit se diriger vers X…
La question des modalités de stockage (verbal, moteur, amodal…) des schémas est
aussi posé à propos des scripts. Les scripts, développés par Schank et Abelson (1977)
décrivent les actions composant des événements sociaux : aller au restaurant, faire sa toilette,
prendre l’avion ou le bus… Un script est composé d’une suite de scènes qui peuvent être
adaptées aux situations particulières. Le terme de scénario est utilisé comme synonyme de
script.
Dans le tableau N° 5 est reproduite la version simplifiée du script du restaurant
proposée par Baddeley (1992, p. 370). Les têtes de chapitres sont communes à l’ensemble des
scripts :
- le nom du script : « restaurant » ;
- les rôles qui désignent les acteurs : « client, serveur, cuisinier, caissier,
patron » mais on devrait aussi ajouter, pour les grands restaurants, « maître
d’hôtel… » ;
- les conditions qui spécifient les circonstances qui conditionnent le
développement des actions : « avoir faim, avoir de l’argent… » ;
- les résultats qui précisent ce à quoi l’on aboutit : « le client n’a plus faim, il a
moins d’argent, le patron du restaurant en a plus, » on pourrait aussi ajouter la
« satisfaction d’un bon repas ou le désagrément de s’être fait avoir… » ;
- les scènes qui comme au théâtre découpent la chaîne des actions : « entrée,
commande, repas, sortie… »
Ce découpage peut évidemment être modifié et complexifié selon les situations. Chaque scène
comprend une série de tableaux : « le client prend le menu, il lit le menu… ».
La lecture de ce script montre que selon le pays, la culture et le type de restaurant le
contenu du script varie, généralement les têtes de chapitres sont communes mais les contenus
peuvent varier. Ainsi, aux Etats-Unis, lorsque l’on rentre dans un restaurant on se dirige vers
un endroit où l’on attend que le maître d’hôtel ou le serveur viennent vous chercher pour vous
conduire à une table. La rubrique « le client cherche une table » est donc remplacée par les
rubriques « le client se dirige vers le point d’attente. Il attend le maître d’hôtel ou le serveur.
Lorsque celui-ci arrive, il le suit jusqu’à la table qui lui est proposée ». De même, en France,
habituellement, le client paye la serveuse et ne se déplace vers la caissière que rarement. Au
moment de la commande la serveuse fait généralement des propositions, le client demande
des informations concernant la constitution des plats. Bref, le script peut varier et doit être
adapté aux situations particulières.
Tableau 5 : Version simplifiée du script du restaurant proposée par Baddeley (1992, p.
370)
Nom :
Propriétés
restaurant
tables
menu
nourriture
addition
argent
pourboire
Rôles : client
serveur
cuisinier
caissier
patron
Conditions d’entrées : les client a faim
Le client a de l’argent
Résultats : le client a moins d’argent
le patron a plus d’argent
le client n’a plus faim
Scène 1 : Entrée
Le client entre au restaurant
Scène 3 : Repas
le cuisinier donne la nourriture
a la serveuse
La serveuse apporte la nourriture
au client
Le client mange la nourriture
Le client cherche une table
Le client choisit une place
Le client va vers une table
Le client s’assoit
Scène 2 : Commande
Le client prend le menu
Le client lit le menu
Le client choisit les plats
Scène 4 : Sortie
La serveuse fait l’addition
La serveuse va vers le client
La serveuse donne l’addition au
client
Le client appelle la serveuse
le client donne un pourboire à la
serveuse
La serveuse vient à la table
le client va vers la caisse
Le client passe la commande
le client paye
La serveuse va à la cuisine
le client sort du restaurant
La serveuse donne la commande au cuisinier
Le cuisinier prépare la nourriture
Notre vie sociale est à l’origine de scripts variés. Script du restaurant, de la cantine, de
la consultation chez le médecin, chez le dentiste, de la toilette, du rasage, du démarrage de la
voiture… Ces scripts ont été appris parfois de façon implicite par simple répétition.
Dans leur étude de la compréhension des problèmes de mathématiques, Frederiksen et
Donin (1991) ont développé la notion de « frame » qui en français peut se traduire par cadre.
Emprunté à Minsky la notion de frame est utilisée par les informaticiens anglo-saxons pour
désigner des cadres de présentation comportant des rubriques qui doivent être présentes. On
appellera par exemple frame le plan de la page d’internet qui doit être respecté pour la vente
d’accessoires de cuisine. Le frame est alors le plan ou la table des matières qui va structurer la
présentation d’une page internet. A l’origine, ce cadre décrit les représentations mentales des
propositions construites à la suite de la lecture. Minsky qui est un informaticien spécialiste de
l’intelligence artificielle utilise le terme frame pour désigner les structures prédicatives des
verbes : le verbe manger comporte un agent qui est un être animé et des objets qui sont
comestibles… L’ensemble « agent qui est un être animé et des objets qui sont comestibles »
constitue le frame associé au verbe manger. Cette notion est étendue par Frederiksen et
Donin (1991) qui décrivent des frames procéduraux et des frames problèmes. Ces frames
représentent des structures de problèmes ou de procédures. Un frame problème est à la fois un
schéma qui spécifie la façon dont un problème est posé et une structure de résolution, ce
qu’en mathématiques l’on dénomme parfois une démarche. Il existe, en effet, des classes de
problèmes qui sont résolus en suivant des démarches identiques. Ces schémas de problèmes et
ces structures de résolution sont appelés frames problèmes par Frederiksen et Donin (1991).
Les schèmes, schémas, scripts et frames sont des structures de représentations apprises
et stockés en mémoire. Il en est de même des plans proposés par Rumelhart et Norman
(1985). Un plan est un schéma cognitif finalisé vers un but. Il décrit les étapes permettant
d’atteindre ce but. Durant la vie l’individu se fixe des buts, stocke en mémoire des
informations qui permettent de prédire les conséquences des actions qu’il perçoit ou
auxquelles il participe, les moyens qui doivent être mis en œuvre, les intentions qui sont
poursuivies ou les plans de certaines actions. Les schémas d’actions décrivant les moyens
d’atteindre ces buts sont des plans. Pour réaliser un compte rendu d’expérience je suis la
procédure qui m’a été enseignée. Cette procédure a été stockée en mémoire et éprouvée
chaque fois que j’ai du réaliser cette tâche. Le compte rendu d’expérience comporte l’objet de
la recherche, la description de la méthode utilisée, des sujets qui ont participé à l’expérience,
les résultats obtenus, leur analyse et une conclusion. Cette énumération des parties que doit
comporter le compte-rendu d’expérience est le plan.
Lorsque j’observe les actions menées par un collègue je peux identifier ses intentions,
les buts qu’il poursuit. Les plans sont des représentations qui non seulement vont guider mes
actions mais aussi vont me permettre de comprendre les buts et intentions des actions des
autres. Ces connaissances lorsqu’elles sont activées vont permettre de faire des inférences
c’est-à-dire des prédictions alors même que l’information n’est pas explicitée (Campion &
Rossi, 1999). La notion d’inférence sera développée à la fin de ce chapitre.
Selon Schank (1982) nos connaissances peuvent s’organiser en thèmes intégrant
différents schémas généraux. Il appelle MOP (Memory Organization Packet) ces ensembles
de connaissances. Les connaissances sur l’hôpital résultent de la connexion entre différents
MOPs, les MOPs associés à la guérison, aux soins, aux diagnostics, aux procédures d’entrées
et d’hospitalisations… Chacun de ces MOPs peut entrer dans la constitution d’une scène, d’un
script ou d’un MOP de niveau supérieur. L’idée intéressante est que des unités de
connaissances élémentaires de type thématique peuvent être intégrées dans des unités plus ou
moins larges ce qui évite des stockages multiples. Les connaissances thématiques pourraient
être construites à la façon d’un jeu de Légo par combinaison de MOPs élémentaires. En ce
sens le MOP est un système économique puisque avec un nombre limité de situations de base
je peux construire un ensemble large de schémas ou de MOP de niveaux supérieurs.
Avant de décrire les propriétés de ces différentes structures schématiques nous allons
illustrer la notion de schéma en présentant un exemple qui a été développé par Mandler
(1982). Il s’agit du schéma de récit.
3. Un exemple : le schéma de récit
Dans les années 1980 lors de recherches sur la compréhension des textes, les
chercheurs ont eu l’idée de construire une grammaire de textes c’est-à-dire un catalogue des
structures des différentes catégories de textes. C’est ainsi que Mandler (1982) s’est attaché à
décrire une grammaire des récits. Il distingue d’ailleurs la grammaire de récit du schéma de
récit : « Une grammaire de récit est un système de règles utilisé pour décrire des régularités
dans la structure des histoires. Un schéma de récit est une sorte de structure mentale et de
mécanisme de traitement… Ainsi, une grammaire de récit est un système de règles qui
précise les séquences canoniques d’unités et les conditions dans lesquelles elles peuvent être
modifiées. Un schéma de récit est un mécanisme qui a incorporé quelques-unes ou la totalité
des ces régularités et en fait usage en cours de traitement… Une grammaire de récit exprime
les éléments des intrigues par l’identification des protagonistes, de leurs buts et de leurs plans,
de leurs tentatives pour atteindre leurs buts et des issues des tentatives. Elle décrit comment
ces types d’unités sont assemblés pour former des structures plus vastes, ou épisodes, et
comment des épisodes sont à leur tout reliés pour former des récits complets. » (Mandler,
1982, p.705 et 706).
Un récit est composé d’épisodes. « Un épisode commence par un événement de début
(initial) qui suscite une réaction complexe chez le protagoniste (ce constituant se compose de
deux partie : une réponse émotionnelle ou cognitive et un but). Ces constituants sont suivis
par une tentative pour atteindre le but, l’issue de la tentative, et une fin, qui conclut l’épisode
par l’énoncé d’une ou plusieurs réactions des personnages aux évènements qui ont eu lieu, ou
des conséquences à long terme de ces évènements. » (Mandler, 1982, p.709). Le niveau de
précision du schéma varie. Plus il est précis, plus il est utile et opérationnel mais aussi moins
le nombre de textes auxquels il s’applique est élevé. A l’inverse, plus il est général, plus il
s’applique à un grand nombre d’instances, mais moins il est utile.
Un résumé de la grammaire d’histoire proposée par Mandler et Johnson (1977) est
présenté sur la figure N° 35. Comme cela est indiqué sur la figure, une histoire comporte un
cadre et une structure événementielle. Le cadre comprend des états et des événements. La
structure événementielle est faite d’une série d’épisodes. Chaque épisode est formé d’un
début, d’une cause, d’un développement, parfois d’une complication, et d’une fin. A la base
de l’organigramme on trouve une série d’unités élémentaires (cause, résultat, état…) qui vont
se combiner de façons différentes en fonction des textes. Ainsi, un épisode peut comporter des
complications alors qu’un autre peut en être dépourvu. La figure N° 36 donne une illustration
de l’application de ce schéma de texte à un récit particulier.
Ces tentatives de construction d’une grammaire des textes se sont heurtées à deux
difficultés : diversité des textes et mixité de nombre de textes. Un proportion importante de
texte comporte des séquences empruntées à différentes catégories. Un article de journal va
comporter des parties argumentatives, des descriptions et mêmes des parties narratives. Si, la
majorité des textes ne peuvent être classés car ils entremêlent plusieurs genres, l’intérêt de la
description des structures hiérarchiques s’en trouve diminué. En revanche, les structures
élémentaires telles que les épisodes ou même les buts peuvent être combinés pour décrire des
textes qui ne sont ni narratifs ni didactiques. Faute de pouvoir appliquer l’organigramme
décrivant le récit, il est possible d’utiliser ses rubriques pour identifier ce dont on parle.
La diversité des textes a rendu difficile un accord sur les descriptions. Ainsi, les
schémas narratifs se sont multipliés. A coté du modèle de Mandler et Johnson (1997) on
trouve des descriptions variées. Des pédagogues enseignent qu’un texte narratif est composé
d’une situation initiale suivie d’un événement déclencheur puis de péripéties, d’un
dénouement et se termine par une situation finale. La situation initiale permet de situer le lieu,
le moment et l’atmosphère du récit. Elle constitue le cadre dans lequel les personnages vont
être introduits et présentés. Généralement elle décrit le projet des protagonistes. L’événement
déclencheur va perturber la réalisation des projets des protagonistes. Et ainsi de suite, chaque
rubrique remplira une ou plusieurs fonctions qui seront décrites avec plus ou moins de
généralité. La difficulté à obtenir un accord sur ces descriptions témoigne de la diversité des
lectures.
Ces descriptions n’intéressent le psychologue que dans la mesure où il est établi que le
schéma de texte est utile au lecteur ou au locuteur. Il s’agit donc de montrer que le schéma de
texte a une validité psychologique. Trois types de validations peuvent être recherchées :
1) Etablir la généralité de la description : montrer qu’une description est applicable à
une majorité de textes.
2) Montrer que l’application de la grammaire se fait sans difficulté c’est à dire que les
différentes rubriques sont décrites de façon opérationnelle de sorte que les parties
du texte puissent être classées sans ambiguïté.
3) Démontrer l’efficacité de la connaissance de la grammaire aussi bien lors de la
compréhension du texte que lors de la production. Dans ce cadre, il peut être
intéressant d’établir que l’enfant apprend progressivement à manipuler ces
schémas.
Les études développementales ainsi que les recherches sur l’efficacité de la
connaissance des schémas témoignent en faveur de l’efficacité de ces schémas. La validité
psychologique des schémas de récits a été l’objet de nombreuses recherches. Les données
obtenues dans les tâches de rappel de textes appris par des enfants ou des adultes ont été
résumées par Mandler (1982). Elles montrent que :
a) Les récits qui respectent les formes canoniques de la grammaire sont mieux
rappelés que ceux qui ne la respectent pas donc le respect des formes
canoniques facilite la rétention ;
b) Dans les rappels des récits qui suivent l’ordre canonique, peu d’inversions
de séquences sont observées. Lorsqu’il a été respecté dans le récit appris
l’ordre canonique n’est pas modifié ;
c) Les composants optionnels sont moins bien rappelés que les composants
obligatoires ;
d) Lorsque le sujet ajoute des informations qui ne sont pas contenues dans le
texte d’origine, ces ajouts portent sur la structure de surface et ne modifient
pas la structure du texte.
Les effets sur la compréhension ont aussi été analysés. Haberland (1980) a montré
que :
a) Les temps de lecture s’allongeaient en début et en fin de séquence. Ainsi, le
passage d’une séquence à l’autre semble être identifié.
b) La relation entre l’acquisition du schéma de récit par l’enfant et sa capacité
de compréhension et de production a été établie par les recherches de
Baudet et Denhière (1991). La compréhension et la production des récits
croît proportionnellement à la maîtrise du schéma de récit.
Toutes ces données témoignent en faveur du rôle et de l’efficacité des grammaires de
textes. C’est la raison pour laquelle ces schémas de connaissance ont été intégrés dans nombre
de modèles de la compréhension de textes. Nous citerons le modèle connexionniste de
Mikkulainen (1993) car il est typique de cette tentative de prendre en compte les différentes
connaissances schématiques. Le « DISCERN » (DIstributed SCript processing and Episodic
memoRy Network) est constitué de quatre systèmes : 1) un système d’analyse syntaxique ; 2)
un système de génération ; 3) un système de réponse aux questions et 4) une mémoire. Le
système reconnaît les lettres, code les mots, identifie leur rôle dans la phrase (sujet, verbe
complément), recherche les épisodes, affecte un rôle à chaque épisode et organise les
épisodes. C’est évidemment ces deux dernières fonctions qui sont intéressantes dans le cadre
de ce chapitre. Pour identifier les épisodes, le système utilise les connaissances stockées en
mémoire. Le système possède une mémoire sémantique contenant les traits sémantiques
associés aux lexèmes mais aussi aux scripts les plus habituels. Les traits sémantiques activés
lors de la lecture vont mobiliser le script avec lequel ils sont les plus compatibles. Ce script va
être utilisé pour comprendre le texte lu.
Figure N° 35 Grammaire de récit représentant la structure d’une histoire simple
(Mandler et Johnson, 1977)
Histoire
Structure
événementielle
Cadre
Evèneme
nt
Etats
Début
Evè
nem
ent
Cause
Epi
sod
e
Développemen
t
Réa Cau
ctio se
n
com
plex
Réa
ctio
n
sim
ple
Cause
Episode
2
Episode 1
Cau
se
Evène
ment
interne
Cause
Fin
Ori
enta
tion
vers
le
But
Ten
tati
ve
Etat
interne
Evène
ment
Cau
se
Evène
ment
Evè Em
nem pha
ent
se
Rés
ulta
t
Episode
Etat
Début
Epi
sod
e
Cause
Développem
ent
Cause
Fin
Une application de cette grammaire est proposée par Baddeley (1992) qui reprend un exemple
d’histoire simple proposé par Mandler et Johnson (1977). L’histoire du chien comprend les 11
unités suivantes :
1. Il était une fois un chien qui avait trouvé un morceau de viande
2. et qui le rapportait à la maison dans sa gueule.
3. Sur son chemin, il devait passer sur une planche pour traverser le ruisseau.
4. En traversant, il regarda en bas
5. et il vit son ombre se reflétant dans l’eau.
6. Il pensa qu’il y avait un autre chien avec un autre morceau de viande,
7. et il voulu avoir aussi ce deuxième morceau.
8. Alors, il essaya de mordre l’ombre
9. mais quand il ouvrit sa gueule, le morceau de viande tomba,
10. et il s’enfonça dans l’eau
11. et il ne l’a pas revu.
L’histoire est représentée sur la figure 36. Dans chaque cellule est indiqué le numéro
renvoyant à la phrase du texte.
Figure N° 36. Application de la grammaire d'une histoire simple à l"histoire du
chien. Les connections « et, puis, cause » sont abrégées par E, P et C, V =
événement (Baddeley, 1992).
Histoire du
chien
Cadre
Structure
évènementielle
E
V
V
1
P
V
2
épisode
E
état
3
début
c
c
c
réact
ion
com
V
V
4
dével
oppe
ment
V
5
réact
ion
simp
but
tenta
tive
V6
inter
ne
état
interne
V
c
c
fin
orien
tatio
n
emp
hase
résul
tat
état
11
V
7
V
8
V
9
c
V
10
4. L’utilité des schémas cognitifs
Les schémas cognitifs vont : a) faciliter l’action en automatisant tout ou partie d’entre
elle; b) faciliter la reconnaissance ; c) faciliter la production. Un schéma est donc une
connaissance stockée en mémoire dont l’activation va faciliter la compréhension, la
production ou l’action.
La connaissance des séquences d’actions que je mets en œuvre lorsque je vais au
restaurant me permet d’agir sans effort attentionel, de m’adapter aux circonstances sans être
obligé de partir à zéro. L’automatisation du script c'est-à-dire le fait que je puisse agir sans
effort d’attention est une des qualités de base de ce schéma d’action. Les ergonomes estiment
que plus la tâche est automatisée moins la charge de travail qu’elle implique est élevée.
Chacun de nous fait le matin sa toilette tout en pensant à autre chose. Ce-ci est possible parce
que chacun d’entre nous a stocké en mémoire le script de sa toilette. Doit-on rappeler le
paradoxe du mauvais élève ? Le bon élève répète et automatise les procédures permettant de
faire une multiplication. Le mauvais élève ne fait pas les exercices et donc doit redécouvrir la
procédure chaque fois qu’il est affronté à une multiplication. Le bon élève possède le script de
la multiplication, il l’a automatisé. Le mauvais élève n’a pas acquis ce script.
Les scripts, vont facilement être adaptés aux circonstances. Le script du restaurant va
être adapté sans effort au type d’établissement dans lequel on va prendre son repas (simple ou
gastronomique) et même au pays dans lequel on se trouve puisque la trame générale reste
approximativement constante.
Les schémas cognitifs vont permettre de reconnaître les situations. La connaissance de
la structure d’un récit va permettre de reconnaître, dans le texte lu, non seulement qu’il s’agit
d’un récit mais aussi que dans tel paragraphe l’auteur situe l’action, que dans tel autre il
complique l’intrigue, que les protagonistes manifestent telle intention et poursuivent tel but...
De même, la connaissance de la structure des articles scientifiques va permettre de situer
rapidement à quel endroit se situe telle information. Où chercher la problématique ? Où
chercher la procédure expérimentale ? Où trouver les perspectives et projets de nouvelles
recherches ?
La grammaire de texte c’est à dire les invariants structurels des différentes catégories
de textes, la description de ses différents constituants permettent au lecteur de savoir comment
se déroulent les évènements, où se situe une catégorie d’information. Pour l’auteur le schéma
de texte est le plan autour duquel il va bâtir sa production. Le schéma est donc aussi un guide
de production, production d’actions, production d’activités cognitives.
Comme on le pressent, le but des formations scolaires ou universitaires devrait être
d’apprendre ces schémas de connaissance mais aussi d’entraîner à s’en servir. Ce deuxième
volet, comporte deux aspects : reconnaissance du (ou des) schémas correspondant à la
situation à laquelle on est affronté, utilisation du schéma pour comprendre ou produire.
La connaissance des schémas et des MOPs va nourrir la production d’inférences
nécessaires à l’établissement de la cohérence des représentations et permettre des
anticipations. En effet, dans le texte tout n’est pas explicité. L’auteur fait appel aux
connaissances du lecteur pour compléter ce qui n’est pas explicite.
5. Les inférences nécessaires à la compréhension
Lors de la compréhension du langage, la production d’inférences est continuelle.
L’inférence32 consiste à produire des informations qui ne sont pas exprimées de façon
32
Une description des différentes inférences sera trouvées dans Campion, N. et Rossi, J.P.
(1999). Inférences et compréhension de texte. L’Année Psychologique, 99, 493-527.
explicite dans le texte. La production des inférences fait appel aux connaissances du lecteur et
particulièrement aux différents schémas qu’il a stockés en mémoire. Les inférences élaborées
lors de la lecture ont essentiellement pour fonction d’établir la cohérence de la représentation.
Ainsi, les deux phrases : « Jean désire aller au cinéma ce soir. Il regarde le journal
Télérama. » donnent deux informations apparemment sans rapport. Or, l’adulte français sait
que ce journal donne le programme et les horaires des scéances. Il établit donc une relation
entre les sens correspondant aux deux phrases en reformulant ce texte : « Jean regarde
Télarama pour avoir les programmes de cinéma de ce soir ». C’est d’ailleurs cette formulation
que très probablement il produira lors d’une tâche de rappel, les jours qui suivent la lecture du
texte. Nos connaissances des journaux aboutissent à élaborer une représentation d’une
situation intégrant les informations lues. Les connaissances du monde, les schémas, scripts,
plans et MOP sont à l’origine de ces inférences. Quatre catégories d’inférences sont
habituellement décrites : les particularisations, les inférences sur le thème du texte, les
inférences de buts sur-ordonnés et les prédictions.
A - Les particularisations.
Généralement, le texte ne décrit que partiellement les situations familières. Le lecteur (ou
l’auditeur) utilise ses connaissances du monde pour particulariser ces situations. Les
inférences permettant des particularisations sont au nombre de 6 :
a - Informations complétant la représentation du déroulement d’une
action.
Deux types d’inférence relèvent de cette catégorie :
- Les particularisations de l’instrument. Si je lis « Jean
coupa la viande » je peux inférer sans prendre trop de
risques que l’instrument avec lequel Jean a coupé la viande
est un couteau.
- La particularisation de l’agent. Lorsque je lis : « En pleine
montée, la voiture accéléra » je peux inférer que le
conducteur est l’agent de cette accélération.
b - Mise en relief d’un trait sémantique d’un lexème. C’est le cas, lorsque
l’action décrite met en relief un trait sémantique de l’objet ou du personnage
décrit dans l’action. Lorsque je lis : « La tomate roule », j’active un trait de la
tomate : une tomate est généralement ronde, pour rouler il faut qu’elle soit ronde.
c - Actions ou sous buts concourant à la réalisation d’une action complexe.
« Jean démarra la voiture » implique une série d’actions : monter dans la voiture,
fermer la porte, mettre la clé de contact, positionner le levier de vitesse au point
mort, tourner la clé de contact….
d - Pré-requis ou états de chose conditionnant la réalisation d’une action. La
réalisation de l’action nécessite certains pré-requis : « je prends le chapeau dans
l’armoire de la cuisine » suppose que le chapeau soit dans ce lieu inhabituel qu’est
l’armoire de la cuisine.
e - Propriétés des personnages et objets décrits. Pour qu’une action soit
comprise il est nécessaire que l’agent ou l’objet possèdent certaines propriétés.
Exemple : « Le médecin s’occupe de Paul », une des propriétés du médecin est de
soigner on peut donc inférer que le médecin soigna Paul.
f - Contexte qui contraint un exemplaire d’une catégorie. Le contexte fait que
l’agent ou l’objet de l’action doit posséder certaines propriétés. Exemple : « le
poisson attaqua le nageur », le poisson doit être un prédateur marin type requin.
B - Les inférences précisant le thème d’une partie du texte.
Elles sont au nombre de deux :
a - Les antécédents causaux communs à plusieurs conséquences explicitées
dans le texte. Till, Mross & Kintsch (1988) donnent l’exemple suivant : « Les
habitants de la ville furent stupéfaits de constater que tous les immeubles s’étaient
effondrés, excepté l’Hôtel de la Monnaie ». La cause de ces écroulements est un
événement présenté dans les phrases précédentes, un tremblement de terre.
b - Les informations correspondant à l’entête d’un schéma de connaissances
particularisé dans le texte. Le script « baptême de bateau » comprend les
événements décrits par le texte suivant : « La foule admirative contemplait le
navire flambant neuf. L’orchestre se tus lorsqu’un enfant lança la bouteille contre
la coque. Lorsque celle-ci éclata tout le monde applaudit et la musique repartit de
plus belle. » (Brandsford et McCarrel, 1988).
C - Inférences des buts sur-ordonnés des actions
Nos connaissances nous permettent de percer les intentions des protagonistes des récits,
d’inférer les buts qu’ils poursuivent. Ces buts concernent aussi bien des actions particulières
que des ensembles d’actions. La lecture des deux phrases suivantes : « Il cherche un stylo. Il
prend une feuille de papier. » nous permet d’inférer sans difficultés que le but du protagoniste
est d’écrire. Le but est aussi bien ce qui motive l’action que l’état qui est atteint lorsque
l’individu réussit à réaliser ce qu’il souhaitait. Dans l’exemple précédent, le but de l’action est
d’écrire, ce qui la motive est aussi d’écrire. Mais dans un contexte particulier le fait d’écrire
peut être motivé par le besoin de fixer une information en mémoire ou d’archiver cette
information. Le but de l’action et sa motivation peuvent alors être dissociés. L’inférence peut
donc porter aussi bien sur le but de l’action que sur sa motivation.
D - Les prédictions
Les prédictions portent sur les anticipations concernant les conséquences non explicites
des actions décrites dans le texte. Ces anticipations concernent toutes les conséquences :
a - Evénements qui vont se produire, cause explicite « je pousse la voiture dans
le ravin. », conséquence inférée : « elle va s’écraser dans la mer ou sur les
rochers ».
b - Les états qui sont provoqués, cause explicite « La découverte de la mort de
sa mère. » conséquence inférée « il a de la peine ».
c - Les actions, cause explicite : « le stylo tombe par terre », action inférée : « il se
penche pour le ramasser ».
Les prédictions concernent des conséquences à venir, c’est ce en quoi elles se distinguent des
particularisations ou des thèmes pour lesquels, l’information inférée est généralement
antérieure ou simultanée par rapport aux informations lues dans le texte.
Le processus de génération des inférences repose sur la récupération en mémoire à
long terme de schémas de connaissances. L’existence d’un script va ainsi permettre de
compléter ce qui n’est pas explicité dans le texte. Cette façon de compléter peut aussi bien
porter sur les buts, les moyens, les protagonistes, les propriétés des objets et des personnages
que sur des scènes. C’est dire que le système cognitif va chercher en mémoire à long terme
toutes les informations qui vont lui permettre de comprendre le texte et de construire une
représentation mentale cohérente de son contenu.
Conclusion
La présentation qui vient d’être faite montre que les psychologues ont développé deux
catégories de schémas : a) les structures théoriques telles que les grammaires de textes ou les
règles logiques étudiées par Piaget ; b) les connaissances qui sont décrites par les MOPs. Dans
le premier cas, on dispose d’une grille dont les items seront actualisés, prendront des valeurs
singulières dans tel événement particulier. Lors de la lecture d’un texte ou de sa production je
cherche à mettre en face de chaque rubrique les informations correspondantes. Je situe le
premier épisode, j’identifie l’état initial, je comprends les complications et je suis capable de
décrire l’état final. Dans l’autre (les MOPs) il s’agit de connaissances directes qui peuvent
être modulées selon les circonstances. L’intégration des connaissances de type MOP dans le
réseau sémantique ne semble pas poser difficulté de même, la structuration des connaissances
lexicales sur la base de frames peut être discutée, en revanche, l’intégration de structures plus
générales telles que les grammaires de récit ou les structures logiques n’est pas sans poser
problème. Comment accéder au schéma de récit ? Est-il associé au concept récit ? A sa
définition ? Est-il activé dès que le lecteur ou l’auditeur comprend qu’il s’agit d’une histoire ?
Comment un contenu va-t-il activer une rubrique du schéma de texte ? Questions auxquelles il
est nécessaire de répondre mais qui sont actuellement peu documentées. Ce qui est acquis
c’est que les signifiés associés à des lexèmes peuvent être intégrés ou associés à des structures
de type schématiques.
Il est habituellement admis que la lecture d’un lexème active les traits sémantiques
(dénotatifs, référentiels et connotatifs) qui lui sont associés. La lecture du lexème pomme
active ma connaissance de la pomme. Mais la lecture de la phrase : « A la fin du repas il prit
comme dessert une pomme » peut, sans doute, dans certaines circonstances, activer le script
correspondant au repas et dans ce script, la rubrique particulière correspondant au dessert.
Ainsi, lors de lecture d’une phrase les mots n’activeraient pas seulement les signifiés qui leur
sont associés mais activeraient aussi les scripts, MOP ou schémas de connaissances stockés en
mémoire à long terme. La mémoire sémantique intégrerait alors ces différentes catégories de
connaissances. Trois organisations sont possibles :
- Les schémas, scripts et MOP font partie intégrante de la mémoire sémantique donc à
chaque lexème seraient associés ses signifiés, ses scripts, ses MOP… Le lexème serait
alors l’unité autour de laquelle s’organiserait les schémas, scripts…
- Les schémas et les scripts seraient au centre de l’organisation de la mémoire sémantique,
les signifiés (traits sémantiques dénotatifs, référentiels et connotatifs) seraient associés aux
schémas et scripts.
- Les signifiés seraient autonomes par rapport aux différentes catégories de schémas. Le
répertoire des signifiés serait différent du répertoire des schémas. Il peut même être
envisagé que chaque catégorie de schéma soit stockée dans un répertoire autonome.
L’autonomie des répertoires n’exclurait pas les liens permettant de connecter les différents
lieux de stockage des connaissances.
Le choix entre ces différentes organisations sera étudié dans le dernier chapitre.