Apprentissage implicite en musique : Théorie et Modèles

Transcription

Apprentissage implicite en musique : Théorie et Modèles
Intellectica, 2008/1, 48, pp. 13-26
Apprentissage implicite en musique : Théorie et Modèles
Emmanuel Bigand et Charles Delbé
RESUME : L’apprentissage implicite désigne une forme d’apprentissage durant
laquelle le sujet intériorise tacitement la structure des stimulations qui lui parviennent
de l’environnement. Dans cet article, nous montrerons qu'il est très probable que les
connaissances implicites acquises par l’auditeur sans formation musicale constituent
un aspect tout à fait essentiel de l’expérience musicale. La musique constitue une
structure écologique de notre environnement qui présente de nombreux intérêts pour
l’étude des apprentissages implicites. Les réponses que la psychologie pourra apporter
ici auront des implications non seulement pour les théories cognitives, mais également
pour les sciences de la musique. Enfin, afin de comprendre quel type d’architecture
cognitive se prête le mieux à la représentation des connaissances musicales implicites,
nous décrirons un modèle connexionniste qui aide à la compréhension des
connaissances musicales qui peuvent être acquises implicitement.
Mots Clés : Apprentissage
connexionniste
Implicite,
Cognition
musicale,
Modélisation
ABSTRACT: Implicit Learning in Music: Theory and Models. Implicit learning is a
form of learning in which one tacitly internalizes the structure of the stimulations
received from the environment. In this article, we will show that it is highly probable
that this implicit knowledge acquired by the listener without formal training is an
essential aspect of musical experience. Music, as an ecological structure of our
environment, is a highly interesting material for implicit learning studies. The answers
that psychology will bring here will have implications in cognitive sciences, but also
in music sciences. Finally, in order to understand what type of cognitive architecture
is best suited to the representation of implicit musical knowledge, we will describe a
connexionist model which helps to understand the musical knowledge which can be
acquired implictly.
Keywords: Implicit learning, Musical cognition, Connexionnist modeling
L’APPRENTISSAGE IMPLICITE EN PSYCHOLOGIE
Valeur adaptative de l'apprentissage implicite
L’apprentissage implicite désigne une forme d’apprentissage durant
laquelle le sujet intériorise tacitement la structure des stimulations qui lui
parviennent de l’environnement. L’apprentissage est qualifié d’implicite parce
que le sujet apprend sans en avoir conscience ni même l’intention et qu’il ne
peut pas expliciter la nature des connaissances acquises. Reber (1992)
Université de Bourgogne, CNRS UMR 5022 Laboratoire d’Etude de l’Apprentissage et du
Développement, Boulevard Gabriel; F-21000 Dijon, France. Tel. +33 (0)380395782; Fax. +33
(0)380395767. [email protected]
Université de Bourgogne, CNRS UMR 5022 Laboratoire d’Etude de l’Apprentissage et du
Développement, Boulevard Gabriel; F-21000 Dijon, France. Tel. +33 (0)380393723. [email protected]
© 2008 Association pour la Recherche Cognitive.
14
E. BIGAND, C. DELBE
considère cette forme d’apprentissage comme un processus cognitif
fondamental qui permet d’acquérir des informations sur l’environnement qui
sont trop complexes pour pouvoir être accessibles par le raisonnement
hypothético-déductif. Les processus d’apprentissage implicite présentent donc
une valeur adaptative fondamentale puisqu’ils entrent en scène lorsque les
informations sont trop complexes pour être appréhendées par la pensée
consciente. L’apprentissage des langues étrangères est un exemple schématique
permettant de contraster les deux formes d’apprentissage. L’apprentissage
explicite porte sur l’acquisition volontaire et consciente d’un ensemble
d’informations (sémantiques et syntaxiques) sur le système linguistique. Ces
informations sont représentées sous un format symbolique qui se prête à une
utilisation volontaire de la part du sujet. Dans bien des cas, et notamment
lorsque nous évoluons dans un pays étranger, nous optons rapidement vers
d’autres stratégies d’apprentissage, qualifiées parfois d’apprentissage par
imprégnation. Ces stratégies reposent sur l’intériorisation tacite d’un ensemble
d’éléments linguistiques qui, sans que nous en ayons véritablement conscience,
vont rapidement nous permettre de comprendre puis de nous exprimer dans la
langue en question. L’acquisition d’une langue maternelle repose
principalement sur ce type d’apprentissage implicite : dès les premiers mois, le
nourrisson apprend les structures de sa langue selon ce processus, sans bien
évidemment avoir la moindre conscience de ce qu’est un mot, un article, un
verbe et un complément d’objet.
Les apprentissages implicites présentent d’autres qualités cognitives
fondamentales pour l’adaptation qui les distinguent définitivement des
apprentissages explicites. Les connaissances acquises sont beaucoup plus
stables en mémoire (Allen & Reber, 1980) et elles résistent à des atteintes
cognitives et neurologiques sévères (Abrams & Reber, 1988 ; Reber,
Walkenfeld, & Hernstadt, 1991). Ainsi, il a été montré que des sujets souffrant
de troubles graves de la mémoire (consécutifs à des maladies neurodégénératives telles que la maladie d’Alzheimer, par exemple) peuvent
continuer à acquérir de nouvelles informations sur l’environnement par des
stratégies d’apprentissage implicite. De la même façon, on sait que le
vieillissement cognitif se traduit par une diminution massive des
apprentissages explicites. Pour autant, les personnes âgées présentent souvent
des performances cognitives similaires à celles des jeunes adultes sains,
lorsque les deux groupes sont placés dans une situation d’apprentissage
implicite. Ces quelques exemples suffiront à montrer que l’apprentissage
implicite est un processus fondamental d’acquisition de connaissances
beaucoup plus robuste qui intervient tôt dans l’ontogenèse et résiste mieux au
vieillissement et à toute autre forme d’atteinte cognitive. Par contre, le
principal inconvénient des ces processus d’apprentissage est de fournir aux
sujets une connaissance qui demeure très difficile à utiliser explicitement1.
Pour un lecteur non averti, ces processus d’apprentissage pourraient
évoquer les théories comportementales (béhavioristes) de l’apprentissage qui
dominaient la psychologie dans la première moitié du XXième siècle. Ce courant
de pensée, souvent réduit aux théories dites du conditionnement, se distinguent
1
Notez que Perruchet et Vinter (2002) rejettent l’idée d’une distinction fonctionnelle entre
apprentissage implicite et explicite, en faveur d’une auto-organisation progressive (associée à une
consience graduelle) des représentations mentales.
Apprentissage implicite en musique : Théorie et Modèles
15
bien des théories actuelles de l’apprentissage implicite dans la mesure où ces
dernières stipulent (et démontrent) que l’apprentissage se traduit par
l’acquisition de connaissances (et non de réflexes conditionnés). A ce titre,
elles entrent bien dans le champ classique de la psychologie cognitive : leur
spécificité est simplement de soutenir que les connaissances acquises sont
représentées dans un format qui présente de très nombreux avantages cognitifs
mais qui se prête très mal à une utilisation volontaire par la pensée consciente.
Nous reviendrons sur ce point dans la dernière section de cet article en
montrant plus en détail comment ces connaissances peuvent être représentées
(de façon distribuée) dans des systèmes artificiels. Il deviendra également clair
au cours de cet article que les connaissances acquises par apprentissage
implicite portent sur des niveaux d’organisation de l’environnement d’une
complexité considérable, sans aucune comparaison possible avec les couplages
stimulus-réponses envisagés par le courant béhavioriste de la psychologie.
Quelques situations expérimentales d’appentissage implicite
Plusieurs situations expérimentales ont été élaborées pour sonder le
fonctionnement des apprentissages implicites. La plupart d’entre elles peuvent
être reprises sans difficulté dans le domaine musical. L’un des paradigmes les
plus connus (le paradigme d'apprentissage de grammaire artificielle ; Reber,
1967, 1989, 1992) consiste à utiliser une grammaire à état fini comparable à
celle représentée Figure 1. Cette grammaire régule la façon dont une série de
symboles sans signification particulière pour le sujet peuvent être combinés en
séquences (phrases). Dans le cas présent, la séquence de lettres ABACD serait
une séquence grammaticale, mais pas la séquence ABCD, qui enfreint une
règle de la grammaire. En effet, la lettre C ne peut pas intervenir après la lettre
B. Cette grammaire est dite artificielle car les règles qui la constituent sont
arbitraires et ne correspondent à rien de ce que le sujet puisse déjà connaître.
De plus, les séquences qu’elle produit sont sans lien direct avec les
connaissances antérieures du sujet. L’expérience procède ensuite en deux
phases : dans une phase initiale, on présente aux sujets des séquences
grammaticales, c’est à dire qui respectent les règles de la grammaire. Dans
cette phase, la tâche des sujets varie en fonction de la nature de l’apprentissage
que l’on veut solliciter. Dans une condition d’apprentissage explicite, les sujets
seront informés qu’il existe des règles qui sous-tendent ces séquences de lettres
et qu’ils doivent les identifier. Dans une condition d’apprentissage implicite,
les sujets pourraient ainsi être simplement invités à compter le nombre de
lettres que contient chaque séquence. La consigne n’induit donc aucune
recherche de règles de leur part. Dans la seconde phase de l’expérience, les
sujets voient de nouvelles séquences de lettres : la moitié respecte les règles de
la grammaire, l’autre moitié enfreint l’une ou l’autre des règles. Dans ce cas,
l’erreur grammaticale porte sur un seul enchaînement invalide de lettres. Les
sujets sont informés pour cette seconde phase de l’étude que seule la moitié des
séquences a été produite par le même programme grammatical qui a généré les
séquences de la première phase. Leur tâche consiste alors à identifier les
séquences grammaticales. Généralement, le désarroi des sujets de la condition
d’apprentissage implicite est immense à l’énoncé de cette consigne, et la quasi
totalité a l’impression de répondre au hasard. Mais leur étonnement devient
plus grand que leur désarroi lorsqu’ils constatent en fin d’expérience avoir
répondu avec des taux de réussite bien supérieurs au hasard (variant de 54 à
70% de réussite en moyenne). Ces taux demeurent le plus souvent supérieurs
ou égaux aux taux de réussite des sujets ayant travaillé dans la condition
16
E. BIGAND, C. DELBE
d’apprentissage explicite. En général, les sujets ayant appris implicitement ne
parviennent pas à expliciter les règles qui leur ont permis d’avoir de si bonnes
performances. Selon Reber, ces sujets auraient acquis une connaissance
implicite des règles de la grammaire artificielle (Reber, 1967, 1989).
Des résultats similaires ont été rapportés avec des sujets atteints de
différentes pathologies cognitives (amnésie, notamment), des bébés de
quelques mois, et il a été montré que des sujets âgés présentent des
performances tout à fait comparables à celles de jeunes adultes sains dans ce
type de situation expérimentale. Enfin, les études sur le transfert
d’apprentissage ont montré que les sujets ayant été exposés à des séquences
grammaticales de lettres peuvent ensuite identifier parmi des séquences de sons
(les lettres sont remplacées par des sons) celles qui respectent les règles de la
grammaire. Les performances dans ces tâches de transfert d’apprentissage des
lettres vers les sons démontrent que la connaissance acquise implicitement est
représentée sous un format relativement abstrait.
Les études sur l’apprentissage implicite réalisées en laboratoire ont le plus
souvent utilisé des alphabets restreints d’items très simples (lettres, positions
d’un spot lumineux sur un écran, symboles abstraits, dessins modernes,
nombres, sons purs). Les résultats obtenus ont toutefois été confirmés par
d’autres études utilisant des matériaux ayant une plus grande signification
écologique. Ainsi, Saffran et ses collaborateurs ont présenté aux sujets des
séquences continues de paroles de synthèse sans signification (bupada,
dutaba,…). Les syllabes de ce langage artificiel étaient concaténées de telle
façon que leurs probabilités transitionnelles permettaient (en théorie) de
distinguer des mots au sein de ce flux continu de parole (Saffran, Aslin, &
Newport, 1996). L’écoute passive (sans intention de trouver les mots du
langage) de ce flux continu de parole pendant quelques minutes suffit pour
conduire ensuite les sujets à différencier les mots des non-mots (c'est-à-dire des
combinaisons de syllabes qui ne sont pas apparues pendant la phase
d'exposition) à des taux bien supérieurs au hasard. Qui plus est, de jeunes
bébés de huit mois parviennent à segmenter le flux continu de parole sur la
base des probabilités transitionnelles après seulement deux minutes d’écoute
(Saffran, Aslin, & Newport, 1996 ; Aslin, Saffran, & Newport, 1998). Ce type
de résultat souligne l’efficacité, la précocité et la robustesse des processus
d’apprentissage implicite. Il faut reconnaître que la complexité des stimuli
présentés dans ce type d’expérience est bien moindre que la complexité des
stimulations de notre environnement naturel (le langage ou la musique, pour ne
citer que ceux la). Toutefois on peut considérer que ces expériences de
laboratoire reproduisent de façon réduite un mécanisme qui se réalise à grande
échelle dans l’environnement naturel : si en quelques minutes les sujets
parviennent à intérioriser des structures dont l’organisation (bien que d’une
complexité modeste) leur parait toutefois difficile à appréhender
consciemment, on peut raisonnablement penser qu’ils seront capables, avec
beaucoup plus de temps d’apprentissage, d’intérioriser les structures complexes
de l’environnement sous l’effet de la simple exposition à cet environnement.
Exemples d'apprentissage implicite en musique
La musique constitue une structure écologique de notre environnement qui
présente de nombreux intérêts pour l’étude des apprentissages implicites. Tout
d’abord, le degré de complexité des organisations musicales peut être, dans
certains cas, considérables. Ensuite, les organisations musicales et les règles
Apprentissage implicite en musique : Théorie et Modèles
17
qui les sous-tendent sont de toute évidence conçues pour ne pas être
perceptibles consciemment par l’auditeur. Celui doit ressentir l’effet de ces
organisations sans pour autant pouvoir les déceler explicitement. L’effet
psychologique de la musique proviendrait du traitement implicite d’un
ensemble très sophistiqué de relations structurelles qui se déploient à plusieurs
échelles temporelles sans que nous en ayons une réelle conscience (Meyer,
1956 ; Lerdahl & Jackendoff, 1983). Il est donc très probable que les
connaissances implicites acquises par l’auditeur sans formation musicale
constitue un aspect tout à fait essentiel de l’expérience musicale.
Plusieurs questions se posent dès lors, questions qui peuvent contribuer
autant à la psychologie des apprentissages qu’aux sciences de la musique. Les
processus d’apprentissage implicite peuvent-ils être suffisamment élaborés
pour permettre à l’auditeur sans formation musicale spécifique (que nous
désignerons par “non musicien”, par commodité dans la suite de cet article)
d’avoir une connaissance (non explicite) de la musique aussi élaborée que celle
d’un expert ? Autrement dit, l’auditeur non musicien peut-il être musicalement
expert même s’il demeure un analphabète musical, pour reprendre l’expression
de R. Francès (1958) ? Etant donné la puissance des processus d’apprentissage
implicite constatée dans tous les domaines de la cognition, il semble qu’une
réponse positive soit tout à fait envisageable. On voit mal en effet pourquoi les
processus d’apprentissage implicite ne s’appliqueraient pas en musique avec la
même vigueur. L’ensemble des travaux expérimentaux engagés dans notre
laboratoire, et dans de nombreux autres (cf. Bigand & Poulin-Charronnat,
2006, pour une revue), apporte de sérieux arguments en faveur de cette réponse
positive. Cette réponse, qui va nettement à l’encontre des croyances les plus
fréquemment répandues, pourrait conduire à repenser les modes
d’apprentissage de la musique qui restent majoritairement basés sur des
stratégies explicites. Il est probable, au regard des connaissances actuelles, que
ces stratégies soient faiblement efficaces, notamment chez les jeunes enfants.
On peut également se demander si les processus d’apprentissage implicite
sont suffisamment puissants pour permettre l’intériorisation des systèmes
musicaux qui apparaissent trop complexes, y compris aux yeux des experts.
Ainsi, le grand débat sur la complexité des musiques contemporaines a souvent
conduit à souligner que certaines organisations musicales (comme la musique
sérielle) dépasseraient l’ordre de ce qui peut être appréhendé par le cerveau
humain (Francès, 1958). Des contraintes cognitives fondamentales pèseraient
sur les systèmes musicaux. Les systèmes ne respectant pas ces contraintes
seraient voués à disparaître tôt ou tard (Lerdahl, 1988 ; McAdams, 1989). Là
encore, les recherches actuelles sur l’apprentissage implicite inviteraient plutôt
à la prudence. Si le sujet peut apprendre en peu de temps des structures aussi
artificielles que celles présentes dans les grammaires artificielles de la Figure
1, on voit mal pourquoi il ne parviendrait pas à intérioriser implicitement des
structures musicales d’une grande complexité, si on lui laisse un temps
d’exposition à la mesure de cette complexité. A ce titre, les problèmes cognitifs
posés par les musiques contemporaines offrent un terrain d’investigation
scientifique de l’apprentissage implicite prometteur. Certains de ces systèmes
constituent un véritable défi pour ces théories de l’apprentissage. Les réponses
que la psychologie pourra apporter ici auront des implications non seulement
pour les théories cognitives, mais également pour les sciences de la musique.
Enfin, il restera à savoir en quoi consistent précisément les connaissances
musicales qui peuvent être acquises implicitement. Il s’agit de comprendre quel
18
E. BIGAND, C. DELBE
type d’architecture cognitive se prête le mieux à la représentation des
connaissances musicales implicites.
Répondre à l’ensemble de ces questions dépasserait le cadre de cet article.
Le lecteur curieux de consulter l’ensemble des travaux portant sur les
apprentissages implicites étudiés dans le cadre de la musique tonale trouvera
une synthèse en langue anglaise dans Bigand et Poulin-Charronnat (2006), et
en langue française dans Pineau et Tillmann (2001). Ces travaux empiriques
sur la musique tonale ont montré, à la suite des travaux initiés par R. Francès
(1958), puis repris par C. Krumhansl (1990), que l’auditeur parvient très tôt à
intérioriser les relations complexes que les notes, les accords et les tonalités
entretiennent entre eux. Les travaux de Trehub et de son équipe démontrent
que des bébés de 6 mois (cf. pour une synthèse en français, Trainor & Trehub,
1994) ont déjà une représentation fine des éléments structuraux de la syntaxe
musicale occidentale. Les travaux entrepris ces dernières années dans notre
laboratoire ont mis en évidence que les connaissances des auditeurs non
musiciens sur la fonction tonale de notes et des accords pouvaient se révéler
aussi sophistiquées que celles mises en oeuvre par des musiciens en troisième
cycle de conservatoire. L’aspect le plus surprenant de ces travaux fut de
constater que ces connaissances implicites pouvaient être mobilisées quasiment
aussi rapidement chez ces deux groupes d’auditeurs. Les études sur l’amorçage
harmonique (cf. Tillmann & Poulin-Charronnat, ce volume), indiquent en effet
que quelques centaines de millisecondes suffisent aux deux groupes
d’auditeurs pour traiter des changements fins de fonction harmonique des
accords en contexte. En d’autres termes, la sophistication des connaissances
acquises par apprentissage implicite dans le cas de la musique tonale porte non
seulement sur leur contenu (ces connaissances ne sont pas rudimentaires et
portent sur les aspects cruciaux du système musical) mais aussi sur l’efficacité
de leur mobilisation (ces connaissances sont mobilisées quasiment
immédiatement). Enfin, il a été observé que ces connaissances sont acquises et
mobilisées très tôt chez le jeune enfant (cf. Schellenberg, Adachi, Purdy, &
McKinnon, 2002 ; Schellenberg, Bigand, Poulin-Charronnat, Garnier, &
Stevens, 2005) et qu’elles peuvent continuer à influencer le comportement de
patients cérébrolésés ayant perdu toute capacité explicite à percevoir des
structures élémentaires dans le musique (Tillmann, 2005).
Les études sur l’apprentissage implicite de la musique ont également abordé
l’apprentissage de nouveaux systèmes musicaux. Certains travaux ont répliqué
avec des sons musicaux les études initiales de Reber sur l’apprentissage de
grammaires artificielles (Bigand, Perruchet, & Boyer, 1998). D’autres ont
directement abordé l’apprentissage de systèmes musicaux réels. Ce fut le cas
notamment des travaux sur l’apprentissage de la musique sérielle, introduite
par Arnold Schoenberg au début du XXième siècle. Une pièce musicale sérielle
est basée sur un ordonnancement temporel spécifique des 12 notes de la
gamme chromatique. Cet ordre temporel définit la série de la pièce musicale.
Cette série peut être modifiée par quatre principes de transformation (la
transposition, la rétrogradation, l’inversion et la rétrogradation inverse). Les
pièces musicales sérielles résultent de la combinaison complexe de ces
différentes transformations de la série à la base de l’oeuvre. En théorie, ces
transformations sont supposées assurer un équilibre suffisant entre l’unité
perceptive de l’oeuvre et sa variété. On sait que la pertinence esthétique et
cognitive de ce système de musique sérielle a été questionnée tout au long du
XXième siècle. La contribution de la psychologie expérimentale à ce débat fut
Apprentissage implicite en musique : Théorie et Modèles
19
de vérifier si l’unité perceptive de la série était bien réelle pour les auditeurs.
Les premiers résultats furent peu encourageants. Dans son étude de 1958,
Francès (expérience 6) présentait aux auditeurs des extraits musicaux qui
dérivaient strictement d’une série donnée. Après cette phase d’apprentissage,
les sujets entendaient de nouveaux extraits musicaux et ils devaient identifier
quelques extraits qui ne respectaient pas les règles de la série. Les résultats
rapportés montrent que les auditeurs ont de grosses difficultés à détecter les
extraits d’oeuvres intrus ne correspondant pas à la série initiale. Qui plus est,
les auditeurs experts en musique sérielle n’avaient pas de meilleurs résultats
que les auditeurs sans formation musicale ; ils tendaient même à en avoir des
pires. Pour remarquable qu’elle soit, cette première étude expérimentale ne
peut être conclusive sur les problèmes d’apprentissage implicite de la musique
sérielle. En effet, les extraits qui ne respectaient pas la série étaient construits
sur une série qui était structurellement très proche de la série initiale : les six
premières notes de la série leurre étaient identiques aux 6 premières notes de la
série initiale, et les 6 suivantes correspondaient à une forme inversée de la série
initiale.
Nous avons repris récemment cette étude avec le compositeur D. D’Adamo
en utilisant un paradigme identique à celui des études sur l’apprentissage des
grammaires artificielles. Les auditeurs écoutaient 20 extraits musicaux
composés selon les règles sérielles résumées ci dessus. Nous leurs présentions
ensuite 20 paires d’extraits. Les deux éléments de la paire avaient le même
rythme et globalement le même contour. Ils étaient donc perceptivement très
semblables: certains auditeurs pensaient d’ailleurs que le second élément était
une répétition du premier. Toutefois, seul l’un de ces extraits respectait les
règles de la série initiale. Les sujets devaient trouver quel était l’extrait en
question. Les auditeurs sans formation musicale ont obtenu des taux de réussite
bien supérieurs au hasard dans cette tâche (60%), identiques à ceux obtenus
avec les étudiants de cycle 3 des Conservatoire Nationaux de Région. Des
performances tout aussi élevées ont été obtenues lorsque des versions
rétrogrades inversées de la série étaient présentées dans la phase de test. Ces
résultats suggèrent que les régularités induites par les principes de la série
peuvent être rapidement intériorisées de façon implicite par tout un chacun (la
phrase d’apprentissage de l’expérience durait 20 minutes). Ils ne permettent
pas bien sûr de valider la qualité esthétique de la musique sérielle, mais
démontrent sa validité cognitive. Les règles sérielles induisent des régularités
statistiques entre les notes à différentes échelles de temps, que le sujet peut
apprendre implicitement, même si elles sont sans doute très difficiles à
discerner de façon explicite.
Modéliser les apprentissages implicites en musique
Dans cette dernière section, nous souhaitons présenter une architecture
possible pour modéliser la façon dont des connaissances musicales peuvent
être acquises implicitement. En sciences cognitives plusieurs architectures ont
été élaborées pour proposer des alternatives aux représentations symboliques
sous forme de règles “si-alors”, souvent utilisées pour modéliser la cognition
consciente. Une architecture cognitive est une théorie (potentiellement) unifiée
du fonctionnement de l'esprit humain, reposant sur l'extraction et l'utilisation de
règles explicites sur des symboles. Bien qu'adaptés à la modélisation de la
cognition consciente, les modèles symboliques de la modélisation cognitive
semblent problématiques pour simuler l'apprentissage musical non
académique. En sciences cognitives, plusieurs architectures ont été élaborées
20
E. BIGAND, C. DELBE
pour proposer des alternatives aux modèles symboliques traditionnels de
l'intelligence artificielle. Le plus souvent, la connaissance est distribuée dans
un réseau et émerge des activations qui vont s’y propager.
L'approche connexionniste de la cognition musicale postule qu'il est
possible de capturer certains aspects du comportement musical humain dans un
système artificiel basé sur l'architecture et la dynamique du cerveau. Ces
modèles connexionnistes permettent l'investigation des processus, tels que
l'apprentissage et la généralisation, et des types de représentations mentales,
telles que des distributions non-symboliques d'activation, qu'il était difficile
voire impossible d'étudier avec les modèles classiques de la psychologie. Les
réseaux de neurones artificiels sont développés en imitant la façon dont une
multitude de neurones fortement interconnectés traitent l'information dans le
cerveau. Ces modèles ont largement été utilisés dans le domaine de la musique,
par exemple dans les domaines de la perception de la hauteur (Sano & Jenkins,
1991), la reconnaissance d’accords (Laden & Keefe, 1989), la perception des
structures tonales (Bharucha & Stoeckig, 1986 ; Bharucha & Todd, 1991 ;
Leman, 1991 ; Griffith, 1993), la perception du temps musical (Desain &
Honing, 1989), du timbre (Cosi, De Poli, & Lauzzana, 1994), ou l’extraction et
reconnaissance de thèmes (Page, 1993). Les réseaux de neurones artificiels ont
aussi été utilisés en composition (Mozer, 1991), improvisation jazz
(Toiviainen, 1995), ou analyse de style (Scarborough, Miller, & Jones, 1991 ;
Soltau, Schultz, & Westphal, 1998).
L'un des modèles les plus influents dans le domaine musical a été proposé
par Bharucha & Stoeckig (1986) puis développé par Tillmann, Bharucha, &
Bigand (2000). MUSACT (MUSical ACTivation) est composé de trois
couches de cellules représentant les 12 hauteurs chromatiques, 24 accords
majeurs et mineurs et 12 tonalités (Figure 2a). Une représentation locale est
utilisée, chaque cellule codant un concept unique. La connaissance de la
hiérarchie tonale occidentale est représentée dans le pattern d'interconnections
de ces différentes cellules. Ainsi, chaque cellule codant la hauteur est
connectée à tous les accords dont elle est membre, ces cellules accords étant
elles-mêmes connectées à toutes les cellules tonalités les impliquant. La
présentation d'une stimulation, consistant en une suite de triades, active les
cellules hauteurs correspondantes. Cette activation se propage vers les cellules
accords, qui activent les cellules tonalités (cf Figure 2b pour la triade do-misol). Le pattern d'activation se réverbère alors dans le réseau et ces activations
réverbérantes vont se propager aux unités accords et notes qui sont hautement
probables dans les tonalités activées par la triade initiale. A un stade
d'équilibre, les propriétés émergentes des valeurs d'activation des différentes
cellules représentent les connaissances musicales tonales activées dans le
réseau par la triade initiale. Ces activations prédisent les performances
humaines. Les unités fortement actives dans le réseau correspondent à des
unités musicales qui sont perçues par les auditeurs comme s’accordant
musicalement bien avec la triade initiale, ou pour lesquels on observe des effets
d’attentes perceptives chez l’auditeur (cf Tillmann et Poulin-Charronnat, ce
volume).
L'intérêt de ce modèle réside dans l'aspect temporel du traitement des
évènements musicaux. Pour une séquence d'accords, l'activité due à chaque
accord est cumulée. A un stade d'équilibre, l'activité décroît de façon
exponentielle en fonction du temps. Si un autre événement apparaît avant que
cette activité ne soit presque nulle, la nouvelle activité est ajoutée à l’activité
Apprentissage implicite en musique : Théorie et Modèles
21
résiduelle due aux évènements précédents. Cette accumulation d’activation est
fonction de la structure harmonique de la séquence entière d’évènements, et va
suffire pour parvenir à simuler les effets de contexte (la fonction d’un
événement musical dépend du contexte d’ensemble dans lequel il apparaît) qui
sont essentiels dans la musique tonale. Cette dynamique permet de simuler de
nombreux aspects séquentiels de la perception harmonique tonale, tels que la
formation d'attentes d'évènements particuliers.
De nombreuses simulations d'amorçage harmonique ont été conduites sur
ce modèle. Les attentes harmoniques des sujets humains, reflétées dans les
patterns d'activation, ont été simulées dans le contexte d'un accord seul
(Bharucha & Stoeckig, 1987 ; Tekman & Bharucha, 1998 ; Tillmann &
Bharucha, 2002), mais aussi dans le cas de contextes harmoniques plus longs,
expliquant la facilitation de traitement des accords reliés (Tillmann, Bigand, &
Pineau, 1998 ; Bigand, Madurell, Tillmann, & Pineau, 1999 ; Tillmann &
Bigand, 2001). De plus, les interactions entre contextes local et global étudiées
par Tillmann, Bigand et Pineau (1998) ont été simulées. Le traitement d'un
accord est facilité quand il est localement ou globalement relié au contexte
harmonique. Cet effet facilitateur décroît pour les accords reliés uniquement
localement ou globalement au contexte, et est minimum pour les accords non
reliés localement ni globalement. Notons que l'effet de facilitation de
traitement d'un accord est une conséquence de la hiérarchie tonale, mais pas de
l'organisation temporelle des accords dans une séquence. Une manipulation
consistant à mélanger les accords d'une séquence harmonique influencera peu
le degré d'activation des cellules cibles. En conséquence, le modèle prédit une
absence d'effet de l'ordre temporel des accords sur le temps de traitement d'un
accord cible. Tillmann et Bigand (2001) ont effectivement montré un effet du
contexte harmonique global sur le traitement d'accords attendus et non
attendus, indépendamment de l'organisation temporelle des accords du
contexte.
L’intérêt de ce modèle, qui reste bien évidemment trop simple pour rendre
compte de tous les aspects subtils que peut revêtir la perception de la musique,
est d’illustrer comment une architecture de connaissances distribuées peut
rendre compte de façon élégante et économique d’un ensemble varié de
réponses perceptives à la musique tonale. Cette architecture ne résulte pas
d’une programmation ad hoc du scientifique : on peut montrer qu’elle émerge
progressivement sous l’effet de l’exposition passive du modèle à des séquences
musicales obéissant aux règles du système tonal (Tillmann, Bharucha, &
Bigand, 2000).
D’autres architectures ont été développées pour rendre compte des
apprentissages implicites en musique. Certaines seraient plus pertinentes pour
les musiques contemporaines. D’une façon générale, ces architectures reposent
sur l’idée que la connaissance musicale implicite résulte de l’extraction des
régularités statistiques présentent dans les oeuvres. Par exemple, Bigand,
Perruchet et Boyer (1998) ont montré que l'acquisition d'une grammaire
artificielle de timbres chez des auditeurs non-musiciens pouvait s’expliquer de
cette façon. Les probabilités conditionnelles associant des hauteurs
temporellement consécutives jouent aussi un rôle dans les aspects prosodiques
de la musique, servant d'indices permettant la segmentation des éléments d'un
flux musical en unités pertinentes (Saffran, Johnson, Aslin, & Newport, 1999 ;
Tillmann & McAdams, 2004), ainsi qu'à la formation de catégories mélodiques
(Delbé, Bigand, & French, 2006).
22
E. BIGAND, C. DELBE
Dans l'environnement, la probabilité d'apparition d'un évènement est
dépendante du contexte. Huron (2006) a relevé de nombreux exemples de ces
dépendances dans la musique tonale. La probabilité conditionnelle est
caractérisée par la distance contextuelle et la taille contextuelle. Certains états
sont influencés par le voisinage contextuel immédiat (distance contextuelle
faible), d’autres par des évènements distants dans le temps (distance
contextuelle importante). La taille contextuelle (ou ordre de la probabilité)
caractérise le nombre d’états influençant cette probabilité conditionnelle ; une
série aléatoire, dans laquelle un évènement est indépendant des évènements
précédents, est d’ordre 0. Si un évènement dépendant uniquement d’un autre
évènement (distant ou non), l’ordre est de 1, etc… L’ordre de la probabilité
d’occurrence est indépendant de la distance contextuelle. Dans le domaine
musical, ces dépendances sont la plupart du temps d’ordre et de distance
contextuels faibles (une note influence la suivante). La musique peut aussi
utiliser une organisation dans laquelle le contexte distant a plus d’influence que
le contexte local, avec un ordre de probabilité assez important (Tillmann,
Bigand, & Pineau, 1998 ; Creel, Newport, & Aslin, 2004). Ainsi, la perception
auditive est une modalité intrinsèquement temporelle. L'écoute musicale
requiert donc la mise en oeuvre de processus cognitifs séquentiels. Les
modèles de la perception musicale doivent être fondamentalement dynamiques,
et appréhender de nombreux aspects temporels du flux auditif.
Dans le domaine de l'apprentissage implicite, Le réseau récurrent simple
(Simple Reccurent Network, SRN) est un modèle majeur de l'extraction de
régularités statistiques séquentielles. Le SRN est un système connexionniste,
introduit par Jordan (1986) et développé par Elman (1990), dont le
comportement dynamique (son état est déterminé en fonction de l’état
précédent et de la stimulation actuelle) le rend particulièrement apte à traiter
des patterns temporels. Grâce à des connexions récurrentes, ce réseau peut
intègrer les probabilités transitionnelles entre évènements. Le SRN a par
exemple été utilisé par Griffith (1993) concernant la reconnaissance d'un centre
tonal et de la fonction d'une hauteur dans un contexte tonal. Ces processus
impliquent une forme d'invariance perceptive/cognitive caractérisée par la
cohérence d'un sous-ensemble de hauteurs et par la fonction de chacune de ces
hauteurs à l'intérieur du sous-ensemble. Griffith suggère que ces processus
peuvent être partiellement modélisés par des mécanismes qui intègrent les
distributions de hauteurs et d'intervalles en fonction du temps. Bien que les
jeux de hauteurs utilisées dans différentes tonalités se chevauchent, leur
fréquence d'occurrence permet l'identification du contexte et de la fonction des
hauteurs. Entraîné sur des extraits de musique tonale, l'activité de la couche
cachée du SRN montre des représentations qui simulent en partie la fonction
des hauteurs en contexte.
CONCLUSION
Les travaux actuels sur l’apprentissage implicite sont importants pour les
sciences de la musique car ils conduisent à repenser le statut des compétences
cognitives requises pour les activités musicales. Ces compétences imposent
nécessairement la possibilité d’une verbalisation explicite chez les musiciens
professionnels, notamment pour les musiciens occidentaux. Le recours à
l’explicitation des connaissances semble en effet moins impérieux dans la
plupart des musiques traditionnelles du monde. Il n’en reste pas moins que
cette nécessité de l’explication, probablement spécifique à notre culture
Apprentissage implicite en musique : Théorie et Modèles
23
occidentale, ne doit pas être l’arbre qui cache la forêt : les compétences
musicales requises pour l’écoute et pour certaines performances musicales
reposent majoritairement sur une grande partie de connaissances acquises
implicitement et représentées sous des formats que notre pensée consciente
peine à atteindre. Comprendre la sophistication de ces connaissances musicales
implicites constitue un enjeu important pour les sciences cognitives et les
sciences de la musique : cela devrait permettre de mieux cerner l’origine des
aptitudes pour la musique, qui sont probablement bien plus partagées que ce
que l’on croit habituellement, et de mieux entrevoir les limites qui pourraient,
éventuellement, peser sur leur développement.
BIBLIOGRAPHIE
Abrams, M., & Reber, A. S. (1988). Implicit Learning: Robustness in the Face of
Psychiatric Disorders. Journal of Psycholinguistic Research, 17, 425-439.
Allen, R., & Reber, A. S. (1980). Very Long-term Memory for Tacit Knowledge.
Cognition, 8, 175-185.
Aslin, R. N., Saffran, J. R., & Newport, E. L. (1998). Computation of conditional
probability statistics by human infants. Psychological Science, 9, 321-324.
Bharucha, J. J., & Stoeckig, K. (1986). Reaction Time and Musical Expectancy:
Priming of Chords. Journal of Experimental Psychology: Human Perception and
Performance, 12(4), 403-410.
Bharucha, J.J., & Stoeckig, K., (1987). Priming of Chords: Spreading Activation or
Overlapping Frequency Spectra? Perception & Psychophysics, 41, (6), 519-524.
Bharucha, J., & Todd, P.M. (1991). Modeling the Perception of Tonal Structure with
Neural Nets. In P.M., Todd & D.G. Loy (Eds), Music and Connectionism, MIT.
Bigand, E., Madurell, F., Tillmann, B., & Pineau, M. (1999). Effect of Global Structure
and Temporal Organization on Chord Processing. Journal of Experimental
Psychology: Human Perception and Performance, 25, 184-197.
Bigand, E., Perruchet, P., & Boyer, M. (1998). Implicit Learning of Artificial Grammar
of Musical Timbres. Current Psychology of Cognition, 17, 577-600.
Bigand, E., & Poulin-Charronnat, B. (2006). Are we “Experienced Listeners”? A
Review of the Musical Capacities that do not Depend on Formal Musical Training.
Cognition, 100, (1), 100-130.
Cosi, P., De Poli, G., & Lauzzana, G. (1994). Auditory Modeling and Self-organizing
Neural Networks for Timbre Classification. Journal of New Music Research, 23,
(1), 71-98.
Creel, S. C., Newport, E. L., & Aslin, R. N. (2004). Distant Melodies: Statistical
Learning of Non-adjacent Dependencies in Tone Sequences. Journal of
Experimental Psychology: Learning, Memory and Cognition, 30, 1119-1130.
Delbé, C., Bigand, E., & French, R. (2006). Asymmetric Categorization in the
Sequential Auditory Domain. Proc. Of the 26th Annual Conference of the Cognitive
Science Society.
Desain, P., & Honing, H. (1989). The quantization of musical time: a connectionist
approach. Computer Music Journal, 13(3).
Elman, J.L. (1990). Finding Structure in Time. Cognitive Science, 14, 179-211.
Francès, R. (1958). La perception de la musique. Paris : Vrin.
Griffith, N. (1993). Modeling the Acquisition and Representation of Musical Tonality
as a Function of Pitch-use Through Self-organizing Artificial Neural Networks.
University of Exeter, PhD.
Huron, D. (2006). Sweet Anticipation: Music and the Psychology of Expectation.
Cambridge, Massachussetts: MIT Press.
Jordan, M. I. (1986). Serial order: A parallel distributed processing approach. San
Diego: Institute for Cognitive Science, University of California.
Krumhansl, C. L. (1990). Cognitive Foundations of Musical Pitch. New York: Oxford
University Press.
Laden, B., & Keefe, D.H., (1989). The Representation of Pitch in a Neural Network
24
E. BIGAND, C. DELBE
Model of Chord Classification. Computer Music Journal, 13(4).
Leman, M. (1991).The Ontogenesis of Tonal Semantics: Results of a Computer Study.
In P.M. Todd & D.G. Loy (Eds), Music and Connexionism, Cambridge MA: MIT
Press, 195-211.
Lerdahl, F. (1988). Cognitive Constraints on Compositional Systems. In J. Sloboda,
ed., Generative Processes in Music. Oxford: Oxford University Press.
Lerdahl, F., & Jackendoff, R. (1983). A Generative Theory of Tonal Music. Cambridge,
MA: MIT Press.
McAdams, S. (1989). Contraintes psychologiques sur les dimensions porteuses de
forme en musique. In McAdams & I. Deliège (Eds), La musique et les sciences
cognitives, Bruxelles : Mardaga, 257-28.
Meyer, L. B. (1956). Emotion and Meaning in Music. Chicago: Chicago University
Press.
Mozer, M. C. (1991). Connexionist Music Composition Based on Melodic, Stylistic
and Psychophysical Constraints. In P. M. Todd & D. G. Loy (Eds), Music and
Connexionism, Cambridge MA: MIT Press, 195-211.
Page, M. (1993). Modeling Aspects of Music Perception Using Self -Organizing Neural
Networks. University of Wales, PhD.
Perruchet, P., & Vinter, A. (2002). The Self-organizing Consciousness. Behavioral and
Brain Sciences, 25, (3), 297-330.
Pineau, M., & Tillmann, B. (2001). Perception des structures musicales. Paris :
L'Harmattan.
Reber, A. S. (1967). Implicit Learning of Artificial Grammars. Journal of Verbal
Learning and Verbal Behavior, 6, 855-863.
Reber, A. S. (1989). Implicit Learning and Tacit Knowledge. Journal of Experimental
Psychology: General, 118, 219-235.
Reber, A. S. (1992). The Cognitive Unconscious: An Evolutionary Perspective.
Consciousness and Cognition, 1, 93-133.
Reber, A. S., Walkenfeld, F. F., & Hernstadt, R. (1991). Implicit and Explicit Learning:
Individual Differences and IQ. Journal of Experimental Psychology: Learning,
memory and cognition, 17, 888-896.
Saffran, J. R., Johnson, E. K., Aslin, R. N., & Newport, E. L. (1999). Statistical
Learning of Tone Sequences by Human Infants and Adults. Cognition, 70, 27-52.
Saffran, J. R., Aslin, R. N., & Newport, E. L. (1996). Statistical Learning by 8-month
old Infants. Science, 274, 1926-1928.
Sano, H., & Jenkins, B. K. (1991). A Neural Network Model for Pitch Perception. In P.
Todd & G. Loy (Eds), Music And Connectionism, Cambridge :MIT Press, 42-49.
Scarborough, D. L., Miller, B. O., &Jones, J. A. (1991). Connectionist Model for Tonal
Analysis. Computer Music Journal, 13, (3).
Schellenberg, E. G., Adachi, M., Purdy, K. T., & McKinnon, M. C. (2002). Expectancy
in Melody: Tests of Children and Adults. Journal of Experimental Psychology:
General, 131, 511-537.
Schellenberg, G., Bigand, E., Poulin, B., Garnier, C., Stevens, C., (2005). Children's
Implicit Knowledge of Harmony in Western Music, Developmental Sciences, 8, (6),
551-566.
Soltau, H., Schultz, T., Westphal, M., &Waibel, A. (1998). Recognition of Music
Types. Proceedings of ICASSP 98.
Tekman H. G., & Bharucha J. J, (1998). Implicit Knowledge Versus Psychoacoustic
Similarity in Priming of Chords. Journal of Experimental Psychology: Human
Perception and Performance, 24(1), 252-260.
Tillmann, B., Bharucha, J., & Bigand, E. (2000). Implicit Learning of Tonality : A SelfOrganizing Approach. Psychological Review, 107, 885-913.
Tillmann, B., Bigand, E., & Pineau, M. (1998). Effect of Local and Global Contexts on
Harmonic Expectancy. Music Perception,16, 99-118.
Tillmann, B., & Bigand, E. (2001). Global Context Effects in Normal and Scrambled
Musical Sequences, Journal of Experimental Psychology: Human Perception and
Performance, 27, 1185-1196.
Apprentissage implicite en musique : Théorie et Modèles
25
Tillmann, B., Bharucha J.J, (2002). Effect of Harmonic Relatedness on the Detection of
Temporal Asynchrones. Perception & Psychophysics, 64, (4), 640-649.
Tillmann, B., & McAdams, S. (2004). Implicit Learning of Musical Timbre Sequences:
Statistical Regularities Confronted with Acoustical (Dis)similarities. Journal of
Experimental Psychology: Learning, Memory & Cognition, 30, (5), 1131-1142.
Toiviainen, P. (1995). Modeling the Target-note Technique of Bebop-style
Improvisation: An Artificial Neural Network Approach. Music Perception, 12, (4),
399-413.
Trehub, S., & Trainor, L. (1994). Les stratégies d’écoute : origines du développement
du développement de la musique et de la praole. In McAdams & Bigand (1994),
Penser les sons : Psychologie cognitive de l’audition, Paris : Presses Universitaires
de France, 299-347.
FIGURES
Figure 1 : Exemple de grammaire artificielle à état fini. Les chaînes grammaticales sont engendrées en
suivant les flèches en passant d’un nœud de la grammaire à un autre, de l’entrée à la sortie.
26
E. BIGAND, C. DELBE
Figure 2 : a) Architecture de MUSACT. b) Propagation d'activation en réponse à une triade (Do Majeur)
Keys
Major Chords
TONES
Minor Chords
F#/Gb C#/Db G#/Ab D#/Eb A#/Bb
F
C
G
D
A
E
B
F#/Gb C#/Db G#/Ab D#/Eb A#/Bb
F
C
G
D
A
E
B
A
A#/Bb
rd#/eb a#/bb
B
C
C#/Db
D
D#/Eb
E
F
F#/Gb
f
c
g
d
a
e
b
f#/gb c#/db g#/ab
G G#/Ab
Bottom-Up Activation
Major
Chords
Tones
Minor
Chords
(linked to right edge)
Keys
F#/Gb
C#/Db G#/Ab D#/Eb A#/Bb
F
C
G
D
A
E
B
F#/Gb
C#/Db
G#/Ab D#/Eb
A#/Bb
F
C
G
D
A
E
B
A
A#/Bb
B
C
C#/Db
D
D#/Eb
E
F
F#/Gb
G
G#/Ab
d#/eb
a#/bb
f
c
g
d
a
e
b
f#/gb
c#/db
g#/ab
(linked to upper edge-keys)
(linked to left edge)
(linked to lower edge-minor chords)