Apprentissage implicite en musique : Théorie et Modèles
Transcription
Apprentissage implicite en musique : Théorie et Modèles
Intellectica, 2008/1, 48, pp. 13-26 Apprentissage implicite en musique : Théorie et Modèles Emmanuel Bigand et Charles Delbé RESUME : L’apprentissage implicite désigne une forme d’apprentissage durant laquelle le sujet intériorise tacitement la structure des stimulations qui lui parviennent de l’environnement. Dans cet article, nous montrerons qu'il est très probable que les connaissances implicites acquises par l’auditeur sans formation musicale constituent un aspect tout à fait essentiel de l’expérience musicale. La musique constitue une structure écologique de notre environnement qui présente de nombreux intérêts pour l’étude des apprentissages implicites. Les réponses que la psychologie pourra apporter ici auront des implications non seulement pour les théories cognitives, mais également pour les sciences de la musique. Enfin, afin de comprendre quel type d’architecture cognitive se prête le mieux à la représentation des connaissances musicales implicites, nous décrirons un modèle connexionniste qui aide à la compréhension des connaissances musicales qui peuvent être acquises implicitement. Mots Clés : Apprentissage connexionniste Implicite, Cognition musicale, Modélisation ABSTRACT: Implicit Learning in Music: Theory and Models. Implicit learning is a form of learning in which one tacitly internalizes the structure of the stimulations received from the environment. In this article, we will show that it is highly probable that this implicit knowledge acquired by the listener without formal training is an essential aspect of musical experience. Music, as an ecological structure of our environment, is a highly interesting material for implicit learning studies. The answers that psychology will bring here will have implications in cognitive sciences, but also in music sciences. Finally, in order to understand what type of cognitive architecture is best suited to the representation of implicit musical knowledge, we will describe a connexionist model which helps to understand the musical knowledge which can be acquired implictly. Keywords: Implicit learning, Musical cognition, Connexionnist modeling L’APPRENTISSAGE IMPLICITE EN PSYCHOLOGIE Valeur adaptative de l'apprentissage implicite L’apprentissage implicite désigne une forme d’apprentissage durant laquelle le sujet intériorise tacitement la structure des stimulations qui lui parviennent de l’environnement. L’apprentissage est qualifié d’implicite parce que le sujet apprend sans en avoir conscience ni même l’intention et qu’il ne peut pas expliciter la nature des connaissances acquises. Reber (1992) Université de Bourgogne, CNRS UMR 5022 Laboratoire d’Etude de l’Apprentissage et du Développement, Boulevard Gabriel; F-21000 Dijon, France. Tel. +33 (0)380395782; Fax. +33 (0)380395767. [email protected] Université de Bourgogne, CNRS UMR 5022 Laboratoire d’Etude de l’Apprentissage et du Développement, Boulevard Gabriel; F-21000 Dijon, France. Tel. +33 (0)380393723. [email protected] © 2008 Association pour la Recherche Cognitive. 14 E. BIGAND, C. DELBE considère cette forme d’apprentissage comme un processus cognitif fondamental qui permet d’acquérir des informations sur l’environnement qui sont trop complexes pour pouvoir être accessibles par le raisonnement hypothético-déductif. Les processus d’apprentissage implicite présentent donc une valeur adaptative fondamentale puisqu’ils entrent en scène lorsque les informations sont trop complexes pour être appréhendées par la pensée consciente. L’apprentissage des langues étrangères est un exemple schématique permettant de contraster les deux formes d’apprentissage. L’apprentissage explicite porte sur l’acquisition volontaire et consciente d’un ensemble d’informations (sémantiques et syntaxiques) sur le système linguistique. Ces informations sont représentées sous un format symbolique qui se prête à une utilisation volontaire de la part du sujet. Dans bien des cas, et notamment lorsque nous évoluons dans un pays étranger, nous optons rapidement vers d’autres stratégies d’apprentissage, qualifiées parfois d’apprentissage par imprégnation. Ces stratégies reposent sur l’intériorisation tacite d’un ensemble d’éléments linguistiques qui, sans que nous en ayons véritablement conscience, vont rapidement nous permettre de comprendre puis de nous exprimer dans la langue en question. L’acquisition d’une langue maternelle repose principalement sur ce type d’apprentissage implicite : dès les premiers mois, le nourrisson apprend les structures de sa langue selon ce processus, sans bien évidemment avoir la moindre conscience de ce qu’est un mot, un article, un verbe et un complément d’objet. Les apprentissages implicites présentent d’autres qualités cognitives fondamentales pour l’adaptation qui les distinguent définitivement des apprentissages explicites. Les connaissances acquises sont beaucoup plus stables en mémoire (Allen & Reber, 1980) et elles résistent à des atteintes cognitives et neurologiques sévères (Abrams & Reber, 1988 ; Reber, Walkenfeld, & Hernstadt, 1991). Ainsi, il a été montré que des sujets souffrant de troubles graves de la mémoire (consécutifs à des maladies neurodégénératives telles que la maladie d’Alzheimer, par exemple) peuvent continuer à acquérir de nouvelles informations sur l’environnement par des stratégies d’apprentissage implicite. De la même façon, on sait que le vieillissement cognitif se traduit par une diminution massive des apprentissages explicites. Pour autant, les personnes âgées présentent souvent des performances cognitives similaires à celles des jeunes adultes sains, lorsque les deux groupes sont placés dans une situation d’apprentissage implicite. Ces quelques exemples suffiront à montrer que l’apprentissage implicite est un processus fondamental d’acquisition de connaissances beaucoup plus robuste qui intervient tôt dans l’ontogenèse et résiste mieux au vieillissement et à toute autre forme d’atteinte cognitive. Par contre, le principal inconvénient des ces processus d’apprentissage est de fournir aux sujets une connaissance qui demeure très difficile à utiliser explicitement1. Pour un lecteur non averti, ces processus d’apprentissage pourraient évoquer les théories comportementales (béhavioristes) de l’apprentissage qui dominaient la psychologie dans la première moitié du XXième siècle. Ce courant de pensée, souvent réduit aux théories dites du conditionnement, se distinguent 1 Notez que Perruchet et Vinter (2002) rejettent l’idée d’une distinction fonctionnelle entre apprentissage implicite et explicite, en faveur d’une auto-organisation progressive (associée à une consience graduelle) des représentations mentales. Apprentissage implicite en musique : Théorie et Modèles 15 bien des théories actuelles de l’apprentissage implicite dans la mesure où ces dernières stipulent (et démontrent) que l’apprentissage se traduit par l’acquisition de connaissances (et non de réflexes conditionnés). A ce titre, elles entrent bien dans le champ classique de la psychologie cognitive : leur spécificité est simplement de soutenir que les connaissances acquises sont représentées dans un format qui présente de très nombreux avantages cognitifs mais qui se prête très mal à une utilisation volontaire par la pensée consciente. Nous reviendrons sur ce point dans la dernière section de cet article en montrant plus en détail comment ces connaissances peuvent être représentées (de façon distribuée) dans des systèmes artificiels. Il deviendra également clair au cours de cet article que les connaissances acquises par apprentissage implicite portent sur des niveaux d’organisation de l’environnement d’une complexité considérable, sans aucune comparaison possible avec les couplages stimulus-réponses envisagés par le courant béhavioriste de la psychologie. Quelques situations expérimentales d’appentissage implicite Plusieurs situations expérimentales ont été élaborées pour sonder le fonctionnement des apprentissages implicites. La plupart d’entre elles peuvent être reprises sans difficulté dans le domaine musical. L’un des paradigmes les plus connus (le paradigme d'apprentissage de grammaire artificielle ; Reber, 1967, 1989, 1992) consiste à utiliser une grammaire à état fini comparable à celle représentée Figure 1. Cette grammaire régule la façon dont une série de symboles sans signification particulière pour le sujet peuvent être combinés en séquences (phrases). Dans le cas présent, la séquence de lettres ABACD serait une séquence grammaticale, mais pas la séquence ABCD, qui enfreint une règle de la grammaire. En effet, la lettre C ne peut pas intervenir après la lettre B. Cette grammaire est dite artificielle car les règles qui la constituent sont arbitraires et ne correspondent à rien de ce que le sujet puisse déjà connaître. De plus, les séquences qu’elle produit sont sans lien direct avec les connaissances antérieures du sujet. L’expérience procède ensuite en deux phases : dans une phase initiale, on présente aux sujets des séquences grammaticales, c’est à dire qui respectent les règles de la grammaire. Dans cette phase, la tâche des sujets varie en fonction de la nature de l’apprentissage que l’on veut solliciter. Dans une condition d’apprentissage explicite, les sujets seront informés qu’il existe des règles qui sous-tendent ces séquences de lettres et qu’ils doivent les identifier. Dans une condition d’apprentissage implicite, les sujets pourraient ainsi être simplement invités à compter le nombre de lettres que contient chaque séquence. La consigne n’induit donc aucune recherche de règles de leur part. Dans la seconde phase de l’expérience, les sujets voient de nouvelles séquences de lettres : la moitié respecte les règles de la grammaire, l’autre moitié enfreint l’une ou l’autre des règles. Dans ce cas, l’erreur grammaticale porte sur un seul enchaînement invalide de lettres. Les sujets sont informés pour cette seconde phase de l’étude que seule la moitié des séquences a été produite par le même programme grammatical qui a généré les séquences de la première phase. Leur tâche consiste alors à identifier les séquences grammaticales. Généralement, le désarroi des sujets de la condition d’apprentissage implicite est immense à l’énoncé de cette consigne, et la quasi totalité a l’impression de répondre au hasard. Mais leur étonnement devient plus grand que leur désarroi lorsqu’ils constatent en fin d’expérience avoir répondu avec des taux de réussite bien supérieurs au hasard (variant de 54 à 70% de réussite en moyenne). Ces taux demeurent le plus souvent supérieurs ou égaux aux taux de réussite des sujets ayant travaillé dans la condition 16 E. BIGAND, C. DELBE d’apprentissage explicite. En général, les sujets ayant appris implicitement ne parviennent pas à expliciter les règles qui leur ont permis d’avoir de si bonnes performances. Selon Reber, ces sujets auraient acquis une connaissance implicite des règles de la grammaire artificielle (Reber, 1967, 1989). Des résultats similaires ont été rapportés avec des sujets atteints de différentes pathologies cognitives (amnésie, notamment), des bébés de quelques mois, et il a été montré que des sujets âgés présentent des performances tout à fait comparables à celles de jeunes adultes sains dans ce type de situation expérimentale. Enfin, les études sur le transfert d’apprentissage ont montré que les sujets ayant été exposés à des séquences grammaticales de lettres peuvent ensuite identifier parmi des séquences de sons (les lettres sont remplacées par des sons) celles qui respectent les règles de la grammaire. Les performances dans ces tâches de transfert d’apprentissage des lettres vers les sons démontrent que la connaissance acquise implicitement est représentée sous un format relativement abstrait. Les études sur l’apprentissage implicite réalisées en laboratoire ont le plus souvent utilisé des alphabets restreints d’items très simples (lettres, positions d’un spot lumineux sur un écran, symboles abstraits, dessins modernes, nombres, sons purs). Les résultats obtenus ont toutefois été confirmés par d’autres études utilisant des matériaux ayant une plus grande signification écologique. Ainsi, Saffran et ses collaborateurs ont présenté aux sujets des séquences continues de paroles de synthèse sans signification (bupada, dutaba,…). Les syllabes de ce langage artificiel étaient concaténées de telle façon que leurs probabilités transitionnelles permettaient (en théorie) de distinguer des mots au sein de ce flux continu de parole (Saffran, Aslin, & Newport, 1996). L’écoute passive (sans intention de trouver les mots du langage) de ce flux continu de parole pendant quelques minutes suffit pour conduire ensuite les sujets à différencier les mots des non-mots (c'est-à-dire des combinaisons de syllabes qui ne sont pas apparues pendant la phase d'exposition) à des taux bien supérieurs au hasard. Qui plus est, de jeunes bébés de huit mois parviennent à segmenter le flux continu de parole sur la base des probabilités transitionnelles après seulement deux minutes d’écoute (Saffran, Aslin, & Newport, 1996 ; Aslin, Saffran, & Newport, 1998). Ce type de résultat souligne l’efficacité, la précocité et la robustesse des processus d’apprentissage implicite. Il faut reconnaître que la complexité des stimuli présentés dans ce type d’expérience est bien moindre que la complexité des stimulations de notre environnement naturel (le langage ou la musique, pour ne citer que ceux la). Toutefois on peut considérer que ces expériences de laboratoire reproduisent de façon réduite un mécanisme qui se réalise à grande échelle dans l’environnement naturel : si en quelques minutes les sujets parviennent à intérioriser des structures dont l’organisation (bien que d’une complexité modeste) leur parait toutefois difficile à appréhender consciemment, on peut raisonnablement penser qu’ils seront capables, avec beaucoup plus de temps d’apprentissage, d’intérioriser les structures complexes de l’environnement sous l’effet de la simple exposition à cet environnement. Exemples d'apprentissage implicite en musique La musique constitue une structure écologique de notre environnement qui présente de nombreux intérêts pour l’étude des apprentissages implicites. Tout d’abord, le degré de complexité des organisations musicales peut être, dans certains cas, considérables. Ensuite, les organisations musicales et les règles Apprentissage implicite en musique : Théorie et Modèles 17 qui les sous-tendent sont de toute évidence conçues pour ne pas être perceptibles consciemment par l’auditeur. Celui doit ressentir l’effet de ces organisations sans pour autant pouvoir les déceler explicitement. L’effet psychologique de la musique proviendrait du traitement implicite d’un ensemble très sophistiqué de relations structurelles qui se déploient à plusieurs échelles temporelles sans que nous en ayons une réelle conscience (Meyer, 1956 ; Lerdahl & Jackendoff, 1983). Il est donc très probable que les connaissances implicites acquises par l’auditeur sans formation musicale constitue un aspect tout à fait essentiel de l’expérience musicale. Plusieurs questions se posent dès lors, questions qui peuvent contribuer autant à la psychologie des apprentissages qu’aux sciences de la musique. Les processus d’apprentissage implicite peuvent-ils être suffisamment élaborés pour permettre à l’auditeur sans formation musicale spécifique (que nous désignerons par “non musicien”, par commodité dans la suite de cet article) d’avoir une connaissance (non explicite) de la musique aussi élaborée que celle d’un expert ? Autrement dit, l’auditeur non musicien peut-il être musicalement expert même s’il demeure un analphabète musical, pour reprendre l’expression de R. Francès (1958) ? Etant donné la puissance des processus d’apprentissage implicite constatée dans tous les domaines de la cognition, il semble qu’une réponse positive soit tout à fait envisageable. On voit mal en effet pourquoi les processus d’apprentissage implicite ne s’appliqueraient pas en musique avec la même vigueur. L’ensemble des travaux expérimentaux engagés dans notre laboratoire, et dans de nombreux autres (cf. Bigand & Poulin-Charronnat, 2006, pour une revue), apporte de sérieux arguments en faveur de cette réponse positive. Cette réponse, qui va nettement à l’encontre des croyances les plus fréquemment répandues, pourrait conduire à repenser les modes d’apprentissage de la musique qui restent majoritairement basés sur des stratégies explicites. Il est probable, au regard des connaissances actuelles, que ces stratégies soient faiblement efficaces, notamment chez les jeunes enfants. On peut également se demander si les processus d’apprentissage implicite sont suffisamment puissants pour permettre l’intériorisation des systèmes musicaux qui apparaissent trop complexes, y compris aux yeux des experts. Ainsi, le grand débat sur la complexité des musiques contemporaines a souvent conduit à souligner que certaines organisations musicales (comme la musique sérielle) dépasseraient l’ordre de ce qui peut être appréhendé par le cerveau humain (Francès, 1958). Des contraintes cognitives fondamentales pèseraient sur les systèmes musicaux. Les systèmes ne respectant pas ces contraintes seraient voués à disparaître tôt ou tard (Lerdahl, 1988 ; McAdams, 1989). Là encore, les recherches actuelles sur l’apprentissage implicite inviteraient plutôt à la prudence. Si le sujet peut apprendre en peu de temps des structures aussi artificielles que celles présentes dans les grammaires artificielles de la Figure 1, on voit mal pourquoi il ne parviendrait pas à intérioriser implicitement des structures musicales d’une grande complexité, si on lui laisse un temps d’exposition à la mesure de cette complexité. A ce titre, les problèmes cognitifs posés par les musiques contemporaines offrent un terrain d’investigation scientifique de l’apprentissage implicite prometteur. Certains de ces systèmes constituent un véritable défi pour ces théories de l’apprentissage. Les réponses que la psychologie pourra apporter ici auront des implications non seulement pour les théories cognitives, mais également pour les sciences de la musique. Enfin, il restera à savoir en quoi consistent précisément les connaissances musicales qui peuvent être acquises implicitement. Il s’agit de comprendre quel 18 E. BIGAND, C. DELBE type d’architecture cognitive se prête le mieux à la représentation des connaissances musicales implicites. Répondre à l’ensemble de ces questions dépasserait le cadre de cet article. Le lecteur curieux de consulter l’ensemble des travaux portant sur les apprentissages implicites étudiés dans le cadre de la musique tonale trouvera une synthèse en langue anglaise dans Bigand et Poulin-Charronnat (2006), et en langue française dans Pineau et Tillmann (2001). Ces travaux empiriques sur la musique tonale ont montré, à la suite des travaux initiés par R. Francès (1958), puis repris par C. Krumhansl (1990), que l’auditeur parvient très tôt à intérioriser les relations complexes que les notes, les accords et les tonalités entretiennent entre eux. Les travaux de Trehub et de son équipe démontrent que des bébés de 6 mois (cf. pour une synthèse en français, Trainor & Trehub, 1994) ont déjà une représentation fine des éléments structuraux de la syntaxe musicale occidentale. Les travaux entrepris ces dernières années dans notre laboratoire ont mis en évidence que les connaissances des auditeurs non musiciens sur la fonction tonale de notes et des accords pouvaient se révéler aussi sophistiquées que celles mises en oeuvre par des musiciens en troisième cycle de conservatoire. L’aspect le plus surprenant de ces travaux fut de constater que ces connaissances implicites pouvaient être mobilisées quasiment aussi rapidement chez ces deux groupes d’auditeurs. Les études sur l’amorçage harmonique (cf. Tillmann & Poulin-Charronnat, ce volume), indiquent en effet que quelques centaines de millisecondes suffisent aux deux groupes d’auditeurs pour traiter des changements fins de fonction harmonique des accords en contexte. En d’autres termes, la sophistication des connaissances acquises par apprentissage implicite dans le cas de la musique tonale porte non seulement sur leur contenu (ces connaissances ne sont pas rudimentaires et portent sur les aspects cruciaux du système musical) mais aussi sur l’efficacité de leur mobilisation (ces connaissances sont mobilisées quasiment immédiatement). Enfin, il a été observé que ces connaissances sont acquises et mobilisées très tôt chez le jeune enfant (cf. Schellenberg, Adachi, Purdy, & McKinnon, 2002 ; Schellenberg, Bigand, Poulin-Charronnat, Garnier, & Stevens, 2005) et qu’elles peuvent continuer à influencer le comportement de patients cérébrolésés ayant perdu toute capacité explicite à percevoir des structures élémentaires dans le musique (Tillmann, 2005). Les études sur l’apprentissage implicite de la musique ont également abordé l’apprentissage de nouveaux systèmes musicaux. Certains travaux ont répliqué avec des sons musicaux les études initiales de Reber sur l’apprentissage de grammaires artificielles (Bigand, Perruchet, & Boyer, 1998). D’autres ont directement abordé l’apprentissage de systèmes musicaux réels. Ce fut le cas notamment des travaux sur l’apprentissage de la musique sérielle, introduite par Arnold Schoenberg au début du XXième siècle. Une pièce musicale sérielle est basée sur un ordonnancement temporel spécifique des 12 notes de la gamme chromatique. Cet ordre temporel définit la série de la pièce musicale. Cette série peut être modifiée par quatre principes de transformation (la transposition, la rétrogradation, l’inversion et la rétrogradation inverse). Les pièces musicales sérielles résultent de la combinaison complexe de ces différentes transformations de la série à la base de l’oeuvre. En théorie, ces transformations sont supposées assurer un équilibre suffisant entre l’unité perceptive de l’oeuvre et sa variété. On sait que la pertinence esthétique et cognitive de ce système de musique sérielle a été questionnée tout au long du XXième siècle. La contribution de la psychologie expérimentale à ce débat fut Apprentissage implicite en musique : Théorie et Modèles 19 de vérifier si l’unité perceptive de la série était bien réelle pour les auditeurs. Les premiers résultats furent peu encourageants. Dans son étude de 1958, Francès (expérience 6) présentait aux auditeurs des extraits musicaux qui dérivaient strictement d’une série donnée. Après cette phase d’apprentissage, les sujets entendaient de nouveaux extraits musicaux et ils devaient identifier quelques extraits qui ne respectaient pas les règles de la série. Les résultats rapportés montrent que les auditeurs ont de grosses difficultés à détecter les extraits d’oeuvres intrus ne correspondant pas à la série initiale. Qui plus est, les auditeurs experts en musique sérielle n’avaient pas de meilleurs résultats que les auditeurs sans formation musicale ; ils tendaient même à en avoir des pires. Pour remarquable qu’elle soit, cette première étude expérimentale ne peut être conclusive sur les problèmes d’apprentissage implicite de la musique sérielle. En effet, les extraits qui ne respectaient pas la série étaient construits sur une série qui était structurellement très proche de la série initiale : les six premières notes de la série leurre étaient identiques aux 6 premières notes de la série initiale, et les 6 suivantes correspondaient à une forme inversée de la série initiale. Nous avons repris récemment cette étude avec le compositeur D. D’Adamo en utilisant un paradigme identique à celui des études sur l’apprentissage des grammaires artificielles. Les auditeurs écoutaient 20 extraits musicaux composés selon les règles sérielles résumées ci dessus. Nous leurs présentions ensuite 20 paires d’extraits. Les deux éléments de la paire avaient le même rythme et globalement le même contour. Ils étaient donc perceptivement très semblables: certains auditeurs pensaient d’ailleurs que le second élément était une répétition du premier. Toutefois, seul l’un de ces extraits respectait les règles de la série initiale. Les sujets devaient trouver quel était l’extrait en question. Les auditeurs sans formation musicale ont obtenu des taux de réussite bien supérieurs au hasard dans cette tâche (60%), identiques à ceux obtenus avec les étudiants de cycle 3 des Conservatoire Nationaux de Région. Des performances tout aussi élevées ont été obtenues lorsque des versions rétrogrades inversées de la série étaient présentées dans la phase de test. Ces résultats suggèrent que les régularités induites par les principes de la série peuvent être rapidement intériorisées de façon implicite par tout un chacun (la phrase d’apprentissage de l’expérience durait 20 minutes). Ils ne permettent pas bien sûr de valider la qualité esthétique de la musique sérielle, mais démontrent sa validité cognitive. Les règles sérielles induisent des régularités statistiques entre les notes à différentes échelles de temps, que le sujet peut apprendre implicitement, même si elles sont sans doute très difficiles à discerner de façon explicite. Modéliser les apprentissages implicites en musique Dans cette dernière section, nous souhaitons présenter une architecture possible pour modéliser la façon dont des connaissances musicales peuvent être acquises implicitement. En sciences cognitives plusieurs architectures ont été élaborées pour proposer des alternatives aux représentations symboliques sous forme de règles “si-alors”, souvent utilisées pour modéliser la cognition consciente. Une architecture cognitive est une théorie (potentiellement) unifiée du fonctionnement de l'esprit humain, reposant sur l'extraction et l'utilisation de règles explicites sur des symboles. Bien qu'adaptés à la modélisation de la cognition consciente, les modèles symboliques de la modélisation cognitive semblent problématiques pour simuler l'apprentissage musical non académique. En sciences cognitives, plusieurs architectures ont été élaborées 20 E. BIGAND, C. DELBE pour proposer des alternatives aux modèles symboliques traditionnels de l'intelligence artificielle. Le plus souvent, la connaissance est distribuée dans un réseau et émerge des activations qui vont s’y propager. L'approche connexionniste de la cognition musicale postule qu'il est possible de capturer certains aspects du comportement musical humain dans un système artificiel basé sur l'architecture et la dynamique du cerveau. Ces modèles connexionnistes permettent l'investigation des processus, tels que l'apprentissage et la généralisation, et des types de représentations mentales, telles que des distributions non-symboliques d'activation, qu'il était difficile voire impossible d'étudier avec les modèles classiques de la psychologie. Les réseaux de neurones artificiels sont développés en imitant la façon dont une multitude de neurones fortement interconnectés traitent l'information dans le cerveau. Ces modèles ont largement été utilisés dans le domaine de la musique, par exemple dans les domaines de la perception de la hauteur (Sano & Jenkins, 1991), la reconnaissance d’accords (Laden & Keefe, 1989), la perception des structures tonales (Bharucha & Stoeckig, 1986 ; Bharucha & Todd, 1991 ; Leman, 1991 ; Griffith, 1993), la perception du temps musical (Desain & Honing, 1989), du timbre (Cosi, De Poli, & Lauzzana, 1994), ou l’extraction et reconnaissance de thèmes (Page, 1993). Les réseaux de neurones artificiels ont aussi été utilisés en composition (Mozer, 1991), improvisation jazz (Toiviainen, 1995), ou analyse de style (Scarborough, Miller, & Jones, 1991 ; Soltau, Schultz, & Westphal, 1998). L'un des modèles les plus influents dans le domaine musical a été proposé par Bharucha & Stoeckig (1986) puis développé par Tillmann, Bharucha, & Bigand (2000). MUSACT (MUSical ACTivation) est composé de trois couches de cellules représentant les 12 hauteurs chromatiques, 24 accords majeurs et mineurs et 12 tonalités (Figure 2a). Une représentation locale est utilisée, chaque cellule codant un concept unique. La connaissance de la hiérarchie tonale occidentale est représentée dans le pattern d'interconnections de ces différentes cellules. Ainsi, chaque cellule codant la hauteur est connectée à tous les accords dont elle est membre, ces cellules accords étant elles-mêmes connectées à toutes les cellules tonalités les impliquant. La présentation d'une stimulation, consistant en une suite de triades, active les cellules hauteurs correspondantes. Cette activation se propage vers les cellules accords, qui activent les cellules tonalités (cf Figure 2b pour la triade do-misol). Le pattern d'activation se réverbère alors dans le réseau et ces activations réverbérantes vont se propager aux unités accords et notes qui sont hautement probables dans les tonalités activées par la triade initiale. A un stade d'équilibre, les propriétés émergentes des valeurs d'activation des différentes cellules représentent les connaissances musicales tonales activées dans le réseau par la triade initiale. Ces activations prédisent les performances humaines. Les unités fortement actives dans le réseau correspondent à des unités musicales qui sont perçues par les auditeurs comme s’accordant musicalement bien avec la triade initiale, ou pour lesquels on observe des effets d’attentes perceptives chez l’auditeur (cf Tillmann et Poulin-Charronnat, ce volume). L'intérêt de ce modèle réside dans l'aspect temporel du traitement des évènements musicaux. Pour une séquence d'accords, l'activité due à chaque accord est cumulée. A un stade d'équilibre, l'activité décroît de façon exponentielle en fonction du temps. Si un autre événement apparaît avant que cette activité ne soit presque nulle, la nouvelle activité est ajoutée à l’activité Apprentissage implicite en musique : Théorie et Modèles 21 résiduelle due aux évènements précédents. Cette accumulation d’activation est fonction de la structure harmonique de la séquence entière d’évènements, et va suffire pour parvenir à simuler les effets de contexte (la fonction d’un événement musical dépend du contexte d’ensemble dans lequel il apparaît) qui sont essentiels dans la musique tonale. Cette dynamique permet de simuler de nombreux aspects séquentiels de la perception harmonique tonale, tels que la formation d'attentes d'évènements particuliers. De nombreuses simulations d'amorçage harmonique ont été conduites sur ce modèle. Les attentes harmoniques des sujets humains, reflétées dans les patterns d'activation, ont été simulées dans le contexte d'un accord seul (Bharucha & Stoeckig, 1987 ; Tekman & Bharucha, 1998 ; Tillmann & Bharucha, 2002), mais aussi dans le cas de contextes harmoniques plus longs, expliquant la facilitation de traitement des accords reliés (Tillmann, Bigand, & Pineau, 1998 ; Bigand, Madurell, Tillmann, & Pineau, 1999 ; Tillmann & Bigand, 2001). De plus, les interactions entre contextes local et global étudiées par Tillmann, Bigand et Pineau (1998) ont été simulées. Le traitement d'un accord est facilité quand il est localement ou globalement relié au contexte harmonique. Cet effet facilitateur décroît pour les accords reliés uniquement localement ou globalement au contexte, et est minimum pour les accords non reliés localement ni globalement. Notons que l'effet de facilitation de traitement d'un accord est une conséquence de la hiérarchie tonale, mais pas de l'organisation temporelle des accords dans une séquence. Une manipulation consistant à mélanger les accords d'une séquence harmonique influencera peu le degré d'activation des cellules cibles. En conséquence, le modèle prédit une absence d'effet de l'ordre temporel des accords sur le temps de traitement d'un accord cible. Tillmann et Bigand (2001) ont effectivement montré un effet du contexte harmonique global sur le traitement d'accords attendus et non attendus, indépendamment de l'organisation temporelle des accords du contexte. L’intérêt de ce modèle, qui reste bien évidemment trop simple pour rendre compte de tous les aspects subtils que peut revêtir la perception de la musique, est d’illustrer comment une architecture de connaissances distribuées peut rendre compte de façon élégante et économique d’un ensemble varié de réponses perceptives à la musique tonale. Cette architecture ne résulte pas d’une programmation ad hoc du scientifique : on peut montrer qu’elle émerge progressivement sous l’effet de l’exposition passive du modèle à des séquences musicales obéissant aux règles du système tonal (Tillmann, Bharucha, & Bigand, 2000). D’autres architectures ont été développées pour rendre compte des apprentissages implicites en musique. Certaines seraient plus pertinentes pour les musiques contemporaines. D’une façon générale, ces architectures reposent sur l’idée que la connaissance musicale implicite résulte de l’extraction des régularités statistiques présentent dans les oeuvres. Par exemple, Bigand, Perruchet et Boyer (1998) ont montré que l'acquisition d'une grammaire artificielle de timbres chez des auditeurs non-musiciens pouvait s’expliquer de cette façon. Les probabilités conditionnelles associant des hauteurs temporellement consécutives jouent aussi un rôle dans les aspects prosodiques de la musique, servant d'indices permettant la segmentation des éléments d'un flux musical en unités pertinentes (Saffran, Johnson, Aslin, & Newport, 1999 ; Tillmann & McAdams, 2004), ainsi qu'à la formation de catégories mélodiques (Delbé, Bigand, & French, 2006). 22 E. BIGAND, C. DELBE Dans l'environnement, la probabilité d'apparition d'un évènement est dépendante du contexte. Huron (2006) a relevé de nombreux exemples de ces dépendances dans la musique tonale. La probabilité conditionnelle est caractérisée par la distance contextuelle et la taille contextuelle. Certains états sont influencés par le voisinage contextuel immédiat (distance contextuelle faible), d’autres par des évènements distants dans le temps (distance contextuelle importante). La taille contextuelle (ou ordre de la probabilité) caractérise le nombre d’états influençant cette probabilité conditionnelle ; une série aléatoire, dans laquelle un évènement est indépendant des évènements précédents, est d’ordre 0. Si un évènement dépendant uniquement d’un autre évènement (distant ou non), l’ordre est de 1, etc… L’ordre de la probabilité d’occurrence est indépendant de la distance contextuelle. Dans le domaine musical, ces dépendances sont la plupart du temps d’ordre et de distance contextuels faibles (une note influence la suivante). La musique peut aussi utiliser une organisation dans laquelle le contexte distant a plus d’influence que le contexte local, avec un ordre de probabilité assez important (Tillmann, Bigand, & Pineau, 1998 ; Creel, Newport, & Aslin, 2004). Ainsi, la perception auditive est une modalité intrinsèquement temporelle. L'écoute musicale requiert donc la mise en oeuvre de processus cognitifs séquentiels. Les modèles de la perception musicale doivent être fondamentalement dynamiques, et appréhender de nombreux aspects temporels du flux auditif. Dans le domaine de l'apprentissage implicite, Le réseau récurrent simple (Simple Reccurent Network, SRN) est un modèle majeur de l'extraction de régularités statistiques séquentielles. Le SRN est un système connexionniste, introduit par Jordan (1986) et développé par Elman (1990), dont le comportement dynamique (son état est déterminé en fonction de l’état précédent et de la stimulation actuelle) le rend particulièrement apte à traiter des patterns temporels. Grâce à des connexions récurrentes, ce réseau peut intègrer les probabilités transitionnelles entre évènements. Le SRN a par exemple été utilisé par Griffith (1993) concernant la reconnaissance d'un centre tonal et de la fonction d'une hauteur dans un contexte tonal. Ces processus impliquent une forme d'invariance perceptive/cognitive caractérisée par la cohérence d'un sous-ensemble de hauteurs et par la fonction de chacune de ces hauteurs à l'intérieur du sous-ensemble. Griffith suggère que ces processus peuvent être partiellement modélisés par des mécanismes qui intègrent les distributions de hauteurs et d'intervalles en fonction du temps. Bien que les jeux de hauteurs utilisées dans différentes tonalités se chevauchent, leur fréquence d'occurrence permet l'identification du contexte et de la fonction des hauteurs. Entraîné sur des extraits de musique tonale, l'activité de la couche cachée du SRN montre des représentations qui simulent en partie la fonction des hauteurs en contexte. CONCLUSION Les travaux actuels sur l’apprentissage implicite sont importants pour les sciences de la musique car ils conduisent à repenser le statut des compétences cognitives requises pour les activités musicales. Ces compétences imposent nécessairement la possibilité d’une verbalisation explicite chez les musiciens professionnels, notamment pour les musiciens occidentaux. Le recours à l’explicitation des connaissances semble en effet moins impérieux dans la plupart des musiques traditionnelles du monde. Il n’en reste pas moins que cette nécessité de l’explication, probablement spécifique à notre culture Apprentissage implicite en musique : Théorie et Modèles 23 occidentale, ne doit pas être l’arbre qui cache la forêt : les compétences musicales requises pour l’écoute et pour certaines performances musicales reposent majoritairement sur une grande partie de connaissances acquises implicitement et représentées sous des formats que notre pensée consciente peine à atteindre. Comprendre la sophistication de ces connaissances musicales implicites constitue un enjeu important pour les sciences cognitives et les sciences de la musique : cela devrait permettre de mieux cerner l’origine des aptitudes pour la musique, qui sont probablement bien plus partagées que ce que l’on croit habituellement, et de mieux entrevoir les limites qui pourraient, éventuellement, peser sur leur développement. BIBLIOGRAPHIE Abrams, M., & Reber, A. S. (1988). Implicit Learning: Robustness in the Face of Psychiatric Disorders. Journal of Psycholinguistic Research, 17, 425-439. Allen, R., & Reber, A. S. (1980). Very Long-term Memory for Tacit Knowledge. Cognition, 8, 175-185. Aslin, R. N., Saffran, J. R., & Newport, E. L. (1998). Computation of conditional probability statistics by human infants. Psychological Science, 9, 321-324. Bharucha, J. J., & Stoeckig, K. (1986). Reaction Time and Musical Expectancy: Priming of Chords. Journal of Experimental Psychology: Human Perception and Performance, 12(4), 403-410. Bharucha, J.J., & Stoeckig, K., (1987). Priming of Chords: Spreading Activation or Overlapping Frequency Spectra? Perception & Psychophysics, 41, (6), 519-524. Bharucha, J., & Todd, P.M. (1991). Modeling the Perception of Tonal Structure with Neural Nets. In P.M., Todd & D.G. Loy (Eds), Music and Connectionism, MIT. Bigand, E., Madurell, F., Tillmann, B., & Pineau, M. (1999). Effect of Global Structure and Temporal Organization on Chord Processing. Journal of Experimental Psychology: Human Perception and Performance, 25, 184-197. Bigand, E., Perruchet, P., & Boyer, M. (1998). Implicit Learning of Artificial Grammar of Musical Timbres. Current Psychology of Cognition, 17, 577-600. Bigand, E., & Poulin-Charronnat, B. (2006). Are we “Experienced Listeners”? A Review of the Musical Capacities that do not Depend on Formal Musical Training. Cognition, 100, (1), 100-130. Cosi, P., De Poli, G., & Lauzzana, G. (1994). Auditory Modeling and Self-organizing Neural Networks for Timbre Classification. Journal of New Music Research, 23, (1), 71-98. Creel, S. C., Newport, E. L., & Aslin, R. N. (2004). Distant Melodies: Statistical Learning of Non-adjacent Dependencies in Tone Sequences. Journal of Experimental Psychology: Learning, Memory and Cognition, 30, 1119-1130. Delbé, C., Bigand, E., & French, R. (2006). Asymmetric Categorization in the Sequential Auditory Domain. Proc. Of the 26th Annual Conference of the Cognitive Science Society. Desain, P., & Honing, H. (1989). The quantization of musical time: a connectionist approach. Computer Music Journal, 13(3). Elman, J.L. (1990). Finding Structure in Time. Cognitive Science, 14, 179-211. Francès, R. (1958). La perception de la musique. Paris : Vrin. Griffith, N. (1993). Modeling the Acquisition and Representation of Musical Tonality as a Function of Pitch-use Through Self-organizing Artificial Neural Networks. University of Exeter, PhD. Huron, D. (2006). Sweet Anticipation: Music and the Psychology of Expectation. Cambridge, Massachussetts: MIT Press. Jordan, M. I. (1986). Serial order: A parallel distributed processing approach. San Diego: Institute for Cognitive Science, University of California. Krumhansl, C. L. (1990). Cognitive Foundations of Musical Pitch. New York: Oxford University Press. Laden, B., & Keefe, D.H., (1989). The Representation of Pitch in a Neural Network 24 E. BIGAND, C. DELBE Model of Chord Classification. Computer Music Journal, 13(4). Leman, M. (1991).The Ontogenesis of Tonal Semantics: Results of a Computer Study. In P.M. Todd & D.G. Loy (Eds), Music and Connexionism, Cambridge MA: MIT Press, 195-211. Lerdahl, F. (1988). Cognitive Constraints on Compositional Systems. In J. Sloboda, ed., Generative Processes in Music. Oxford: Oxford University Press. Lerdahl, F., & Jackendoff, R. (1983). A Generative Theory of Tonal Music. Cambridge, MA: MIT Press. McAdams, S. (1989). Contraintes psychologiques sur les dimensions porteuses de forme en musique. In McAdams & I. Deliège (Eds), La musique et les sciences cognitives, Bruxelles : Mardaga, 257-28. Meyer, L. B. (1956). Emotion and Meaning in Music. Chicago: Chicago University Press. Mozer, M. C. (1991). Connexionist Music Composition Based on Melodic, Stylistic and Psychophysical Constraints. In P. M. Todd & D. G. Loy (Eds), Music and Connexionism, Cambridge MA: MIT Press, 195-211. Page, M. (1993). Modeling Aspects of Music Perception Using Self -Organizing Neural Networks. University of Wales, PhD. Perruchet, P., & Vinter, A. (2002). The Self-organizing Consciousness. Behavioral and Brain Sciences, 25, (3), 297-330. Pineau, M., & Tillmann, B. (2001). Perception des structures musicales. Paris : L'Harmattan. Reber, A. S. (1967). Implicit Learning of Artificial Grammars. Journal of Verbal Learning and Verbal Behavior, 6, 855-863. Reber, A. S. (1989). Implicit Learning and Tacit Knowledge. Journal of Experimental Psychology: General, 118, 219-235. Reber, A. S. (1992). The Cognitive Unconscious: An Evolutionary Perspective. Consciousness and Cognition, 1, 93-133. Reber, A. S., Walkenfeld, F. F., & Hernstadt, R. (1991). Implicit and Explicit Learning: Individual Differences and IQ. Journal of Experimental Psychology: Learning, memory and cognition, 17, 888-896. Saffran, J. R., Johnson, E. K., Aslin, R. N., & Newport, E. L. (1999). Statistical Learning of Tone Sequences by Human Infants and Adults. Cognition, 70, 27-52. Saffran, J. R., Aslin, R. N., & Newport, E. L. (1996). Statistical Learning by 8-month old Infants. Science, 274, 1926-1928. Sano, H., & Jenkins, B. K. (1991). A Neural Network Model for Pitch Perception. In P. Todd & G. Loy (Eds), Music And Connectionism, Cambridge :MIT Press, 42-49. Scarborough, D. L., Miller, B. O., &Jones, J. A. (1991). Connectionist Model for Tonal Analysis. Computer Music Journal, 13, (3). Schellenberg, E. G., Adachi, M., Purdy, K. T., & McKinnon, M. C. (2002). Expectancy in Melody: Tests of Children and Adults. Journal of Experimental Psychology: General, 131, 511-537. Schellenberg, G., Bigand, E., Poulin, B., Garnier, C., Stevens, C., (2005). Children's Implicit Knowledge of Harmony in Western Music, Developmental Sciences, 8, (6), 551-566. Soltau, H., Schultz, T., Westphal, M., &Waibel, A. (1998). Recognition of Music Types. Proceedings of ICASSP 98. Tekman H. G., & Bharucha J. J, (1998). Implicit Knowledge Versus Psychoacoustic Similarity in Priming of Chords. Journal of Experimental Psychology: Human Perception and Performance, 24(1), 252-260. Tillmann, B., Bharucha, J., & Bigand, E. (2000). Implicit Learning of Tonality : A SelfOrganizing Approach. Psychological Review, 107, 885-913. Tillmann, B., Bigand, E., & Pineau, M. (1998). Effect of Local and Global Contexts on Harmonic Expectancy. Music Perception,16, 99-118. Tillmann, B., & Bigand, E. (2001). Global Context Effects in Normal and Scrambled Musical Sequences, Journal of Experimental Psychology: Human Perception and Performance, 27, 1185-1196. Apprentissage implicite en musique : Théorie et Modèles 25 Tillmann, B., Bharucha J.J, (2002). Effect of Harmonic Relatedness on the Detection of Temporal Asynchrones. Perception & Psychophysics, 64, (4), 640-649. Tillmann, B., & McAdams, S. (2004). Implicit Learning of Musical Timbre Sequences: Statistical Regularities Confronted with Acoustical (Dis)similarities. Journal of Experimental Psychology: Learning, Memory & Cognition, 30, (5), 1131-1142. Toiviainen, P. (1995). Modeling the Target-note Technique of Bebop-style Improvisation: An Artificial Neural Network Approach. Music Perception, 12, (4), 399-413. Trehub, S., & Trainor, L. (1994). Les stratégies d’écoute : origines du développement du développement de la musique et de la praole. In McAdams & Bigand (1994), Penser les sons : Psychologie cognitive de l’audition, Paris : Presses Universitaires de France, 299-347. FIGURES Figure 1 : Exemple de grammaire artificielle à état fini. Les chaînes grammaticales sont engendrées en suivant les flèches en passant d’un nœud de la grammaire à un autre, de l’entrée à la sortie. 26 E. BIGAND, C. DELBE Figure 2 : a) Architecture de MUSACT. b) Propagation d'activation en réponse à une triade (Do Majeur) Keys Major Chords TONES Minor Chords F#/Gb C#/Db G#/Ab D#/Eb A#/Bb F C G D A E B F#/Gb C#/Db G#/Ab D#/Eb A#/Bb F C G D A E B A A#/Bb rd#/eb a#/bb B C C#/Db D D#/Eb E F F#/Gb f c g d a e b f#/gb c#/db g#/ab G G#/Ab Bottom-Up Activation Major Chords Tones Minor Chords (linked to right edge) Keys F#/Gb C#/Db G#/Ab D#/Eb A#/Bb F C G D A E B F#/Gb C#/Db G#/Ab D#/Eb A#/Bb F C G D A E B A A#/Bb B C C#/Db D D#/Eb E F F#/Gb G G#/Ab d#/eb a#/bb f c g d a e b f#/gb c#/db g#/ab (linked to upper edge-keys) (linked to left edge) (linked to lower edge-minor chords)