Composition musicale : représentations, granularités

Transcription

Composition musicale : représentations, granularités
Intellectica, 2008/1-2, 48-49, pp. 155-174
Composition musicale : représentations, granularités,
émergences
Horacio VAGGIONE
RESUME : Ce texte aborde le sujet des représentations opératoires (symboles,
notations, écritures) qui sous-tendent la pratique de la composition musicale,
spécialement celle qui se développe actuellement avec des moyens informatiques
(composition électroacoustique, composition assistée par ordinateur). Afin de situer le
sujet dans une perspective plus ample, on rappelle les grandes lignes de la critique
herméneutique de la représentation, ainsi que de la critique de l’algorithmique
linéaire, ces deux courants de pensée coïncidant dans la nécessité d’une
« incomplétude » formelle comme condition de tout engagement dans l’action (ainsi
que de tout comportement « intelligent »). Une place importante est réservée au
concept de réseau, ainsi qu’à celui de granularité, car ces concepts impliquent un
« changement de fonction de la fonction » : une révision de la logique du
fonctionnalisme à partir d’une logique de l’émergence.
Mots clés : représentations musicales, composition multi-échelle, réseaux,
engagement dans l’action, situation, interaction, émergence, approche multi-locale,
granularité.
ABSTRACT: Music Composition: Representations, Granularities, Emergences.
This text approaches the subject of musical representations, specially within the field
of computer-aided composition. To situate the subject on a broader perspective, we
recall the main lines of the hermeneutical critics of representation, as well as the
critics of linear algorithmics, these two currents of thought coinciding in the necessity
of a formal « uncompleteness » as a condition of any committement to action (and of
any « intelligent » behaviour). An important place is reserved to the concept of
network, as well as that of granularity, as these concepts imply a revision of the logic
of functionalism in the light of a logic of emergence.
Keywords: Musical representations, multi-scale composition, networks, commitment
to action, situation, interaction, emergence, multi-local approach, granularity.
« …on court toujours le risque d'enfanter un mythe du symbolisme
ou un mythe des processus mentaux. Au lieu de dire simplement ce
que chacun sait et ne peut pas ne pas accorder »
Wittgenstein, 1953, p. 221.
INTRODUCTION
Ce texte aborde le sujet des représentations (symboles, notations, écritures)
qui sous-tendent la pratique de la composition musicale, spécialement celle qui
se développe actuellement avec des moyens informatiques (composition
Université Paris VIII, CICM (Centre de recherche Informatique et Création Musicale).
http://cicm.mshparisnord.org. E-mail : [email protected].
© 2008 Association pour la Recherche Cognitive.
156
H. VAGGIONE
électroacoustique, composition assistée par ordinateur). S’agissant de
représentations, un regard même sommaire sur quelques-unes de leurs
résonances cognitives s’avère nécessaire. Les nombreuses références hors
musique qui suivront, notamment celles qui, dans le cadre des sciences
cognitives, renvoient aux auteurs pionniers (années 1980 et 1990) de la critique
herméneutique de la représentation, vont nous permettre de réaffirmer, en tout
état de cause, l’engagement du musicien dans l’action (ce qu’on appelle
ici l’opératoire). Elles vont nous permettre aussi d’évoquer l’incomplétude
formelle inhérente aux situations interactives, dont les processus
compositionnels font partie (comme d’ailleurs tout comportement
« intelligent »). L’interaction, précisément, va dégager l’argument également
essentiel d’une révision (d’un recentrage) du rôle des algorithmes en tant que
composantes de systèmes complexes. Le concept de réseau, critiqué dans sa
version connexionniste, va nous fournir la base d’une organisation opératoire
des représentations musicales. En outre, on évoquera, sans systématicité, la
question de la « granularité » des représentations. Cette dernière question est
pertinente dans le domaine de la composition musicale assistée par ordinateur,
car elle a suscité le développement d’une approche multi-échelle ouvrant la
voie à un « changement de fonction de la fonction », impliquant une révision
de la logique du fonctionnalisme classique à partir d’une logique de
l’émergence.
SYMBOLES, SUB-SYMBOLES, RÉSEAUX : REMARQUES MÊLÉES
Parler de « symbole» est toujours risqué, compte tenu de la polysémie du
terme. Dans ce texte, on ne considérera pas des sens tels qu’évocation,
référence, expression, et ainsi de suite : on se tiendra à la notion d’outil
compositionnel, relevant quelques-unes de ses caractéristiques constitutives
(discrétisation, stratification, encapsulation, réversibilité, etc.). Cet outil, ce
moyen d’écriture (présent sous forme de script, de patch, de fonction
graphique) véhicule une pensée opératoire qui constitue le socle de l’actionperception musicale. C’est parce qu’il est possible de construire des réseaux de
représentations diverses, relevant d’échelles temporelles multiples, situées
entre le microtemps (la microstructure des sons) et le macrotemps (les figures
musicales de diverses tailles) qu’on peut travailler dans le composable,
intervenir à tout moment pour généraliser un détail, travailler une saillance,
itérer des flux de données, et ainsi de suite. Une pensée opératoire musicale ne
saurait en aucun cas se confondre avec un quelconque « mécanisme » formel
qui ne tiendrait pas compte du contexte (interactif, ouvert, multi-échelle) du
composable. J’espère que ce point essentiel pourra s’éclaircir au long de ce
texte.
La polysémie du « symbolique » pourrait, par ailleurs, se trouver à l’origine
des ambiguïtés qui entourent la signification de quelques-uns de ses dérivés. Le
terme sub-symbolique vient immédiatement à l’esprit, surtout si l’on a affaire à
des opérations réalisées avec des moyens numériques. Ce terme prend des sens
différents, selon les disciplines ; entre autres : (1) ce qui se trouve littéralement
au-dessous des symboles formels ; (2) ce qui, en termes opératoires, n’est pas
réversible ; (3) ce que la perception ne peut pas distinguer. Ces trois sens ne
sont pas, en fait, si radicalement différents : seulement leurs fonctions
paradigmatiques permettent de les distinguer.
Le premier sens est utilisé dans les sciences de la cognition par les courants
connexionnistes (notamment à partir du recueil classique de D. Rumelhart et J.
Composition musicale : représentations, granularités, émergences
157
McClelland, 1986)1. Le niveau sub-symbolique est parfois appelé « subconceptuel » (Smolensky, 1988) ; il représente des organisations distribuées
(des réseaux) dont le sens global (le sens symbolique) émerge de la connexion
de grandes quantités d’entités élémentaires (appelées – métaphoriquement –
« neurones ») : on parle alors de dispositifs « massivement parallèles ». Le
parallélisme constitue un modèle d’organisation extrêmement fertile,
aujourd’hui très répandu, mais il faut rappeler, en tout état de cause, qu’il ne
constitue nullement un aspect qui appartiendrait en propre au connexionnisme2.
On pourrait par ailleurs reprocher au connexionnisme le fait de concevoir la
mécanique sub-symbolique seulement en tant que moyen efficace de capture
de symboles macroscopiques (plus efficace que la manipulation
« computationnelle » de ces symboles), la motivation étant évidemment
d’ordre technologique : éviter le « goulot d’étranglement » (bottleneck) des
systèmes symboliques séquentiels. Cette motivation est sans doute
raisonnable3. Mais le problème que soulève l’approche connexionniste provient
du fait que la différence entre les termes et les connexions est conçue comme
étant absolue – la cohérence de l’approche proposée dépendant évidemment de
ce postulat. En outre, dire que le sens symbolique « émerge » (apparaît, jaillit)
de l’état global d’un réseau sub-symbolique équivaut à adopter une
directionnalité prédéterminée : le « sens » du réseau connexionniste est
unidirectionnel, bottom-up, malgré le fait qu’il fonctionne de façon
massivement parallèle4. Pour revenir sur la différence entre les termes et les
connexions : une tout autre affaire serait de concevoir cette différence non pas
comme une différence absolue, « de nature », mais comme une différence de
point de vue, concernant la granularité (dépendant de la taille, de l’échelle
temporelle de référence), ainsi que la mobilité fonctionnelle des composantes
d’un réseau. On serait en droit, alors, d’affirmer un concept de réseau de type
multi-échelle : un réseau est fait d’objets, mais chaque objet appartenant à un
réseau est aussi, en lui-même, un réseau. Dans les limites des échelles
temporelles auxquelles nous avons accès, tout réseau d’objets est composé par
des objets qui sont eux-mêmes des réseaux (Vaggione, 2003). Évidemment,
ces réseaux ne sont pas « de bas niveau » ; cependant, ils peuvent recevoir et
faire circuler des granularités de toutes tailles. Il est vrai que la question reste
1
Concernant des propositions d’application du connexionnisme au champ musical (de la synthèse des
sons à l’analyse syntaxique), je renvoie au recueil « historique » de G. Loy, 1989a. Voir aussi Leman,
1995 ; Camurri et Leman, 1997.
2
Les modèles parallélistes (y compris celui de réseau) ont été développés en informatique bien avant la
formulation des stratégies connexionnistes (cf. sur ce point Loy, 1989b). Quant à l’idée d’utiliser un
réseau de micro-traits pour capturer des détails des sons, elle avait été mise en pratique dans le domaine
de l’analyse-synthèse sonore numérique par J. Strawn (cf. Strawn, 1980). Cependant, l’ « analyse
syntaxique » de Strawn ne relevait pas du paradigme du parallélisme, mais de celui, antérieur, du
« pattern matching » séquentiel, bien que prenant en compte plusieurs échelles temporelles. J’ai
présenté ailleurs des résumés de cette « analyse syntaxique » (cf. Vaggione, 1993, 1998).
3
Cependant, on pourrait questionner le rôle que le connexionnisme assigne par hypothèse aux
neurones : car « nous ne savons pas réellement comment la computation est faite aux niveaux plus bas
du cerveau. Il y a des doutes si le neurone est l’unité fonctionnelle du système nerveux, ou si un seul
neurone peut agir comme s’il contenait beaucoup d’unités plus petites et indépendantes » (Brooks
1991b). Sur ce point, cf. aussi Cohen et Wu, 1990.
4
Je reviendrai maintes fois sur ce point : un simple schème ascendant (bottom-up) ne saurait suffire à
une saisie du concept d’émergence dans toutes ses implications structurelles. Dans l’utilisation du terme
qu’on a fait dans ce texte, il est question d’émergence pour signifier la mise en place d’une multiplicité
de vectorisations simultanées.
158
H. VAGGIONE
posée sur la nécessité, pour un réseau quelconque, d’être sous-tendu par des
particules insécables. On retournera sur ce sujet polémique vers la fin de ce
texte (notamment à propos de la différence « catégoriale » entre signal et
symbole).
Par ailleurs, le reproche majeur à faire au connexionnisme, au-delà d’une
conception limitée du concept de réseau, serait de ne pas avoir suffisamment
théorisé l’idée de représentation. On verra plus loin qu’il en a été autrement
dans le cas des courants ayant approché une critique (herméneutique) de la
représentation. Cette critique s’est prolongée dans les propositions de
l’informatique et de la « nouvelle IA » qui ont situé le concept d’interaction au
cœur de systèmes complexes, en déplaçant celui d’autonomie d’algorithmique.
Le deuxième sens du sub-symbolique provient de l’informatique,
constituant une caractéristique de la numérisation. On peut qualifier de subsymbolique un signe qui n’est pas sous-tendu par d’autres signes. Ainsi, par
exemple, les « pixels » sont des sub-symboles car ils ne représentent rien qui se
trouverait au-dessous d’eux-mêmes : ils acquièrent une signification seulement
sous une double condition : (1) se trouver intégrés dans un contexte, et (2)
véhiculer des processus réversibles (on verra tout de suite, à propos des images
du sonagramme, qu’une seule de ces conditions ne saurait suffire à caractériser
une représentation opératoire).
Un signe sub-symbolique est dans tous les cas une entité simple, atomique,
tandis qu’un symbole (dans le sens opératoire employé dans ce texte) est déjà,
indépendamment de sa taille temporelle, un multiple, un réseau contenant
plusieurs strates de représentation, de nature diverse, qui se trouvent réunies,
ou « encapsulées », dans un objet – dans une entité conçue en tant que support
d’une action compositionnelle au sens large (Vaggione, 1991). Les symboles
musicaux ne sont jamais neutres. Ils constituent des conglomérats de pointeurs
agglutinés en fonction de leur valence opératoire. Le système de la notation
musicale conventionnelle présente déjà une structure interne hautement
stratifiée : il constitue effectivement un conglomérat de plusieurs types de
représentation, de nature très hétérogène, qui coexistent sans pourtant se
rattacher aux mêmes plans de référence. Dans le cas de la musique
électroacoustique, de nouveaux traits viennent s’ajouter, correspondant à des
échelles temporelles non couvertes par le système notationnel conventionnel
(la synthèse et la transformation des sons par des techniques informatiques).
Face à cette diversité notationnelle, il s’avère nécessaire de trouver des
stratégies concernant leur « vectorisation commune ».
C'est en pensant dans ces termes que j'ai été amené, depuis les années 1980
– confronté, comme d'autres compositeurs travaillant avec des moyens
numériques, à ce genre de problèmes – à concevoir des processus de
composition basés sur « la définition logicielle d'entités actives (les objets)
dotées de modalités de comportement spécifiques (leurs méthodes),
déterminées de manière numérique (leurs codes) et dont la fonctionnalité est en
même temps dépendante de leurs contenus et du contexte de leur utilisation –
car tout objet logiciel, étant un réseau, est continuellement reconfigurable,
comme l'est également le macro-réseau5 qui le contient » (Vaggione, 1998). Il
5
Ce « macro-réseau » est essentiellement un réseau comme les autres, mais il les englobe car il
constitue l'ensemble des ressources d'un processus compositionnel. Ainsi quand je parle de réseau
compositionnel dans lequel circulent les objets, il ne faut pas voir une prééminence ontologique de
celui-ci sur les réseaux qui sont les objets eux-mêmes.
Composition musicale : représentations, granularités, émergences
159
est à signaler que, ainsi conçu, le réseau d’objets possède un caractère
fortement interactif : aucune détermination logicielle ne fonctionne comme
algorithme autonome. Le réseau est continuellement reconfigurable parce qu’il
n’est pas une collection de boîtes noires, mais qu’il accueille toujours des
actions, des « gestes », des interventions manuelles6, des décisions concernant
un certain local ou un certain global – un « état composable », et non pas un
mécanisme fixé à l’avance.
Le troisième sens du terme « sub-symbolique », dérivé du deuxième, dénote
la non-perceptibilité des unités minimales qui sont à la base de la numérisation.
Comme le dit C. Roads : « les échantillons individuels sont sub-symboliques –
perceptivement non-distinguables l’un de l’autre. C’est intrinsèquement
difficile d’aligner les échantillons ensemble afin de former des symboles
musicalement signifiants » (Roads, 2001). Ici encore, les sub-symboles
n’acquièrent un sens qu’une fois insérés dans des configurations plus vastes, la
mesure de la perceptibilité de ces configurations étant donnée par la masse
critique d’échantillons ressemblés. Nous trouvons par ailleurs, dans cette
citation de Roads, le fait de l’intrication entre les concepts de perceptibilité et
d’opérabilité.
Le terme sub-symbolique est parfois employé également en musique
informatique pour désigner ce qui n’est pas du ressort de la notation musicale
conventionnelle, c’est-à-dire, ce qui relève du niveau de la synthèse sonore, qui
montre une granularité plus fine que celle des « notes » macroscopiques. Cela
conforte la vision traditionnelle qui réserve aux symboles musicaux purement
macroscopiques le monopole d’un statut syntaxique (articulatoire). Cependant,
il est clair que les outils logiciels dont nous disposons pour travailler les
morphologies au niveau des micro-échelles temporelles (le niveau de
pertinence opératoire de la synthèse sonore, celui de l’écriture directe des sons)
constituent bien des entités symboliques, car ils sont, comme on l’a vu, des
objets stratifiés (des réseaux) contenant plusieurs types de représentation,
appartenant à diverses échelles temporelles. On peut ainsi considérer ces outils
logiciels de synthèse sonore comme étant de véritables formes de notation.
Une forme de notation prenant explicitement en charge des opérations
musicales comporte toujours des représentations réversibles – pouvant passer
par conversion directe des symboles aux sons et vice-versa ; par exemple, le
cas des opérations réalisées dans le domaine du micro-temps, pouvant passer
de l’analyse numérique spectrale des sons à leur resynthèse. Par contre, on peut
désigner comme sub-symboliques (dans le sens 2) toutes les « images » qui ne
sont pas convertibles, qui ne s’insèrent pas dans des processus réversibles,
n’étant donc pas des causes directes de production sonore. Le sonagramme
classique constitue un cas de ce genre : il présente une image automatique
produite par un algorithme d’analyse spectrale d’un signal sonore, rendue sous
la forme d’un ensemble de pixels, mais ces pixels ne nous permettent pas de
reconstituer le signal analysé (d’en faire une resynthèse). On peut trouver des
applications pour des telles images sub-symboliques. Cependant, n’étant pas
des notations, elles vont nécessiter la mise en place de stratégies additionnelles
pour faire accéder au niveau pleinement opératoire les informations qu’elles
portent. Ces stratégies additionnelles sont parfois qualifiées de pré6
J’ai été ainsi intéressé par les environnements logiciels interactifs laissant une large place aux
interventions directes. La programmation « orientée-objet » offre cette possibilité, surtout dans ses
derniers avatars, y compris le « live coding » (la programmation directe, « sur la marche »).
160
H. VAGGIONE
symboliques, notamment dans les situations où il s’agirait d’extraire des
informations d’ordre physique (spectrales, par exemple) pour les quantifier et
les récupérer au niveau de la notation musicale macroscopique (Assayag et al.,
1997).
CRITIQUES DE LA REPRÉSENTATION
Ayant abordé le fait d’écriture – le fait représentationnel – du point de vue
de l’opératoire musical, je vais me tourner, comme prévu, vers la
problématique générale de la représentation. En informatique et en sciences
cognitives, on a vu naître, dès la fin des années 1970, des propositions
alternatives au cognitivisme classique, des propositions aussi diverses que
celles de Dreyfus, 1979, 1981, 1986 ; Winograd, 1979, 1989, 1997 ; Winograd
et Flores, 1986 ; Brooks 1987, 1991a, 1991b ; Chapman, 1991 ; Wegner
1997 – entre autres. Toutes ces propositions contiennent, sous une forme ou
une autre, une critique de la représentation. Je vais commenter rapidement
quelques-unes – même si elles sont aujourd’hui fort bien connues – car le sujet
de la critique de la représentation est capital pour notre propos.
Le mérite de Dreyfus, le premier à soulever la question, a été d’articuler
une critique herméneutique de l’intelligence artificielle à partir d’une lecture
heideggerienne de la situation, chose vraiment inattendue à l’époque, et de
mener sous cette base une attaque frontale contre la réduction formaliste. Le
mérite de Winograd, touché lui aussi par la phénoménologie, a consisté en
postuler que l’ordinateur n’est pas une machine isolée, mais qu’il constitue une
« composante de systèmes complexes », en incluant dans ces systèmes
l’homme lui-même, l’homme situé en tant que référent d’un « nouveau
design » de programmes informatiques fortement interactifs7. Selon Winograd,
« l’approche herméneutique » postule que « les concepts émergent dans
l’interaction plutôt que dans la machine ou dans la tête de
l’utilisateur » (Winograd, 1997). On reviendra sur cette idée plusieurs fois au
long de ce texte.
On peut considérer l’approche de l’énaction (Varela, 1989)8, sans trop
regarder l’historique du terme, comme étant l’une des manifestations de ce
grand courant critique de la situation – interaction. L’idée varelienne de
l’énaction met l’accent sur la notion de « couplage structurel » (Maturana et
Varela, 1980), afin de situer la cognition en tant qu’action visant à « faireémerger » un « monde non prédéfini »9. Il s’agirait, dans cette approche, de
7
Ainsi Winograd écrivait en 1979 : « Les ordinateurs ne sont pas utilisés seulement pour résoudre des
problèmes bien structurés, ils constituent plutôt des composantes de systèmes complexes (…)
Programmer, dans le futur, dépendra de plus en plus de comment spécifier des comportements (…) Afin
de comprendre l’interaction entre des composantes indépendantes, nous serons concernés par des
aspects détaillés de leur comportement temporel. La machine doit être pensée comme un mécanisme
avec lequel nos interagissons, et non comme une abstraction mathématique qui peut être complètement
caractérisée en fonction de ses résultats » (Winograd, 1979, p. 393).
8
Il faut remarquer qu’il existe actuellement un domaine scientifique libellé « énactif », s’occupant
surtout de la conception d’interfaces informatiques dynamiques, et dont les bases théoriques ne dérivent
pas des auteurs cités, mais d’une autre ligne de pensée dont l’origine remonte aux travaux du
psychologue J. Bruner (Bruner, 1966). Bien entendu, le terme est parfois pris dans le sens varélien. Cf.
le site du programme de recherche ENACTIVE, financé par l’Union Européenne. Concernant les
interfaces musicales énactives, voir Cadoz, 2006 ; Wessel, 2006.
9
Pour un commentaire rondement mené de la notion d’émergence musicale à partir de celle de
feedback, jusqu’au « faire-émerger » de Varela, selon les assomptions compositionnelles d’Agostino Di
Composition musicale : représentations, granularités, émergences
161
« travailler sans représentations » – dans la mesure où celles-ci renvoient à un
monde prédéfini : « seul un monde prédéfini peut être représenté » (Varela,
1989, p. 92).
La critique de la représentation est, on l’a vu, une condition qui se trouve
également énoncée par les autres auteurs que je viens de citer. On pourrait
résumer l’élément commun aux divers avatars de cette critique de la
représentation dans une terminologie proche à la fois de l’herméneutique et de
la systémique, de la manière suivante : une existence située ne saurait se
manifester que dans l’interaction (dans la réciprocité, l’asymétrie,
l’incomplétude, et ainsi de suite), et non pas dans la fixation et la prédictibilité
d’un système fermé.
Ainsi formulée, la critique de la représentation énonce tout d’abord, à ce
qu’il me semble, une condition : un impératif de ne pas hypostasier les
représentations, car les hypostases constituent précisément ce qui rend
impossible tout type d’émergence (cf. infra). Le cognitivisme classique a
certainement hypostasié le concept de représentation. Dans le cas de la critique
de la représentation, au contraire, ce qui est mis en avant c’est le fait que les
représentations n’ont pas de réalité intrinsèque : elles ne sont que des outils qui
pointent vers une émergence contextuelle, correspondant à une situation, ou,
comme dit Varela, à un couplage structurel. Ce qui implique justement une
valorisation d’un « faire » – d’un engagement dans l’action. On doit dès lors
faire attention dans l’utilisation du terme, car on n’est pas en train de parler
d’une simple émergence « naturelle » mais d’une émergence « construite » :
« faite » plutôt que « suivie ». Merleau-Ponty (1945, p. 136) parlait à ce sujet
d’« arc intentionnel »10 : ce qui correspond à la plus proche relation, au
couplage le plus fin entre un actant et le monde de son action – en d’autres
termes : plus un actant se situe (s’engage) dans le monde de son action, plus il
agit « sans représenter » ou même « sans se représenter », car il est, à ce degré
de proximité de ce monde, dans la situation de la présentation.
Dans cette optique, et si on se tourne vers notre condition située d’actants
dans notre rapport avec l’ordinateur, qui ne saurait être qu’une composante de
notre situation, on peut dire, avec P. Wegner, que « l’interaction est plus
importante que les algorithmes ». Car les algorithmes sont, dans leur propre
ontologie régionale, complets (finis, fermés), tandis que « le choix engagé dans
l’action est, par nature, incomplet » (Wegner, 1997). Ici se trouve l’argument
essentiel d’une révision (d’un recentrage) du rôle des algorithmes dans l’action
productive, et par conséquent de celui de la logique propositionnelle ellemême. L’argument de Wegner s’inscrit dans le dépassement du paradigme des
machines de Turing : le fait que « les machines de Turing ne peuvent pas
modeler l’interaction » est dû à « l’impossibilité théorique d’une réduction de
la computation à la logique. (…) L’argument-clé a trait à l’inhérent « tradeoff »
entre complétude logique et engagement. Le choix engagé dans l’action est
incomplet, de façon inhérente, parce que cet engagement coupe des branches
de l’arbre des preuves qui pourraient contenir la solution, et donc que
Scipio, voir Solomos, 2005. La « théorie de l’émergence sonologique » de Di Scipio constitue un
exemple de la problématique du dépassement du dualisme forme-matériau, dépassement qui est, d’une
façon ou d’une autre, une question qui revient sans cesse dans la composition musicale aujourd’hui (Di
Scipio, 1995, 2003). Une autre conception de l’émergence musicale, basée sur la construction de
« macrosons » d’après une relation d’échelles auto-similaires, est exposée dans Bokesoy, 2006.
10
Dreyfus se réfère à ce concept de Merleau-Ponty dans Dreyfus, 2001.
162
H. VAGGIONE
l’engagement est incompatible avec une exploration complète » (Wegner,
1999). Et il poursuit : « Ces résultats négatifs ont pavé la voie vers le
développement de modèles positifs de computation interactive » (ibid.).
Des auteurs mentionnés, à part Wegner (chercheur en informatique),
Brooks (chercheur en intelligence artificielle) a fait des propositions allant dans
le sens d’une incomplétude nécessaire à l’action. Pour Brooks, il ne saurait y
avoir de comportements intelligents se référant à une « représentation
centrale » (qui serait, comme on l’a vu, une hypostase, fermée à de véritables
interactions – c’est-à-dire, des actions imbriquées non prévues dans le
système). Pour Brooks, l’absence de représentation centrale constitue l’élément
essentiel d’une situation cognitive où l’on quitte les « micro-mondes » décontextualisés (comme ceux de l’IA première manière – cf. par exemple
Minsky, 1986) pour viser, au contraire, la complexité ouverte du « monde
réel » (Brooks, 1991a, 1991b). Bien entendu, Brooks se réfère à des
constructions relevant de l’IA, mais cette position retombe sans tarder sur une
épistémologie de la cognition et de l’action en général.
Que veut donc dire en réalité la proposition : « travailler sans
représentations » ? On a vu la réponse de Varela : « seul un monde prédéfini
peut être représenté », mais un tel monde n’est pas viable, on ne tirera rien de
sa prédéfinition, qui sera toujours illusoire – car un « monde » ne saurait être
connu que par l’échange (le couplage structurel). Pour Winograd, cela veut dire
abandonner ce qu’il nomme la « rationalité classique », c’est-à-dire, la
rationalité hilbertienne de l’axiomatique comme « compression » du réel par et
dans le calcul. Pour Brooks, c’est abandonner l’idée de fournir à une « créature
artificielle » des règles formalisant des « connaissances » inoculées au fur et à
mesure qu’on aborde la définition des tâches qu’elle devra accomplir – car,
autrement, elle ne pourra pas faire face à des situations réelles qui
demanderaient des comportements non prévus dans les règles dont elle
dispose. En d’autres mots : aucun type de comportement « intelligent » ne
saurait se manifester en dehors d’une incomplétude formelle.
Brooks soulève encore un point, dans sa critique de la représentation : « un
extrémiste dirait que nous avons réellement des représentations, mais qu’elles
sont implicites. (…). Cependant, nous ne sommes pas satisfaits avec
l’appellation représentation appliquée à ces choses-là » (Brooks, 1991a). En
effet, postuler que nous avons des « représentations implicites », c’est
certainement aller à l’encontre de l’idée même de représentation : une
représentation cachée n’a pas de sens. Wittgenstein dirait à ce propos que nous
sommes face à un cas illusoire de « langage privé » : il dirait « comment le
savez-vous ? et que veut dire ici savoir si cela n’a pas de sens de supposer que
vous pourriez ne pas le savoir ou en douter ? » (Bouveresse, 1976, p. XIII).
LES LIMITES DE LA FORMALISATION
De toutes ces critiques de la représentation, se dégage, à ce qu’il me
semble, un point essentiel : ce de quoi il est question, c’est de l’impossibilité de
représenter un « monde arrêté » (Adorno dirait un monde « mutilé »11), et de la
difficulté de rendre compte du « monde réel » (non réduit à une quelconque
11
En mentionnant Adorno, j’ai conscience de faire un amalgame : nulle dialectique n’est à ce point
requise. Cependant, je pense, en dehors de toute dialectique, que le cognitivisme a constitué une
véritable « mutilation », réalisée par le biais du « knowledge engineering », de toute pensée, y compris
celle du calcul lui-même.
Composition musicale : représentations, granularités, émergences
163
abstraction) au moyen d’une axiomatique. Comme le dit Granger par rapport à
la philosophie : « L'axiomatisation suppose en effet d'abord la possibilité d'une
réduction à un petit nombre de propositions. (...) Mais si la philosophie est une
tentative pour organiser les significations attribuables aux contenus d'une
expérience, ou bien les formules proposées en petit nombre pour les exprimer
demeureront larges et vagues, ou bien leur précision trop sèche et le plus
souvent illusoire laissera échapper de ces contenus des aspects essentiels »
(Granger 1994, p. 389). Mais Granger nous dit encore plus : que le philosophe,
« à différents moments de son exploration, enrichit – et quelquefois
subrepticement – ses propositions primitives, ce qui serait assurément le péché
capital contre l’authenticité de l’axiomatisation » (ibid., p. 390).
Du point de vue de la composition musicale, nous trouvons une situation
pareille d « enrichissement » des primitives, ou des conditions initiales d’un
processus qui est, comme on le verra plus loin, toujours incertain, malgré les
stratégies mises en place pour l’aborder (lesquelles seront à coup sûr
contournées par le compositeur lui-même, au profit de ce qui émerge de son
action – habituellement le compositeur revendique fièrement cette trahison aux
règles, qu’elles soient propres ou imposées : « L’œuvre musicale fait ses
propres règles », disait Debussy ; « Souvent, j’oublie mes codes », disait
Donatoni). En composition musicale, donc, ce qui est important, ce qu’on
demande à un système de représentation, ce n’est pas de fournir une réduction
d’un monde sonore « à un petit nombre de propositions » : c’est le côté
opératoire, constructeur (et son inhérente incomplétude) qui est ici appelé pour
la création de contenus sensibles, ce qui passe par une prolifération (et non pas
par une réduction) de « significations » (et non pas simplement des règles)12.
Dire que l'on compose selon des règles, et que, a fortiori, ces règles peuvent
être comme telles traduites dans un algorithme linéaire, est singulièrement
naïf : « car tout ce qui arrive selon la règle est une interprétation de la règle »
(Wittgenstein, 1953, p. 48). Cela, d’après Brooks, même un bon robot devrait
le comprendre.
Je pense par ailleurs que ce sens de l’opératoire (cet engagement dans
l’action musicale) va si loin qu’il implique également l’auditeur, dans la
mesure où l’auditeur effectue lui-même des opérations. Les opérations
« d’écoute » de l’auditeur sont en quelque sorte impliquées (mais non
déterminées) par celles qui relèvent de la composition : elles présupposent
l’existence d’un processus articulé (une musique), sur lequel, en passant par ses
projections diverses (partitions, performances, enregistrements), va se produire
un couplage avec les moyens opératoires de l’auditeur (cf. A. Soulez et H.
Vaggione, 2006).
De notre point de vue de compositeurs, situés dans cette perspective
opératoire, constructive, nous pouvons envisager, comme je le suggère dans ce
texte, des états de choses « multi-locaux » dans lesquels nous agissons en
choisissant nos degrés de liberté, en travaillant finement les attributs
morphologiques se trouvant dans l’ordre de grandeur des fenêtres (les échelles
temporelles) que nous postulons nous-mêmes. C’est précisément à ce point que
la question de la granularité des représentations se pose (elle est orthogonale
au concept de réseau) compte-tenu de la multiplicité d’échelles temporelles qui
s’imbriquent dans un processus compositionnel. Mais avant d’aborder cette
12
Sur le rôle des règles (des régularités) en tant que « primitifs » sous-tendant les pratiques musicales,
cf. Vaggione, 2001.
164
H. VAGGIONE
question, je voudrais revenir sur le statut singulier de la musique.
SINGULARITÉ DE LA MUSIQUE
Bien entendu, je ne saurais nier la nécessité de la recherche de « solutions
structurées » pour des problèmes bien définis, mais seulement distinguer des
ontologies diverses ou divergentes : l’opératoire musical n’est pas, comme on
vient de le voir, le dérivé « d’un procédé traditionnel d’analyse quantitative »
(Winograd 1997), ou d’une réduction « à un petit nombre de propositions »
(Granger, 1994). De fait, on retrouve, quant à la musique, la pertinence de
l’orientation de Winograd concernant le « design » situé du point de vue d’un
actant considéré en tant que composante d’un système complexe, autant que
celle de la théorisation de Wegner concernant le « glissement de paradigme »
de l’algorithmique linéaire vers l’interaction. En puisant dans notre expérience
de compositeurs, qui correspond à une situation éminemment interactive, on
peut dire que les divers niveaux de granularité que nous établissons, dans le
domaine de l’opératoire musical, ne forment pas une hiérarchie dans le sens
classique du terme, car on ne saurait parler de réduction d’un ordre de grandeur
à un autre : ces ordres de grandeur – ces niveaux, ces granules – constituent des
strates, des perspectives, des fenêtres, qui n’existent que parce qu’ils ont des
interactions avec d’autres strates, etc. C’est cela qui constitue le socle de la
situation multi-locale suggérée dans ce texte.
Dès lors, pour insister encore sur un point crucial, la création musicale ne
saurait être approchée sur le même plan que la modélisation ou la résolution de
problèmes, car son ontologie régionale13 est d’une tout autre nature. Pour
paraphraser encore Winograd : les morphologies que nous composons
« émergent dans l’interaction » plutôt que « dans la machine » ou « dans la
tête » de « l’utilisateur ». Il n’y a rien dans notre action qui puisse se rattacher à
une « recherche de critères objectifs qui se trouverait dans le droit-fil de la
tradition de l’ingénierie » (Winograd, 1993).
Wittgenstein s'est interrogé, à plusieurs reprises, sur ce statut singulier de
l'œuvre musicale : elle apparaît comme étant dans un certain sens « une
solution » sans qu'on puisse formellement définir ou même identifier « le
problème » auquel elle se réfère : « Quand nous parlons d'une symphonie de
Beethoven, nous ne disons pas qu'elle est correcte. Il intervient quelque chose
de tout à fait différent » (Wittgenstein, 1971). Bien entendu, ceci ne constitue
pas une négation de l’existence d’œuvres techniquement défaillantes, mais une
affirmation concernant une différence ontologique. La musique constitue un
engagement dans l’action où les représentations sont, comme on l’a vu,
absolument nécessaires ; seulement, ces représentations ne cherchent pas à
modéliser une réalité out there. On ne trouvera pas dans ces représentations la
prétention de se constituer en tant que « miroir de la nature », selon le mot
celèbre de Rorty. Par ailleurs, ces représentations, bien qu’elles s’appliquent à
des processus temporels, s’accommodent mal à des raisonnements séquentiels :
comme le dit V. Zuckerkandl, « En principe, chaque pas (dans une composition
musicale) aurait pu être pris différemment, et donc, de ce point de vue, même
un choix « conventionnel » est « nouveau ». Ceci rend impossible de déceler,
dans une œuvre, un passage qu'aurait pu paraître « incorrect » au compositeur.
Si nous ne pouvons pas décider ce qui est correct et ce qui ne l'est pas sur la
base de ce qui a été déjà énoncé (comme on peut le faire en logique), comment
13
J’utilise l’expression « ontologie régionale » dans le sens de Husserl (Husserl, 1951, p. 34-55).
Composition musicale : représentations, granularités, émergences
165
peut-on alors prendre une décision quelconque? (...) Le problème est insoluble
non seulement dans la pratique mais aussi théoriquement: il n'a pas de sens »
(Zuckerkandl, 1976, p. 298).
Ceci exemplifie l’incomplétude nécessaire à l’action. L'action du
compositeur étant un cheminement singulier qui vise la création d'un contexte,
ou, comme le dit Granger, l’instauration d’un nœud de significations
nouvelles14, elle est, par nature, ouverte à chaque instant à ce qui pourrait être
et n'est pas encore; action donc subtile et incertaine parce qu'elle intègre
l'imprévu qui émerge de l'interaction des contraintes et des choix instantanés.
Pour citer encore Zuckerkandl : « l'auditeur de l'œuvre finie, qui connaît
seulement (ce qui découle) des pas qui ont été pris, peut jouir d'une
consistance; le compositeur, à l'intérieur de sa composition, qui doit prendre
tous ces pas, sent qu'il ne peut pas prédire ce qui deviendra consistant. Ce que
chaque pas doit être, afin de devenir consistant, ceci le compositeur ne peut pas
le savoir avant de l'avoir pris » (Zuckerkandl, 1976, p. 299).
APPROCHES GRANULAIRES EN SYNTHÈSE SONORE
Ce qu’on vient de lire nous donne assez d’éléments pour nous attaquer au
concept d’émergence en composition musicale. Mais je voudrais différer un
peu plus l’examen des conditions et types concernant ce mode d’organisation
pour me tourner auparavant vers un aspect récent de la technique musicale dont
je pense qu’il contient des éléments qui pourront éclaircir davantage la
question.
Les procédés de synthèse sonore granulaire15, utilisés dans la composition
musicale électroacoustique assistée par ordinateur, concernent la génération de
sons complexes à partir de flux de grains ayant des densités variables, mais
souvent très élevées. Ceci correspond à une description de type corpusculaire
du phénomène sonore, description complémentaire à celle de type ondulatoire
(cette dernière ayant prévalu pendant des siècles). On pourrait tenter de tracer
la frontière de pertinence de ce domaine granulaire, à titre indicatif, autour d'un
seuil de densité de 20 événements par seconde : en deçà de cette densité nous
percevons des entités sonores individuelles ; au-delà, les entités se diluent dans
une texture globale (Vaggione, 1984 ; Roads, 1985). De fait un vaste champ
morphologique s’ouvre à nous dès qu’on considère le son comme un ensemble
de grains, plutôt qu’une forme d’onde. A des très hautes densités, les textures
granulaires approchent le caractère laminaire (continu) des formes d’onde. En
diminuant la densité des grains, les textures se feront plus ou moins rugueuses,
trouées, ou saturées d’intermittences. Mais on peut également diversifier
l’échelle des grains eux-mêmes, qui peuvent alors avoir des tailles différentes,
ainsi que des attributs variés (hauteurs spectrales, enveloppes d’amplitude,
14
« Les opérations du scientifique et de l’artiste relèvent d’un même métaconcept (…) Mais il s’agit
d’opérations de genres différents. (…) Pour l’objet scientifique, les contenus se présentent d’abord
comme un obstacle à réduire. (…) Dans l’objet esthétique au contraire, bien loin que le travail de
l’artiste – ressenti et retrouvé par l’interprète et l’amateur d’art – soit orienté vers la réduction des
contenus, il vise à leur instauration » (G. Granger, 1994, p. 386).
15
On peut faire remonter l’approche granulaire à la critique de l’analyse harmonique de Fourier par
Norbert Wiener (1925, cf. Wiener 1964), puis au premier modèle des « quanta de sons » de Dennis
Gabor (1946), repris par Xenakis (1963) et implémenté pour la première fois sous forme numérique par
Roads (1978). L’approche granulaire s’est enrichie, à partir des années 1980, d’une myriade de
techniques de synthèse et transformation des sons (cf. par exemple Truax 1988). Roads (2001) donne
une vision d’ensemble du sujet.
166
H. VAGGIONE
localisations spatiales, etc.16), contribuant à l’émergence de morphologies
complexes et hautement différenciées.
IRRÉVERSIBILITÉ ET ÉMERGENCE
L’approche granulaire d’analyse et synthèse sonore fait partie du
développement d’un nouveau paradigme, au sens large, non seulement par
rapport à l’analyse harmonique classique et à la problématique de la dualité
onde-corpuscule (cf. infra), mais aussi, il faut le redire, à une nouvelle
perspective concernant le couplage d’échelles temporelles diverses (de divers
types de temporalité, dépendant des échelles concernées).
Par ailleurs, cette nouvelle perspective inclut un aspect dissipatif (le
« comportement » d’un son, sa nature « kaléidoscopique », pourrait-on dire) et
irréversible (sa continuité étant composée de phénomènes transitoires, tout au
long de sa manifestation)17. Le son musical, étant un composé, est une entité
qui découle d’une situation loin de l’équilibre, dont la structure est hautement
stratifiée, faite de moments agglutinés, à la manière d’un millefeuille.
Dans une approche sous-tendue par le principe d’un temps irréversible, la
hauteur n’est pas un « paramètre » absolu, mais un phénomène émergent,
résultant d’une situation aux interactions multiples. Elle constitue un aspect
important des morphologies musicales, mais cet aspect n’est pas isolé des
autres contingences. En affirmant le caractère irréversible du temps, nous
avons un cadre nous permettant de considérer le phénomène de la hauteur sans
le réduire, comme c’était le cas dans le paradigme ondulatoire classique, à
celui de l’oscillateur entretenu. Ce cadre alternatif comporte des implications
qui pointent vers une réciprocité phénoménale : la hauteur, dans ce cadre, est
un attribut morphologique aux multiples facettes, un vecteur résultant d’un
grand nombre de facteurs imbriqués. Bien entendu, ces facteurs font partie du
composable : c’est au compositeur de déterminer les poids morphophoriques
relatifs.
Enfin, il faut insister sur le fait que cette réciprocité phénoménale
s’applique à tous les ordres de grandeur temporelle. Parmi ces temporalités
irréversibles, on doit situer celle qu’on appelle d’habitude « macroforme », qui
devient, dans l’approche multi-échelle, un niveau (une strate) à traiter de la
même manière que les autres, en tant que morphologie complexe. On ne saurait
donc nullement envisager la macroforme comme quelque chose de prédéfini, ni
découlant du « matériau », ni constituant un niveau « supérieur » auquel
seraient inféodés tous les autres. Cela dit, on ne saurait considérer la
macroforme comme le seul lieu d’une émergence : dans une approche multiéchelle, tous les niveaux sont émergents, car ils sont imbriqués, se manifestant
à partir d’une réciprocité concernant l’ensemble des relations en jeu dans le
réseau compositionnel. Cette approche n’autorise pas de cloisonnements
dualistes, car elle concerne des réciprocités fonctionnelles qui s’« énactent » à
tous les niveaux possibles, autant au niveau d’un grain d’une durée de quelques
16
Les grains peuvent également avoir des « silences attachés » de diverses durées – ce qui contribue,
entre autres choses, à établir une irréversibilité temporelle dans les flux de grains (Vaggione, 1984,
2005).
17
La réversibilité en tant que condition d’un système de notation, discutée plus haut, n’est pas en
contradiction avec l’irréversibilité du phénomène sonore créé. Bien au contraire, il s’agit d’aspects non
pas « complémentaires » mais correspondant à des « moments » différents (comme dirait Husserl) du
faire-émerger.
Composition musicale : représentations, granularités, émergences
167
millisecondes qu’à ceux, multiples, des figures et des objets de tout ordre de
grandeur. Et cela, j’insiste, non pas en raison d’une homogénéité structurelle
(ou d’un principe d’unité formelle), mais en raison des interactions, des
intrications, entre les niveaux composables.
FONCTIONNALITÉ ET ÉMERGENCE
Quelles conséquences tirer de l’approche que l’on vient de décrire ? Tout
d’abord : une évaluation du rôle de l’émergence en termes de force
organisatrice. La musique tonale est, on le sait, sous-tendue par une logique
fonctionnelle, sur laquelle s’appuie le développement thématique-harmonique.
Elle requiert la présence d’un substrat stable sur lequel puisse se déployer le
jeu fonctionnel18. Cette logique est étrangère à l’approche multi-échelle dont il
est ici question, non pas parce qu’on ne trouve plus des fonctionnalités (elles
sont, au contraire, nombreuses, diverses et multiples) mais parce que ces
fonctionnalités ne constituent plus le fondement de l’organisation musicale.
L’état de choses à composer n’est plus sous-tendu par une hiérarchie préétablie
de degrés d’attraction, ce qui constituait la charpente sur laquelle une
figuration musicale venait acquérir son sens. Il se manifeste plutôt, dans la
perspective du réseau et de l’émergence, par un jeu stratifié d’échelles
temporelles qui est lui-même composable, et non pas préétabli.
Bien entendu, l’abandon de la fonctionnalité n’est pas un fait nouveau : il
s’est manifesté à partir de l’atonalisme de Schönberg. Depuis lors, la musique
du XXème siècle a cherché d’autres modes de structuration. Le jeu fonctionnel
fut suspendu, évité, contourné, dissimulé, dans les musiques post-tonales. Il y a
eu aussi, par la suite, maintes tentatives de restauration partielle, dont la
justification était d’affirmer certaines polarités, en évitant ainsi de tomber dans
une uniformité qui semble être le risque d’un énoncé musical strictement non
fonctionnel mais dont le seul mode d’organisation n’est qu’un simple jeu
combinatoire. C’est pourquoi les propositions sérialistes des années 1950 ont
vite atteint le mode du pur mécanisme. Assurément, l’irruption de
l’électroacoustique et la mise en place de processus hautement stratifiés ont pu
aider à concevoir une logique de l’émergence qui viendrait assurer une
alternative au fonctionnalisme. La musique instrumentale, à partir de Xenakis
et Ligeti, a suivi de près ce chemin, de façon certes lente et incertaine mais non
moins réellement affirmée. L’importance du « geste » dans la musique plus
récente relève sans doute d’une logique du « faire émerger » (Criton, 2007).
Évidemment, la tâche qui nous attend maintenant est celle d’une
clarification par rapport aux types (aux classes) possibles d’émergence. Un
simple schème ascendant (bottom-up) ne saurait suffire à une saisie du concept
d’émergence dans toutes ses implications structurelles. Dans l’utilisation du
terme qu’on a fait dans ce texte, il est question d’émergence pour signifier la
mise en place d’une multiplicité de vectorisations simultanées. L’idée de
réseau multi-échelle constitue ici le socle structurant. Ainsi par exemple quand
on dit que la hauteur d’un son est un phénomène émergent, et non pas un
attribut indépendant, cela ne veut surtout pas signifier que la hauteur n’est pas
perceptible en tant que telle, ou qu’elle advienne de façon aléatoire, ou
incontrôlée, mais qu’elle est le produit d’un grand nombre d’interactions,
déployées dans un réseau de relations auquel participent d’autres attributs tels
18
Pour une théorisation récente du fonctionnalisme tonal, cf. Lerdhal et Jackendoff, 1983.
168
H. VAGGIONE
que la durée, l’intensité, la configuration spectrale, l’enveloppe globale, et ainsi
de suite, chacun de ces attributs étant à son tour le produit de l’interaction de
tous les autres attributs co-présents. C’est pourquoi cette situation est
« dynamique », car tous les attributs d’un son, à n’importe quelle échelle
temporelle, constituent non seulement des « paramètres » mais des
émergences. Ce qui veut dire que chaque dimension morphologique, comme
chaque échelle temporelle, se constitue par un mouvement de généralisation
des propriétés de chaque composé, sans qu’il s’en suive une négation du local
ou du global. Comme je l’ai exprimé souvent (cf. par exemple Vaggione
1998) : le composable est l’ensemble d’attributs morphophoriques que l’on se
doit d’articuler par ce jeu généralisé d’interactions. Le composable est
l’articulable : il est le lieu des émergences, mais celles-ci ne constituent pas
des phénomènes « trouvés » ou provoqués par une espèce d’empilement de
processus élémentaires, mais le fait d’une construction stratifiée d’interactions
soigneusement articulées – composées. De plus, on l’a vu, une « logique de
l’émergence » qui viendrait se substituer à une « logique fonctionnelle »
n’implique pas nécessairement un abandon de l’idée de fonction, mais une
reconsidération de celle-ci sur d’autres bases que celles du fonctionnalisme
traditionnel. On assisterait donc, selon le mot de D. Charles, à un
« changement de fonction de la fonction » (Charles, 1978).
D’autre part, un tel état de choses réclame une variété d’outils de
représentation, une « palette » beaucoup plus diversifiée que celle qui était
nécessaire pour les processus musicaux fonctionnalistes, car dorénavant chaque
outil correspond à l’échelle temporelle sur laquelle nous sommes en train
d’effectuer nos opérations. Ici, de manière similaire à ce qui arrive dans
d’autres domaines où l’on est passé d’une représentation centrale à une multireprésentation, la différence entre centralité et périphérie se dissout. Ceci est
également une conséquence de l’idée de réseau en tant que mode de mise en
relation des divers attributs du composable.
La composition musicale peut ainsi se concevoir en tant que création
d'« ensembles singuliers » qui seraient en même temps des « ensembles de
singularités » (Vaggione, 2003). Ou, pour paraphraser Thom : des ensembles
singuliers qui « ont en fait une structure stratifiée qui manifeste une hiérarchie
de singularités » (Thom, 1990, p. 312). Il faut cependant dire que les
singularités musicales relèvent d'une ontologie spécifique, qui ne saurait se
confondre avec celle des singularités mathématiques. On retrouvera plus loin
une considération ontologique du même type à propos de l’interprétation de la
dualité onde-particule en musique et en physique quantique.
LE DOMAINE DES NOTES : POINTEURS ET PARALLÉLISMES
J’ai parlé de la prolifération de représentations opératoires qui s’est
constituée à partir de l’adoption des moyens numériques en composition
musicale, étant donné la pluralité d’échelles temporelles à composer. Il est
évident que les techniques de synthèse sonore ont eu besoin de développer de
nouvelles formes de notation pour faire face à cette situation (ou pour la créer).
L’approche granulaire se manifeste ainsi au moyen de « grains de
représentation » qui déterminent les myriades de phénomènes morphologiques
composables au niveau du micro-temps. Quant à la notation musicale
conventionnelle : elle reste, même en milieu numérique, adscrite au domaine
des échelles temporelles macroscopiques, ne pouvant descendre en dessous de
ce domaine. Bien qu’on puisse contracter ou dilater une note, cela se fera
Composition musicale : représentations, granularités, émergences
169
uniquement à l’échelle de la note elle-même (une note plus courte ou plus
longue). Il n’y a pas dans ce système de possibilité de changer véritablement de
perspective temporelle. On ne peut pas représenter la forme d’onde, le spectre,
etc., à partir de la marque graphique de la note. On ne peut pas mélanger ces
types de données dans la même partition. La note tire cependant de ce fait une
efficacité certaine dans le traitement d’opérations avec des « gros grains », ce
qu’on pourra caractériser comme le domaine de la « macro-intervallique ».
Mais si la note ne peut pas « écrire le timbre », c’est-à-dire, le microtemps, elle peut néanmoins l’atteindre par ricochet : l’écriture instrumentale
n’est pas dépourvue de manettes relatives (des « pointeurs ») concernant le son
composé à partir d’opérations macroscopiques. Le « timbre global », la fusion
des composantes instrumentales, est une conquête de l’écriture symphonique.
Cette conquête s’est effectuée bel et bien à l’intérieur du paradigme
fonctionnaliste, même si l’art de l’orchestration n’a été accepté dans le cadre de
la théorie de la tonalité que comme une espèce d’habillement, quelque chose
d’extérieur à la « musique elle-même ». Ce timbre global instrumental, on peut
le dire aujourd’hui, constitue un phénomène émergent, car il présente un état
sonore où l’on ne distingue pas les instruments individuels qui le composent
mais l’« effet » au-delà de la « cause » : l’écoute intègre ici une entité
fusionnée. Naturellement, cela arrive par moments, parmi d’autres moments où
la ségrégation causale est affirmée. Aucune théorie des états timbraux
fusionnés n’a été développée dans le cadre de la musique symphonique, mais
on pourrait suivre l’approfondissement de la pratique dans l’inclusion de plus
en plus affirmée d’attributs consignés dans les partitions (tels que les marques
de dynamique et articulation), à partir de l’école de Mannheim, en passant par
Haydn, Beethoven, et ainsi de suite (cf. Vaggione, 2002). En réalité, tout se
passe, en musique tonale, comme si le fonctionnalisme, mode privilégié
d’organisation des relations macroscopiques linéaires, ne pourrait se déployer
sans recours à une autre articulation parallèle qui concernerait la « matière »
sonore en tant que catégorie composable. Une symphonie de Beethoven ne se
perçoit pas seulement comme tissu thématique, lui-même ancré sur un plansubstrat harmonique, fonctionnel, mais également comme un jeu d’intensités,
de densités et de couleurs dont les caractéristiques et les articulations ne
constituent pas des dérivées structurelles de ce plan fonctionnel. Nous trouvons
donc, au cœur de la fonctionnalité tonale, superposée à celle-ci, une trame
parallèle de relations émergentes. C’est tout un « miracle » de la musique
(qu’elle soit modale ou tonale) que d’avoir développé des tels parallélismes, le
résultat desquels est un déploiement de morphologies musicales riches de sens.
Et, par un juste retour des choses, avec la dissolution du substrat harmonique
fonctionnel dans les musiques non tonales, une fois libérés de ce cadre
préétabli, nous trouvons un grand nombre de fonctionnalités qui s’appliquent à
des ordres divers de grandeur temporelle, leur mode de manifestation relevant
d’une interaction d’attributs, d’une mise en place d’une multiplicité de
vectorisations simultanées, participant dorénavant à la détermination du
composable.
ONDES ET PARTICULES
Énonçons la chose de nouveau, afin de la regarder sous une autre
perspective. Prenons la hauteur : elle découle d’un tissu de relations
temporelles ; tous les attributs d’un phénomène sonore, imbriqués dans toutes
les échelles temporelles présentes, contribuent à sa définition. La hauteur est,
170
H. VAGGIONE
donc, émergente. Mais ce qui paraît aujourd’hui une évidence l’est depuis très
peu de temps : depuis que le paradigme harmonique classique de Helmholtz,
qui voyait le spectre comme une simple addition de partiels statiques, a cédé la
place à un autre paradigme dans lequel les rapports temporels sont à la base
d’une structure dynamique. Le spectre est, donc, émergent. Considérons ceci
du point naturaliste, physique, c’est-à-dire, du point de vue du signal. Après les
efforts pionniers de Gabor, qui sont à l’origine de la première formulation de la
description granulaire des sons (Gabor 1946, 1947), le paradigme physique –
harmonique classique a changé considérablement à partir de l’introduction
dans le cadre de l’analyse de Fourier du concept de « fenêtre glissante »,
réalisée en ingénierie du signal à partir des années 1960 (Rabiner et Gold,
1975), lequel a produit une variante significative. Dans ce modèle, la durée (la
taille, le grain) de la fenêtre d’analyse spectrale du signal, déclarée avec
précision, au niveau du micro-temps, est constante et arbitraire. Cependant,
cette durée a une incidence directe sur le résultat de l’analyse spectrale : les
données récoltées par l’analyse dépendent du moment, de l’instant choisi pour
l’effectuer. A un autre moment de la vie d’un son, l’analyse nous montrera une
autre structure spectrale. Car un son instrumental ou naturel – contrairement à
un son produit par un oscillateur entretenu – n’est jamais absolument
périodique, mais, au mieux, quasi ou multi-périodique (Risset et Wessel,
1982) : il comporte toujours des variations instantanées de hauteur et
d’intensité des partiels, incluant des intermittences, des fluctuations, des
largeurs de bande qui ne suivent pas les proportions des séries classiques des
proportions harmoniques, lesquelles, à rebours de ce qu’ont soutenu les
manuels d’acoustique, ne constituent pas les modèles de résonance les plus
répandus dans « la nature », mais plutôt une classe, correspondant aux flux
typiquement laminaires. La plupart des sons constituent des phénomènes
dynamiques, comportant des turbulences, des repliements, des non-linéarités.
C’est ici que réside la difficulté d’une représentation exclusivement ondulatoire
du sonore. C’est pourquoi l’approche granulaire a pu être considéré comme
mode d’engendrement valable pour tout son, car elle incorpore l’aspect
ondulatoire comme un état de choses parmi d’autres : un état laminaire (de
n’importe quelle durée) obtenu à partir de flux de grains19. En physique
quantique, un problème apparemment similaire avait émergé au début du XXe
siècle, conduisant à l’énonciation du célèbre principe de « complémentarité »
entre ondes et particules, étant compris qu’une seule description ne pouvait
résoudre ce dilemme (concernant la représentation des divers aspects du
temps). Cette « complémentarité » a été, à son tour, la cause de nouvelles
tracasseries théoriques, impliquant des choses aussi graves que la violation des
principes d’identité, de causalité, et ainsi de suite. « Très vraisemblablement, la
contradiction onde-corpuscule traduit un nouveau principe important et
fondamental : la non-identité de ce qui est détaillé dans l’espace-temps d’un
côté et de ce qui est observable d’un autre côté » (Schrödinger, 1929, p. 15-16).
Mais, bien entendu, le problème ne se pose plus ainsi de nos jours, ni dans la
cognition énactive, ni dans la musique : nous n’avons pas affaire à une dualité
entre ce que nous trouvons et ce que nous observons.
19
Ainsi, on peut réaliser par synthèse granulaire des sons absolument lisses, que l’on perçoit comme des
mouvements ondulatoires, alors qu’ils sont créés par des flux de grains. Bien entendu, ceci correspond à
une possibilité de plus, parmi les myriades de possibilités de créer des sons mouvants, dynamiques,
striés, troués, et ainsi de suite. Entre la fusion (laminaire) et la fission, ou ségrégation (turbulente) des
grains il y a de la place pour des morphologies sonores de toute espèce.
Composition musicale : représentations, granularités, émergences
171
Comme le dit M. Bitbol : « Plutôt que de concevoir une sorte de
conglomérat symbolique de la représentation ondulatoire et de la représentation
corpusculaire, n’est-il pas plus clair d’admettre que ni l’une ni l’autre n’ont de
raison de subsister dans leur entier ? Une fois que l’on a bien identifié l’origine
commune, contextuelle, des distributions spatiales semi-continues de forme
ondulatoire et des discontinuités quantiques évocatrices d’une représentation
corpusculaire, il n’y a plus de raison d’hésiter à franchir ce dernier pas »
(Bitbol, 2003, p. 229). Pour éclaircir ce point, Bitbol cite Bohr et Heisenberg :
« D’une part “nous savons maintenant, tant pour la lumière que pour les
particules matérielles, que plusieurs espèces d’images sont nécessaires pour
représenter tous les aspects des phénomènes (…)” (N. Bohr, 1929, p. 88). Mais
d’autre part, toute tentation de conférer une signification ontologique à cette
pluralité d’images (qui se réduit en général à une dualité) est rapidement
désamorcée. Car “ces deux représentations n’ont qu’une valeur d’analogies,
correctes seulement dans des cas limités” (W. Heisenberg, 1972, p.7) » (Bitbol,
2003, op. cit., p. 237).
En tout cas, la musique étant arrivée de son côté à projeter une image
dyadique (onde-particule, réversible-irréversible, continu-discontinu) de sa
matière sonore, il est normal qu’elle se pose à son tour le problème de la
multiplicité de représentations. Elle le fait, toutefois, dans un but opératoire
plutôt que descriptif. La différence est capitale, et doit être une fois de plus
signalée.
Ainsi, par exemple, on peut penser que la véritable raison de
l’incorporation réussie de l’approche granulaire à la composition musicale
pourrait bien se décrire comme étant un transfert catégoriel du niveau du signal
vers le niveau symbolique opératoire, tel qu’il a été défini dans ce texte. Car les
grains qu’on manipule en composition musicale n’ « expliquent » rien, quant à
la nature du sonore élémentaire : dans notre cas, ces grains sont – déjà – des
morphologies musicales, situées au niveau du micro-temps, mais néanmoins
composées. L’intérêt de l’approche granulaire, pour la composition musicale,
consiste donc dans la possibilité de réaliser un traitement symbolique
opératoire à l’échelle du micro-temps. Et, par extension du principe, de
travailler des entités morphologiques de toutes tailles, en les fragmentant, les
agglutinant et les projetant partout dans le composable.
POUR CONCLURE
Je viens de signaler la mise en place, en composition musicale, d’un
transfert catégoriel par lequel le sonore change de statut, en passant du signal
au symbole (inséré dans un réseau) opératoire – compositionnel. Cela signifie,
entre autres choses, que l’acoustique, qui nous renseigne sur le côté physique
des sons, ne saurait pas jouer le rôle de théorie de la musique. « Le son, dans sa
dimension purement acoustique, est habité dès que la composition l'absorbe »
(Adorno, 1962). Autrement dit : la musique – peu importe dans quels termes
on définit son autonomie – ne saurait en aucun cas être « naturalisée ».
D’où la forte tension que l’on ressent, en tant que musiciens, vis-à-vis des
modèles et protocoles de l’empirie, quand ceux-ci tentent de se substituer à
l’opératoire musical qui cherche, quant à lui, à habiter les sons. Le cas de
l’acoustique est clair : une fois assumé le transfert catégoriel du signal au
symbole compositionnel, l’acoustique ne nous pose pas de problèmes
particuliers, tant qu’on utilise ses modèles à des finalités musicales, des
finalités qui ne sont pas de l’ordre de la modélisation. Il en va de même pour ce
172
H. VAGGIONE
qui est de l’informatique, car nous savons comment transformer ses
propositions en « matériaux » compositionnels. Dans la mesure où les sciences
cognitives visent, en tant que sciences, une certaine modélisation autonome, on
devrait prendre soin, en nous approchant de leurs analyses, de ne pas aplatir
l’ontologie régionale spécifique à la musique.
Quoi qu’il en soit, j’espère au moins avoir exploré, un tant soit peu, cette
problématique de la différence catégoriale entre les symboles musicaux en tant
que représentations opératoires et les représentations « symboliques »
hypostasiées par les approches cognitivistes. Je l’ai fait notamment à l’aide de
la perspective introduite par la critique herméneutique de la représentation. Les
représentations opératoires, en musique, ne sauraient nullement s’identifier
avec des représentations « de processus mentaux » : même si le musicien garde
et manipule « dans sa tête » des quantités de relations musicales en tant
qu’éléments définis hors-temps, ces éléments feront toujours partie d’un
« monde extérieur », celui de la musique. Ce que Brooks postule pour la
robotique est, ô combien, valable pour la musique. Ne pas accepter ce statut
externe des représentations opératoires musicales équivaudrait à tomber dans
ce que Bouveresse appelle « le mythe de l’intériorité » (Bouveresse, 1976).
C’est pourquoi j’ai mis en exergue de ce texte une citation de Wittgenstein sur
le risque qu’on court, si l’on ne prend pas garde de s’éloigner de ce type de
croyances, « d’enfanter un mythe du symbolisme », qui serait dans tous les cas
« un mythe des processus mentaux ». En conséquence, le point de vue adopté
ici a été de souligner, en reprenant les mots de Winograd, le fait que les
morphologies que nous composons « émergent dans l’interaction » plutôt que
« dans la machine » ou « dans la tête » de « l’utilisateur ». C’est un point de
vue qui nous prévient des maintes dérives qui pourraient survenir quand on
compose à l’aide d’outils informatiques. D’autant plus que le « mythe des
processus mentaux », enfantant celui du « symbolisme », risque toujours de
produire celui du « fantôme dans la machine ». Voilà pourquoi Wittgenstein,
qui parlait à une époque où ce dernier mythe était peut-être moins menaçant
mais déjà bien installé dans la platitude d’une certaine mécanique formelle qui
se voulait fondatrice de toute forme de pensée, conseillait de s’attacher plutôt à
la liberté de « dire simplement ce que chacun sait et ne peut pas ne pas
accorder » : que les limites de nos jeux de langage sont celles de notre monde.
REFERENCES
Adorno, T.W. (1962). Quasi una Fantasia. Trad. fr. de J. L. Leleu (1983). Paris :
Gallimard.
Assayag, C, Agon, C., Hanappe, P. & Fineberg, J. (1997). Problèmes de quantification
et de transcription en composition assistée par ordinateur. In : H. Genevois et Y.
Orlarey (éds.), Musique et mathématiques. Lyon : Aléas - Grame.
Bitbol, M. (2003). Mécanique quantique. Une introduction philosophique. Paris :
Flammarion.
Bohr, N. (1929). La théorie atomique et la description des phénomènes. Paris : J.
Gabay, 1993.
Bokesoy, S. (2006). Feedback Implementation Within a Complex Event Generation
System for Emergent Sonic Structures. Proceedings of the Int. Computer Music
Conference, New Orleans.
Bouveresse, J. (1976). Le mythe de l’intériorité. Paris : Minuit.
Bruner, J. (1966). Toward a Theory of Instruction. Cambridge, MA: Belknap PressHarvard University Press.
Brooks, R. (1987). Intelligence Without Representation. AI Rapport, MIT.
Brooks, R. (1991a). Intelligence Without Representation. Nouvelle version : Artificial
Composition musicale : représentations, granularités, émergences
173
Intelligence 47.
Brooks, R. (1991b). Intelligence Without Reasoning. AI Memo 1293, MIT.
Cadoz, C. (2006). Retour au réel : le sens du feedback : rétroaction - interaction énaction. Actes des Rencontres musicales pluridisciplinaires. Lyon : Grame.
Camurri, A. & M. Leman (1997). AI-based music signals applications - an hybrid
approach. In C. Roads et al. (éds.), Musical Signal Processing. Lisse: Swets &
Zeitlinger.
Chapman, D. (1991). Vision, Instruction and Action. Cambridge, MA: MIT Press.
Charles, D. (1978). Le temps de la voix. Paris : Editions universitaires.
Criton, P. (2007). Communication personnelle.
Cohen, D. & Wu, J. (1990). One Neuron, Many Units? Nature, 346, pp. 108-109.
Di Scipio, A. (1995). Inseparable Models of Materials and of Musical Design in
Electroacoustic and Computer Music. Journal of New Music Research, vol. 24, n°1.
Di Scipio, A. (2003). Sound is the Interface: From Interactive to Ecosystemic Signal
Processing. Organized sound, 8, (3). Cambridge: Cambridge University Press.
Dreyfus, H. (1979). What Computers Can’t Do: A critique of Artificial Reason. New
York: Harper and Row.
Dreyfus, H. (1981). From Micro-Worlds to Knowledge Representation: AI at an
Impasse. In : J. Haugeland (éd.), Mind Design. Cambridge, MA: MIT Press.
Dreyfus, H. & Dreyfus, S. (1986). Mind and Machine: The Power of Human Intuition
and Expertise in the Era of the Computer. New York: The Free Press.
Dreyfus, H. (2001). A Phenomenology of Skill Acquisition as the Basis for a MerleauPontian Nonrepresentationalist Cognitive Science. Manuscrit, Stanford University.
Gabor, D. (1946). Theory of Communication. Journal of the IEE, 93.
Gabor, D. (1947). Acoustical Quanta and the Theory of Hearing. Nature, 159.
Granger, G. G. (1994). Formes, opérations, objets. Paris : Vrin.
Heisenberg, W. (1972). Les principes physiques de la théorie des quanta. Paris :
Gauthier-Villars.
Husserl, E. (1951). Idées directrices pour une phénoménologie. Trad. fr. de P. Ricoeur.
Paris : Gallimard.
Leman, M. (1995). Music and Schema Theory - Cognitive Foundations of Systematic
Musicology. Berlin : Springer Verlag.
Lerdhal, F. & Jackendoff, R. (1983). A Generative Theory of Tonal Music. Cambridge:
MA, MIT Press.
Loy, G. (éd.) (1989a). Neural Nets and Connectionism. Computer Music Journal, vol.
13 n. 3 et 4, MIT Press.
Loy, G. (1989b). Composing with Computers: A Survey of Some Compositional
Formalisms and Music Programming languages. In M. Mathews et J. Pierce (éds.),
Current directions in Computer Music Research. Cambridge, MA: MIT Press.
Maturana, H. & Varela, F. (1980). Autopoiesis and Cognition: The Realization of the
Living. Dordrecht : Reidel.
Merleau-Ponty, M. (1945). Phénoménologie de la perception. Paris : Gallimard, coll.
« Tel », 1976.
Minsky, M. (1986). Society of Mind. New York: Simon and Schuster.
Rabiner, L. & Gold, B. (1975). Theory and Applications of Digital Signal Processing.
Englewood: Prentice-Hall.
Risset, J.-C. & Wessel, D. (1982). Exploration of Timbre by Analysis and Synthesis.
In D. Deutsch (éd.), The Psychology of Music Perception. New York: Academic
Press.
Roads, C. (1978). Automated Granular Synthesis of Sound. Computer Music Journal
2 (2), pp. 61-62. Cambridge, MA: MIT Press. Repris dans C. Roads et J. Strawn
(éds.), 1985 : Foundations of Computer Music, Cambridge, MA: MIT Press.
Roads, C. (2001). Microsound. Cambridge, MA: MIT Press.
Rumelhart, D. & McClelland, J. (éds.) (1986). Parallel Distributed Processing.
Explorations in the Microstructure of Cognition, (vol. 1 : Foundations). Cambridge,
MA: MIT Press.
Schrödinger, E. (1929). Neue Wege in der Physik. Elektrotechnische Zeitschrift, 50, pp.
174
H. VAGGIONE
15-16.
Smolensky, P. (1988). A Proprer Traitement of Connectionism. Behavioral and Brain
Sciences, 11, pp. 1-74.
Solomos, M. (2005). Notes sur la notion d’émergence et sur Agostino Di Scipio. Actes
des journées d’informatique musicale (JIM 05), Paris, MSH-CICM, Université de
Paris VIII.
Soulez, A. & Vaggione, H. (2006). Composer, écouter. In M. Solomos (éd.) : Espaces
composables. Paris : L’Harmattan.
Strawn, J. (1980). Approximation and Syntactic Analysis of Amplitude and Frequency
Function for Digital Sound Synthesis. Computer Music Journal, 4 (3). Repris dans
C. Roads (éd.), The Music Machine 1989), Cambridge, MA: MIT Press.
Truax, B. (1988). Real-Time Granular Synthesis with a Digital Signal Processor.
Computer Music Journal, 12 (2), pp. 48-54. Cambridge, MA: MIT Press.
Vaggione, H. (1984). The Making of Octuor. Computer Music Journal, 8, (2), pp. 4854. Cambridge, MA, MIT Press. Repris dans C. Roads (éd.), (1989): The Music
Machine, Cambridge, MA: MIT Press.
Vaggione, H. (1991). A note on Object-based Composition. In O. Laske (éd.),
Composition Theory. Interface 20 (3-4).
Vaggione, H. (1993). Timbre as Syntax. Contemporary Music Review, 11 (1), pp. 7383. Londres: Harwood.
Vaggione, H. (1998). Son, temps, objet, syntaxe. Vers une approche multi-échelle dans
la composition assistée par ordinateur. Cahiers de philosophie du langage, n° 3,
Paris : L’Harmattan.
Vaggione, H. (2001). Some Ontological Remarks About Music Composition Processes.
Computer Music Journal, 25 (1), pp. 54-61.
Vaggione, H. (2002). Technologies, conjonctures et supports de la musique. In
Composition et technologie en musique életroacoustique. Actes de l’Académie
internationale de musique életroacoustique, vol. VI, Bourges : Mnémosyne.
Vaggione, H. (2003). Composition musicale et moyens informatiques : questions
d’approche. In M. Solomos, A. Soulez, H. Vaggione : Formel - informel, musique
et philosophie. Paris : l’Harmattan.
Vaggione, H. (2005). Notes on Atem. Contemporary Music Review, 24, (4-5), pp. 339349, Londres: Routledge.
Varela, F. (1989). Connaître les sciences cognitives. Paris : Seuil. Repris sous le titre :
Invitation aux sciences cognitives, Paris: Seuil, 1996.
Wegner, P. (1997). Why Interaction is more Powerful than Algorithms.
Communications of the ACM, 40 (5).
Wegner, P. (1999). ECOOP ’99 Banquet Speech. European Conference on OrientedObject Programming. Manuscript, Brown University.
Wessel, D. (2006). An Enactive Approach to Computer Music Performance.
Rencontres musicales pluridisciplinaires. Lyon : Grame.
Wiener, N. (1964). Spatial-Temporal Continuity, Quantum Theory, and Music. In M.
Capek (éd.), The Concepts of Space and Time. Boston: Reidel.
Winograd, T. (1979). Beyond Computer Programming. Communications of the ACM,
22 (7).
Winograd, T. & Flores, F. (1986). Understanding Computers and Cognition. New
Jersey: Ablex Press.
Winograd, T. (1997). The Design of Interaction. In P. Denning and B. Metcalfe (éds.),
Beyond Calculation, The Next 50 Years of Computing. Berlin: Springer-Verlag.
Winograd, T. (1989). Heidegger et la conception des systèmes informatiques », trad.
française dans Intellectica, 17, pp. 51-78, 1993.
Wittgenstein, L. (1953). Philosophical Investigations. Londres: Blackwell. Trad. fr. F.
Dastur et al., Paris : Gallimard (2005).
Wittgenstein, L. (1971). Leçons et conversations sur l’esthétique, la psychologie et la
croyance Religieuse. Trad. française de J. Fauve. Paris : Gallimard.
Xenakis, I. (1963). Musiques Formelles. Paris : La revue musicale.
Zuckerkandl, V. (1976). Man the Musician. Princeton: Princeton University Press.