to get the file
Transcription
to get the file
Institut für Elektronische Musik und Akustik (IEM) Seminararbeit aus Computermusik Die musikalische Anwendung generativer Grammatiken Version 1.2 (29.6.2004) vorgelegt von Florian Hollerweger, April 2004 Betreuung: Mag. Gerhard Nierhaus Vorwort Diese Arbeit ist im Wintersemester 2003/04 im Rahmen des Seminars Computermusik 1 am Institut für Elektronische Musik und Akustik (IEM) der Universität für Musik und darstellende Kunst Graz entstanden. Ihr Autor kann unter der E-Mail-Adresse [email protected] kontaktiert werden. Florian Hollerweger, April 2004 -2- Inhalt Vorwort.....................................................................................................................................................2 Inhalt.........................................................................................................................................................3 Abstract....................................................................................................................................................5 1 Generative Grammatik in natürlichen und künstlichen Sprachen..................................................6 1.1 Was sind generative Grammatiken?..............................................................................................6 1.2 Elementarformalismen generativer Grammatiken..........................................................................6 1.2.1 Phrasenstruktur- oder PS-Grammatik.....................................................................................7 1.2.1.1 Typ-0-Grammatik (unbeschränkte PS-Grammatik).........................................................9 1.2.1.2 Typ-1 Grammatik (kontextsensitive PS-Grammatik).......................................................9 1.2.1.3 Typ-2 Grammatik (kontextfreie PS-Grammatik)............................................................10 1.2.1.4 Typ-3 Grammatik (reguläre PS-Grammatik)................................................................. 10 1.2.2 Kategorial- oder C-Grammatik..............................................................................................10 1.2.3 Linksassoziative oder LA-Grammatik................................................................................... 11 1.3 Erweiterte Formalismen................................................................................................................12 1.3.1 Transformationsgrammatiken ..............................................................................................12 1.3.2 Regulated Grammars ...........................................................................................................13 1.3.3 Systemic Grammars .............................................................................................................13 1.3.4 Transition Networks ..............................................................................................................13 2 Musik als Sprache im Sinn der generativen Linguistik?...............................................................14 2.1 Musik und Sprache als Kommunikationsträger im soziokulturellen Kontext................................14 2.2 Struktur und Hierarchie in Musik und Sprache.............................................................................16 2.3 Gleichzeitigkeit in der Musik.........................................................................................................16 2.4 Mängel probabilistischer Konzepte ..............................................................................................17 2.5 Formale Sprachdefinition..............................................................................................................17 3 Musikalische Anwendung generativer Grammatiken....................................................................19 3.1 Musikalische Analyse mit Hilfe von Grammatiken........................................................................20 3.1.1 Grammatiken melodischer und harmonischer Strukturen ................................................... 20 3.1.1.1 MELOS 2........................................................................................................................20 3.1.1.2 HARMONY.....................................................................................................................20 3.1.1.3 CHANSON.....................................................................................................................21 3.1.2 Experiments in Music Intelligence (EMI) ..............................................................................21 3.1.3 Modellierung musikalischer Stilrichtungen mit GI-Algorithmen ............................................23 3.1.4 Grammatiken schwedischer Kinder- und Volkslieder .......................................................... 24 3.1.5 Eine generative Theorie tonaler Musik..................................................................................25 3.1.6 Analyse nichteuropäischer Musik..........................................................................................27 3.1.6.1 Zwei Grammatiken javanesischer Gamelanmusik .......................................................27 3.1.6.2 Afghanische Rubab-Improvisation ................................................................................27 3.1.6.3 Die Polyphonie der Venda ............................................................................................27 3.1.6.4 Analyse von Liedern der Eskimos..................................................................................28 3.1.6.5 Analyse nordindischer Tablamusik ...............................................................................28 3.1.7 Weitere Beispiele analytischer Anwendungen......................................................................29 3.2 Musikalische Komposition mit Hilfe von Grammatiken................................................................ 30 3.2.1 Bol Processor BP2................................................................................................................30 3.2.1.1 Funktionsprinzip des BP2 .............................................................................................31 3.2.1.2 Echte BP-Grammatiken ................................................................................................31 3.2.1.3 Subgrammatiken und Ableitungsmodi ..........................................................................32 3.2.1.4 Gewichtung von Ersetzungsregeln ...............................................................................32 3.2.1.5 Metavariablen (Wild Cards) ..........................................................................................32 3.2.1.6 Remote contexts ...........................................................................................................33 -3- 3.2.1.7 Negierte Darstellung .....................................................................................................33 3.2.1.8 Metagrammatiken .........................................................................................................33 3.2.1.9 Programmed Grammars und Production Procedures ..................................................33 3.2.2 Weitere Beispiele kompositorischer Anwendungen..............................................................34 3.3 Kritik der musikalischen Anwendung generativer Grammatiken..................................................35 3.3.1 Vorteile..................................................................................................................................35 3.3.1.1 "Unendlichkeit" als kreative Triebkraft...........................................................................35 3.3.1.2 Makrostrukturbildung.....................................................................................................35 3.3.2 Probleme der Analyse...........................................................................................................36 3.3.2.1 Verwechslung von Musik mit Melodie............................................................................36 3.3.2.2 Verwechslung von Musik mit tonaler abendländischer Musik....................................... 37 3.3.2.3 Das Problem des soziokulturellen Kontextes................................................................ 37 3.3.3 Probleme der Resynthese.....................................................................................................38 3.3.3.1 Resynthese als analytisches Werkzeug........................................................................38 3.3.3.2 Resynthese als kompositorisches Werkzeug................................................................39 3.3.4 Probleme der Komposition....................................................................................................40 3.3.5 Lösungsansätze....................................................................................................................41 Quellenverzeichnis...............................................................................................................................44 -4- Abstract Im Zuge des Erfolgs der generativen Linguistik, wie sie von Noam CHOMSKY 1957 begründet wurde, ist von vielen Seiten die Frage nach der musikalischen Anwendbarkeit generativer Grammatiken gestellt worden. Entsprechende Ansätze existieren seit den 1960ern (und zum Teil auch schon früher) sowohl für die Analyse als auch für die Komposition musikalischer Werke. Versuche geeigneter Modifikationen der Theorien der generativen Linguistik für musikalische Zwecke eröffnen dabei oft Querverbindungen zu anderen Forschungsgebieten wie der Künstlichen Intelligenz (KI) oder der Wahrscheinlichkeitstheorie. Die vorliegende Arbeit gibt einen Überblick über die historische Entwicklung und gegenwärtige Darstellung generativer Grammatiken in der Computerlinguistik. Es wird die Frage behandelt, inwieweit Musik als Sprache im Sinne der generativen Linguistik behandelt werden kann. Die abschließende Übersicht über die vielfältigen musikalischen Anwendungen generativer Grammatiken in Analyse und Komposition beinhaltet eine entsprechende Kritik inklusive weiterführender Vorschläge. After the success of generative linguistics, introduced by Noam CHOMSKY in 1957, many questions about possible applications of generative grammars in music have arised. According ideas have been formulated since the 1960s (and partly even earlier) for analysis as well as for composition of music. Attempts of modifying the theories of generative linguistics for musical purposes have opened links to other fields of research, like artificial intelligence (AI) or theory of probabilities. This paper provides an overview of the historical development and contemporary description of generative grammars in computer-assisted linguistics. The question of in how far music can be treated as a language in the sense of generative linguistics will be treated. The concluding survey of different musical applications of generative grammars in analysis and composition includes a critique and concepts for continuing research. -5- 1 Generative Grammatik in natürlichen und künstlichen Sprachen 1.1 Was sind generative Grammatiken? Eine generative Grammatik ist die explizite Definition einer Sprache, sei diese eine künstliche oder eine natürliche. Über rekursive Regelsysteme formuliert sie die prinzipielle Strukturbeschreibung aller wohlgeformten Ausdrücke einer Sprache, also all ihrer "grammatikalisch korrekten Sätze". So ist das Ziel einer generativen Grammatik, alle möglichen Sätze einer Sprache (und gleichzeitig nur diese) zu beschreiben. Beschreibt sie auch "ungrammatische" Ausdrücke (Übergenerierung), so ist sie ebenso inkorrekt wie wenn sie nicht alle wohlgeformten Ausdrücke generiert (Untergenerierung).1 Ihre Regeln sollen es erlauben, für einen beliebigen Ausdruck (auch einen nie zuvor verwendeten) zu entscheiden, ob dieser wohlgeformt ist oder nicht.2 Man spricht von der generativen Kapazität einer Grammatik als Maß für die Strukturbeschreibung: Die generative Kapazität einer Grammatik ist hoch, wenn sie nicht nur in der Lage ist, viele Sprachstrukturen zu generieren, sondern gleichzeitig auch all das ausschließen kann, was nicht zur Sprache gehört. Die generative Kapazität einer Grammatik ist dagegen niedrig, wenn die Grammatik nur wenig Kontrolle über die von ihr generierten Strukturen erlaubt.3 1.2 Elementarformalismen generativer Grammatiken Nun vollzieht sich gewissermaßen der Übergang von der generativen zur formalen Grammatik, denn es stellt sich die Frage, wie diese Strukturbeschreibung auszusehen hat – wie sich also der Formalismus einer generativen Grammatik gestaltet. Die formale Basis eines solchen Formalismus ist seine algebraische Definition. Auf der Grundlage dieser Definition sollen die wesentlichen mathematischen 4 Eigenschaften des gegebenen Formalismus ermittelbar sein. Innerhalb der formalen Sprachtheorie wurden bisher drei Elementarformalismen definiert: 1 2 3 4 vgl. [HAUSSER, S. 144] vgl. [HAUSSER, S. 143] vgl. [HAUSSER, S. 157] vgl. [HAUSSER, S. 140f] -6- 1.2.1 Phrasenstruktur- oder PS-Grammatik 1936 vom amerikanischen Logiker E. POST publiziert und bekannt als rewrite system oder post production system ist dieser Elementarformalismus im mathematischen Kontext der Rekursionstheorie entstanden und steht in enger Beziehung zur Automaten- und Komplexitätstheorie. 1957 wurden rewrite systems von N. CHOMSKY unter dem Namen Phasenstrukturgrammatik erstmals auf natürliche Sprachen angewendet.5 Algebraische Definition der PS-Grammatik: 6 Eine PS-Grammatik ist ein Quadrupel < V, VT, S, P > mit V endliche Menge von Zeichen (Variablen und terminale Zeichen) VT Untermenge von V der terminalen Zeichen (nicht mehr weiter ersetzbar) S Zeichen aus der Menge (V \ VT) ("V ohne VT"), genannt Startsymbol P Menge von Ersetzungsregeln der Form α β, wobei α V+ und β V* V* freies Monoid 7 über den Zeichenvorrat V (auch: Kleene-Hülle) V+ V* ohne die leere Wortkette ε (auch: positive Hülle) Abbildung 1: Mengen der Terminale Variablen in der PS-Grammatik Die terminalen Zeichen aus der Menge VT entsprechen der Wortoberfläche der Sprache (in natürlichen Sprachen z.B. den einzelnen Wörtern, also das, was man von einer Sprache "sieht"). Nicht-terminale Zeichen aus der Menge (V \ VT) heißen Variablen (in natürlichen Sprachen entsprechen sie syntaktischen Kategorien wie "Verb"). Sequenzen aus V* werden mit griechischen Buchstaben bezeichnet, einzelne Variablen mit lateinischen Großbuchstaben und einzelne Terminale mit lateinischen Kleinbuchstaben. Die sprachlichen Ausdrücke werden über Ersetzungsregeln generiert, bei denen jeweils die linke Regelseite durch die rechte ersetzt wird (Prinzip der möglichen Substitutionen). 5 6 7 vgl. [HAUSSER, S. 155] vgl. [HAUSSER, S. 156] das freie Monoid V* ist die unendliche Menge aller möglichen Wortfolgen einer gegebenen Wortmenge , also für die Wortmenge V = {a, b} z.B.: ε (leere Wortkette), a, b, aa, ab, ba, bb, aaa, aab, aba, ..., bbb, aaaa, aaba, abaa, ... -7- Beispiel: 8 Die künstliche Sprache akbk (k≥1) mit dem Lexikon LX = {a, b} umfasst als wohlgeformte Ausdrücke die Sequenzen ab, aabb, aaabbb, etc. Ihre PS-grammatische Definition besteht aus den Ersetzungsregeln (1) S aSb (2) S ab Die Sequenz aaabbb beispielsweise lässt sich anhand dieser Regeln folgendermaßen als wohlgeformter Ausdruck der Sprache ableiten: 1. Anwendung der Regel (1): S aSb 2. Anwendung der Regel (1): aSb aaSbb 3. Anwendung der Regel (2): aaSbb aaabbb Solche Ableitungen lassen sich auch als Baumstrukturen darstellen, die umgekehrt auch das Parsen von Sätzen ermöglichen, also deren Überprüfung auf Korrektheit im Sinne einer gegebenen Grammatik: Abbildung 2: Baumstruktur der Ableitung des Ausdrucks aaabbb 9 8 9 vgl. [HAUSSER, S. 139f] vgl. [HAUSSER, S. 188] -8- Die Form der Ersetzungsregeln erlaubt systematische Restriktionen verschiedener Arten, die N. CHOMSKY in seinem Buch Syntactic Structures zur Unterscheidung vier verschiedener Grammatiktypen veranlasste (Typ-0 bis -3 Grammatiken). Vom Typ-0 zum Typ-3 werden die Restriktionen dabei immer größer, sodass die Regeln eines gegebenen Typs auch den Bedingungen aller niedrigeren Regeltypen genügen. Somit ist beispielsweise die von Typ-2 Grammatiken generierte Sprachklasse eine echte Untermenge der von Typ-1 Grammatiken generierten Sprachklasse.10 1.2.1.1 Typ-0-Grammatik (unbeschränkte PS-Grammatik) Bei Ersetzungsregeln, die in Typ-0 Grammatiken Verwendung finden, können auf der linken und rechten Regelseite beliebige Folgen von Terminalen und Variablen stehen. Somit kann eine unendliche (besser: rekursiv aufzählbare) Anzahl von Sequenzen generiert werden. 11 Beispiele: aBc A , b ABE , Ab AcDE, etc. Eine Typ-0 Grammatik ist einer Turing-Maschine äquivalent. Daher existieren Parser für solche Grammatiken nur in der Theorie, weil ein solcher über einen unendlich großen Speicher und unendliche Rechenzeit verfügen müsste. Zeitlich später angewandte Ersetzungsregeln können Sequenzen, die von früher angewandten Regeln produziert worden sind, wieder löschen.12 1.2.1.2 Typ-1 Grammatik (kontextsensitive PS-Grammatik) Bei Ersetzungsregeln einer Typ-1 Grammatik stehen auf der linken und rechten Regelseite beliebige Folgen von Terminalen und Variablen, wobei die rechte Regelseite mindestens so lang sein muss wie die linke.13 Beispiele: ABC ADE , ABC ADEC , etc. Die Kontextsensitivität wird üblicherweise folgendermaßen ausgedrückt: QxR QyR Das heißt, dass sich die Ersetzung von x durch y jeweils im spezifischen Kontext vollzieht. Ersetzungsregeln vom Typ 1 sind mehrdeutig – es existieren also verschiedene erlaubte Parsing-Wege. Die Spezifikation und das Parsing der Regeln gestaltet sich auf Grund des Problems der Kontexterkennung und –veränderung allerdings sehr schwierig.14 10 11 12 13 14 vgl. [HAUSSER, S. 157] vgl. [HAUSSER, S. 156] vgl. ROADS Curtis: An Overview of Music Representation, in: [BARONI, S. 17] vgl. [HAUSSER, S. 156] vgl. ROADS Curtis: An Overview of Music Representation, in: [BARONI, S. 17f] -9- 1.2.1.3 Typ-2 Grammatik (kontextfreie PS-Grammatik) Bei einer Ersetzungsregel vom Typ 2 steht auf der linken Seite genau eine Variable. Auf der rechten Regelseite steht eine Zeichenkette aus V+ (also eine beliebige nicht leere Sequenz).15 Beispiele: A BC , A bBCc , etc. Auch Ersetzungsregeln vom Typ 2 sind mehrdeutig (verschiedene mögliche Parsing-Wege). Da aber das Problem der Einbindung in einen Kontext hier nicht gegeben ist, gestaltet sich Parsing wesentlich einfacher als bei einer Typ-1 Grammatik.16 1.2.1.4 Typ-3 Grammatik (reguläre PS-Grammatik) Eine Ersetzungsregel vom Typ 3 besteht auf der linken Seite aus genau einer Variablen und auf der rechten Seite aus genau einem Terminal, gefolgt von höchstens einer Variablen.17 Beispiele: A b , A bC , etc. Grammatiken vom Typ 3 werden auch finite-state grammars genannt. Da jede Ersetzungsregel auf der rechten Seite nur eine Variable beinhalten kann, können mit ihnen keine eingebetteten Strukturen realisiert werden. Typ-3 Grammatiken sind nach CHOMSKY Markov-Ketten äquivalent.18 1.2.2 Kategorial- oder C-Grammatik Die C-Grammatik ist das früheste Beispiel eines generativen Grammatikformalismus und wurde von den polnischen Logikern LEŚNIEWSKI 1929 und AJDUKIEWIZC 1935 entwickelt. Auf ihre algebraische Definition soll hier nicht näher eingegangen werden. Grundsätzlich werden darin aber ähnlich wie bei den PS-Grammatiken Weise die Grundbausteine des Systems aufgezählt und mengentheoretisch kategorisiert.19 Wie die PS-Grammatik basiert auch die C-Grammatik auf dem Prinzip der möglichen Substitutionen. Im Gegensatz zur PSGrammatik, in der ein Zeichen durch ein, zwei oder mehrere Zeichen ersetzt wird (top-down verzweigend), werden in der C-Grammatik zwei analysierte Ausdrücke durch einen ersetzt (bottom-up amalgamierend).20 15 16 17 18 19 20 vgl. [HAUSSER, S. 156] vgl. ROADS Curtis: An Overview of Music Representation, in: [BARONI, S. 18] vgl. [HAUSSER, S. 157] vgl. ROADS Curtis: An Overview of Music Representation, in: [BARONI, S. 18f] vgl. [HAUSSER, S. 145ff] vgl. [HAUSSER, S. 204] -10- 1.2.3 Linksassoziative oder LA-Grammatik Der dritte und jüngste (1985) Elementarformalismus generativer Grammatiken wird durch die LA-Grammatik beschrieben. Ihr Name bezieht sich auf die linksassoziative Ableitungsordnung, die diesem Formalismus zugrunde liegt. Der Begriff linksassoziativ kann wie folgt erklärt werden: a+b+c interpretiert als (a + b) + c linksassoziativ interpretiert als a + (b + c) rechtsassoziativ Diese Klammerstrukturen können in eine beliebige Anzahl von Ebenen fortgesetzt werden: linksassoziativ: rechtsassoziativ: a a (a + b) (b + a) ((a + b) + c) (c + b) + a)) (((a + b) + c) + d) (d + (c + (b + a))) Neben diesen beiden Strukturen (links- und rechts-assoziativ) gibt es eine Fülle unregelmäßiger Klammerstrukturen, z.B.: (((a + b) + (c + d)) + e) ((a + b) + ((c + d)) + e) etc. Diese unregelmäßigen Klammerstrukturen, deren Anzahl exponentiell mit der Kettenlänge wächst, werden von der C- und PS-Grammatik über deren Prinzip der möglichen Substitutionen erzeugt. Die LA-Grammatik hingegen beruht auf dem Prinzip der möglichen Fortsetzungen: Beginnend mit dem ersten Wort eines Satzes beschreibt die LA-Grammatik für jeden wohlgeformten Satzanfang bei paralleler Abarbeitung die möglichen Fortsetzungen, indem sie die Regeln angibt, die für die jeweils nächste Komposition (d.h. das Anhängen des nächsten Wortes) grammatikalisch möglich sind. Dadurch kann eine unregelmäßige Ableitungsordnung, wie sie in C- und PS-Grammatik auftritt, vermieden werden.21 21 vgl. [HAUSSER, S. 201ff] -11- Abbildung 3: Ableitungsordnungen in LA-, C- und PS-Grammatik 22 Die Regelmäßigkeit LA-grammatischer Ableitungen erlaubt eine sehr einfache Darstellung der Baumstrukturen in strukturierten Listen: Abbildung 4: (i) linksassoziative Baumstruktur, (ii) Darstellung in Listenform 23 Auf die algebraische Definition der LA-Grammatik soll hier nicht näher eingegangen werden. 1.3 Erweiterte Formalismen Auf dem Fundament der drei vorgestellten Elementarformalismen sind im Laufe der Zeit zahlreiche abgeleitete Formalismen entwickelt worden, um inhärente Schwächen oder Unvollständigkeiten des jeweiligen Elementarformalismus zu überwinden. Ohne auf die Details ihrer Funktionsweise einzugehen, seien hier einige von ihnen der Vollständigkeit halber angeführt und in ihren Eigenschaften kurz umrissen: 1.3.1 Transformationsgrammatiken 24 Bei Transformationsgrammatiken handelt es sich um Erweiterungen der PS-Grammatik, wie sie beispielsweise von CHOMSKY 1965 zur effizienteren Anwendung von PS-Grammatiken auf natürliche Sprache vorgeschlagen wurden. Sie bestehen aus zwei Komponenten: einer 22 23 24 Abbildung aus [HAUSSER, S. 204] Abbildung aus [HAUSSER, S. 209] vgl. ROADS Curtis: An Overview of Music Representation, in: [BARONI, S. 19] -12- Basiskomponente im bekannten PS-Stil, und einer Transformations-Komponente, die das Einfügen, Neuordnen und Löschen von bereits generierten Strukturen erlaubt. 1.3.2 Regulated Grammars 25 Regulated grammars können als eine Art Vorläufer des bereits beschriebenen LAFormalismus gesehen werden, denn so wie dieser basieren sie auf Kontrollstrukturen, die spezifizieren, welche Regeln jeweils an einem bestimmten Punkt im Prozess des Parsings bzw. der Generierung von Sätzen gültig sind. Beispiele: Wenn Regel A angewandt worden ist, sind die Regeln A.1, A.2 und A.3 gültig. Wenn wir uns im Stadium x des Prozesses befinden und Regel B noch nicht angewandt wurde, dann wende Regel C an. 1.3.3 Systemic Grammars 26 Systemic grammars wurden von M.A.K. HALLIDAY entwickelt (1961, 1973). Die Knotenpunkte solcher Grammatiken verfügen über Eigenschaften, die es ihnen erlauben, auf Plausibilität und Sinnhaftigkeit getestet zu werden. So wird es möglich, gemeinsam mit den syntaktischen auch semantische Optionen in der Grammatik zu kodieren. 1.3.4 Transition Networks 27 Der Begriff Transition Network (TN) bezieht sich auf die in der Informatik übliche Darstellungsform von Automaten als Knotenpunkte (Zustände), die mit beschrifteten Pfeilen verbunden werden (Transitionen). Augmented Transition Networks (ATNs) wurden 1970 von W OODS als Erweiterung der Recursive Transition Networks (RTNs) vorgestellt und können als derzeitige Standardanwendung von Transition Networks bezeichnet werden. Ihr Vorteil besteht darin, dass verschiedene Knotenpunkt-Typen sehr flexibles Verhalten in Bezug auf Generierung bzw. Parsing von Satzstrukturen ermöglichen. So können beispielsweise bestimmte Knotenpunkte Tests repräsentieren, die erfolgreich durchgeführt werden müssen, bevor zum nächsten strukturgenerierenden Knotenpunkt weitergegangen wird. Andere Knotenpunkte operieren an bereits generierten Baumstrukturen. So können transformierende Operationen ohne eigenständige Transformationskomponente (vgl. 1.3.1) des Parsers durchgeführt werden. Programmiertechnisch realisiert werden ATN-Grammatiken üblicherweise Programmiersprache LISP. 25 26 27 vgl. ROADS Curtis: An Overview of Music Representation, in: [BARONI, S. 20] vgl. ROADS Curtis: An Overview of Music Representation, in: [BARONI, S. 20f] vgl. ROADS Curtis: An Overview of Music Representation, in: [BARONI, S. 21] -13- in der 2 Musik als Sprache im Sinn der generativen Linguistik? Die Frage nach Analogien zwischen Musik und Sprache ist eine sehr alte und oft gestellte. Meistens sind dabei natürliche Sprachen (und tonale Musik) gemeint. Den kleinsten gemeinsamen Nenner scheint die Identität der morphologischen Struktur von Musik und Sprache darzustellen: Schallschwingungen als Sowohl Medium natürliche zur Sprachen Fortpflanzung. als auch Beiden ist Musik die verwenden Stimme das ursprünglichste Instrument, und die Imitation der menschlichen Stimme galt lange Zeit als das Ideal eines jeden Musikinstruments. Darüber hinaus ergeben sich zahlreiche weitere Analogien, die Mario BARONI und Carlo JACOBONI – die Autoren einer bekannten Studie zur Analyse lutherischer Choräle mit Hilfe generativer Grammatiken (vgl. 3.1.1) – zur Formulierung fünf entsprechender Hypothesen veranlasste. Sie seien den folgenden Gedanken im Sinne eines strukturierenden Leitfadens eingefügt. 2.1 Musik und Sprache als Kommunikationsträger im soziokulturellen Kontext Die unmittelbarste Funktion von Musik sowie von natürlichen Sprachen stellt offensichtlich die Übermittlung von Informationen zwischen den Individuen eines gemeinsamen kulturellen Kontextes dar: "First Hypothesis (semiotical hypothesis). Musical language, like verbal language, is primarily concerned with communication. […]" 28 Um diese Kommunikation zu bewerkstelligen bedienen sich sowohl natürliche Sprachen wie auch Musik bestimmter sozialer Kodes: "Second Hypothesis (hypothesis of conventionality). The process of communication occurs in accordance with codes, that is accepted social conventions that ascribe a sense to the musical form. […]" 29 Dieser Umstand wirft Licht auf die vielschichtigen Interpretationsmöglichkeiten, die der Kommunikationsfluss, wie er von Musik oder natürlicher Sprache hergestellt wird, auf der Seite des Empfängers zulässt: 28 29 vgl. BARONI Mario, BRUNETTI Rossella, CALLEGARI Laura, JACOBONI Carlo: A Grammar for Melody. Relationships between Melody and Harmony, in: [BARONI, S. 201] vgl. ebd. -14- "In music, thirds, fourths, fifths, and even octaves, are social facts, whose syntactical behaviour can differ as much as that of 'si', 'see', and 'sea', 'beau', 'bow', and 'bo', or 'buy', 'bye', 'by' and 'bai' " 30 Der Grund für diese verschiedenen Möglichkeiten der Deutung sprachlicher und musikalischer Ausdrücke liegt darin, dass diese sozialen Konventionen im Allgemeinen keine explizit formulierten sind. Vielmehr werden sie von jedem Menschen im Rahmen seiner kulturellen Sozialisierung erlernt und gegebenenfalls auch weiterentwickelt.31 Im Falle natürlicher Sprachen wirkt diese Mehrdeutigkeit einerseits kreativitätsstiftend, andererseits kann sie auch negative Auswirkungen in Form von sprachlich-zwischenmenschlichen Missverständnissen zur Folge haben: "The ambiguity of natural language has a strong survival function; it permits people to communicate via interpretations, without being bound to replicating insights exactly, or duplicating the so-called real world. (Rather, the world is a body of interpretations.) Ambiguity is the price humans pay for the endless creativity of language use." 32 Dieses Problem entfällt – eine reife Zuhörerschaft vorausgesetzt – in der Musik völlig. Individuelle Interpretationsmöglichkeiten sind hier ausdrücklich erwünscht und in der abendländischen Tradition seit vielen Jahren konstituierendes Element der musikalischen Aufführungs- und Rezeptionspraxis.33 Allerdings ist zu beachten, dass Musik, die in diesem uns vertrauten Umfeld praktiziert wird, oft einer sehr unterschiedlichen kulturellen Umgebung entspringt: "Third Hypothesis (hypothesis of variation). Musical language, even more than verbal language, varies according to its cultural environment. […]" 34 Auch wenn der Behauptung, dass die kulturelle Variationsbreite von Musik größer sei als jene von Sprache, nicht bedingungslos zuzustimmen ist, so herrscht doch Übereinstimmung darin, dass Musik und Sprache immer Produkte bestimmter kultureller Rahmenbedingungen darstellen, die in Betracht gezogen werden müssen, wenn die grammatische Analyse einer bestimmten Sprache oder eines bestimmten Musikstils erfolgreich sein soll. 30 31 32 33 34 vgl. BLACKING John: What Languages Do Musical Grammars Describe?, in: [BARONI, S. 365] Die "Oktave" wird beispielsweise in der westlich-musikalischen Ausbildung eher als musiktheoretisches Faktum denn als soziale Konvention gelehrt. Ihre syntaktische Bedeutung obliegt bereits einem wesentlich unbewusster ablaufenden Lernprozess. vgl. LASKE Otto: Artificial Intelligence and Music: A Cornerstone of Cognitive Musicology, in: [BALABAN, S. 14] Umso erstaunlicher scheint es, dass scheinbar gerade in jener Aufführungspraxis oft eben nicht von einer solchen reifen Zuhörerschaft ausgegangen werden kann. Ein Umstand, der sich in den zahlreichen musikalischen "Skandalen" des 20. Jahrhunderts (Schönberg, Cage, etc.) äußert. vgl. BARONI Mario, BRUNETTI Rossella, CALLEGARI Laura, JACOBONI Carlo: A Grammar for Melody. Relationships between Melody and Harmony, in: [BARONI, S. 201f] -15- 2.2 Struktur und Hierarchie in Musik und Sprache Eine weitere Gemeinsamkeit von Sprache und Musik stellen ihre strukturellen Eigenschaften dar: "Fourth Hypothesis (structural hypothesis). Musical language, like verbal language, is structured. […] A grammar implies bringing these structures to the surface in the form of rules." 35 Aus dem Wunsch nach Sichtbarmachung der Strukturen von Sprache bzw. Musik durch Formulierung ihrer Grammatik ergibt sich automatisch die Forderung nach der Bildung von Hierarchien: "Fifth Hypothesis (hypothesis of hierarchy). Musical languages and musical grammars are organized in a hierarchical form. […]" 36 In den Grammatiken natürlicher Sprachen wird eine solche Hierarchie getragen von Nomen, Verben und anderen abstrakten Begriffen. Die Grammatiken abendländischer Musik kennen nicht minder abstrakte Begriffe wie Tonika, Subdominante und Dominante, die als funktionale Bedeutungsträger in der hierarchischen Struktur der Kadenz verstanden werden. Überhaupt kennt komponierte Musik ineinandergreifende Hierarchien auf jeder Ebene des musikalischen Geschehens: Melodik und Rhythmik kleinster thematischer Einheiten basieren ebenso auf hierarchischen Überlegungen wie großformale Konstrukte, wie zum Beispiel die Sonatenhauptsatzform, das Rondo oder auch das Album. 2.3 Gleichzeitigkeit in der Musik Der vielleicht wichtigste Punkt, in dem sich Musik von Sprache klar unterscheidet, betrifft das Phänomen der Gleichzeitigkeit in der Musik. Curtis ROADS spricht in diesem Zusammenhang von sonic parallelism:37 verschiedene musikalische Objekte, die eindeutig getrennt wahrnehmbar sind, existieren zum gleichen Zeitpunkt einerseits gleichberechtigt nebeneinander, treten aber andererseits miteinander in Beziehung. Solche Objekte können beipielsweise repräsentiert werden durch die verschiedenen Klänge mehrerer zusammen musizierender Instrumente, andererseits auch schon durch kontrapunktische Führung mehrerer Stimmen auf nur einem Instrument. Sowohl in natürlichen als auch in künstlichen Sprachen werden solche Parallelitäten zugunsten möglichst verständlicher und eindeutiger Bedeutungsübermittlung bewusst vermieden. 35 36 37 vgl. BARONI Mario, BRUNETTI Rossella, CALLEGARI Laura, JACOBONI Carlo: A Grammar for Melody. Relationships between Melody and Harmony, in: [BARONI, S. 202] vgl. ebd. vgl. ROADS Curtis: An Overview of Music Representation, in [BARONI, S. 24] -16- 2.4 Mängel probabilistischer Konzepte 38 "Probabilities describe rather than explain." 39 Ihre in Kapitel 2.2 angeführten hierarchischen Eigenschaften sind es wohl, die eine Beschreibung von Musik oder Sprache mit den Methoden der Wahrscheinlichkeitstheorie unzureichend erscheinen lässt. CHOMSKY hat auf diese fehlende Eignung probabilistischer Konzepte zur Beschreibung natürlicher Sprachen hingewiesen: viele grammatikalisch einwandfreie Sätze werden beinahe nie gesprochen, oder sind überhaupt noch nie gesprochen worden. Gleiches gilt für die Musik: es wird laufend Musik produziert, die niemals zuvor gehört worden ist, aber dennoch bestimmten stilistischen Richtungen eindeutig zugeordnet werden kann. Johan SUNDBERG und Björn LINDBLOM, die Autoren einer Studie über Grammatiken schwedischer Kinder- und Volkslieder (vgl. 3.1.4) bringen diesen Umstand mit folgendem Vergleich auf den Punkt: "For example we could imagine a pastiche in Mozart's style, which say, was errouneously attributed to him. This would offer an example of a perfectly grammatical music. The probability that Mozart wrote this piece would of course be zero, because he did not actually do so." 40 Die generative Linguistik versucht nun, dieses Problem zu umgehen und geeignetere Konzepte zur Beschreibung natürlicher Sprachen zu entwickeln. Aufgrund der vorhandenen Analogie bietet es sich daher an, ähnliche Konzepte für musikalische Anwendungen in Erwägung zu ziehen. Dabei wird im folgenden Kapitel zu untersuchen sein, inwiefern Musik der Definition von Sprache im Sinne der formalen Sprachtheorie folgt. 2.5 Formale Sprachdefinition Die Definition von Sprache im Sinne der formalen Sprachtheorie lautet: "Sprache ist eine Menge von Wortfolgen" 41 Es ist anzumerken, dass es sich bei Wörtern im Sinne dieser Definition auch um künstliche Wörter handeln kann (vgl. Beispiel der künstlichen Sprache akbk in Kapitel 1.2.1). Bei der Anwendung dieser Definition auf den Begriff der Musik stellt sich also unmittelbar die Frage nach der Definition eines Wortes im musikalischen Sinn. Handelt es sich dabei um ein Motiv, eine Phrase oder Periode? Um eine einzelne Note? Und in welchem Verhältnis steht ein 38 39 40 41 vgl. SUNDBERG Johan, LINDBLOM Björn: Generative Theories for Describing Musical Structure, in: [HOWELL, S. 248f] vgl. SUNDBERG Johan, LINDBLOM Björn: Generative Theories for Describing Musical Structure, in: [HOWELL, S. 265] vgl. SUNDBERG Johan, LINDBLOM Björn: Generative Theories for Describing Musical Structure, in: [HOWELL, S. 248f] vgl. [HAUSSER, S. 136] -17- solches "musikalisches Wort" zu seinem morphologischen Äquivalent, dem Klang (vgl. Wort und Laut in natürlichen Sprachen)? Was meinen wir überhaupt mit Musik? Ist Musik einfach eine "Menge von Tonfolgen" oder verfügt sie über Eigenschaften, die zur erfolgreichen Anwendung generativer Grammatiken auf musikalischem Gebiet komplexere Definitionen notwendig machen? Die Beantwortung dieser Fragen beschäftigt die MusiktheoretikerInnen und MusikwissenschafterInnen ebenso wie die KomponistInnen und LinguistInnen. Die entsprechenden Ansätze einiger von ihnen sollen im nun folgenden Kapitel vorgestellt werden. -18- 3 Musikalische Anwendung generativer Grammatiken Bereits ein halbes Jahrhundert vor CHOMSKY analysierte der deutsche Musikwissenschafter Heinrich SCHENKER die Werke zwölf bekannter Komponisten von ihrer Oberfläche bis zu ihrer von ihm vermuteten Tiefenstruktur. In der Meinung, dass sämtliche Töne der Oberflächenstruktur eines Werkes auf einen "Ursatz" dieses Werkes rückführbar wären, vertrat er die Ansicht, dass eine Art universelle Grammatik die Entfaltungsmöglichkeiten der Musik beschränkt, wobei er glaubte, einige Regeln dieser Grammatik entdeckt zu haben. Zwar war seine Theorie trotz ihrem Anspruch auf Universalität nur auf eine stark begrenzte musikalische Stilistik anwendbar, da sie vorwiegend auf der rein harmonischen Analyse meist deutscher Komponisten beruhte. Dennoch ist das Beispiel bemerkenswert, weil es sich dabei um einen Versuch handelt, eine Art generative Grammatik für musikalische Anwendungen zu formulieren, noch bevor dieser Begriff in der Linguistik selbst geprägt wurde.42 Ebenso wie Grammatiken in der generativen Linguistik einerseits zur Überprüfung von Satzstrukturen auf ihre Korrektheit, andererseits zur Generierung korrekter Satzstrukturen im Sinne dieser Grammatik dienen können, so ist es naheliegend, bei ihrer musikalischen Anwendung zwischen Analyse und Komposition zu unterscheiden. Dabei fällt auf, dass die analytische Anwendung klar zu dominieren scheint, was allerdings auch daran liegt, dass das Oeuvre von MusiktheoretikerInnen und -wissenschafterInnen ein eben wissenschaftliches und somit im Gegensatz zu jenem von KomponistInnen sich selbst dokumentierendes ist. Der Entstehungsprozess eines musikalischen Werkes (und somit eine eventuelle kompositorische Anwendung generativer Grammatiken) erschließt sich ja lediglich der über das reine Klangerlebnis hinaus interessierten HörerIn. Dieses Kapitel soll ohne jeden Anspruch auf Vollständigkeit einen Ausschnitt über verschiedene Anwendungen generativer Grammatiken in der musikalischen Analyse und Komposition bieten. Dabei wurden auch jene Anwendungen der Analyse zugerechnet, die nach der Dechiffrierung der Regeln einer musikalischen Stilrichtung auch Stücke in diesem Stil zu generieren versuchen, da dies im Allgemeinen nur der Überprüfung der Zuverlässigkeit der erstellten Grammatik dient (Analyse durch Synthese, oder auch: Resynthese). Von kompositorischer Anwendung sei nur dort die Rede, wo Grammatiken nicht aus bereits bestehenden musikalischen Strukturen extrahiert werden, sondern zur Generierung neuer Strukturen "erfunden" werden. Abschließend wird eine Kritik der musikalischen Anwendung generativer Grammatiken entwickelt. 42 vgl. [JOURDAIN, S. 339f] -19- 3.1 Musikalische Analyse mit Hilfe von Grammatiken 3.1.1 Grammatiken melodischer und harmonischer Strukturen 43 Mario BARONI und Carlo JACOBONI entwickelten in drei Projekten – aufbauend auf den Theorien der generativen Linguistik – mehrere Grammatiken zur Analyse melodischer Strukturen. Bemerkenswert ist der Umstand, dass die Autoren selbst auf das Problem der zufälligen Auswahl aus den von ihren Computerprogrammen generierten Varianten melodischer bzw. harmonischer Strukturen verweisen (Problem der Generierung geeigneter Zufallszahlen). Diesem Umstand begegneten LERDAHL und JACKENDOFF später mit der Einführung sogenannter preference rules in ihrer generative theory of tonal music (vgl. 3.1.5). 3.1.1.1 MELOS 2 In diesem Projekt (1978) wurden die Melodien von ca. 100 lutherischen Chorälen analysiert und ihre grammatikalische Struktur in makroformalen und mikroformalen Regeln ausgedrückt. Erstere beziehen sich auf Anzahl, Länge und Tonalität der musikalischen Phrasen, gruppieren diese in Perioden und bilden Analogien zwischen ihnen. Letztere bestimmen die Gestalt der einzelnen Phrasen innerhalb der von den makroformalen Regeln festgelegten Grenzen. Die Konstruktion einer Phrase erfolgt in zwei Schritten: zunächst wird basierend auf einem Kernel (Intervall zwischen erster und letzter betonter Zählzeit einer Melodie) eine primitive Phrase gebildet, die im zweiten Schritt über Transformationen dieser Phrase zur endgültigen Melodie führt. Die entwickelte Grammatik verzichtet bemerkenswerterweise auf jegliche hierarchische Baumstrukturen. Mit MELOS 2 können Melodien im Stil lutherischer Choräle einerseits analysiert, andererseits aber auch generiert werden. 3.1.1.2 HARMONY Basierend auf MELOS 2 bezieht das Projekt HARMONY (1984) die Bass-, Tenor- und Altstimmen der Harmonisierungen lutherischer Choräle von J. S. Bach mit in die Analyse ein. So wird eine Beziehung zwischen melodischen und harmonischen Strukturen hergestellt, die – ähnlich wie in MELOS 2 – auf einem harmonischen Kernel beruht (erster und letzter Akkord). Die Basslinie solcher Choräle kann durch jene Prozedur beschrieben werden, wie sie in MELOS 2 zur Analyse der Sopranlinie verwendet wird. Für die Mittelstimmen (Alt und Tenor) trifft das nicht mehr zu, da diese über geringere melodische Eigenständigkeit verfügen. 43 vgl. BARONI Mario, BRUNETTI Rossella, CALLEGARI Laura, JACOBONI Carlo: A Grammar for Melody. Relationships between Melody and Harmony, in: [BARONI, S. 205ff] -20- 3.1.1.3 CHANSON Dieses Projekt (1984) diente zur Anwendung der Prozeduren aus MELOS 2 und HARMONY auf musikalische Beispiele einer anderen Stilrichtung. Dazu wurden ca. 100 Beispiele aus einer Sammlung von Chansons (Paris 1760) analysiert. Anhand dieser Beispiele wurde versucht eine Grammatik zu entwickeln, die zur Analyse und Imitation von Melodien sowohl im Stile der Chansons als auch im Stile der lutherischen Choräle aus MELOS 2 geeignet ist. Dabei war es das Ziel, allgemein gültige von stilistisch spezifischen Regeln zu unterscheiden. 3.1.2 Experiments in Music Intelligence (EMI) 44 Bei EMI handelt es sich um ein Programm zur Analyse und Resynthese musikalischer Stilrichtungen (vorwiegend tonaler Musik). Es werden also Stücke verschiedener KomponistInnen der gleichen Stilrichtung analysiert, um stilistisch ähnliche Kompositionen zu generieren. Die EMI-interne Terminologie klassifiziert dabei Noten in vier verschiedene Symbole (identifier): O (ornamental), S (statement), A (antecedent) und C (consequent) in aufsteigender Priorität, wobei diese Symbole nochmals in drei Bedeutungsstufen gegliedert werden (1-3 in aufsteigender Priorität). Über Augmented Transition Networks (vgl. 1.3.4) werden diese Symbole zueinander in Beziehung gesetzt, wobei für jede Ebene der sich ergebenden Baumstruktur definiert wird, über welche legalen Vorgänger und Nachfolger ein jeweiliges Symbol verfügen kann. Abbildung 5: einfache melodische Phrase 45 44 45 vgl. COPE David: On Algorithmic Representation of Musical Style, in: [BALABAN, S. 354ff] Abbildung aus [BALABAN, S. 358] -21- Abbildung 6: Darstellung der hierarchischen Struktur der Phrase 46 Abbildung 7: Darstellung der Struktur in der Terminologie von EMI 47 Das folgende Notenbeispiel zeigt ein maschinengeneriertes Stück im Stil der Bachschen zweistimmigen Inventionen, das mit EMI realisiert worden ist: 46 47 Abbildung aus [BALABAN, S. 358] Abbildung aus [BALABAN, S. 359] -22- Abbildung 8: vollständig von EMI generiertes Musikstück im Stil von J. S. Bach 48 3.1.3 Modellierung musikalischer Stilrichtungen mit GI-Algorithmen 49 Pedro CRUZ-ALCÁZAR und Enrique VIDAL-RUIZ präsentierten 1998 eine Anwendung von grammatical inference (GI) zur Analyse und Synthese von homophonen Melodien im Stile von gregorianischen Chorälen, Chorälen von J. S. Bach und Ragtimes von Scott Joplin. Grammatical inference bezieht sich auf das Erlernen von Sprachmodellen anhand von Beispielsätzen aus den zu erlernenden Sprachen. In in ihrer Studie "fütterten" die Autoren drei verschiedene GI-Algorithmen mit je 100 Beispielmelodien aus den angesprochenen Stilrichtungen (ECGI-, k-TSI- und ALERGIA-Algorithmus). Am erfolgreichsten bei der richtigen Zuordnung der Beispielmelodien zu den ihnen entsprechenden musikalischen Stilrichtungen erwies sich dabei der k-TSI-Algorithmus, und zwar für alle drei Stile. Anschließend generierten die drei Algorithmen anhand der erlernten Strukturen selbständig Melodien, deren erfolgreiche Imitation des entsprechenden Stils von den Autoren auf einer fünfteiligen Skala von very good bis bad beurteilt wurden. Dabei erwiesen sich der ECGIund der k-TSI-Algorithmus als am erfolgreichsten. Auffallend ist, dass sowohl Zuordnung als auch Imitation für Melodien im gregorianischen Stil von allen drei Algorithmen am besten 48 49 Abbildung aus [BALABAN, S. 362] vgl. CRUZ-ALCÁZAR Pedro, VIDAL-RUIZ Enrique: Learning Regular Grammars to Model Musical Style: Comparing Different Coding Schemes, in: [HONAVAR, S. 211ff] -23- bewerkstelligt wurde, wohingegen Melodien im Stil von Bach und Joplin aufgrund ihrer komplexeren Struktur schwieriger einzuordnen bzw. nachzuahmen waren. An dieser Stelle soll kurz die Funktionsweise der beiden Algorithmen ECGI und k-TSI umrissen werden: ECGI-Algorithmus: Aus dem ersten Beispielsatz, der dem Algorithmus "gefüttert" wird, wird bereits eine einfache Grammatik erstellt. Für jeden weiteren Beispielsatz, der in dieser Grammatik keinem wohlgeformten Ausdruck (vgl. 1.1) entspricht, wird nun ein wohlgeformter Ausdruck der Grammatik gesucht, der einem bestimmten Korrekturschema zufolge diesem Beispielsatz am nächsten kommt. Den Resultaten entsprechend wird die ursprüngliche Grammatik nun um jene Regeln und Variablen erweitert, die es dem zunächst inkorrekten Beispielsatz erlauben, nun einen wohlgeformten Ausdruck der Grammatik darzustellen. k-TSI-Algorithmus: Dieser Algorithmus bedient sich sogenannter k-testable languages in the strict sense (kTSSL), definiert mittels eines Quadrupels Zk = (Σ, I, F, T) mit dem Alphabet Σ, einer Menge I von initial substrings, einer Menge F von final substrings und einer Menge T von forbidden substrings. Eine entsprechende Sprache besteht aus Sätzen, die mit Elementen aus I beginnen, mit Elementen aus F enden und keine Elemente aus T enthalten. Der Algorithmus generiert nun durch Beobachtung der entsprechenden Strukturen in den Beispielsätzen dieses Quadrupel Zk selbständig. Bemerkenswert ist der Umstand, dass die Kodierung der Beispielmelodien für die informatische Verarbeitung entsprechend verschiedener Schemata erfolgte: Implizite Notation wurde dabei gegen differentielle Notation der Tonhöhe (Änderung im Vergleich zur Vorgängernote in Halbtonschritten) getestet und zwar jeweils bei gemeinsamer sowie getrennter Kodierung von Tonhöhe und –länge. So ergaben sich vier verschiedene Kodiermethoden, von denen jene beiden mit getrennter Kodierung von Tonhöhe und –länge deutlich bessere Ergebnisse in der stilistischen Zuordnung der Beispielmelodien ermöglichten. 3.1.4 Grammatiken schwedischer Kinder- und Volkslieder 50 LINDBLOM und SUNDBERG veröffentlichten zwei generative Theorien für Kinderlieder der schwedischen Komponistin Alice Tegnér (1972) und für eine Art von Melodievariation, wie sie typischerweise in schwedischen Volksliedern auftritt (1976). Die beiden Grammatiken ermitteln die hierarchische Struktur der Melodien, die durch Perioden, Eröffnungs- und Schlussphrasen, Taktpaare, einzelne Takte und einzelne Zählzeiten (in absteigender hierarchischer Reihenfolge) gebildet wird. Anhand dieser Analyse wird jeder Zählzeit ein 50 vgl. SUNDBERG Johan, LINDBLOM Björn: Generative Theories for Describing Musical Structure, in: [HOWELL, S. 249f] -24- Wert zugeordnet, der definiert, wie streng die Regeln der Grammatik bezüglich erlaubter Noten, Intervalle und Akkorde auf diese Zählzeit anzuwenden sind (prominence rank values). Anhand der entworfenen Grammatiken wurden auch stilistisch ähnliche Melodien generiert. Bemerkenswert ist der Umstand, dass sich die Grammatiken je nach hierarchischem Level wechselweise einer linksassoziativen oder aber einer rechtsassoziativen Parsing-Methode bedienten (vgl. 1.2.3). 3.1.5 Eine generative Theorie tonaler Musik Den umfassendsten Ansatz zur Anwendung der Methoden generativer Linguistik in der musikalischen Analyse entwickelten Fred LERDAHL und Ray JACKENDOFF (MIT). Für ihre generative theory of tonal music adoptierten sie diese Methoden für den musikanalytischen Gebrauch. Allerdings verzichten sie dabei auf die für andere Studien so typische Analyse durch Synthese (Resynthese), also auf die Generierung stilistisch ähnlicher Musikbeispiele anhand der grammatikalischen Analyse. Die wesentlichste Erweiterung der Theorie von LERDAHL und JACKENDOFF stellt die Einführung von sogenannten preference rules dar, die den aus der generativen Linguistik bekannten well-formedness rules zur Seite gestellt werden. Während letztere auch hier zur Generierung wohlgeformter Ausdrücke (vgl. 1.1) verwendet werden (also grammatikalisch korrekter Strukturen für z.B. Rhythmus, Melodie, Harmonie, etc.), entscheiden die preference rules dabei über jenen Ausdruck, den ein erfahrener Hörer aus allen generierten Varianten auswählen würde.51 LERDAHL und JACKENDOFF argumentieren diesen Schritt mit der Tatsache, dass Musik nicht in der gleichen Weise wie Sprache an die Vermittlung bestimmter Bedeutungen gebunden ist (vgl. 2.1). Gleichzeitig verweisen sie auf Gebiete der Linguistik, die den preference rules ähnliche Mechanismen verwenden.52 Die generative Theorie tonaler Musik basiert auf der Notwendigkeit von Reduktionen in der musikalischen Analyse. Sie wird von den Autoren mit einer Reduktionshypothese begründet: "Reduction Hypothesis: The listener attempts to organize all the pitch-events of a piece into a single coherent structure, such that they are heard in a hierarchy of relative importance." 53 Diese Reduktionen, die im zeitlichen Verlauf einer Komposition auf motivische und rhythmische Strukturen angewandt werden, werden durch Baumstrukturen veranschaulicht. Das folgende Beispiel zeigt eine Analyse der bekannten Eröffnung von Mozarts Sinfonie in g-moll anhand einer sogenannten time-span reduction: 51 52 53 vgl. [LERDAHL, S. 9] vgl. [LERDAHL, S. 308] vgl. [LERDAHL, S. 106] -25- Abbildung 9: generative Analyse der Eröffnung von Mozarts g-moll-Sinfonie 54 54 Abbildung aus [LERDAHL, S. 259] -26- Anhand dieses Beispiels ist klar ersichtlich, dass die Analyse im Wesentlichen auf die Dechiffrierung der hierarchischen Gewichtung der einzelnen Noten abzielt. So kann zumindest auf der ersten Reduktionsebene (g) wohl auch ein ungeübter Hörer noch erkennen, welche Komposition gemeint ist. Ähnliche Formalismen werden zur Bildung sogenannter prolongational reductions herangezogen, die die charakteristischen musikalischen Elemente von Spannung und Auflösung in die Analyse miteinbeziehen.55 3.1.6 Analyse nichteuropäischer Musik 3.1.6.1 Zwei Grammatiken javanesischer Gamelanmusik 56 Hier handelt es sich um den einzigen Fall nichteuropäischer Musik, in dem zwei konkurrierende Grammatiken auf den gleichen Datensatz – javanesische Gamelanmusik – angewandt wurden. BECKER präsentierte zu deren Analyse 1979 eine auf neun Regeln basierende Transformationsgrammatik. Diese inspirierte HUGHES 1988 zum Entwurf einer eigenen grammatikalischen Analyse, die auf einem grundverschiedenen Ansatz basiert und aus Regeln fünf verschiedener Arten besteht: base rules (5 Stück), contour assignment rules (3 Stück), restriction rules (4 Stück), transformation rules (5 Stück) und derivation rules. Neben anderen Verbesserungen gegenüber der Grammatik von BECKER kann jene von HUGHES auf alle drei Unterklassen javanesischer Gamelanmusik (Sampak, Srepegan und Ayak-ayakan) angewandt werden, während dies bei BECKER nur für den Srepegan-Stil der Fall ist. 3.1.6.2 Afghanische Rubab-Improvisation 57 John BAILY präsentierte 1989 eine Grammatik zur Beschreibung einer Musik, wie sie in von afghanischen Musikern auf einem gezupften Lauteninstrument namens Rubab improvisiert wird. Für kurze Sequenzen aus vier oder weniger Schlägen definiert er beispielsweise mit sechs Regeln die erlaubten Kombinationen aus Aufschlägen (Λ) und Abschlägen (V), wobei diese zum Teil sehr vage gehalten sind (Regel 1: "V is the dominant stroke.", Regel 2: "Λ only occurs in association with V."). 3.1.6.3 Die Polyphonie der Venda 58 John BLACKING beschrieb in mehreren Studien (1969, 1970, 1971, 1973, 1984) eine detaillierte Struktur für verschiedene vokale und instrumentale Melodien des Volkes der Venda im nördlichen Transvaal (Südafrika). 55 56 57 58 vgl. [LERDAHL, S. 179] vgl. HUGHES, David: Grammars of Non-Western Musics: A Selective Survey, in: [HOWELL, S. 332ff] vgl. HUGHES, David: Grammars of Non-Western Musics: A Selective Survey, in: [HOWELL, S. 350ff] vgl. HUGHES, David: Grammars of Non-Western Musics: A Selective Survey, in: [HOWELL, S. 352ff] sowie BLACKING, John: What Languages Do Musical Grammars Describe?, in: [BARONI, S. 366ff] -27- Allerdings sind die Regeln seiner Grammatik sehr allgemein gehalten. Sie beginnen mit grundlegenden Regeln der Kontextualisierung eines gegebenen musikalischen Genres (Regel 1.0.0: "Music was performed as part of social situations"), und enden bei Regeln der musikalischen Struktur (Regel 4.3.2: "Since the chorus is constant, its tonality is more fundamental than that of the solo. ...") und der Tiefenstruktur (Regel 4.4.3: "Two melodies which are harmonically equivalent are regarded as the same even though their melodies may sound different. ..."). Von einer generativen Grammatik im Sinne der generativen Linguistik kann hier also kaum mehr gesprochen werden. 3.1.6.4 Analyse von Liedern der Eskimos Ramón PELINSKI präsentierte 1984 einen "Algorithmus" zur Beschreibung von A Ja Jait, einem bestimmten Genre des Liedguts der Eskimos. Anhand 30 ausgewählter Lieder entwirft er 28 generative Regeln.59 David HUGHES weist auf mehrere Unklarheiten und Widersprüche in diesem Algorithmus hin und kritisiert den Umstand, dass PELINSKI nur ein einziges Beispiel einer anhand seiner Regeln generierten Melodie anführt, welches erstens diesen Regeln teilweise widerspricht und zweitens von keinem Musiker der Eskimos überprüft worden ist.60 Analyse nordindischer Tablamusik 61 3.1.6.5 Bernard BELL und Jim KIPPEN veröffentlichten 1989 eine kontextfreie Grammatik (vgl. 1.2.1.2) zur Analyse von Qa' idas, Improvisationsschemata nordindischer Tablamusik. In dieser musikalischen Tradition werden Improvisationssequenzen durch sogenannte Bols – Silben zur Repräsentation bestimmter Klänge und Schläge auf den Tablas – überliefert. Beispiel: tira, kita, dhee, tee, dha, ta, ti, ge, ke, na, ra Dieses Beispiel stellt eine Auswahl von Bols dar, wie sie in zahlreichen Stilistiken der Tablamusik verwendet wird. In deren musikalischen Praxis werden verschiedene Variationen als Sequenzen dieser Bols musiziert. Die Beurteilung der ästhetischen "Korrektheit" einer durchgeführten Sequenz fußt auf einem komplexen Regelsystem, welches allerdings in der mündlichen Tradition der Tablamusik nie explizit vorlag, sondern jeweils von den Meistern an ihre Schüler weitervermittelt wurde. BELL und KIPPEN verwendeten diese Silben als Terminalzeichen (vgl. 1.2.1) der von ihnen erstellten Grammatik, die anhand eines definierten Regelsatzes zur Generierung wohlgeformter Ausdrücke (vgl. 1.1), also "korrekter" Sequenzen im Sinne dieser Tradition diente. Anhand der so erstellten Analysen wurde das Computerprogramm Bol Processor 59 60 61 vgl. PELINSKI Ramón: A Generative Grammar of Personal Eskimo Songs, in: [BARONI, S. 273ff] vgl. HUGHES, David: Grammars of Non-Western Musics: A Selective Survey, in: [HOWELL, S. 354ff] vgl. BELL Bernard, KIPPEN Jim: Bol Processor Grammars, in: [BALABAN, S. 366ff] -28- BP1 entwickelt, welches später zum BP2 für allgemeine kompositorische Anwendungen erweitert wurde (vgl. 3.2.1). 3.1.7 Weitere Beispiele analytischer Anwendungen W INOGRAD verwendete systemic grammars (vgl. 1.3.3) zur harmonischen Analyse von Werken von Johann Sebastian Bach und Franz Schubert (1968).62 STOFFER analysierte mit Hilfe generativer Grammatiken deutsche Kinder- und Volkslieder (1979).63 LIPPUS nutzte generative Grammatiken zur Analyse von Volksmusik aus Estland (1980). Eine bemerkenswerte Eigenschaft der von ihr verwendeten Grammatik ist der Verzicht auf hierarchische StrukturenWeiters ordnete sie den generativen Regeln jeweils Wahrscheinlichkeiten zu.64 LONGUET-HIGGINS verwendete generative Grammatiken für verschiedene musikanalytische Anwendungen (1984 gemeinsam mit LEE, 1989 gemeinsam mit LISLE).65 CHEN entwickelte eine Grammatik zur Beschreibung der Beziehungen zwischen Text und Melodie in gregorianischen Chorälen (1983).66 STEEDMAN konstruierte eine generative Grammatik für Akkordverbindungen im Jazz (1984), die er später mithilfe sogenannter categorial grammars überarbeitete.67 Aufbauend auf der Arbeit von BARONI und JACOBONI (vgl. 3.1.1) entwickelte CAMILLIERI eine generative Grammatik zur Analyse von musikalischen Themen aus Werken von Franz Schubert (1984).68 W ENCK erweiterte die Grammatik von BARONI und JACOBONI zur Anwendung auf Musik von Claude Debussy (1988).69 SLOBODA diskutierte ausgewählte Aspekte der musikanalytischen Anwendung generativer Grammatiken (1985).70 62 63 64 65 66 67 68 69 70 vgl. ROADS Curtis: An Overview of Music Representation, in: [BARONI, S. 20f] vgl. SUNDBERG Johan, LINDBLOM Björn: Generative Theories for Describing Musical Structure, in: [HOWELL, S. 256] vgl. SUNDBERG Johan, LINDBLOM Björn: Generative Theories for Describing Musical Structure, in: [HOWELL, S. 255] vgl. SUNDBERG Johan, LINDBLOM Björn: Generative Theories for Describing Musical Structure, in: [HOWELL, S. 251] vgl. ebd. vgl. [PAPADOPOULOS, S. 2] vgl. SUNDBERG Johan, LINDBLOM Björn: Generative Theories for Describing Musical Structure, in: [HOWELL, S. 251] vgl. ebd. vgl. ebd. -29- John RAHN beschäftigte sich mit der Anwendung generativer Grammatiken auf Motetten im Stil der Ars Antiqua (1984).71 Leo PLENCKERS erarbeitete eine generative Grammatik zur Erkennung von Patterns in den Cantigas de Santa Maria, einer Sammlung von etwa 400 Liedern aus dem Spanien des 13. Jahrhunderts (1984).72 P. N. JOHNSON-LAIRD entwickelte eine Grammatik zur Beschreibung von JazzImprovisationen in Bezug auf die Bildung von Rhythmen, harmonischen 73 Fortschreitungen, Basslinien und Melodien (1991). William SHOTTSTAEDT schrieb ein Computerprogramm zur Generierung kontrapunktischer Musik, basierend auf den etwa 75 Regeln, die Johann Joseph Fux in seinem Werk Gradus ad Parnassum zur Lehre des Kontrapunktes im strengen Palestrina-Stil anwendete.74 Kemal EBCIOGLU entwickelte ein System namens CHORAL zur Generierung vierstimmiger Choräle im Stil von Johann Sebastian Bach.75 3.2 Musikalische Komposition mit Hilfe von Grammatiken 3.2.1 Bol Processor BP2 Aufbauend auf ihrer Analyse nordindischer Tablamusik (vgl. 3.1.6.5) entwickelten Bernard BELL und Jim KIPPEN das Computerprogramm Bol Processor BP2 für kompositorische Anwendungen auf dem Apple Macintosh®. Dieses Programm ist in einer Evaluationsversion unter http://www.bp2.org erhältlich. Klassische PS-grammatische Ansätze (vgl. 1.2.1) werden im BP2 anhand praktisch-kompositorischer Überlegungen um zahlreiche intuitive Konzepte erweitert, die hier kurz vorgestellt werden sollen. 71 72 73 74 75 vgl. RAHN John: Teorie su alcuni motetti dell' Ars Antiqua con relative considerazioni metodologiche, in: [BARONI, S. 39ff] vgl. PLENCKERS Leo: A Pattern Recognition System in the Study of the Cantigas de Santa Maria, in: [BARONI, S. 59ff] vgl. JOHNSON-LAIRD P. N.: Jazz Improvisation: A Theory at the Computational Level, in: [HOWELL, S. 291ff] vgl. [MAURER] vgl. ebd. -30- 3.2.1.1 Funktionsprinzip des BP2 76 Abbildung 10: Funktionsprinzip des Bol Processor BP2 77 BP2 produziert Musik anhand von Textpartituren in einem eigenen Format. Diese werden entweder durch benutzerdefinierte Grammatiken generiert, direkt mit einem Texteditor eingegeben oder aber auch von einem MIDI-Instrument empfangen. Die generierten Partituren können sowohl direkt über MIDI ausgegeben werden als auch in MIDI-Dateien oder Partituren im CSound-Format umgerechnet werden. Wesentlich ist die Verwendung sogenannter sound objects, die nicht notwendigerweise Klänge generieren, aber auch einfache musikalische Noten darstellen können. Diese sound objects werden einer symbolic time zugewiesen, deren Abfolge keine reguläre sein muss, um der starren Behandlung von Zeit in vielen computermusikalischen Anwendungen vorzubeugen. So werden polymetric expressions ermöglicht, also die sequentielle Darstellung von gleichzeitigen Objekten in Listen. Die Interpretation dieser polymetric expressions entspricht der Umsetzung von symbolischer in reale Zeit zwecks Partitursynthese. 3.2.1.2 Echte BP-Grammatiken 78 Mit BP2 können sowohl Satzstrukturen einer benutzerdefinierten Grammatik generiert als auch einzelne Sätze auf ihre Wohlgeformtheit in Bezug auf eine gegebene Grammatik überprüft werden (membership test). Eine solche Überprüfung setzt allerdings voraus, dass 76 77 78 vgl. [BP2_INTRO] Abbildung aus [BP2_INTRO] vgl. [BP2_DOC, Kapitel 7: "True" Bol Processor grammars] -31- es sich bei der betreffenden Grammatik um eine echte BP-Grammatik handelt: echte BPGrammatiken entsprechen Grammatiken, die dem im Bol Processor BP1 (vgl. 3.1.6.5) implementierten Formalismus folgen, erweitert um sogenannte remote contexts (vgl. 3.2.1.6). Das heißt, dass die Grammatik unter anderem auf polymetric expressions (vgl. 3.2.1.1) sowie auf Regeln zum Löschen bereits generierter Strukturen verzichten muss. Allerdings können auch Grammatiken, die sich nicht zum Parsen von Satzstrukturen eignen, vom BP2 kompiliert und zur Generierung von Sequenzen verwendet werden. 3.2.1.3 Subgrammatiken und Ableitungsmodi 79 Üblicherweise werden Grammatiken im BP2 in einzelne Subgrammatiken unterteilt, die vier verschiedenen Ableitungsmodi angehören. Letztere beziehen sich auf die Reihenfolge, in der die Ersetzungsregeln bei der Generierung von Satzstrukturen angewendet werden: RND-Modus: die Ersetzungsregeln werden in zufälliger Reihenfolge ausgeführt. LIN-Modus: die Ersetzungsregeln werden so ausgeführt, dass sich eine Ableitung von links nach rechts ergibt. ORD-Modus: die Ersetzungsregeln werden in der Reihenfolge ausgeführt, in der sie in der Grammatik definiert sind. SUB-Modus: wie RND-Modus; allerdings wird das Argument auf der linken Seite der aktuellen Ersetzungsregel gleichzeitig überall dort ersetzt, wo es innerhalb der Grammatik auftritt (parallel derivation). Außerdem muss auch für jede einzelne Ersetzungsregel, die nicht einer LIN-Grammatik angehört, ein Ableitungsmodus (LEFT oder RIGHT) angegeben werden. 3.2.1.4 Gewichtung von Ersetzungsregeln 80 In BP2 gibt es die Möglichkeit, den Ersetzungsregeln Wahrscheinlichkeitsgewichtungen zuzuordnen. Damit kann im Einzelfall aus mehreren Kandidaten die "geeignetste" Regel ausgewählt werden. Diese Prozedur erinnert stark an die preference rules in der generative theory of tonal music von LERDAHL und JACKENDOFF (vgl. 3.1.5). 3.2.1.5 Metavariablen (Wild Cards) 81 Wild cards in Ersetzungsregeln können durch ein beliebiges Terminalsymbol, eine einzelne Note, eine Variable etc. ersetzt werden. Diese Metavariablen werden mit ?1, ?2 etc. notiert. Ihre Gültigkeit ist lokal begrenzt. 79 80 81 vgl. [BP2_DOC, Kapitel 4.4: BP2 grammars] vgl. [BP2_DOC, Kapitel 4.6: Weights] vgl. [BP2_DOC, Kapitel 4.7: Metavariables] -32- Remote contexts 82 3.2.1.6 Remote contexts beziehen in den Ableitungsprozess die Frage ein, ob sich eine bestimmte Sequenz irgendwo (nicht nur unmittelbar, wie in kontextsensitiven Grammatiken; vgl. 1.2.1.2) auf der linken oder rechten Seite der aktuellen Ableitungsposition vorfindet. Standardgrammatiken im Sinne von CHOMSKY (vgl. 1.2.1) machen eine Realisierung von remote contexts zwar theoretisch möglich, praktisch ist dies aber außerordentlich schwierig zu bewerkstelligen. Im BP2 wurde ihnen daher eine eigene Syntax zugewiesen. Beispiel: (a b c) X Y (c d) X e f "X Y" kann nur dann durch "X e f" ersetzt werden, wenn im abgeleiteten Satz "a b c" irgendwo vor "X Y" und "c d" irgendwo nach "X Y" gefunden wird. Negierte Darstellung 83 3.2.1.7 Alle Variablen, Terminale etc. können in den Ersetzungsregeln auch negiert dargestellt werden. Beispiel: #(a b c) X c d e "X" kann nur dann durch "c d e" ersetzt werden, wenn im abgeleiteten Satz "a b c" nirgendwo vor "X" gefunden wird. 3.2.1.8 Metagrammatiken 84 Im BP2 können alle Symbole zur Darstellung einer Grammatik als Terminalzeichen einer Metagrammatik definiert werden, die so Verknüpfungen zwischen mehreren Grammatiken herstellen kann. 3.2.1.9 Programmed Grammars und Production Procedures 85 Programmed grammars und production procedures beziehen sich auf zwei verschiedene Lösungsansätze im BP2, anhand derer die KomponistIn auf intuitive Art und Weise die Reihenfolge der Abarbeitung der Ersetzungsregeln bestimmen und so den Prozess der Satzgenerierung besser nachvollziehen und reflektieren kann. 82 83 84 85 vgl. [BP2_DOC, Kapitel 4.12: Remote context] vgl. ebd. vgl. [BP2_DOC, Kapitel 4.13: Metagrammars] vgl. [BP2_DOC, Kapitel 8.1: Production procedures] sowie [BP2_DOC, Kapitel 11: Programmed grammars] -33- 3.2.2 Weitere Beispiele kompositorischer Anwendungen LIDOV und GABURA verwendeten eine einfache Typ-1 Grammatik (vgl. 1.2.1.2) zur Generierung von Rhythmen (1973).86 HOLTZMANN setzte Typ-1 Grammatiken in seiner Kompositionssprache GGDL ein und definierte Regeln der musikalischen "Metaproduktion", die Kontrollstrukturen entsprechen, wie sie in regulated grammars (vgl. 1.3.2) auftreten (1981).87 MOORER verwendete Markov-Ketten (den Typ-3 Grammatiken äquivalent, vgl. 1.2.1.4) zur algorithmischen Komposition von Melodien (1972).88 SMOLIAR verwendete Strukturgeneratoren, die Transformationsgrammatiken (vgl. 1.3.1) ähneln, für sein Kompositionsprogramm SCHENKER (1980).89 LIDOV und GABURA verwendeten ebenfalls einen Mechanismus im Stile linguistischer Transformationen zur Generierung von homophonen Melodien (1973).90 Hanspeter KYBURZ (Studium in Graz bei A. DOBROWOLSKI und Gösta NEUWIRTH) verwendet Grammatiken in seiner kompositorischen Arbeit. Basierend auf sogenannten cultural grammars (als Variation generativer Grammatiken) schrieb R. Douglas REICKEN ein Kompositionsprogramm namens Wolfgang.91 Stephen Travis POPE verwendete ein auf Grammatiken basierendes Regelsystem für Kombination XI, den ersten Satz seiner Komposition Celebration: Laments and Simple Truths for a Quiet Spiritual Place, zur Verbindung musikalischer und textlicher Strukturen (1990).92 Jon MCCORMACK implementierte ein auf Grammatiken basierendes Computersystem mit MIDI-Ausgabe zur kompositorischen Anwendung.93 86 87 88 89 90 91 92 93 vgl. ROADS Curtis: An Overview of Music Representation, in: [BARONI, S. 18] vgl. ebd. vgl. ROADS Curtis: An Overview of Music Representation, in: [BARONI, S. 19] vgl. ROADS Curtis: An Overview of Music Representation, in: [BARONI, S. 20] vgl. ebd. vgl. http://music.dartmouth.edu/~wowem/hardware/algorithmdefinition.html vgl. [POPE, S. 5] vgl. [MCCORMACK, S. 11] -34- 3.3 Kritik der musikalischen Anwendung generativer Grammatiken 3.3.1 Vorteile Es sind die zwei charakteristischen Eigenschaften generativer Grammatiken, die einerseits ihren Durchbruch in der Linguistik begründet haben, andererseits ihre musikalische Anwendung nahelegen: 3.3.1.1 "Unendlichkeit" als kreative Triebkraft Erstens erlauben es generative Grammatiken, mithilfe einer endlichen (und typischerweise vor allem auch überschaubaren) Anzahl von Regeln eine unendliche Anzahl von Sätzen zu generieren. Ihre schiere Unerschöpflichkeit lässt sie so sehr als kreatives Werkzeug geeignet erscheinen. Hier stehen sie auch im Gegensatz zum Permutationsprinzip serialistischen Denkens: Permutationen liefern eine sehr große, aber endliche Anzahl von Sequenzen. Mit anderen Worten: die Zahl der möglichen Zwölftonreihen ist riesig, aber endend. Von einer endlichen Zahl geht aber eine wesentlich geringere Strahlkraft aus als vom Begriff der Unendlichkeit. Hier liegt wohl der Schlüssel zum Reiz, den die generative Linguistik bereits sehr bald nach ihrer Entstehung auf musikalisch tätige Menschen ausgeübt hat. 3.3.1.2 Makrostrukturbildung Zweitens umgehen generative Grammatiken das größte Problem der meisten anderen algorithmischen Kompositionstechniken: "The problem with many compositional algorithms is the lack of macrostructure. Music that consists of only one level of hierarchy (for instance successive short melodies) is hardly of any interest." 94 Auch hier kann von einer Überwindung serialistischen Denkens durch generative Grammatiken gesprochen werden. Wiederum sei an das Konzept der Permutation erinnert: es ist ein eindimensionales. Eine Zwölftonreihe operiert auf der einen hierarchischen Ebene der Tonhöhe. Auch dort, wo das Reihenkonzept sonst noch angewandt worden ist, berührt es isolierte Parameter, deren Verknüpfung sich dann auch meist als das primäre kompositorische Problem herausgestellt hat (vgl. Stockhausens Kreuzspiel oder Boulez' Structures). Es ist dieses Denken in Parametern, welches die Bildung einer musikalischen Makrostruktur erschwert: Sein Vorteil – die von Fremdeinflüssen isolierte Betrachtung und Gestaltung musikalischer Aspekte – erweist sich gleichzeitig als seine größte Schwäche. Die 94 vgl. [JÄRVELÄINEN, S. 6] -35- Idee des Parameters hat aber nun Eingang in die meisten algorithmischen Konzepte gefunden, die für musikalische Anwendungen in Betracht gezogen worden sind.95 Meist ergibt sich daraus prompt das Problem des Mappings: wie lassen sich auf einem nichtmusikalischen Gebiet erfolgreich extrahierte Parameter sinnvoll in ebenso isolierte musikalische Parameter übersetzen? Nur zu oft gehen solche Versuche schief, und meist verbirgt sich dahinter mangelndes Bewusstsein für die Notwendigkeit einer musikalischen Makrostruktur. So ein Strukturbewusstsein stellt nun aber gewissermaßen das konstituierende Element des Konzepts der generativen Grammatik dar. Dieses Konzept impliziert die Einführung abstrakter, strukturbildender Einheiten (z. B. "Substantiv", "Verb", "Relativsatz" in natürlichen Sprachen, oder "Tonika", "Dominante", "Seitenthema" in der Musik) als Variablen (vgl. 1.2.1) einer Grammatik, die im Gegensatz zu Parametern verschiedenste musikalisch- hierarchische Ebenen berühren können. Da die Musiktheoretiker bereits mehrere Jahrhunderte mit der Formulierung abstrakter Begriffe für musikalische Strukturen beschäftigt waren, existierte zum Zeitpunkt der Einführung der generativen Linguistik zumindest in der abendländischen Musik bereits ein sehr umfangreiches Spektrum solcher strukturbeschreibenden Begriffe, welches außerdem relativ weit und einheitlich verbreitet war und immer noch ist. Dies ist ein weiterer Grund, warum sich generative Grammatiken bald großer Beliebtheit in der musikalischen Anwendung erfreuten. Diese Anwendung fand zunächst vor allem in der musikalischen Analyse statt (vgl. 3.1). Die sich dabei ergebenden Probleme werden im folgenden Kapitel behandelt. 3.3.2 Probleme der Analyse Zwei im vorhergehenden Kapitel angeführte Aspekte sind es, die zwei weitverbreiteten Mißverständnissen in der musikanalytischen Anwendung generativer Grammatiken Tür und Tor öffnen: 3.3.2.1 Verwechslung von Musik mit Melodie Der in Kapitel 3.3.1.2 angesprochene verführerische Vorteil des Parameterdenkens, das Extrahieren einzelner Aspekte aus komplexen Strukturen, hinterlässt seine Spuren in den im Kapitel 3.1 vorgestellten Beispielen musikalischer Analyse: Nur zu oft wird dabei der klassischste aller musikalischen Parameter – die Tonhöhe – als primäres und oft einziges Ziel einer musikalisch-grammatikalischen Analyse erhoben. Eine solche Vereinfachung gründet sich zwar unter Umständen auf Fragen der Wissenschaftlichkeit, gleichzeitig verkennt sie aber die eigentliche Stärke generativer Grammatiken: die vielschichtiger, ineinander verwobener Strukturen. 95 z. B.: zelluläre Automaten, Fraktaltheorie, genetische Algortihmen, neuronale Netze, etc. -36- Bildung 3.3.2.2 Verwechslung von Musik mit tonaler abendländischer Musik Ebenfalls in Kapitel 3.3.1.2 beschrieben wurde die Tatsache, dass das Vorhandensein zahlreicher strukturbeschreibender musikanalytischer Fachbegriffe in der Tradition der abendländischen Musik die Anwendung generativer Grammatiken in der musikalischen Analyse begünstigt. Die logische Folge davon ist, dass meist ebensolche Musik das Ziel generativer Analysen darstellt. Da diese uns wiederum neue Details über das Innenleben dieser Musik verrät, laufen wir noch mehr Gefahr, den Begriff der Musik mit dem gleichzusetzen, was unseren abendländisch-tonalen Höhrgewohnheiten entspricht, als wir es in der westlichen Hemisphere ohnehin bereits tun. Leider wirken die Beispiele der Analyse nichteuropäischer Musik (vgl. 3.1.6) dieser Gefahr insofern wenig entgegen, als sie oft nur sehr unzureichende Beschreibungen der jeweils beobachteten musikalischen Tradition liefern, wie HUGHES es in seinem Aufsatz Grammars of Non-Western Music beschreibt.96 3.3.2.3 Das Problem des soziokulturellen Kontextes Die im letzten Kapitel beschriebene Gefahr der Reduzierung von Musik auf persönliche Hörgewohnheiten verweist auf ein allgemeineres Problem: die Grammatiken natürlicher Sprachen ebenso wie jene musikalischer Stile sind keine starren Gebilde sondern lebendige Organismen, die historischen Veränderungen ebenso unterliegen wie kulturellen Zusammenhängen. Da eine Grammatik im Allgemeinen bei weitem nicht allen Personen, die von ihr Gebrauch machen, explizit bekannt ist, unterliegt sie außerdem noch den individuellen Interpretationen der sie Ausübenden. Gerade diese Interpretationsmöglichkeiten sind wohl auch die Triebkraft, die eine Grammatik zum Spielball dynamischer Veränderungen macht. Sie ist eben ein kulturelles Produkt – und als solches nie definitiv. In Kapitel 2.1 wurden allerdings bereits die Vorteile von Mehrdeutigkeiten in Musik und natürlichen Sprachen behandelt. John BLACKING vertritt zu diesem Thema eine recht optimistische Ansicht: "To insist that musical analysis must account for varieties of individual interpretation is not to abandon all hope of describing musical grammars and being able to compare them in such a way that we can eventually discover some general characteristics of musical languages. On the contrary, it recognizes that individuals' 'intentions to mean' and their interpretations of others' meanings are primary factors which give structure to their communication [...]. Grammars are attempts to codify the regularities of the structure that communities generate in order to give coherence to their communication and to enable individuals to share meanings." 97 96 97 vgl. HUGHES, David: Grammars of Non-Western Musics: A Selective Survey, in: [HOWELL, S. 356f] vgl. BLACKING John: What Languages Do Musical Grammars Describe?, in: [BARONI, S. 364] -37- Generative Grammatiken können in der musikalischen Analyse keine Beschreibung des soziokulturellen Kontextes ersetzen. Nur dort, wo dieser in verantwortungsvoller Weise berücksichtigt wird, stellen sie ein geeignetes musikanalytisches Werkzeug dar. 3.3.3 Probleme der Resynthese Der Begriff der Resynthese bezieht sich in diesem Kapitel auf die Fähigkeit generativer Grammatiken, basierend auf der Analyse verschiedener Sätze einer Sprache weitere gültige Sätze dieser Sprache zu generieren (und in diesem Sinne zu resynthetisieren). 3.3.3.1 Resynthese als analytisches Werkzeug Die Fähigkeit generativer Grammatiken zur Generierung von Satzstrukturen wird in ihrer musikanalytischen Anwendung gerne als Werkzeug zur Überprüfung der "Korrektheit“ einer solchen Grammatik herangezogen. Mit anderen Worten: eine Grammatik, die anhand der Analyse von Beethovschen Klaviersonaten gebildet wurde, kann dann als korrekt bezeichnet werden, wenn sie in der Lage ist, Musikbeispiele zu generieren, die wie Beethovsche Klaviersonaten klingen. LERDAHL und JACKENDOFF machen in diesem Punkt in ihrer generative theory of tonal music (vgl. 3.1.5) eine deutliche Ausnahme. Sie verzichten auf jegliche Generierung von Musikbeispielen anhand der von ihnen beschriebenen Mechanismen und begründen diesen Schritt wie folgt: "[…] Under this interpretation, a musical grammar should be an algorithm that composes pieces of music. There are three errors in this view. First, the sense of 'generate' in the term 'generative grammar' is not that of an electrical generator that produces electricity, but the mathematical sense, in which it means to describe a (usually infinite) set by finite formal means. Second, it was pointed out by Chomsky and Miller (1963), and it has been an unquestioned assumption of actual research in linguistics, that what is really of interest in a generative grammar is the structure it assigns to sentences, not which strings of words are or are not grammatical sentences. The same holds for our theory of music. It is not intended to enumerate what pieces are possible, but to specify a structural description for any tonal piece; that is, the structure that the experienced listener infers in his hearing of the piece. A third error in the conception of a generative grammar as a sentence-spewing device is not evident from passing acquaintance with the early works of the generative school, but emerges as a prominent theme of Chomsky 1965, Lenneberg 1967, and subsequent work. Linguistic theory is not simply concerned with the analysis of a set of sentences; rather it considers itself a branch of psychology, concerned with making empirically verifiable claims about one complex aspect of human life: -38- language. Similarly, our ultimate goal is an understanding of musical cognition, a psychological phenomenon." 98 SUNDBERG und LINDBLOM, die Autoren einer anderen Studie (vgl. 3.1.4) kritisieren diese Einstellung mit den folgenden Worten: "By refraining from the analysis-by-synthesis approach, i.e. the goal of generating or resynthesizing their observations, Lerdahl and Jackendoff appear to give up the tool they need to deal rigorously with the complex consequences of their hypotheses." 99 In einem anderen Zusammenhang vertritt John BLACKING eine ähnliche Einstellung: "[...] the test of any grammar is in its performance." 100 Die Schwierigkeit, das Werkzeug der Resynthese der Theorie von LERDAHL und JACKENDOFF zugänglich zu machen, liegt in deren Anspruch auf Allgemeinheit. Alle anderen vorgestellten Studien zur musikalischen Analyse mithilfe generativer Grammatiken beziehen sich auf ein relativ eng und klar begrenztes Teilgebiet musikalischer Stilistiken – wohl eben auch, um die Überprüfung der Ergebnisse mittels Resynthese einfacher zu gestalten. LERDAHL und JACKENDOFF aber beanspruchen das gesamte Gebiet der tonalen Musik für ihre Analysen. Ein darauf basierender Resynthesealgorithmus müsste also zur Generierung von Musikstücken unzähliger Stilistiken geeignet sein. Die dazu notwendigen Differenzierungen zwischen den zahlreichen Spielarten tonaler Musik können aber wohl kaum in einer einzigen Studie behandelt werden. Der Verdienst der generative theory of tonal music liegt im Hinweis auf die Gemeinsamkeiten in der Struktur verschiedenster Ausprägungen tonaler Musik. 3.3.3.2 Resynthese als kompositorisches Werkzeug Es ist wohl die ungebrochene Faszination, die die Idee der Maschine auf den Menschen ausübt, die als Wegbereiterin eines weitverbreiteten Missverständnisses im Zusammenhang mit algorithmischen Kompositionstechniken fungiert: der Computer könne die KomponistIn ersetzen. Gerade die Fähigkeit generativer Grammatiken zur Resynthese musikalischer Stile, die sie von anderen algorithmischen Kompositionstechniken unterscheidet, trägt einen entscheidenden Teil zu diesem Irrtum bei. Es ist auf Wandlungsfähigkeit von Grammatiken natürlicher und musikalischer Sprachen hingewiesen worden, die von der Interpretationsvielfalt der Individuen eines gemeinsamen kulturellen Kontextes getragen wird (vgl. 3.3.2.3). Die Formulierung der Grammatik eines musikalischen Stils ist aber bereits selbst Teil einer solchen Interpretation. Die Musik, die so eine Grammatik durch Resynthese generieren kann, wird dieser Interpretation folgen müssen. Komposition ist nun aber immer auch Suche nach Neuem, Ungesagtem. Eine Maschine, die auf der Analyse von Altem, vgl. [LERDAHL, S. 6] vgl. SUNDBERG Johan, LINDBLOM Björn: Generative Theories for Describing Musical Structure, in: [HOWELL, S. 268f] 100 vgl. BLACKING John: What Languages Do Musical Grammars Describe?, in: [BARONI, S. 364] 98 99 -39- bereits Gesagtem, beruht, kann also in diesem Sinn keine KomponistIn sein oder eine solche ersetzen. Aber sie kann ihr Mittel zum Zweck sein: dort wo die KomponistIn sich auf Altes beziehen muss, um Neues sagen zu können, kann sie ihr "altes" musikalisches Material liefern, und zwar ihrer Interpretation folgend. Es ist diese Methode des "Remix ohne direktes Zitat", der sich die KomponistInnen als Vermittler im Spannungsfeld zwischen Tradition und Innovation zu allen Zeiten bedient haben. 3.3.4 Probleme der Komposition "Music is something we do, not just something we understand, and much of what we try to understand regarding music is meant to lead to the making of it." 101 (Marvin MINSKY) Wo stellen sich nun die Probleme, wenn die Mittel generativer Grammatiken zur musikalischen Komposition eingesetzt werden? Marvin MINSKY äußert sich zu diesem Punkt wie folgt: "The so-called 'generative' approach purports to describe all choices open to a speaker or composer – but it also tries to abstract away the actual procedure, the temporal evolution of the compositional process. Consequently, it cannot even begin to describe the choices composers must actually face – and we can understand that only by making models of the cognitive constraints that motivate an author or composer. I suspect that when we learn how to do that, many regularities that today are regarded as grammatical will be seen as results of how the composer's motivations interact with the knowledge-representation mechanisms shared by the composer and the listener." 102 Es sind aber genau diese von KomponistInnen und ZuhörerInnen geteilten Mechanismen der Wissensrepräsentation, die sich in musikalischen Grammatiken formulieren lassen. KomponistIn und ZuhörerIn "wissen" intuitiv, dass nach der Dominante die Tonika zu erwarten ist. Die KomponistIn kann nun dieses intuitive Wissen zur expliziten "Regel" im kompositorischen Prozeß machen. Oder aber diese Regel bewußt brechen, um musikalisches Neuland betreten zu können. MINSKY dazu: "Each initial discord, be it melodic, rhythmic, harmonic, or whatever, can be seen as a problem to be later resolved. A lot of what a composer does is setting up expectations, and then figuring out how to frustrate them. That gives the composer some problems to solve. The problems and their solutions are then like elements of a plot, and composition becomes a kind of story telling." 103 vgl. MINSKY Marvin, LASKE Otto: Foreword: A Conversation with Marvin Minsky, in: [BALABAN, S. xii] vgl. MINSKY Marvin, LASKE Otto: Foreword: A Conversation with Marvin Minsky, in: [BALABAN, S. xvii] 103 vgl. MINSKY Marvin, LASKE Otto: Foreword: A Conversation with Marvin Minsky, in: [BALABAN, S. xviii] 101 102 -40- Sofern die KomponistIn die von ihr verwendeten Grammatiken nicht mit einer "Kompositionsmaschine" verwechselt, solange sie sich also ihrer kompositorischen Aufgabe stellt, wird sie sich diesem "Geschichtenerzählen" nicht entziehen können. Wo wirklich komponiert wird, kann keine Kompositionsmethode der Welt den eigentlichen 104 Kompositionsprozeß "wegabstrahieren". 3.3.5 Lösungsansätze Ein wesentlicher Aspekt der sinnvollen musikalischen Anwendung generativer Grammatiken betrifft den Einsatz paralleler Grammatiken. Diese Forderung ergibt sich aus der Überlegung, dass Musik sich von natürlichen Sprachen in erster Linie durch das Phänomen der Gleichzeitigkeit unterscheidet (sonic parallelism; vgl. 2.3). Einerseits können zur Realisierung paralleler Grammatiken unabhängige Ersetzungsregeln für Rhythmik, Melodik, etc. implementiert werden, andererseits kann man sich paralleler Ersetzungsregeln bedienen: Beispiel: Ax/y A generiert zum gleichen Zeitpunkt sowohl x als auch y. Solche Parallelitäten sind auch auf die linke Seite der Ersetzungsregeln erweiterbar: Beispiel: B / C (i, j) / (k, l) Auf diese Weise entstehen sogenannte array grammars, die in der Lage sind, mehrdimensionale Muster zu erkennen und entsprechend derartiger Regeln zu ersetzen.105 In der Anwendung paralleler Grammatiken stellt sich die Frage nach einer sinnvollen Unterteilung und Verknüpfung der einzelnen Teilgrammatiken.106 Zusätzlich muß wiederum die Problematik des soziokulturellen Kontexts jeder musikalischen Grammatik (vgl. 2.1) in Betracht gezogen werden: "In musical traditions where performances are given from written scores, it may be necessary to distinguish the grammar of the score from the grammar of performance, especially when a century or more of social and musical change separates the analyst from a composer and his / her contemporary audience." 107 Es wird dabei auf die Implementierung von programmed grammars und production procedures im Bol Processor BP2 (vgl. 3.2.1.9) verwiesen. 105 vgl. ROADS Curtis: An Overview of Music Representation, in: [BARONI, S. 24f] 106 Im Computerprogramm Bol Processor BP2 beispielsweise ist zu diesem Zweck der Mechanismus der Metagrammatiken (vgl. 3.2.1.8) implementiert. 107 vgl. BLACKING John: What Languages Do Musical Grammars Describe?, in: [BARONI, S. 365] 104 -41- Diese Beobachtung legt den Schluß nahe, dass sich die Herausforderung der Parallelität, oder besser: der Vielschichtigkeit musikalisch-hierarchischer Ebenen und ihrer Verknüpfungen, nicht nur auf der rein morphologischen Ebene des Klangereignisses stellt: "[...] if a musical grammar is concerned only with the structure of the sonic product, it may not be describing the process of creation that a grammar is supposed to reflect, because it could be analysing the wrong language." 108 Hier nimmt BLACKING auf den linearen Prozess des "Geschichtenerzählens", wie ihn Marvin MINSKY beschreibt (vgl. 3.3.4), Bezug, wobei dieser nun nicht mehr ausschließlich den Prozess des Komponierens selbst meint, sondern auch das Nachvollziehen dieses Prozesses in der Analyse. Die Analyse wird in der abendländischen Kunstmusik seit Jahrhunderten insofern als Wegbereiterin der Komposition betrachtet, als sie einen Lernprozess darstellt, der den KomponistInnen die persönliche Positionierung im historischkulturellen Spektrum ermöglichen soll. Die Aufarbeitung dieses Spektrums wurde und wird dabei als Bedingung zu eigenständiger kompositorischer Arbeit verstanden. Otto LASKE dazu: "Although I find the rigorous version of this conception of music analysis [the orthodox one, Anm.] attractive, I consider it as procedurally more realistic109 to free the analysis process from being a replica of the compositional one. This means giving it its own unique object to generate. In my definition, this object is a systematized set of examples for concepts newly synthesized on the basis of an initial set of concepts." 110 Natürlich geht der eigentliche Zweck musikalischer Analyse über die reine Nacherzählung einer (von der KomponistIn ohnehin spannender erzählten) "Geschichte" hinaus. Sie soll immer auch weiterführende musikalische Konzepte bieten: wie könnte man die Geschichte fortsetzen? Oder auch: Wie könnte man die Geschichte anders erzählen? Sollte man überhaupt eine andere Geschichte erzählen? Heute steht der Analyse mehr musikalisches Repertoire als je zuvor zur Verfügung. Weil die kulturellen Unterschiede in diesem Repertoire zu offensichtlich sind, kann sie nicht mehr auf Harmonielehre und Kontrapunkt beschränkt bleiben. Weil ihr der Einsatz des Computers neue Bereiche erschließt (Stichwort Spektralanalyse), muß sie darauf nicht mehr beschränkt bleiben. Musikalische Grammatiken können ein geeignetes Mittel sein, um diese vielfältigen analytischen Ebenen zur Gewinnung neuer kompositorischer Konzepte miteinander zu verknüpfen. vgl. BLACKING John: What Languages Do Musical Grammars Describe?, in: [BARONI, S. 369] "more realistic" ist hier im Sinne von "der Realität besser entsprechend" zu verstehen, Anm. 110 vgl. LASKE Otto: A Rule System for Music-Analytical Discoveries, in: [BARONI, S. 168] 108 109 -42- Wenn also der Beginn des dritten Kapitels dieser Arbeit zunächst eine Trennung von Analyse und Komposition vollzogen hat, so soll an dieser Stelle auf die Möglichkeit hingewiesen werden, mit Hilfe musikalischer Grammatiken wieder zu einer übergreifenderen Betrachtung dieser beiden ursprünglich gemeinsam gewachsenen Begriffe zurückzufinden. Sandeep BHAGWATI hat sich in seinem Aufsatz Komponieren im 21. Jahrhundert mit der zukünftigen Rolle musikalischer Grammatiken auseinandergesetzt. Die entsprechende Textstelle sei dieser Arbeit als abschließendes Zitat eingefügt: "Wir schauen auf eine unergründliche Fülle von Details auf allen Ebenen der Musik, von der Betrachtung des einzelnen Samples bis zu den verschiedenen musikalischen Hochkulturen – aber noch haben wir keine übergeordnete Metasprache entwickelt, die unter diesen Details sinnvoll vermitteln könnte. Diese Metasprache wird nicht eine monolithisch einzelne sein, auch universalistische Wunschträume verbinde ich nicht mit ihr. Vielmehr sehe ich sie als eine Art Grammatik – Grammatiken zeichnen sich ja im Unterschied zu musikalisch geschlossenen Systemen durch ihre Fähigkeit aus, auch Ausnahmen und vor allem logische Widersprüche in verschiedenen Teilen des Systems existieren zu lassen – und trotzdem ein verständliches Gebilde zu erzeugen. Wenn man so will, möchte ich, dass die Komponisten lernen, die musikalischen Strukturmodelle, die ihnen vertraut sind, nicht als grundlegend zu betrachten, sondern als Oberfläche – die wirkliche Struktur ist eine Tiefengrammatik, an der zu arbeiten eine Aufgabe der Zukunft sein wird." 111 111 vgl. [BHAGWATI] -43- Quellenverzeichnis [BALABAN] BALABAN Mira, EBCIOĞLU Kemal, LASKE Otto: Understanding Music with AI. Perspectives on Music Cognition. The AAAI Press, Menlo Park, 1992 [BARONI] BARONI M., CALLEGARI L.: Musical Grammars and Computer Analysis. Leo S. Olschki Editore, Florenz, 1984 [BHAGWATI] BHAGWATI Sandeep: Komponieren im 21. Jahrhundert. Texte 1993-99. Beiträge zur Elektronischen Musik, Bd. 9, Institut für Elektronische Musik, Graz, 1999 Quelle: http://iem.kug.ac.at/projekte/publications/bem/bem9/index_html [BP2_INTRO] BEL Bernard: Bol Processor BP2 presentation + sound examples. Quelle: http://www.lpl.univ-aix.fr/~belbernard/music/bp2intro.htm [BP2_DOC] BEL Bernard: The BP2 Reference Manual. Quelle: http://www.lpl.univ-aix.fr/~belbernard/music/bpdoc/bp2doc.html [HAUSSER] HAUSSER Roland: Grundlagen der Computerlinguistik. Kommunikation in natürlicher Sprache. Springer Verlag, Berlin, 2000 Mensch-Maschine- [HONAVAR] HONAVAR Vasant, SLUTZKI Giora: Grammatical Inference. 4th International Colloquium, ICGI-98. Ames, Iowa, USA, July 1998. Proceedings. Springer Verlag, Berlin, 1998 [HOWELL] HOWELL Peter, WEST Robert, CROSS Ian: Representing Musical Structure. Academic Press, London, 1991 [JÄRVELÄINEN] JÄRVELÄINEN Hanna: Algorithmic Musical Composition. Helsinki University of Technology, 2000 Quelle: http://www.tml.hut.fi/Studies/Tik-111.080/2000/papers/hanna/alco.pdf [JOURDAIN] JOURDAIN Robert: Das wohltemperierte Gehirn. Wie Musik im Kopf entsteht und wirkt. Spektrum Akademischer Verlag, Heidelberg, 2001 [LERDAHL] LERDAHL Fred, JACKENDOFF Ray: A Generative Theory of Tonal Music. MIT Press, Cambridge, 1983 [MAURER] MAURER John: A Brief History of Algorithmic Composition. Center for Computer Research in Music and Acoustics (CCRMA), Department of Music, Stanford University Quelle: http://ccrma-www.stanford.edu/~blackrse/algorithm.html [MCCORMACK] MCCORMACK Jon: Grammar Based Music Composition. Computer Science Department, Monash University Clayton Quelle: http://www.csse.monash.edu.au/~jonmc/resources/L-systemsMusic.pdf [PAPADOPOULOS] PAPADOPOULOS George, WIGGINS Geraint: AI Methods for Algorithmic Composition: A Survey, a Critical View and Future Prospects. School of Artificial Intelligence, Division of Informatics, University of Edinburgh Quelle: http://www.soi.city.ac.uk/~geraint/papers/AISB99b.pdf [POPE] POPE Stephen Travis: Fifteen Years of Computer-Assisted Composition. Center For New Music and Audio Technologies (CNMAT), Department of Music, University of California Berkeley Quelle: http://www.create.ucsb.edu/~stp/PostScript/SBC.95.AlgComp.pdf -44-