Sganarelles
Transcription
Sganarelles
Göttinger philologisches Forum, Thursday the 3rd December 2015 The syntax of stage: studying linguistic patterns in Molière Elodie Benard, Francesca Frontini Labex OBVIL, Paris - ILC CNR, Pisa Respondentin : Berenike Herrmann Courant Centre “Text Structures” Göttingen Context of this work Labex OBVIL ● Molière digital edition, under the supervision of Prof. Georges Forestier Equipe ACASA - headed by Prof. Jean-Gabriel Ganascia: ● EReMoS (Extraction et Recherche de Motifs Syntaxiques) tool (http://eremos. lip6.fr/) ● Amine Boukhaled, Jean-Gabriel Ganascia Outline of the talk ● Small excursus on the study of characterization using computational / algorithmic means ● Our methodology of pattern extraction - EReMoS ● Our methodology for pattern filtering - Correspondence Analysis ● The case study on the Sganarelles ● Conclusions Characters and roles ● Successful authors provide their characters with a unique “voice” ○ ● in theater characterization is achieved by linguistic and non linguistic traits (acting) From the linguistic point of view, we can analyse the differences in the speech of various characters ○ ● phonetic, syntactic, semantic, conversational aspects Characterization interacts with role and communicative function (Biber & Conrad 2009) ○ different syntactic structures for different communicative situations (dialogues vs monologues) Goal of this talk Analyse the interaction between the different characters and dramatic role they have in plays. Case study: Molière. Focus on the Sganarelles: a specific sub group of characters that bear the same name but do not always have the exact same function. Our approach ● Multivariate analysis similar to PCA + interpretative approach ● Not predictive but exploratory statistics ● Focus on syntax ● Bottom up feature selection Multivariate analysis T1 T2 T3 T4 f1 1 2 2 3 f2 3 4 0 2 f3 0 1 0 6 Texts are represented as vectors of features f4 1 6 1 9 Distances between vectors represent distances between characters EReMoS Method for extracting patterns and counting them (generating vectors). ● tokenise, lemmatise, PoS tag (TreeTagger) the text of each character separately ● perform sequential pattern mining (Agrawal 1993, Fournier-Viger et al 2014) ○ ● extracts sequences of PoS and lexical elements (with possible gaps) describe each character with a vector of pattern frequencies For those interested we will see this more in focus in tomorrow's workshop. EReMoS extraction example ● "Je suis perdu, je suis assassiné, on m'a coupé la gorge, on m'a dérobé mon argent." (From the famous monologue of Harpagon) ● Je_je_PRO:pers suis_être_VER:infi… ● (PRO:pers) (VER:pres) (VER:infi) (PUN) f. 2 (on)(PRO:pers)(VER:pres)(VER:infi)(DET:art)(NOM) f. 2 ..... Data analysis ● ● ● Sequential pattern mining produces a large quantity of patterns even from small amounts of texts How to filter the data? Perform Correspondence Analysis (Benzécri ,1977) similar to PCA ○ ● Possible to filter for contribution, extracting patterns that contribute the most to the final plot ○ ● ● produces a bi-plot where texts and features are projected in the space contribution of each feature to the spatial disposition of the texts with respect to each other (displacement in both axes) Instance retrieval with EReMoS for significant patterns Interpretation of the data with a qualitative, hermeneutic approach Methodology used for this analysis ● ● Separate texts of each of selected characters from the rest of the plays Analyse the texts with EReMoS. Parameters: ○ ○ ○ ● ● Perform CA on resulting vectors of frequencies Filter for 10 most contributive patterns for each character ○ ● ● French Treetagger (simplified PoS tagset) Extraction of patterns of length 3-5 Basic frequency filters to remove very low frequencies patterns that are over-represented for that character Extract all instances of that pattern Analyse them - close reading (as opposed to distant reading) Characters Molière often used names to define "typologies" of characters. 7 characters named “Sganarelle” in Molière’s plays ● Sganarelle ou Le Cocu imaginaire (staged 1660/printed 1660) 1 act verse [abbr. SGAcocu] ● L’École des maris (staged 1661/printed 1661) 3 acts verse [abbr. SGAécole] ● L’Amour médecin (staged 1665/printed 1666) 3 acts prose [abbr. SGAamour] ● Le Médecin malgré lui (staged 1666/printed 1667) 3 acts prose [abbr. SGAmalgrélui] ● Le Mariage forcé (staged 1664/1668/ printed 1668) 1 act prose [abbr. SGAforcé] ● Don Juan (staged 1665/printed 1682) 5 acts prose [abbr. SGAjuan] ● Le Médecin volant (staged 1659/printed 1819) 1 act prose [abbr. SGAvol] A priori distinctions Distinctions usually made: ● Typology of character Model = SGAcocu Traditional comic servants SGAécole SGAamour SGAmalgrélui SGAforcé SGAjuan SGAvol = good bourgeois Backward views concerning: -marriage -education of women, etc. = gullible (errors of perception) = grotesque (+ cowardice, vanity) = clever enough to help his master (SGAvol). A priori distinctions ● Social status Bourgeois Men of people SGAcocu SGAécole SGAamour SGAforcé SGAjuan SGAvol Apart: SGAmalgrélui: = woodcutter → a common man (dead bottom of the bourgeoisie) A priori distinctions ● Dramatic role Main characters Deceived Deceivers (false doctors) SGAcocu SGAécole SGAamour SGAforcé SGAvol SGAmalgrélui = both deceived and deceiver Secondary character Comic confidant SGAjuan Plots Plots : prose vs poetry Analysis of the plots: general distribution CA Rank PATTERNID PATTERN NearestTo 1 Pattern_438 <0> PRO -1 <1> VER -1 <2> SENT -1 SGAforcé 2 Pattern_483 <0> NOM -1 <1> DET -1 <2> NOM -1 SGAcocu 3 Pattern_426 <0> DET -1 <1> NOM -1 <2> DET -1 SGAcocu 4 Pattern_878 <0> PRP -1 <1> PRO -1 <2> VER -1 <3> SENT -1 SGAforcé 5 Pattern_354 <0> VER -1 <1> PRP -1 <2> DET -1 <3> NOM -1 <4> VER -1 SGAcocu 6 Pattern_513 <0> VER -1 <1> DET -1 <2> NOM -1 <3> PUN -1 SGAcocu 7 Pattern_1407 <0> PRO -1 <1> PUN -1 <2> NAM -1 SGAforcé 8 Pattern_340 <0> PRO -1 <1> ADV -1 <2> ADJ -1 SGAcocu 9 Pattern_336 <0> NOM -1 <1> VER -1 <2> DET -1 <3> NOM -1 SGAcocu 10 Pattern_366 <0> PUN -1 <1> KON -1 <2> DET -1 <3> NOM -1 SGAécole Analysis of the plots: general distribution “Marked” characters: ■ SGAcocu ■ SGAécole ■ SGAforcé What hypotheses can be formulated? Analysis of the plots: general distribution ● Verse vs prose (x axis) ○ SGAécole: far on the right. ○ SGAcocu → syntax is very sensitive to genre and register variation. Examples of patterns determined by metrics: ○ SGAécole: Pattern 154 NOM-VER-PUN ■ De ces souliers mignons de rubans revêtus, Qui vous font ressembler à des pigeons pattus; (v. 33-34) ■ Appelons Isabelle, elle montre le fruit, Que l’éducation dans une âme produit, (v. 445-446) ■ Son cœur qu’avec excès votre poursuite outrage, N’a que trop de vos yeux entendu le langage; (v. 415-416) ■ Dans quel ravissement est-ce que mon cœur nage, Lorsque je vois en elle une fille si sage; (v. 503-504) Analysis of the plots: general distribution ○ SGAcocu: Pattern 483 NOM-DET-NOM ■ Nous l’avons, et je puis voir à l’aise la trogne Du malheureux pendard qui cause ma vergogne. (v. 253-254) ■ Sganarelle Voici ma foi la chose en propre original. La femme de Sganarelle, à Lélie. C’est par trop vous hâter, Monsieur, et votre mal (v. 332-333) ■ Sganarelle C’est-à-dire qu’il faut toucher au doigt la chose. Le Parent Le trop de promptitude à l’erreur nous expose. (v. 318-319) ■ Clélie La déclaration est assez ingénue. Sganarelle, à sa femme. L’on ne demandait pas carogne ta venue, (v. 565-566) Analysis of the plots: general distribution ● SGAforcé as a stock character? 5 most distinctive patterns: Pattern_438 PRO-VER-SENT Pattern_878 PREP-PRO-VER-SENT Pattern_1407 PRO-PUN-NAM Pattern_294 PRO-PRO-VER-SENT Pattern_1406 NAM-NAM-PUN ● ● short patterns (length 3) high frequency of verbs and pronouns (first and second persons) ● apostrophes ➢ features of interaction Not much text. Mostly addresses to another character. Not very complex and repetitive discourse Analysis of the plots: general distribution ● Preliminary conclusion: ○ Usual (and rough) distinctions between the Sganarelles aren’t perceptible on the plots. ○ May the plots reveal other connections or differences between these characters? That is what we will see by focusing first on patterns related to comic effects: ➢ off-centered position vs centered position idiosyncrasies comic effects due to repetitions VS no idiosyncrasies comic related to medicine based on other devices than repetitions Before entering into the details of the analysis, we would like to highlight some choices underlying our interpretation. Problems in interpreting Some biases: ● Punctuation Unlike spelling, punctuation was under stable rules in the 17th-century, though different from ours. But printers could make errors → punctuation varies from an edition to another ➢ punctuation can bring out some syntactic structures instead of others. ● Amount of text for each character ● PoS tagging errors (rare): preposition plus article (“au, aux”/”du, des”), confusion DET/PRO (case of predeterminers). Selection of patterns for interpretation ● Not all patterns relate to characterization. Only by examining the usage of these patterns (by conducting qualitative analysis) can one determine whether a pattern has anything to do with characterization. ➢ The manual inspection of instances has guided the choice of which patterns were further analysed. 1. Patterns related to comic effects ● SGAamour CONTRIB. RANK PATTERN ID PATTERN 15 Pattern_888 PRO - VER - PRO - SENT 53 Pattern_1431 INT - ADV - PUN 91 Pattern_843 PRO - PRO - VER - ADV - SENT 159 Pattern_35 VER - VER - SENT 160 Pattern_1383 PRO - VER - DET - ADV 1. Patterns related to comic effects SGAamour ○ Pattern 843: PRO-PRO-VER-ADV-SENT ■ ■ ■ ➢ ➢ Non, ne m’en parlez point. Ne m’en parlez point. Ne m’en parlez point. ○ Pattern 888: PRO-VER-PRO-SENT ■ ■ ■ ■ Que sera-ce ? Qu’est-ce ? Qu’y a-t-il ? Qu’est-ce? dialogue of the deaf these patterns = not only signs of interaction, also related to comic effects based on repetitions LISETTE LISETTE C’est un mari qu’elle veut. SGANARELLE, faisant semblant de ne pas entendre. Je l’abandonne. [...] Ah, malheur ! ah, disgrâce ! ah, pauvre Seigneur Sganarelle ! où pourrai-je te rencontrer ? LISETTE Un mari. SGANARELLE SGANARELLE Que dit-elle là ? LISETTE Ah, misérable père ! que feras-tu ? quand tu sauras cette nouvelle. Non, ne m’en parlez point. SGANARELLE LISETTE Un mari. Que sera-ce ? […] SGANARELLE LISETTE Ne m’en parlez point. Ah, Monsieur ! LISETTE SGANARELLE Un mari. Qu’est-ce ? SGANARELLE LISETTE Ne m’en parlez point. Monsieur. LISETTE SGANARELLE Un mari, un mari, un mari. (I, 3) Qu’y a-t-il ? LISETTE Votre fille. (I, 6) 1. Patterns related to comic effects ● SGAforcé CONTRIB. RANK PATTERN ID PATTERN 1 Pattern_438 PRO - VER - SENT 4 Pattern_878 PRP - PRO - VER - SENT 7 Pattern_1407 PRO - PUN - NAM 16 Pattern_294 PRO - PRO - VER - SENT 25 Pattern_1406 NAM - NAM - PUN 1. Patterns related to comic effects SGAforcé ○ ■ ■ ■ ■ ■ ■ ➢ Pattern 1407: PRO-PUN-NAM [tagging error] Je … Il a tort. Je … Cela est vrai. Je … Vous avez raison. Je… Non. Je … Eh! Je … Non, non, non, non, de par tous les diables, non. Sganarelle is unable to speak, in front of Pancrace obsessed by his argument with a colleague over Aristotle’s principles. ➢ Highly distinctive patterns are related to comic effects based on repetitions SGANARELLE SGANARELLE Eh ! mon Dieu. Je… Non. Je… […] PANCRACE Me vouloir soutenir une Proposition de la sorte ? SGANARELLE SGANARELLE Nenni. Je… Il a tort. Je… PANCRACE PANCRACE Si l’essence du Bien est mise dans l’appétibilité, ou dans la convenance ? Une Proposition condamnée par Aristote ? SGANARELLE Cela est vrai. Je… PANCRACE En termes exprès ? SGANARELLE Vous avez raison. […] Ce n’est pas cela. Je… PANCRACE Si elle a pour objet les trois opérations de l’ Esprit, ou la troisième seulement ? SGANARELLE Non. Je… PANCRACE Si le Bien se réciproque avec la fin ? SGANARELLE Eh ! non. Je… PANCRACE Si la Fin nous peut émouvoir par son Être réel, ou par son Être intentionnel ? SGANARELLE Non, non, non, non, non, de par tous les diables, non. (sc. 4) 2. Patterns related to characterization The study of characterization in Molière is to be understood in a broad sense, it implies the analysis of: ● some important features of a given character, related to his social status or his dramatic role. Ex: SGAcocu is gullible, because he is presented by Molière as a good bourgeois whose values are blamed by “mondains” (“false” values > false perceptions). Some patterns relate to characterization, as we will see through 4 examples. 2. Patterns related to characterization (Ex. 1) Example 1: SGAforcé CONTRIB. RANK PATTERN ID PATTERN 1 Pattern_438 PRO - VER - SENT 4 Pattern_878 PRP - PRO - VER - SENT 7 Pattern_1407 PRO - PUN - NAM 16 Pattern_294 PRO - PRO - VER - SENT 25 Pattern_1406 NAM - NAM - PUN 2. Patterns related to characterization (Ex. 1) Example 1 : SGAforcé ○ ■ ■ ■ ■ ■ ■ ➢ ➢ Pattern 438 PRO-VER-SENT Tout de bon, vous me le conseillez ? (sc. 1) J’ai quelque chose à vous communiquer. (sc. 4) Voilà qui est fait : je vous prie de m’écouter. (sc. 4) Laissez tout cela, et prenez la peine de m’écouter. (sc. 4) Je vous la veux expliquer aussi ; mais il faut m’écouter. (sc. 4) Ce n’est pas là me répondre. (sc. 6) object pronoun + verb referring to the act of asking sb sth not only signs of interaction, but they relate to the desperate search of Sganarelle to marry in complete safety. Another pattern supports this... 2. Patterns related to characterization (Ex. 1) Example 1: SGAforcé CONTRIB. RANK PATTERN ID PATTERN 1 Pattern_438 PRO - VER - SENT 4 Pattern_878 PRP - PRO - VER - SENT 7 Pattern_1407 PRO - PUN - NAM 16 Pattern_294 PRO - PRO - VER - SENT 25 Pattern_1406 NAM - NAM - PUN 2. Patterns related to characterization (Ex. 1) ● Pattern 1406 NAM-NAM-PUN Seigneur + proper noun → apostrophes They are addressed to : ○ Geronimo, Sganarelle’s friend ■ ○ ○ Seigneur Géronimo, je vous trouve à propos, et j’allais chez vous vous chercher (sc. 1) Pancrace and Marphurius, the 2 philosophers ■ Seigneur Docteur, ne songez plus à tout cela. (sc. 4 ) ■ Seigneur Docteur, j’aurais besoin de votre Conseil sur une petite Affaire dont il s’agit. (sc. 5) Alcantor, his future father-in-law ■ Seigneur Alcantor, j’ai demandé votre fille en mariage, il est vrai ; et vous me l’avez accordée: mais je me trouve un peu avancé en âge pour elle. (sc. 8) ■ Seigneur Alcantor, je vous suis obligé de l’honneur que vous me faites ; mais je vous déclare que je ne me veux point marier. (sc. 8) 2. Patterns related to characterization (Ex. 2) Example 2: SGAmalgrélui ● short patterns (length 3) 5 most distinctive patterns: ● high frequency of verbs and pronouns (first and second persons) Pattern 544 PRO-PRO-VER ➢ features of interaction, oral speech Pattern 540 DET-NOM-SENT Pattern 486 PRO-PRO-PRO Pattern 485 PRO-PRO-PRO-VER Pattern 397 PRO-VER-KON-PRO ● one noun-pattern as distinctive pattern ➢ longer cues ➢ talkative character In the opening scene, Sganarelle boasts that he has served a doctor for 6 years, pretending to be a “faiseur de fagots qui [sait] raisonner des choses”. 2. Patterns related to characterization (Ex. 2) Example 2: SGAmalgrélui CONTRIB. RANK PATTERN ID PATTERN 14 Pattern_544 PRO - PRO - VER 40 Pattern_540 DET - NOM - SENT 48 Pattern_486 PRO - PRO - PRO 99 Pattern_485 PRO - PRO - PRO - VER 192 Pattern_397 PRO - VER - KON - PRO 2. Patterns related to characterization (Ex. 2) Example 2: SGAmalgrélui ○ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Pattern 397 PRO-VER-KON-PRO Non, je te dis que je n’en veux rien faire, et que c’est à moi de parler et d’être le maître. (I, 1) Il suffit que nous savons ce que nous savons, et que tu fus bien heureuse de me trouver. (I, 1) Donne-leur le fouet : quand j’ai bien bu et bien mangé, je veux que tout (?) le monde soit saoul dans ma maison. (I, 1) Ma femme, vous savez que je n’ai pas l’âme endurante, et que j’ai le bras assez bon. (I, 1) Je vous assure que c’est du meilleur de mon âme que je vous parle. (II, 2) *Tous nos meilleurs auteurs vous diront que c’est l’empêchement de l’action de sa langue. (II, 4) *Pour revenir donc à notre raisonnement, je tiens que cet (?) empêchement de l’action de sa langue est causé par de certaines humeurs (II, 4) [I]l arrive que ces vapeurs... Ossabandus, nequeys, nequer, potarinum, quipsa milus. (II, 4) Ce que je crois, qu’il faille faire ? (II, 4) Monsieur, voilà une nourrice à laquelle il faut que je fasse quelques petits remèdes. (II, 4) Tenez, voilà un morceau de formage qu’il faut que vous lui fassiez prendre. (III, 2) ➢ ➢ verb expressing certainty and confidence + that-clause Husband’s authority over his wife Doctor’s authority over his patients 2. Patterns related to characterization (Ex. 3) Example 3: SGAjuan 5 most distinctive patterns: ● Pattern 1327 VER-VER-PRO Pattern 1312 NOM-KON-PRP Pattern 1328 KON-PRO-PRO-VER-VER Pattern 1178 ADV-VER-PRO-ADV Pattern 1137 VER-PRO-NOM-PRP ➢ ● ● ● ➢ ➢ high frequency of verbs and pronouns (first and second persons) features of interaction, oral speech longer patterns (length 5) noun-patterns as distinctive conjunctions longer cues talkative character 2. Patterns related to characterization (Ex. 3) Example 3: SGAjuan CONTRIB. RANK PATTERN ID PATTERN 20 Pattern_1327 VER - VER - PRO 24 Pattern_1312 NOM - KON - PRP 41 Pattern_1328 KON - PRO - PRO - VER - VER 58 Pattern_1178 ADV - VER - PRO - ADV 72 Pattern_1137 VER - PRO - NOM - PRP 2. Patterns related to characterization (Ex. 3) Example 3: SGAjuan ○ ■ ■ ■ ■ Pattern 1312 NOM-KON-PRP [T]ant il est vrai que le tabac inspire des sentiments d’honneur et de vertu [I]l me vaudrait bien mieux d’être au diable que d’être à lui [C]’est une méchante raillerie que de se railler du Ciel [C]ette grâce n’éteint pas peut-être le ressentiment des parents et des amis ○ Pattern 1328 KON-PRO-PRO-VER-VER ■ [J]e t’ai fait cette confidence avec franchise, et cela m’est sorti un peu bien vite de la bouche ■ Il y avait six jours entiers qu’il ne pouvait mourir, et cela le fit mourir tout d’un coup ■ Et voilà ce que je ne puis souffrir, car il n’y a rien de plus vrai que le Moine bourru, et je me ferais pendre pour celui-là ➢ ➢ chiefly coordinating conjunctions Sganarelle’s discourse is not logically articulated (as is Don Juan’s), it has a rambling structure as if thoughts were expressed as they occur. 2. Patterns related to characterization (Ex. 3) ● SGAjuan CONTRIB. RANK PATTERN ID PATTERN 20 Pattern_1327 VER - VER - PRO 24 Pattern_1312 NOM - KON - PRP 41 Pattern_1328 KON - PRO - PRO - VER - VER 58 Pattern_1178 ADV - VER - PRO - ADV 72 Pattern_1137 VER - PRO - NOM - PRP 2. Patterns related to characterization (Ex. 3) Example 3: SGAjuan ○ ■ Pattern 1178: ADV-VER-PRO-ADV ■ Osez-vous bien ainsi vous jouer au Ciel, et ne tremblez-vous point de vous moquer comme vous faites des choses les plus saintes ? Ne croyez-vous point l’autre vie ? Vous voilà vous, par exemple, vous êtes là : est-ce que vous vous êtes fait tout seul, et n’ a-t-il pas fallu que votre père ait engrossé votre mère pour vous faire ? Cela n’est-il pas merveilleux que me voilà ici, et que j’aie quelque chose dans la tête qui pense cent choses différentes en un moment, et fait de mon corps tout ce qu’elle veut ? Ne sais-je pas bien que je vous dois ? ➢ ➢ adverb + inverted subject-verb order: negative rhetorical questions Sganarelle’s “reasoning” to convince his master to quit his evil ways ■ ■ ■ 2. Patterns related to characterization (Ex. 4) Example 4: SGAcocu 5 most distinctive patterns: Pattern 340 PRO-ADV-ADJ Pattern 354 VER-PRP-DET-NOM Pattern 426 DET-NOM-DET Pattern 483 NOM-DET-NOM Pattern 513 VER-DET-NOM-PUN ● ➢ high frequency of noun-patterns more “written” and less interactive style associated with verse 2. Patterns related to characterization (Ex. 4) Example 4: SGAcocu CONTRIB. RANK PATTERN ID PATTERN 2 Pattern_483 NOM - DET - NOM 3 Pattern_426 DET - NOM - DET 5 Pattern_354 VER - PRP - DET - NOM - VER 6 Pattern_513 VER - DET - NOM - PUN 8 Pattern_340 PRO - ADV - ADJ 2. Patterns related to characterisation (Ex. 4) Example 4: SGAcocu ○ Pattern 354: VER-PRP-DET-NOM-VER ■ ■ ■ À d’autres je vous prie, La chose est avérée, et je tiens dans mes mains, Un (?) bon certificat du mal dont je me plains. Ce Damoiseau, parlant par révérence Me fait cocu Madame, avec toute licence ; Et j'ai su par mes yeux avérer aujourd’hui Le commerce secret de ma femme et de lui. Sans doute, et je l’avais de ses mains arraché, Et n’eusse pas sans lui découvert son péché. ➢ Adverbial phrases referring to a body part ➢ Means used by Sganarelle as a proof that his reasoning is correct, that he has followed the right course. ➢ Credulity Conclusion ● The distribution of the plot seems motivated by the opposition between ○ comic based on repetitions (off-centered position: SGAforcé and SGAamour) VS ○ comic associated with the false doctors, not based on repetitions (centered position: SGAvol and SGAmalgrélui) ● Patterns analysis associated with semantic analysis (from instances) confirm aspects of the characterization Future works ● Other experiments (main protagonists # Sganarelles). ● More generally, test other EReMoS configurations to extract lexico-semantic patterns ○ find ways to combine lexical and syntactic analysis Thanks We thank Berenike Herrmann and the Courant Centre Text Structures for inviting us here. We would also like to thank the members of the equipe ACASA, and in particular Mohamed Amine Boukhaled who is the developer of EReMoS and Suzanne Mpouli for their comments and suggestions!