Dialogues
Transcription
Dialogues
Dialogues Caractéristiques des dialogues humains Formalisation des propriétés -> système automatique (actes de langage) Plan ● Historique : les pionniers, quelques exemples ● Quelques éléments fondateurs ● Quelques qpproches ● Grosz & Sidner ● Inférences de plan ● Modèle à base de frames ● Modèle BDI Historique...: les pionniers ● ELIZA (Weizenbaum, 1966) – ● Et ses descendants : – ● http://jerz.setonhill.edu/if/canon/eliza.htm PARRY(Colby, 1971), simulant la paranoïa SHRDLU (Winograd, 1972) – http://hci.stanford.edu/~winograd/shrdlu/ – Premier système “complet” : ● ● Connaissances linguistiques, sémantiques, du domaine, résolution de problème Problème : réduit à un monde de blocs Exemple de ELIZA Men are all alike. IN WHAT WAYS They're always bugging us about something or other. CAN YOU THINK OF A SPECIFIC EXAMPLE Well, my boyfriend made me come here. YOUR BOYFRIEND MADE YOU COME HERE He says's I'm depressed much of the time. I'M SORRY TO HEAR THAT YOU ARE DEPRESSED It's true. I'm unhappy. DO YOU THINK COMING HERE WILL HELP YOU NOT TO BE UNHAPPY I need some help, that much seems certain. WHAT WOULD IT MEAN TO YOU IF YOU GOT SOME HELP Perhaps I could learn to get along with my mother. TELL ME MORE ABOUT YOUR FAMILY ... WHAT ELSE COMES TO MIND WHEN YOU THINK OF YOUR FATHER Bullies DOES THAT HAVE ANYTHING TO DO WITH THE FACT THAT YOUR BOYFRIEND MADE YOU COME HERE ... Prémisses Comprendre un énoncé exige de reconnaître les intentions et croyances de la personne qui a produit cet énoncé. Donc, plus globalement: participer à un dialogue de reconnaître les intentions et croyances des personnes qui participent à ce dialogue. Tout dialogue est structuré : D ≠ e1 + e2 + e3 + ... Un dialogue n’est pas juste une séquence d’énoncés. Donc, le sens d’un dialogue comprend plus que le sens de chaque énoncé La reconnaissance de cette structure est indispensable pour l'interprétation comme pour la génération. Quelques exemples en vrac... Utilisateur : La boîte à outils est fermée. Système : (Pourquoi me dit-il cela? Je sais déjà que la boîte à outils est fermée ... Je sais que l'utilisateur a besoin d'avoir accès au contenu de la boîte à outils. Peut-être me ditil que la boîte à outils est fermée parce qu'il pense que je peux l'aider d'une manière ou d'une autre ... Pour ouvrir la boîte, il faut avoir une clef. L'utilisateur sait cela, et il sait que je le sais également. La clef est dans le classeur. Si l'utilisateur le savait, il ouvrirait simplement la boîte. Donc, c'est qu'il ne le sait pas. Je peux le lui faire savoir en disant : "La clef est dans le classeur". Mon rôle est de l'aider. Je vais donc le dire.) La clef est dans le classeur. Suite... Contexte du réceptionniste : A: Connaissez vous le numéro de téléphone de Mr. Dupont? B: Non, mais son email est [email protected] Contexte de la cafétéria : A: T’as l’heure? B: T’en fais pas, la prof est toujours en retard. Contexte d’un système d’aide : A: Mon imprimante est en panne. B: D’accord, fait enregistré. Un client qui parle à un psychiatre lacanien : Client: May I ask you three questions? Psychiatrist: Yes, but that will cost you $1000 Client: Isn't that rather expensive? Psychiatrist: Yes. What's the third question? Un peu d'anglais... U: A fire's been reported near Lexington Reservoir. Show me the area east of there. S: [displays map] U: The fires are here [pointing with mouse] S: By the way, some of the equipment from Station 3 is being used for a kitchen fire in town. U: Can you tell me what equipment is left? S: All the big trucks, the water tank trucks, and the bulldozers U: OK. Then we're in good shape. The fire isn't too big yet. S: I suggest a firebreak here. [pointing with mouse] U: Isn't the area too steep? Questions à se poser... Sur quoi repose la structure d’un discours ? Comment la déterminer ? Quelles infos sont pertinentes ? Quelles sont les relations entre les segments de cette structure? Questions de fond : Quelle est la nature de la cohérence d'un discours? Comment expliquer le rôle d'un segment du discours par rapport au discours en entier? Examinons :Tours de parole ● ● ● Qui doit prendre la parole ? Quand peut-on la prendre? Analyse de conversations : – Si A est désigné par le locuteur courant, alors il doit prendre la parole – Si le locuteur courant ne désigne personne, n'importe qui peut prendre la parole – Si personne ne prend la parole, alors le locuteur peut la reprendre Segmentation en énoncés : – Petits mots (bon, bien, alors,...) – Suite de types de mots, ou n-grams – prosodie Continuations (grounding) ● Moyens utilisés par l'auditeur (A) qu'il croit avoir compris ce que le locuteur (L) veut dire (Clark&Schaefer, 1989): – Attention maintenue : A continue de d'écouter, montrant qu'il est satisfait – Intervention suivante pertinente – Acquiescement : A opine, dit “hum-hum”, ou une approbation “super!” – Démonstration : A montre à L qu'il a compris, en paraphrasant A ou en complétant ce qu'il a dit A :Je partirai la veille au soir, le 11 L : Le 11? ● -> l'assurance de la compréhension commune (“grounding”) s'exprime de différentes façons suivant les modalités. Implicature conversationnelle ● ● L'interprétation d'un énoncé nécessite plus que le simple sens de la phrase Le locuteur attend de l'auditeur qu'il fasse certaines inférences : A : Quel jour de mai voulez-vous voyager? B : Je dois y être pour une réunion qui a lieu entre le 12 et le 15... Maximes de Grice ● ● Quantité : sois aussi informatif que nécessaire – Rend ta contribution aussi informative que possible – Ne la rend pas plus informative que nécessaire Qualité : fais en sorte que ta contribution soit – Ne contient rien que tu ne crois faux – Ne contient pas d'élément pour lesquels tu n'as aucune preuve ● Pertinence : sois pertinent ● Clarté : sois compréhensible – Évite les expressions obscures – Évite l'ambiguïté – Sois bref – Sois organisé Maximes de Grice (2) ● ● Utilisées pour interpréter des violations de ces maximes comme porteuses de sens : Exemples : – Lettre de recommendation se finissant par : “Je recommande Truc” – A voit B avec un jerrycane, qui lui demande : “où est la station service la plus proche” “à droite, à 300m” Alors qu'il sait qu'elle est ...fermée! Actes de dialogue ● Austin 62 : une intervention dans un dialogue est une sorte d'action effectuée par le locuteur – Les performatifs : “Je déclare la séance ouverte”, “Je te baptise...” – Différents types d'actes : ● ● ● Locutoires : l'énonciation d'une phrase avec un sens particulier Illocutoires : l'acte de demander, promettre, en énonçant une phrase : il fait froid (en regardant la fenêtre ouverte Perlocutoires : la production (généralement intentionelle) de certains effets sur l'interlocuteur en prononçant une phrase Taxonomie de Searle ● Searle (75) a raffiné la taxonomie des actes illocutoires : – Assertifs : obligeant le locuteur à ce que quelque chose devienne la réalité (jurer, suggérer,...) – Directifs : tentatives du locuteur d'obtenir que l'auditeur fasse quelque chose (demander, ordonner, inviterà,...) – Commissifs : obligeant le locuteur à faire quelque chose (promettre, planifier, ...) – Expressifs : exprimant l'état psychologique du locuteur par rapport à un état de fait (penser, s'excuser, accueillir,...) – Déclarations : modifier l'état du monde par un énoncé (Je renonce, tu es viré,...) Dialogue Act Markup ● DAMSL (Dialogue Act Mark up à plusieurs couches) (Allen&Core 1997; Walker et al. 1996; Carletta 1997) – Dirigé par les besoins des developpeurs de systèmes de dialogues – Contient plusieurs niveaux, incluant une fonction de regard en avant et une fonction de regard en arrière – Structure hiérarchique – Indépendant du domaine, mais fait pour les dialogues orientés par la tâche Quelques approches ● Relations rhétoriques – – – – Cohérence du discours repose sur un ensemble fini de relations rhétoriques. Par ex. purpose, enablement, circumstance, background, motivation "discourse", "rhetorical", "coherence" relations Ex: Hobbs (79,83), Lehnert (81), Reichman (81), Mann et Thompson (86), McKeown (85) parmi les premiers Mais : • choix et définition des relations? (comment sait-on qu'on les a toutes, et qu'elles sont toutes bonnes?) • diversité des intentions sous-jacentes aux discours par opposition à un ensemble fini de relations Quelques approches (suite) Grammaires Cohérence du discours repose sur un ensemble fini de règles de décomposition (grammaire; type d'information à la base des règles varie selon les modèles) ex : "story grammar", Rumelhart (1975) story setting episodes setting state-desc setting state-desc setting episodes episode episodes episode episodes episode events reactions events event-desc events event-desc events Quelques approches Grammaires (suite) ex : « argument grammar", Reichman (1984) argument claim support support authority citation support narrative support proposition Mais : choix des règles? notion de structure correcte ou incorrecte? comment choisir quelle règle appliquer? (suite) Approche de Grosz et Sidner ● Cohérence (structure) du discours repose sur un ensemble infini d'intentions et un petit ensemble de relations entre intentions "intentional relations are the root of discourse (1986) structure" “the natural segmentation of a discourse reflects intentional behavior" (1990) ● Problème subsidiaire : comment reconnaître les intentions reconnaissance de plans “Attention, Intentions and the Structure of Discourse” Grosz et Sidner (1986) Un modèle de dialogue en trois composantes interdépendantes : ● structure linguistique : segmentation du discours "linguistic structure" : discourse segments and an embedding relationship between them ● structure intentionnelle : intentions et relations "intentional structure": discourse segment purposes (DSPs) and the relationships of dominance and satisfaction-precedence ● état attentionnel : segments de discours, entités et intentions "attentional state " : an abstraction of the discourse participants' focus of attention as their discourse unfolds, containing the entities that are salient to the segment, as well as its DSPs. Discourse Structures (GS86) linguistic intentional purposes segments focus spaces - Segmentation - Focus of attention - Plans underlying discourse attentional Structure linguistique ● ● Structure hiérarchique composée d'énoncés regroupés en segments ("discourse segments"), Interaction bidirectionnelle entre la structure linguistique et les énoncés: – – la structure linguistique permet de contraindre l'interprétation des énoncés (cf. la référence). les expressions linguistiques (intonation, "cue phrases", "tense shift") peuvent communiquer des informations concernant la structure linguistique "In essence, the OCP must judge for each utterance whether it start a new segment, ends the current one (and possible some of its embedding segments), or contributes to the current one." Etat attentionnel ● ● ● Structure dynamique composée d'informations contextuelles concernant les objets, propriétés, relations et intentions qui sont les plus pertinents à un moment donné. Permet de limiter l'information contextuelle disponible pour l'interprétation et la génération d'énoncés (cf. référence) Modélisation: une pile de "focus spaces", un par segment de discours encore ouvert, contenant, chacune, – – les entités mentionnées dans le segment correspondant (« quoi? ») et une représentation du "discourse segment purpose" (« pourquoi? ») "The focusing structure is the central repository for the contextual information needed to process utterances at each point in the discourse. It distinguishes those objects, properties, and relations that are most salient at that point and, moreover, has links to relevant parts of both the linguistic and intentional structures." Structure intentionnelle ● ● Structure composée d'intentions ("discourse segment purpose", DSP), reliées entre elles par les relations de "dominance" et de "satisfaction-precedes". "Discourse segment purpose": (DSP) la raison pour laquelle les locuteurs engagent le segment de discours en question – – – ne sont pas nécessairement explicitement formulés dans un énoncé n'existent pas en nombre fini doivent être reconnus "A rather straightforward property of discourse, namely, that they (or, more accurately, those who participate in them) have an overall purpose, turns out to play a fundamental role in the theory of discourse structure. In particular, some of the purposes that underlie discourse, and their component segments, provide the means of individuating discourses and of distinguishing discourse that are coherent form those that are not". Structure intentionnelle ● (suite) Relations – – "dominance" : DSP1 domine DSP2 si DSP2 contribue une partie de la satisfaction de DSP1 "satisfaction-precedes": DSP1 "satisfaction-precedes" DSP2 si DSP1 doit être satisfaite avant DSP2 "These relations represent respectively, the fact that satisfaction of one intention contributes to the satisfaction of a second, and the fact that one intention needs to be satisfied before another. (...) Determination of discourse segment purposes depends in part on recognition of these relationships, in part on domain knowledge, and in part on other features of the discourse context." Fonctions de regard en avant et ...en arrière ● STATEMENT : une affirmation faite par un locuteur ● INFO-REQUEST : une question par le locuteur ● CHECK : questions pour confirmer une information ● OPENING : souhait ● ---------------------------------------------------------------- ● ACCEPT : une affirmation d'un locuteur ● ANSWER : répondre à une question ● UNDERSTANDING : si le locuteur comprend Exemple et interprétation : facile? ● YES-NO-QUESTION : Le petit-déjeuner est-il servi sur USAir 1557? – ● STATEMENT : Le déjeuner m'est égal – ● Inversion auxiliaire-sujet Syntaxe déclarative (pas d'inversion) COMMAND : Montrez-moi les vols de Milwaukee à Orlando dans la nuit de jeudi – Syntaxe impérative (pas de sujet syntaxique) ... pas toujours! ● ● Correspondance entre forme de surface et acte de dialogue ni toujours évidente ni univoque QUESTION / REQUEST : – ● Pouvez-vous me donner une liste des vols d'Atlanta à Boston? QUESTION / STATEMENT : – Et vous dites que vous voulez voyager la semaine prochaine? =>2 solutions : – traitement de surface : classification des actes fondée sur des indices lexicaux, prosodiques et structuraux – Compréhension “profonde” : interprétation fondée sur l'inférence Interprétation par inférence de plans ● Un locuteur peut faire une requête indirecte en mentionant ou en interrogeant sur des propriétés variées de l'activité désirée (Gordon&Lakoff, 1971; Searle, 1975) : – Pouvez-vous me donner la liste des vols d'Atlanta à Boston? ( capacité de faire une action -> action) – Pourriez-vous me mettre sur le vol de Delta (idem) – Je veux aller d'Atlanta à Boston (souhait -> action) – J'aimerais faire escale ailleurs (désir -> action) – Me diriez-vous l'heure de départ du vol American? (mentionner l'auditeur faisant l'action -> action) – Pourrais-je avoir la liste des vols quittant Boston? (le locuteur a—t-il le droit d'avoir les résultats d'une action) Chaîne d'inférence de Searle(1) ● ● ● ● ● 1) X m'a posé une question sur ma capacité à donner une liste de vols 2) Je pars du principe que X est coopératif dans la conversation et que de ce fait son énoncé fait partie d'un plan 3) X sait que j'ai la capacité de donner une telle liste, et de ce fait il n'y a pas de raison pour laquelle X pourrait avoir un intérêt théorique dans ma capacité à donner des listes 4) Donc l'énoncé de X a une portée illocutoire? Laquelle cela peut-il être? ... Chaîne d'inférence de Searle(2) ● ● ● ● 5) Une condition préparatoire pour une directive est que le locuteur a la capacité de faire l'action requise 6) Donc X m'a posé une question pour savoir si je suis prêt pour l'action de donner à X une liste de vols 7) De plus X et moi sommes dans une situation de conversation dans laquelle donner des vols est une activité attendue et commune 8) Donc, en l'absence de toute autre action plausible, X est probablement entrain de me demander de lui donner une liste de vols Dialogue par automates (“frame-based”) ● ● ● Les systèmes les plus utilisés depuis GUS (Bobrow et al. Exemple de dialogue et structures... diapos suivantes! Quelques phénomènes : changement d'initiative, prise en compte du contexte, gestion des anaphores,... Modèles BDI ● Modèles de Croyance (B), Désir (D) et Intention (I) Cohen&Perrault, 1979; Perrault&Allen, 1980; Allen, 1995) – Utlisés en génération et en compréhension – Fondés sur la formalisation des chaînes d'inférence de Searle, via les techniques de planification Bases de BDI ● Croyance : – ● Savoir – ● KNOW(S,P) ≡ P ∧ B(S,P) ¬ Savoir-Si – ● B(A,P)∧B(A,Q)->B(A,P∧Q)KNOW(S,P) ≡ P ∧ B(S,P) KNOWIF(S,P) ≡ KNOW(S,P) ∨ KNOW(S, ¬P) Volonté – W(S,P), W(S,S(ACT(H)) Axiomatisation des modèles BDI ● Schémas d'actions : – Contraintes : types des variables – Préconditions : Conditions qui doivent être remplies pour pouvoir accomplir l'action avec succès – Effets : Un ensemble partiellement ordonné d'états-buts qui doivent être atteints en accomplissant les actions – Corps : Un ensemble partiellement ordonné d'états qui doivent être atteints en accomplissant l'action Exemple de schéma d'action Réserver un vol (A,C,V) ● Contraintes : Agent(A) ^ Vol (V) ^ Client(C) ● Précondition : Know(A, date-départ(V)) ^ Know (A, heure-départ(V)) ^ Know (A, ville-départ(V)) ^ Know (A, ville-arrivée(V)) ^ A-sièges(V) ^ ... ● Effet : Vol-Réservé(A, C, V) ● Corps : Faire-Réservation (A, V, C) Définition de INFORM ● ● Grice : Un locuteur informe l'auditeur de quelque chose surtout en faisant en sorte que l'auditeur croit que le locuteur veut qu'ils le sachent INFORM(L, A, P) – Contraintes : Locuteur(L) ^ Auditeur(A) ^ Propostion(P) – Préconditions : Know (L, P) ^ W(L, INFORM(L,A,P)) – Effet : Know(A, P) – Corps : B(A, W(L, Know(A, P))) Définition de REQUEST ● REQUEST(L, Au, Act) – Contraintes : Locuteur(L) ^ Auditeur(Au) ^ Action(Act) – Préconditions : W(L,Act(H)) – Effet : W(Au, Act(Au)) – Corps : B(Au, W(L, Act(Au))) Actes de surface ● Correspondent au sens littéral des phrases ● Débutent la chaîne d'inférences de l'auditeur : Locuteur : L.REQUEST(L, Au, InformIf (Au, L, CanDo(Au, Give(Au, L, List)))) Auditeur : REQUEST (Au, L, Give(Au, L, List)) Règles d'inférence de Plans (PI) ● ● ● ● ● (Pi. AE) Règle Action-Effet : Pour tous les agents L et Au, si Y est un effet de l'action X et si Au croit que L veut que X soit fait, alors il est plausible que Au croit que L veut obtenir Y (Pi. Pa) Règle Précondition-Action : Pour tous les agents L et Au, si X est une précondition des actions Y et si Au croit que L veut obtenir X, alors il est plausible que Au croit que L veut que Y soit fait (Pi. CA) Règle Corps-Action : Pour tous les agents L et Au, si X est une partie du corps de Y et si Au croit que L veut que X soit fait, alors il est plausible que Au croit que L veut que Y soit fait (PI. KD) Règle Savoir-Désiir : Pour tous les agents L et Au, si Au croit que L veut KnowIf(P), alors Au croit que L veut KnowIf(P), alors Au croit que L veut que P soit vraie (EI. ) Règle d'Inférence Etendue : B(Au,W(L)) peut être ajouté à toute règles d'inférence de plan Exemple d'Inférence Pouvez-vous me donner une liste des vols venant d'Atlanta ? L.REQUESTS 1. (L,Au,InformIf(Au,L,CanDo(Au,Give(Au,L,List)))) 2. PI.AE : B(Au,W(L,InformIf(Au,L,CanDo(Au,Give(Au,L,List))))) 3. PI.AE/EI : B(Au,W(L,KnowIf(Au,L,CanDo(Au,Give(Au,L,List))))) 4. PI.KP/EI : B(Au,W(L,CanDo(Au,Give(Au,L,List)))) 5. PI.KP/EI : B(Au,W(L,Give(Au,L,List))) 6. PI.CA : REQUEST(Au,L,Give(Au,L,List))