Dialogues

Transcription

Dialogues
Dialogues
Caractéristiques des dialogues humains
Formalisation des propriétés -> système
automatique (actes de langage)
Plan
●
Historique : les pionniers, quelques exemples
●
Quelques éléments fondateurs
●
Quelques qpproches
●
Grosz & Sidner
●
Inférences de plan
●
Modèle à base de frames
●
Modèle BDI
Historique...: les pionniers
●
ELIZA (Weizenbaum, 1966)
–
●
Et ses descendants :
–
●
http://jerz.setonhill.edu/if/canon/eliza.htm
PARRY(Colby, 1971), simulant la paranoïa
SHRDLU (Winograd, 1972)
–
http://hci.stanford.edu/~winograd/shrdlu/
–
Premier système “complet” :
●
●
Connaissances linguistiques, sémantiques, du domaine,
résolution de problème
Problème : réduit à un monde de blocs
Exemple de ELIZA
Men are all alike.
IN WHAT WAYS
They're always bugging us about something or other.
CAN YOU THINK OF A SPECIFIC EXAMPLE
Well, my boyfriend made me come here.
YOUR BOYFRIEND MADE YOU COME HERE
He says's I'm depressed much of the time.
I'M SORRY TO HEAR THAT YOU ARE DEPRESSED
It's true. I'm unhappy.
DO YOU THINK COMING HERE WILL HELP YOU NOT TO BE UNHAPPY
I need some help, that much seems certain.
WHAT WOULD IT MEAN TO YOU IF YOU GOT SOME HELP
Perhaps I could learn to get along with my mother.
TELL ME MORE ABOUT YOUR FAMILY
...
WHAT ELSE COMES TO MIND WHEN YOU THINK OF YOUR FATHER
Bullies
DOES THAT HAVE ANYTHING TO DO WITH THE FACT THAT YOUR
BOYFRIEND MADE YOU COME HERE
...
Prémisses
Comprendre un énoncé exige de reconnaître les intentions et croyances
de la personne qui a produit cet énoncé.
Donc, plus globalement: participer à un dialogue de reconnaître les intentions et
croyances des personnes qui participent à ce dialogue.
Tout dialogue est structuré : D ≠ e1 + e2 + e3 + ...
Un dialogue n’est pas juste une séquence d’énoncés.
Donc, le sens d’un dialogue comprend plus que le sens de chaque énoncé
La reconnaissance de cette structure est indispensable pour
l'interprétation comme pour la génération.
Quelques exemples en vrac...
Utilisateur : La boîte à outils est fermée.
Système :
(Pourquoi me dit-il cela? Je sais déjà que la boîte à outils est fermée ...
Je sais que l'utilisateur a besoin d'avoir accès au contenu de la boîte à outils. Peut-être me ditil que la boîte à outils est fermée parce qu'il pense que je peux l'aider d'une manière ou d'une
autre ...
Pour ouvrir la boîte, il faut avoir une clef. L'utilisateur sait cela, et il sait que je le sais
également. La clef est dans le classeur. Si l'utilisateur le savait, il ouvrirait simplement la
boîte. Donc, c'est qu'il ne le sait pas.
Je peux le lui faire savoir en disant : "La clef est dans le classeur". Mon rôle est de l'aider. Je
vais donc le dire.)
La clef est dans le classeur.
Suite...
Contexte du réceptionniste :
A:
Connaissez vous le numéro de téléphone de Mr. Dupont?
B:
Non, mais son email est [email protected]
Contexte de la cafétéria :
A:
T’as l’heure?
B:
T’en fais pas, la prof est toujours en retard.
Contexte d’un système d’aide :
A:
Mon imprimante est en panne.
B:
D’accord, fait enregistré.
Un client qui parle à un psychiatre lacanien :
Client:
May I ask you three questions?
Psychiatrist: Yes, but that will cost you $1000
Client:
Isn't that rather expensive?
Psychiatrist: Yes. What's the third question?
Un peu d'anglais...
U:
A fire's been reported near Lexington Reservoir. Show me
the area east of there.
S:
[displays map]
U:
The fires are here [pointing with mouse]
S:
By the way, some of the equipment from Station 3 is
being used for a kitchen fire in town.
U:
Can you tell me what equipment is left?
S:
All the big trucks, the water tank trucks, and the
bulldozers
U:
OK. Then we're in good shape. The fire isn't too big yet.
S:
I suggest a firebreak here. [pointing with mouse]
U:
Isn't the area too steep?
Questions à se poser...
Sur quoi repose la structure d’un discours ?
Comment la déterminer ?
Quelles infos sont pertinentes ?
Quelles sont les relations entre les segments de cette
structure?
Questions de fond :
Quelle est la nature de la cohérence d'un discours?
Comment expliquer le rôle d'un segment du discours par
rapport au discours en entier?
Examinons :Tours de parole
●
●
●
Qui doit prendre la parole ? Quand peut-on la
prendre?
Analyse de conversations :
–
Si A est désigné par le locuteur courant, alors il doit
prendre la parole
–
Si le locuteur courant ne désigne personne, n'importe
qui peut prendre la parole
–
Si personne ne prend la parole, alors le locuteur peut
la reprendre
Segmentation en énoncés :
–
Petits mots (bon, bien, alors,...)
–
Suite de types de mots, ou n-grams
–
prosodie
Continuations (grounding)
●
Moyens utilisés par l'auditeur (A) qu'il croit avoir
compris ce que le locuteur (L) veut dire
(Clark&Schaefer, 1989):
–
Attention maintenue : A continue de d'écouter, montrant
qu'il est satisfait
–
Intervention suivante pertinente
–
Acquiescement : A opine, dit “hum-hum”, ou une
approbation “super!”
–
Démonstration : A montre à L qu'il a compris, en
paraphrasant A ou en complétant ce qu'il a dit
A :Je partirai la veille au soir, le 11
L : Le 11?
●
-> l'assurance de la compréhension commune (“grounding”)
s'exprime de différentes façons suivant les modalités.
Implicature conversationnelle
●
●
L'interprétation d'un énoncé nécessite plus
que le simple sens de la phrase
Le locuteur attend de l'auditeur qu'il fasse
certaines inférences :
A : Quel jour de mai voulez-vous voyager?
B : Je dois y être pour une réunion qui a lieu entre le 12 et le
15...
Maximes de Grice
●
●
Quantité : sois aussi informatif que nécessaire
–
Rend ta contribution aussi informative que possible
–
Ne la rend pas plus informative que nécessaire
Qualité : fais en sorte que ta contribution soit
–
Ne contient rien que tu ne crois faux
–
Ne contient pas d'élément pour lesquels tu n'as aucune preuve
●
Pertinence : sois pertinent
●
Clarté : sois compréhensible
–
Évite les expressions obscures
–
Évite l'ambiguïté
–
Sois bref
–
Sois organisé
Maximes de Grice (2)
●
●
Utilisées pour interpréter des violations de ces
maximes comme porteuses de sens :
Exemples :
–
Lettre de recommendation se finissant par :
“Je recommande Truc”
–
A voit B avec un jerrycane, qui lui demande :
“où est la station service la plus proche”
“à droite, à 300m”
Alors qu'il sait qu'elle est ...fermée!
Actes de dialogue
●
Austin 62 : une intervention dans un dialogue est
une sorte d'action effectuée par le locuteur
–
Les performatifs :
“Je déclare la séance ouverte”, “Je te baptise...”
–
Différents types d'actes :
●
●
●
Locutoires : l'énonciation d'une phrase avec un sens
particulier
Illocutoires : l'acte de demander, promettre, en énonçant une
phrase : il fait froid (en regardant la fenêtre ouverte
Perlocutoires : la production (généralement intentionelle) de
certains effets sur l'interlocuteur en prononçant une phrase
Taxonomie de Searle
●
Searle (75) a raffiné la taxonomie des actes
illocutoires :
–
Assertifs : obligeant le locuteur à ce que quelque chose
devienne la réalité (jurer, suggérer,...)
–
Directifs : tentatives du locuteur d'obtenir que l'auditeur
fasse quelque chose (demander, ordonner, inviterà,...)
–
Commissifs : obligeant le locuteur à faire quelque chose
(promettre, planifier, ...)
–
Expressifs : exprimant l'état psychologique du locuteur par
rapport à un état de fait (penser, s'excuser, accueillir,...)
–
Déclarations : modifier l'état du monde par un énoncé (Je
renonce, tu es viré,...)
Dialogue Act Markup
●
DAMSL (Dialogue Act Mark up à plusieurs couches)
(Allen&Core 1997; Walker et al. 1996; Carletta
1997)
–
Dirigé par les besoins des developpeurs de systèmes de
dialogues
–
Contient plusieurs niveaux, incluant une fonction de regard
en avant et une fonction de regard en arrière
–
Structure hiérarchique
–
Indépendant du domaine, mais fait pour les dialogues
orientés par la tâche
Quelques approches
●
Relations rhétoriques
–
–
–
–
Cohérence du discours repose sur un ensemble fini de
relations rhétoriques. Par ex. purpose, enablement,
circumstance, background, motivation
"discourse", "rhetorical", "coherence" relations
Ex: Hobbs (79,83), Lehnert (81), Reichman (81), Mann
et Thompson (86), McKeown (85) parmi les premiers
Mais :
• choix et définition des relations? (comment sait-on qu'on les a
toutes, et qu'elles sont toutes bonnes?)
• diversité des intentions sous-jacentes aux discours par opposition
à un ensemble fini de relations
Quelques approches
(suite)
Grammaires
Cohérence du discours repose sur un ensemble fini de règles de
décomposition (grammaire; type d'information à la base des règles
varie selon les modèles)
ex : "story grammar", Rumelhart (1975)
story
 setting
episodes
setting  state-desc
setting  state-desc
setting
episodes  episode
episodes  episode episodes
episode  events reactions
events  event-desc
events  event-desc events
Quelques approches
Grammaires (suite)
ex : « argument grammar", Reichman (1984)
argument
 claim support
support
 authority citation
support
 narrative
support
 proposition
Mais :
choix des règles?
notion de structure correcte ou incorrecte?
comment choisir quelle règle appliquer?
(suite)
Approche de Grosz et Sidner
●
Cohérence (structure) du discours repose sur un ensemble
infini d'intentions et un petit ensemble de relations entre
intentions
"intentional relations are the root of discourse
(1986)
structure"
“the natural segmentation of a discourse
reflects intentional behavior" (1990)
●
Problème subsidiaire : comment reconnaître les intentions
 reconnaissance de plans
“Attention, Intentions and the
Structure of Discourse”
Grosz et Sidner (1986)
Un modèle de dialogue en trois composantes
interdépendantes :
●
structure linguistique : segmentation du discours
"linguistic structure" : discourse segments and an embedding relationship
between them
●
structure intentionnelle : intentions et relations "intentional
structure": discourse segment purposes (DSPs) and the relationships of
dominance and satisfaction-precedence
●
état attentionnel : segments de discours, entités et
intentions
"attentional state " : an abstraction of the discourse participants' focus of
attention as their discourse unfolds, containing the entities that are salient to the
segment, as well as its DSPs.
Discourse Structures (GS86)
linguistic
intentional
purposes
segments
focus spaces
- Segmentation
- Focus of attention
- Plans underlying discourse
attentional
Structure linguistique
●
●
Structure hiérarchique composée d'énoncés regroupés en
segments ("discourse segments"),
Interaction bidirectionnelle entre la structure linguistique
et les énoncés:
–
–
la structure linguistique permet de contraindre l'interprétation
des énoncés (cf. la référence).
les expressions linguistiques (intonation, "cue phrases", "tense
shift") peuvent communiquer des informations concernant la
structure linguistique
"In essence, the OCP must judge for each utterance whether it start
a new segment, ends the current one (and possible some of its
embedding segments), or contributes to the current one."
Etat attentionnel
●
●
●
Structure dynamique composée d'informations contextuelles
concernant les objets, propriétés, relations et intentions qui sont les
plus pertinents à un moment donné.
Permet de limiter l'information contextuelle disponible pour
l'interprétation et la génération d'énoncés (cf. référence)
Modélisation: une pile de "focus spaces", un par segment de
discours encore ouvert, contenant, chacune,
–
–
les entités mentionnées dans le segment correspondant (« quoi? »)
et une représentation du "discourse segment purpose" (« pourquoi? »)
"The focusing structure is the central repository for the contextual
information needed to process utterances at each point in the discourse.
It distinguishes those objects, properties, and relations that are most
salient at that point and, moreover, has links to relevant parts of both the
linguistic and intentional structures."
Structure intentionnelle
●
●
Structure composée d'intentions ("discourse segment purpose",
DSP), reliées entre elles par les relations de "dominance" et de
"satisfaction-precedes".
"Discourse segment purpose": (DSP) la raison pour laquelle les
locuteurs engagent le segment de discours en question
–
–
–
ne sont pas nécessairement explicitement formulés dans un énoncé
n'existent pas en nombre fini
doivent être reconnus
"A rather straightforward property of discourse, namely, that they (or, more
accurately, those who participate in them) have an overall purpose, turns
out to play a fundamental role in the theory of discourse structure. In
particular, some of the purposes that underlie discourse, and their
component segments, provide the means of individuating discourses and of
distinguishing discourse that are coherent form those that are not".
Structure intentionnelle
●
(suite)
Relations
–
–
"dominance" : DSP1 domine DSP2 si DSP2 contribue une
partie de la satisfaction de DSP1
"satisfaction-precedes": DSP1 "satisfaction-precedes" DSP2
si DSP1 doit être satisfaite avant DSP2
"These relations represent respectively, the fact that satisfaction
of one intention contributes to the satisfaction of a second, and the
fact that one intention needs to be satisfied before another. (...)
Determination of discourse segment purposes depends in part on
recognition of these relationships, in part on domain knowledge,
and in part on other features of the discourse context."
Fonctions de regard en avant
et ...en arrière
●
STATEMENT : une affirmation faite par un locuteur
●
INFO-REQUEST : une question par le locuteur
●
CHECK : questions pour confirmer une information
●
OPENING : souhait
●
----------------------------------------------------------------
●
ACCEPT : une affirmation d'un locuteur
●
ANSWER : répondre à une question
●
UNDERSTANDING : si le locuteur comprend
Exemple et interprétation :
facile?
●
YES-NO-QUESTION : Le petit-déjeuner est-il servi
sur USAir 1557?
–
●
STATEMENT : Le déjeuner m'est égal
–
●
Inversion auxiliaire-sujet
Syntaxe déclarative (pas d'inversion)
COMMAND : Montrez-moi les vols de Milwaukee à
Orlando dans la nuit de jeudi
–
Syntaxe impérative (pas de sujet syntaxique)
... pas toujours!
●
●
Correspondance entre forme de surface et acte de
dialogue ni toujours évidente ni univoque
QUESTION / REQUEST :
–
●
Pouvez-vous me donner une liste des vols d'Atlanta à
Boston?
QUESTION / STATEMENT :
–
Et vous dites que vous voulez voyager la semaine
prochaine?
=>2 solutions :
–
traitement de surface : classification des actes fondée sur
des indices lexicaux, prosodiques et structuraux
–
Compréhension “profonde” : interprétation fondée sur
l'inférence
Interprétation par inférence de plans
●
Un locuteur peut faire une requête indirecte en
mentionant ou en interrogeant sur des propriétés
variées de l'activité désirée (Gordon&Lakoff, 1971;
Searle, 1975) :
–
Pouvez-vous me donner la liste des vols d'Atlanta à Boston? ( capacité de
faire une action -> action)
–
Pourriez-vous me mettre sur le vol de Delta (idem)
–
Je veux aller d'Atlanta à Boston (souhait -> action)
–
J'aimerais faire escale ailleurs (désir -> action)
–
Me diriez-vous l'heure de départ du vol American? (mentionner l'auditeur
faisant l'action -> action)
–
Pourrais-je avoir la liste des vols quittant Boston? (le locuteur a—t-il le
droit d'avoir les résultats d'une action)
Chaîne d'inférence de
Searle(1)
●
●
●
●
●
1) X m'a posé une question sur ma capacité à
donner une liste de vols
2) Je pars du principe que X est coopératif dans la
conversation et que de ce fait son énoncé fait partie
d'un plan
3) X sait que j'ai la capacité de donner une telle
liste, et de ce fait il n'y a pas de raison pour laquelle
X pourrait avoir un intérêt théorique dans ma
capacité à donner des listes
4) Donc l'énoncé de X a une portée illocutoire?
Laquelle cela peut-il être?
...
Chaîne d'inférence de
Searle(2)
●
●
●
●
5) Une condition préparatoire pour une directive est
que le locuteur a la capacité de faire l'action requise
6) Donc X m'a posé une question pour savoir si je
suis prêt pour l'action de donner à X une liste de
vols
7) De plus X et moi sommes dans une situation de
conversation dans laquelle donner des vols est une
activité attendue et commune
8) Donc, en l'absence de toute autre action
plausible, X est probablement entrain de me
demander de lui donner une liste de vols
Dialogue par automates
(“frame-based”)
●
●
●
Les systèmes les plus utilisés depuis GUS (Bobrow
et al.
Exemple de dialogue et structures... diapos
suivantes!
Quelques phénomènes : changement d'initiative,
prise en compte du contexte, gestion des
anaphores,...
Modèles BDI
●
Modèles de Croyance (B), Désir (D) et Intention (I)
Cohen&Perrault, 1979; Perrault&Allen, 1980; Allen, 1995)
–
Utlisés en génération et en compréhension
–
Fondés sur la formalisation des chaînes d'inférence de
Searle, via les techniques de planification
Bases de BDI
●
Croyance :
–
●
Savoir
–
●
KNOW(S,P) ≡ P ∧ B(S,P)
¬
Savoir-Si
–
●
B(A,P)∧B(A,Q)->B(A,P∧Q)KNOW(S,P) ≡ P ∧ B(S,P)
KNOWIF(S,P) ≡ KNOW(S,P) ∨ KNOW(S, ¬P)
Volonté
–
W(S,P), W(S,S(ACT(H))
Axiomatisation des modèles
BDI
●
Schémas d'actions :
–
Contraintes : types des variables
–
Préconditions : Conditions qui doivent être remplies pour
pouvoir accomplir l'action avec succès
–
Effets : Un ensemble partiellement ordonné d'états-buts
qui doivent être atteints en accomplissant les actions
–
Corps : Un ensemble partiellement ordonné d'états qui
doivent être atteints en accomplissant l'action
Exemple de schéma d'action
Réserver un vol (A,C,V)
●
Contraintes : Agent(A) ^ Vol (V) ^ Client(C)
●
Précondition : Know(A, date-départ(V)) ^ Know (A, heure-départ(V))
^ Know (A, ville-départ(V)) ^ Know (A, ville-arrivée(V)) ^ A-sièges(V) ^ ...
●
Effet : Vol-Réservé(A, C, V)
●
Corps : Faire-Réservation (A, V, C)
Définition de INFORM
●
●
Grice : Un locuteur informe l'auditeur de quelque
chose surtout en faisant en sorte que l'auditeur croit
que le locuteur veut qu'ils le sachent
INFORM(L, A, P)
–
Contraintes : Locuteur(L) ^ Auditeur(A) ^ Propostion(P)
–
Préconditions : Know (L, P) ^ W(L, INFORM(L,A,P))
–
Effet : Know(A, P)
–
Corps : B(A, W(L, Know(A, P)))
Définition de REQUEST
●
REQUEST(L, Au, Act)
–
Contraintes : Locuteur(L) ^ Auditeur(Au) ^
Action(Act)
–
Préconditions : W(L,Act(H))
–
Effet : W(Au, Act(Au))
–
Corps : B(Au, W(L, Act(Au)))
Actes de surface
●
Correspondent au sens littéral des phrases
●
Débutent la chaîne d'inférences de l'auditeur :
Locuteur :
L.REQUEST(L, Au, InformIf (Au, L, CanDo(Au, Give(Au,
L, List))))
Auditeur :
REQUEST (Au, L, Give(Au, L, List))
Règles d'inférence de Plans
(PI)
●
●
●
●
●
(Pi. AE) Règle Action-Effet : Pour tous les agents L et Au, si Y est
un effet de l'action X et si Au croit que L veut que X soit fait, alors
il est plausible que Au croit que L veut obtenir Y
(Pi. Pa) Règle Précondition-Action : Pour tous les agents L et Au,
si X est une précondition des actions Y et si Au croit que L veut
obtenir X, alors il est plausible que Au croit que L veut que Y soit
fait
(Pi. CA) Règle Corps-Action : Pour tous les agents L et Au, si X est
une partie du corps de Y et si Au croit que L veut que X soit fait,
alors il est plausible que Au croit que L veut que Y soit fait
(PI. KD) Règle Savoir-Désiir : Pour tous les agents L et Au, si Au
croit que L veut KnowIf(P), alors Au croit que L veut KnowIf(P),
alors Au croit que L veut que P soit vraie
(EI. ) Règle d'Inférence Etendue : B(Au,W(L)) peut être ajouté à
toute règles d'inférence de plan
Exemple d'Inférence
Pouvez-vous me donner une liste des vols venant d'Atlanta ?
L.REQUESTS
1. (L,Au,InformIf(Au,L,CanDo(Au,Give(Au,L,List))))
2. PI.AE :
B(Au,W(L,InformIf(Au,L,CanDo(Au,Give(Au,L,List)))))
3. PI.AE/EI :
B(Au,W(L,KnowIf(Au,L,CanDo(Au,Give(Au,L,List)))))
4. PI.KP/EI :
B(Au,W(L,CanDo(Au,Give(Au,L,List))))
5. PI.KP/EI :
B(Au,W(L,Give(Au,L,List)))
6. PI.CA :
REQUEST(Au,L,Give(Au,L,List))