FTAG et construction sémantique
Transcription
FTAG et construction sémantique
FTAG et construction sémantique Claire Gardent CNRS, Nancy Collaboration avec Laura Kallmeyer, Paris 7 ARC INRIA “Generation et Inférence” January 29, 2003 Plan de l’exposé Construction sémantique : Montague, Grammaires informatiques et TAG Langages pour la représentation sémantique Feature based Tree Adjoining Grammar (FTAG) Interface syntaxe/sémantique et construction sémantique Données linguistiques Comparaison avec les approches existantes FTAG et construction sémantique, Calligramme, 23 janvier 2003 Construction sémantique (Montague) Construction parallèle d’un arbre syntaxique (arbre dérivé) et d’une représentation sémantique Langage de représentation sémantique : lambda calcul d’ordre supérieur Composition par béta réduction FTAG et construction sémantique, Calligramme, 23 janvier 2003 Grammaires informatiques à grande couverture HPSG English Resource Grammar : Copestake, Flickinger, Malouf (45 000 lignes de codes, 5000 mots, Testsuite de 1350 phrases, Verbmobil) LFG Parallel Grammars : Butt, King, Nino, Segond Grammaire pour l’anglais; 315 règles, 9 652 verbes, Wall street journal Plus petit : CCG (Clark, Hockenmaier, Steedman), UCG (Calder, Klein, Reape) FTAG et construction sémantique, Calligramme, 23 janvier 2003 Traitement sémantique dans les grammaires informatiques Ressemblances avec l’approche Montagovienne Construction parallèle d’un arbre syntaxique (arbre dérivé) et d’une représentation sémantique Différences avec l’approche Montagovienne (motivées par (i) l’utilisation massive de l’unification pour composer les signes linguistiques entre eux et (ii) la simplicité d’écriture). Langage de représentation sémantique : Structures de traits Composition par unification FTAG et construction sémantique, Calligramme, 23 janvier 2003 Construction sémantique dans les TAGs Basée sur l’arbre de dérivation L’arbre de dérivation refléte les dépéndences sémantiques L’adjonction est structurellement non monotone et complique la mise en application des idées utilisées dans les grammaires basées sur l’unification Exposé: Construction sémantique à la Montague (i.e., basée sur l’arbre dérivé) dans les FTAGs FTAG et construction sémantique, Calligramme, 23 janvier 2003 Langages pour la représentation sémantique Montague: Higher-Order typed Lambda calculus Grammaires (HPSG, LFG) informatiques: Termes et structures plates Termes: l’utilisation de termes contenant des variables d’unification permet de simuler la beta reduction Structures plates: permettent la sous-spécification sémantique (Une phrase de 30 mots contenant 8 opérateurs de portée a 576 interprétations) FTAG et construction sémantique, Calligramme, 23 janvier 2003 Sémantiques plates: Plugs and Holes (Johan Bos) Une formule logique sous spécifiée bien formée : – a une étiquette ( ) – peut contenir outre les symboles de la logique décrite : des étiquettes, ) des “trous” ( ) et des contraintes de portée ( – forme un graphe acyclique avec une racine unique Les solutions d’une formule sous-spécifiée (admissible pluggings) sont des injections de l’ensemble des trous vers l’ensemble des étiquettes qui respectent les contraintes imposées par cette formule FTAG et construction sémantique, Calligramme, 23 janvier 2003 Exemple “Tous les chats chassent un rat” Représentation sous-spécifiée Admissible pluggings Représentations finales FTAG et construction sémantique, Calligramme, 23 janvier 2003 Sémantique plate basée sur l’unification Formules sous spécifiées unifiantes (contenant des variables d’unification) Formules sous spécifiées saturées (exemptes de variables d’unification) FTAG et construction sémantique, Calligramme, 23 janvier 2003 Notational conventions " " " # ! ! Constantes sur les étiquettes " " " $ $ Variables d’unification sur les étiquettes " " " # ' & # % Constantes sur les individus " " " ( ( Variables d’unification sur les individus " " " * # ) # ( Variables sur les individus FTAG et construction sémantique, Calligramme, 23 janvier 2003 FTAG Une grammaire FTAG est un ensemble d’arbres élémentaires (initiaux ou auxiliaires) et deux opérations qui permettent de combiner ces arbres entre eux : l’adjonction et la substitution. Les noeuds des arbres sont décorés avec deux structures de traits (top et bottom) La substitution est une forme particulière d’adjonction L’adjonction est l’insertion d’un arbre auxiliaire dans un arbre dérivé FTAG et construction sémantique, Calligramme, 23 janvier 2003 Adjonction en FTAG 2 X X . + X . - . - . - . . 01/ - , .. -- - . . . + X X 4 2 . - 3 . - . - . - . - . - / , 4 .. -- . - FTAG et construction sémantique, Calligramme, 23 janvier 2003 FTAG et Construction sémantique 5 Chaque arbre élémentaire est associée avec une formule son sens représentant 5 Les noeuds des arbres élémentaires sont décorés par des variables d’unification apparaissant dans Le sens associé à un arbre dérivé est l’union des sens associés avec les arbres élémentaires composant cet arbre compte tenu des unifications faites pendant la dérivation FTAG et construction sémantique, Calligramme, 23 janvier 2003 Exemple : “John loves Mary” S NP 1 7 6 VP loves L :love(X,Y) < name(J,john) NP ; John NP 9 : 6 V 8 NP Mary name(M,mary) L :love(J,M),name(J,john),name(M,mary) FTAG et construction sémantique, Calligramme, 23 janvier 2003 Quantification S A @?> B 0 = D ?> C> = N A A C> = = V N Det VP N N D D barks every E GF< H L P J I K NML OL D A D P ( ! ( J I ! ( Y# Y ! ! E FD VW X Z[ ^ P A Q A M A ] O J I U RST FA E dog \ FTAG et construction sémantique, Calligramme, 23 janvier 2003 Intersective adjectives = A @?> = ?> D _ 0 0 D A C> = = = @?> D D ?> _ dog black every N N Adj N D N N > A D d> ?> =b a`< C e c A = n lm `D C e c =k ghij ? D ` _ ? d e c A A f ( Z[ ! ( ^ ] ! $ Y Y# ! ( \ FTAG et construction sémantique, Calligramme, 23 janvier 2003 VP modifiers “Pat alledgedly usually drives a Cadillac” Y # Y % ! ( pq o ! ! Y ( ! Y ! ( ! ! Y Y r ! ! S C VP C NP VP A _ VP VP 0 ADV C drives a c. s ? _ VP 0 ADV alledgedly D OL D E L L s J I t F < E ? P L J I u FD E P A L P O I Fx _ E usually J L L Q P wKI v A D FA E E O O M A _ Q _ P O I y Fs E O M s _ Q FTAG et construction sémantique, Calligramme, 23 janvier 2003 Control verbs “John tries to meet Mary” NP VP PRO VP S V NP meet Mary 0 V John A D C> S = S D @?> z tries to } ~ D L P P J I } FA E D M L | I # F{ < E ! ! ! FTAG et construction sémantique, Calligramme, 23 janvier 2003 Comparaison avec les approches concurrentes Construction sémantique à partir de l’arbre de dérivation Construction sémantique à partir de l’arbre de dérivation enrichi avec des liens additionels (Kallmeyer et Joshi) Glue semantics (Franck et van Genabith) FTAG et construction sémantique, Calligramme, 23 janvier 2003 Construction sémantique à partir de l’arbre de dérivation Les noeuds de l’arbre représentent des arbres élémentaires, chaque arbre élémentaire étant associé avec une représentation sémantique Les arcs de l’arbre représentent des opérations combinatoires: adjonction ou substitution; ces arcs sont dirigés: une flèche pointant vers le haut indique une adjonction, une flèche pointant vers le bas une substitution La construction sémantique suit le principe suivant: une flèche entre 2 et indique que est le foncteur sémantique et son noeuds argument FTAG et construction sémantique, Calligramme, 23 janvier 2003 cas problématiques Quantifieurs Questions Montée + dépendence longue distance FTAG et construction sémantique, Calligramme, 23 janvier 2003 Quantifieurs (1) Every dog barks barks dog every Pas de flèche (dépendence sémantique) entre le quantificateur et (le noeud de l’arbre associé avec) sa portée. FTAG et construction sémantique, Calligramme, 23 janvier 2003 Questions (2) Who does Paul think John said Bill liked? liked who said John think Paul does Bill Pas de flèche (dépendence sémantique) entre “who” et (le noeud de l’arbre associé avec) sa portée (“think”). FTAG et construction sémantique, Calligramme, 23 janvier 2003 Montée + dépendence longue distance (3) Mary Paul claims John seems to love. to love Mary claims seems John Paul (c) Pas de flèche (dépendence sémantique) entre “claims” et (le noeud de l’arbre associé avec) son argument propositionnel (“seems”). FTAG et construction sémantique, Calligramme, 23 janvier 2003 Arbres de dérivation enrichis Kallmeyer et Joshi 2002 Si domine et est adjoint à la racine de et peut être ajouté entre un lien supplémentaire Résoud le problème posé par les quantifieurs et les questions Reflète les unifications faites dans une FTAG Le cas Montée + dépendence longue distance reste problématique FTAG et construction sémantique, Calligramme, 23 janvier 2003 Glue semantics Frank and van Genabith 2001 Basé sur l’arbre dérivé L’assignement de valeurs aux variables des foncteurs sémantiques est déterminé par des principes plutôt que par unification FTAG et construction sémantique, Calligramme, 23 janvier 2003 Implémentation Deux possibilités : 1. Modifier l’analyseur pour qu’il manipule des paires Arbre, Représentation Sémantique plutôt que des arbres 2. Intégrer la représentation sémantique dans les structures de traits décorant les noeuds des arbres élémentaires. Implémenté dans la grammaire d’arbres polarisé de Guy Perrier FTAG et construction sémantique, Calligramme, 23 janvier 2003 Perspectives Implémenter une grammaire FTAG du Français avec sémantique (utilisable pour la génération) Définir une méta-grammaire pour cette grammaire et par là factoriser l’information sémantique commune à différents arbres élémentaires (classes d’alternance de Levin) Utiliser cette grammaire dans un système de génération FTAG et construction sémantique, Calligramme, 23 janvier 2003