la structure temporelle du French Time Bank telle qu

Transcription

la structure temporelle du French Time Bank telle qu
Université Paris Diderot – 15/16
TP: Cohérence du French Time Bank
Objectif du TP Extraire (une partie de) la structure temporelle du French Time Bank
telle qu’elle est induite par les annotations, pour pouvoir vérifier la cohérence de cette
structure.
<?xml version=’1.0’ encoding=’UTF-8’?>
<!-Source: Est Républicain/CNRTL
Copyright 2010 André Bittar
This file is part of the French TimeBank.
The French TimeBank is distributed under the terms of the
Lesser General Public License for Linguistic Resources.
See file LICENSE (distributed with this file) or read the license at
http://infolingu.univ-mlv.fr/DonneesLinguistiques/Lexiques-Grammaires/lgpllr.html
//-->
<TimeML>
<TEXT>
<TIMEX3 functionInDocument="CREATION_TIME" tid="t1" type="DATE" value="1999-05-17" />Premier
<EVENT class="OCCURRENCE" eid="e9" eiid="ei9" pos="NOUN" pred="DOUBLÉ">doublé</EVENT>
de la «Scuderia» en Principauté. <SIGNAL sid="s1">Après</SIGNAL> un très bon
<EVENT class="OCCURRENCE" eid="e2" eiid="ei2" pos="NOUN" pred="DÉPART">départ</EVENT>, Michael Schumacher a
<EVENT class="STATE" eid="e10" eiid="ei10" pos="VERB" pred="FAIRE" tense="PAST" vform="PASTPART">fait</EVENT>
cavalier seul. Il <EVENT class="STATE" eid="e13" eiid="ei13" pos="VERB" pred="DEVANCER" tense="PRESENT">devance</EVENT>
son coéquipier Eddie Irvine de <TIMEX3 tid="t3" type="DURATION" value="PT30.4S">30,4 secondes</TIMEX3>,
<EVENT class="OCCURRENCE" eid="e5" eiid="ei5" pos="VERB" pred="SIGNER" tense="PRESENT">signe</EVENT>
sa 35e <EVENT class="OCCURRENCE" eid="e6" eiid="ei6" pos="NOUN" pred="VICTOIRE">victoire</EVENT>,
la quatrième à Monaco, la 16e avec Ferrari. Un record absolu.
Dans ce grand <EVENT class="OCCURRENCE" eid="e8" eiid="ei8" pos="NOUN" pred="PRIX">prix</EVENT> au millimètre,
seules neuf voitures ont
<EVENT class="OCCURRENCE" eid="e7" eiid="ei7" pos="VERB" pred="PASSER" tense="PAST" vform="PASTPART">passé</EVENT>
la ligne d’arrivée.
</TEXT>
<TLINK eventInstanceID="ei9" lid="l1" origin="USER" relType="BEFORE" relatedToTime="t1" />
<TLINK eventInstanceID="ei8" lid="l2" origin="USER" relType="BEFORE" relatedToTime="t1" />
<TLINK eventInstanceID="ei9" lid="l3" origin="USER" relType="DURING" relatedToEventInstance="ei8" />
<TLINK eventInstanceID="ei7" lid="l4" origin="USER" relType="DURING" relatedToEventInstance="ei8" />
<TLINK eventInstanceID="ei13" lid="l5" origin="USER" relType="SIMULTANEOUS" relatedToTime="t3" />
<TLINK eventInstanceID="ei13" lid="l6" origin="USER" relType="DURING" relatedToEventInstance="ei9" />
<TLINK eventInstanceID="ei10" lid="l7" origin="USER" relType="AFTER" relatedToEventInstance="ei2" signalID="s1" />
<TLINK eventInstanceID="ei10" lid="l8" origin="USER" relType="INCLUDES" relatedToEventInstance="ei5" />
<TLINK eventInstanceID="ei10" lid="l9" origin="USER" relType="INCLUDES" relatedToEventInstance="ei13" />
<TLINK eventInstanceID="ei5" lid="l10" origin="USER" relType="IDENTITY" relatedToEventInstance="ei6" />
</TimeML>
1. Après avoir récupéré la version 1.1 du FTiB, utiliser la bibliothèque xml de votre
choix pour en extraire les informations pertinentes.
2. Commencer par extraire les informations TLINK before et after, pour construire une
représentation en mémoire du graphe pour chaque texte.
3. Vérifier que le graphe est cohérent, et ajouter dans le graphe les relations obtenues
par transitivité. Produire une sortie textuelle pour rendre visible le graphe :
ei9 : doublé
ei8 : prix
t1 : premier
ei9 < t1 ; ei8 < t1
4. Ajouter les relations simultaneous et identity, et vérifier de nouveau la cohérence du
graphe en ajoutant les relations inférées.
5. Idem avec during et includes.
Bonus Ajouter les autres types de relations.
Le programme doit fonctionner sans erreur sur les 108 documents.

Documents pareils