ANR-12-JS02-007-01 - pagoda

Transcription

ANR-12-JS02-007-01 - pagoda
pagoda: practical algorithms
for ontology-based data access
ANR-12-JS02-007-01
Responsable scientifique : Meghyn Bienvenu
Institution : Université Paris-Sud
12 mars, 2015
Laboratoires participants : LRI, LIRMM, LIG, LJK, IRISA
contexte et objectifs
Problématique : Accès aux données à travers des ontologies
Ontology-based data access (OBDA)
PAGODA (ANR-12-JS02-007-01)
1/22
contexte et objectifs
Problématique : Accès aux données à travers des ontologies
Ontology-based data access (OBDA)
BD
Prof(julie)
MCF(marc)
PAGODA (ANR-12-JS02-007-01)
Ontologie
Prof(x) ! EC(x)
MCF(x) ! EC(x)
Query
q(x) = EC(x)
1/22
contexte et objectifs
Problématique : Accès aux données à travers des ontologies
Ontology-based data access (OBDA)
BD
Prof(julie)
MCF(marc)
Query
Ontologie
Prof(x) ! EC(x)
MCF(x) ! EC(x)
q(x) = EC(x)
Le projet PAGODA cible deux défis majeurs :
1. Passage à l’échelle des algorithmes de réponse aux requêtes
2. Gestion raisonnée des données incohérentes
PAGODA (ANR-12-JS02-007-01)
1/22
participants sur 4 sites - compétences complémentaires
Paris-Saclay (LRI)
∙ Meghyn Bienvenu (CR CNRS, porteuse du projet)
∙ Camille Bourgaux (doctorante, financée par le projet)
Lannion (IRISA)
∙ François Goasdoué (PR, co-encadrant de C. Bourgaux)
Grenoble (LIG, LJK)
∙ Marie-Christine Rousset (PR)
∙ Olivier Palombi (PR)
Montpellier (LIRMM)
∙ Marie-Laure Mugnier (PR)
∙ Jean-François Baget (CR INRIA)
∙ Federico Ulliana (avant : postdoc sur le projet au LIG, maintenant : MCF)
∙ Swan Rocher (doctorant)
Membres passés : Michaël Thomazo, Mélanie König, Despoina Trivela
PAGODA (ANR-12-JS02-007-01)
2/22
organisation
Structuré autour de 5 tâches :
Tâche 1 Coordination
Tâche 2 Algorithmique efficace pour l’OBDA
Tâche 3 Gestion raisonnée des données incohérentes
1er défi
2e défi
Tâche 4 Intégration avec RDF(S) et SPARQL
Tâche 5 Cas d’étude, implémentation, expérimentation
Chaque tâche fait intervenir des participants de plusieurs sites.
PAGODA (ANR-12-JS02-007-01)
3/22
tâche 1 : coordination
Deux recrutements :
∙ C. Bourgaux (doctorante, 10/2013 - ...)
∙ F. Ulliana (postdoc, 01/2013 - 12/2013)
Mise en place d’un site web pour le projet :
http://pagoda.lri.fr/
Mise en place d’un SVN commun pour partager nos documents
PAGODA (ANR-12-JS02-007-01)
4/22
tâche 2 : algorithmique efficace pour l’obda
Deux paradigmes algorithmiques pour la réponse aux requêtes
Saturation : matérialiser les faits inférables
Prof(julie)
+
Prof(x) → EC(x)
→
ajout de EC(julie)
Réécriture : réécrire la requête pour prendre en compte l’ontologie
EC(x)
+
nos deux règles
PAGODA (ANR-12-JS02-007-01)
→
nouvelle requête : EC(x) ∨ Prof(x) ∨ MCF(x)
5/22
tâche 2 : algorithmique efficace pour l’obda
Deux paradigmes algorithmiques pour la réponse aux requêtes
Saturation : matérialiser les faits inférables
Prof(julie)
+
Prof(x) → EC(x)
→
ajout de EC(julie)
Réécriture : réécrire la requête pour prendre en compte l’ontologie
EC(x)
+
nos deux règles
→
nouvelle requête : EC(x) ∨ Prof(x) ∨ MCF(x)
Travaux découpés en trois sous-tâches:
2.1 Algorithmes «mixtes» qui combinent saturation et réécriture
2.2 Analyse de complexité : comment choisir la bonne approche ?
2.3 Optimisations pour algorithmes OBDA
PAGODA (ANR-12-JS02-007-01)
5/22
tâche 2 : résultats
Algorithmes de réécriture, algorithmes mixtes (2.1) :
∙ exploration de l’espace des différents opérateurs de réécriture
(RR [KLMT13], SWJ [KLMT15])
∙ algorithmes mixtes pour règles existentielles «fus» (soumis [KLM*]),
règles linéaires + règles de transitivité (soumis [BBMR*]), ainsi que pour
requêtes arborescentes + ontologie DL-Lite / ELH (IJCAI [BOSX13])
Analyse (2.2) :
∙ critères garantissant la termination de la saturation (ECAI [BGMR13])
∙ méthodes pour tester s’il existe une réécriture en SQL / Datalog
(PODS [BCLW13], IJCAI [BLW13], TODS [BCLW15] )
∙ complexité de la réécriture et réponse aux requêtes, en fonction de la
structure de la requête et de l’ontologie (soumis [BKP*] )
PAGODA (ANR-12-JS02-007-01)
6/22
tâche 2 : résultats
Optimisations (2.3) :
∙ réécriture en requêtes semi-conjonctives (IJCAI, [Th13])
∙ sélection d’une réécriture en fonction du coût d’évaluation estimé
(soumis [BGM*])
Requêtes à base de chemins pour l’OBDA (nouveau sujet) :
∙ motivé par l’introduction de SPARQL 1.1 (avec chemins réguliers)
∙ analyse de complexité et algorithmes (dont certains de type mixte) pour
diverses logiques de description (IJCAI [BOS13], KR [BCOS13], JAIR [BOS15])
PAGODA (ANR-12-JS02-007-01)
7/22
tâche 3 : gestion raisonnée des données incohérentes
Erreurs dans les données ⇒ contradictions, résultats inutilisables
MCF(julie), Prof(julie)
PAGODA (ANR-12-JS02-007-01)
+
MCF(x) → ¬Prof(x)
⇝
contradiction!
8/22
tâche 3 : gestion raisonnée des données incohérentes
Erreurs dans les données ⇒ contradictions, résultats inutilisables
MCF(julie), Prof(julie)
+
MCF(x) → ¬Prof(x)
⇝
contradiction!
Deux approches indépendantes mais complémentaires :
Aider l’utilisateur à réparer les données erronées (sous-tâche 3.1)
Adopter sémantiques alternatives (sous-tâches 3.2, 3.3)
∙ Identification des cas ayant une complexité polynomiale
∙ Méthodes génériques efficaces en pratique
PAGODA (ANR-12-JS02-007-01)
8/22
tâche 3 : résultats
Nous avons surtout exploré la 2e approche.
Méthodes ayant une complexité polynomiale (3.2) :
∙ deux familles d’approximations de la sémantique «idéale» AR, permettant
la réponse aux requêtes en temps polynomial (IJCAI [BR13])
Méthodes génériques (3.3) :
∙ prise en compte d’informations sur la fiabilité des données
∙ approche pratique combinant approximations polynomiales et
l’utilisation d’un solveur SAT (AAAI [BBG13])
∙ CQAPri : premier système OBDA implémentant la sémantique AR
∙ fournir des explications sur les (non-)réponses (soumis [BBG*])
PAGODA (ANR-12-JS02-007-01)
9/22
tâche 4 : intégration avec standards rdf(s) et sparql
Faire un pont entre :
∙ le langage RDFS (plutôt simple, mais offrant des possibilités de «
meta-modelling»)
∙ les langages d’ontologie considérés dans le projet (logiques de
description, règles existentielles)
Deux sous-tâches :
4.1 Enrichir RDF(S) avec contraintes ontologiques plus expressives
4.2 Transfert des résultats des tâches 2 et 3 vers ce cadre
PAGODA (ANR-12-JS02-007-01)
10/22
tâche 5 : cas d’étude, implémentation, experimentation
Validation de nos résultats théoriques
5.1 Cas d’étude d’une application à l’anatomie
∙ ontologie My Corporis Fabrica (MyCF), développée par O. Palombi
∙ utilisations : enseigner l’anatomie (aujourd’hui), interroger et visualiser
données de patientes (à terme)
∙ but : faire évoluer MyCF - ajout de contraintes, outils de raisonnement
5.2 Implémentation d’une boîte à outils OBDA, algorithmes mixtes
5.3 Expérimentation
PAGODA (ANR-12-JS02-007-01)
11/22
tâches 4 et 5 : résultats
Cas d’étude (anatomie) :
∙ refonte de l’ontologie MyCF, ajout de raisonnement (JBS, [PUFLR14])
∙ participation au développement de MyCF Embryo (soumis, [RMURRLP*])
∙ formalisme choisi : deductive RDF triplestores (RDF + règles)
∙ répond en partie à la sous-tâche 4.1 – enrichir RDFS
Cas d’étude ⇒ nouvelles problématiques :
∙ modules paramétrés pour deductive RDF triplestores (AAAI, [UR15])
Prototypes et expérimentations :
∙ plusieurs de nos algorithmes et optimisations (Tâches 2 et 3) ont déjà été
implémentés et expérimentés
∙ CQAPri : dépôt APP en cours, développement d’un benchmark
PAGODA (ANR-12-JS02-007-01)
12/22
etat sur l’avancement
Maintenant
A venir
Tâche 2
Bon avancement 2.1, 2.2
En avance sur 2.3
Poursuivre travaux sur algos,
analyses, optimisations
Considérer d’autres aspects
(e.g. mises à jour, mappings)
Tâche 3
Bon avancement 3.2, 3.3
3.1 remis à plus tard
Poursuivre travaux 3.3
Avancer sur 3.1
Tâche 4
4.1 partiellement accompli
Ajout de contraintes ontologiques supplémentaires
Tâche 5
Cas d’étude (5.1) effectué
En avance sur 5.2, 5.3
Poursuivre l’implémentation
et l’expérimentation
Benchmark pour règles existentielles ?
PAGODA (ANR-12-JS02-007-01)
13/22
etat sur le budget
Alloué
Dépensé
Engagé
Restant
Pourcent
Missions
Fonctionnement
Personnel
82850
24047
0
58803
29%
11450
4377
0
7073
38%
156000
95162
50100
10738
93%
A noter :
∙ missions début 2015 ne sont pas prises en compte (comptes fermés)
∙ certains sites ont pu utiliser d’autres contrats jusqu’à présent
∙ importantes dépenses à prévoir pour le workshop (fin du projet)
PAGODA (ANR-12-JS02-007-01)
14/22
faits marquants
Nombre, qualité, et diversité des publications
∙ 4 articles de revue : JBS, TODS, SWJ, JAIR
∙ 11 articles de conférences : IJCAI (5), AAAI (2), PODS, KR, ECAI, RR
∙ Diversité des supports : IA, bases de données, web sémantique
Très bonne interaction entre participants
∙ Réunions, visites, collaborations, ...
Promotion de l’OBDA à l’étranger et en France
∙ Cours dans les écoles d’été, conférences invitées, ...
PAGODA (ANR-12-JS02-007-01)
15/22
publications
Journaux internationaux (4) :
[PUFLR14] O.Palombi, F. Ulliana, V. Favier, J.-C. Leon, M.-C. Rousset: My Corporis Fabrica:
An Ontology-based Tool for Reasoning and Querying on Complex Anatomical Models.
J. Biomedical Semantics (JBS) 5 : 20, 2014.
[BCLW14] M. Bienvenu, B. ten Cate, C. Lutz, and F. Wolter: Ontology-based Data Access:
A Study through Disjunctive Datalog, CSP, and MMSNP. ACM Transactions on Database
Systems (TODS), 39(4): 33, 2014. Numéro spécial : l’un des 3 papiers PODS’13 invités
[KLMT15] M. Konig, M. Leclere, M.-L. Mugnier, M. Thomazo: Sound, Complete and
Minimal UCQ-Rewriting for Existential Rules. Semantic Web Journal (SWJ), à apparaître.
[BOS15] M. Bienvenu, M. Ortiz, and M. Simkus: Regular Path Queries in Lightweight
Description Logics: Complexity and Algorithms. Journal of Artificial Intelligence
Research (JAIR), accepté.
PAGODA (ANR-12-JS02-007-01)
16/22
publications
Conférences internationales (11) :
[BCLW13] M. Bienvenu, B. ten Cate, C. Lutz, and F. Wolter: Ontology-based Data Access:
A Study through Disjunctive Datalog, CSP, and MMSNP. 32nd International Conference
on the Principles of Database Systems (PODS’13), 2013.
[BLW13] M. Bienvenu, C. Lutz, and F. Wolter: First Order-Rewritability of Atomic Queries
in Horn Description Logics. 23rd International Joint Conference on Artificial
Intelligence (IJCAI’13), 2013.
[BOS13] M. Bienvenu, M. Ortiz, and M. Simkus: Conjunctive Regular Path Queries in
Lightweight Description Logics. 23rd International Joint Conference on Artificial
Intelligence (IJCAI’13), 2013.
[BOSX13] M. Bienvenu, M. Ortiz, M. Simkus, and G. Xiao: Tractable Queries for
Lightweight Description Logics. 23rd International Joint Conference on Artificial
Intelligence (IJCAI’13), 2013.
[BR13] M. Bienvenu and R. Rosati: Tractable Approximations of Consistent Query
Answering for Robust Ontology-based Data Access. 23rd International Joint
Conference on Artificial Intelligence (IJCAI’13), 2013.
PAGODA (ANR-12-JS02-007-01)
17/22
publications
[Th13] M. Thomazo: Compact Rewritings for Existential Rules. 23rd International Joint
Conference on Artificial Intelligence (IJCAI’13), 2013.
[KLMT13] M. König, M. Leclère, M.-L. Mugnier, M. Thomazo: On the Exploration of the
Query Rewriting Space with Existential Rules. 7th International Conference on Web
Reasoning and Rule Systems (RR’13), 2013.
[BGMR14] J.-F. Baget, F. Garreau, M.-L. Mugnier and S. Rocher: Extending Acyclicity
Notions for Existential Rules. 21st European Conference on Artificial Intelligence
(ECAI’14), 2014.
[BBG14] M. Bienvenu, C. Bourgaux, F. Goasdoué: Querying Inconsistent Description
Logic Knowledge Bases under Preferred Repair Semantics. 28th AAAI Conference on
Artificial Intelligence (AAAI’14), 2014.
[BCOS14] M. Bienvenu, D. Calvanese, M. Ortiz, and M. Simkus: Nested Regular Path
Queries in Description Logics. Proc. of the 14th International Conference on Principles
of Knowledge Representation and Reasoning (KR’14), 2014.
[UR15] F. Ulliana, M.-C. Rousset: Extracting Bounded-Level Modules from Deductive
RDF Triplestores. 29th AAAI Conference on Artificial Intelligence (AAAI’15), 2015.
PAGODA (ANR-12-JS02-007-01)
18/22
publications
Articles soumis (6) :
[BBG*] M. Bienvenu, C. Bourgaux, F. Goasdoué: Explaining Query Answers under
Inconsistency-Tolerant Semantics over Description Logic Knowledge Bases.
[BBMR*] J.-F. Baget, M. Bienvenu, M.-L. Mugnier, S. Rocher: Combining Existential Rules
and Transitivity: Next Steps.
[BGM*] D. Bursztyn, F. Goasdoué, I. Manolescu: Efficient Query Answering in DL-Lite
through FOL Reformulation.
[KLM*] Mélanie König, Michel Leclère, Marie-Laure Mugnier: Query Rewriting for
Existential Rules with Compiled Preorder.
[BKP*] M. Bienvenu, S. Kikot, V. Podolskii: Tree-like Queries in OWL 2 QL: Succinctness
and Complexity Results .
[RMURRLP*] P.-Y. Rabattu, B. Massé, F. Ulliana, M.-C. Rousset, D. Rohmer, J.-C. Léon, O.
Palombi: My Corporis Fabrica Embryo: An ontology-based 3D spatio-temporal
modeling of human embryo development.
PAGODA (ANR-12-JS02-007-01)
19/22
interactions - fédérer une communauté française sur l’obda
Réunions annuelles plénières
∙ 28 et 29 mars 2013 à Paris
∙ 20 et 21 février 2014 à Paris
∙ 2 et 3 mars 2015 à Montpellier
Visites (hors réunions)
∙ Visite de M. Bienvenu et C. Bourgaux au LIRMM (2013)
∙ Visites régulières de M. Bienvenu (LRI) au LIRMM
∙ Visites régulières de F. Goasdoué (IRISA) au LRI
Collaborations
∙ LRI - IRISA
[BBG13] [BBG*]
∙ LRI - LIRMM
[BBMR*]
∙ LIRMM - LIG
[UR13] [RMURRLP*]
PAGODA (ANR-12-JS02-007-01)
20/22
promotion de l’obda - visibilité nationale et internationale
Tutoriaux dans les écoles d’été et conférences
∙ Ecole thématique BDA 2014 : Web sémantique et Open-linked data (F. Goasdoué)
∙ Ecole d’été Reasoning Web :
∙ 2014 : Ontology-Based Query Answering with Existential Rules (M.-L. Mugnier)
∙ 2015 : Query Answering with Horn Description Logics (M. Bienvenu)
∙ ICDE 2015: Reasoning on Web Data: Algorithms and Performance (F. Goasdoué)
Exposés, conférences invitées
∙ Journées INRA 2014 : 3 exposés (M.-L. Mugnier, M.-C. Rousset, F. Ulliana)
∙ Conférence invitée à BDA 2015 : Web sémantique : beaucoup de données, quelques
connaissances et un peu de raisonnement (F. Goasdoué et M.-C. Rousset)
Présidence de comités de programme
∙ 27th Int. Workshop on Description Logics (DL) 2014 : M. Bienvenu
∙ 8th Int. Conf. of Web Reasoning and Rule Systems (RR) 2014 : M.-L. Mugnier
PAGODA (ANR-12-JS02-007-01)
21/22
Questions ?
PAGODA (ANR-12-JS02-007-01)
22/22

Documents pareils