ANR-12-JS02-007-01 - pagoda
Transcription
ANR-12-JS02-007-01 - pagoda
pagoda: practical algorithms for ontology-based data access ANR-12-JS02-007-01 Responsable scientifique : Meghyn Bienvenu Institution : Université Paris-Sud 12 mars, 2015 Laboratoires participants : LRI, LIRMM, LIG, LJK, IRISA contexte et objectifs Problématique : Accès aux données à travers des ontologies Ontology-based data access (OBDA) PAGODA (ANR-12-JS02-007-01) 1/22 contexte et objectifs Problématique : Accès aux données à travers des ontologies Ontology-based data access (OBDA) BD Prof(julie) MCF(marc) PAGODA (ANR-12-JS02-007-01) Ontologie Prof(x) ! EC(x) MCF(x) ! EC(x) Query q(x) = EC(x) 1/22 contexte et objectifs Problématique : Accès aux données à travers des ontologies Ontology-based data access (OBDA) BD Prof(julie) MCF(marc) Query Ontologie Prof(x) ! EC(x) MCF(x) ! EC(x) q(x) = EC(x) Le projet PAGODA cible deux défis majeurs : 1. Passage à l’échelle des algorithmes de réponse aux requêtes 2. Gestion raisonnée des données incohérentes PAGODA (ANR-12-JS02-007-01) 1/22 participants sur 4 sites - compétences complémentaires Paris-Saclay (LRI) ∙ Meghyn Bienvenu (CR CNRS, porteuse du projet) ∙ Camille Bourgaux (doctorante, financée par le projet) Lannion (IRISA) ∙ François Goasdoué (PR, co-encadrant de C. Bourgaux) Grenoble (LIG, LJK) ∙ Marie-Christine Rousset (PR) ∙ Olivier Palombi (PR) Montpellier (LIRMM) ∙ Marie-Laure Mugnier (PR) ∙ Jean-François Baget (CR INRIA) ∙ Federico Ulliana (avant : postdoc sur le projet au LIG, maintenant : MCF) ∙ Swan Rocher (doctorant) Membres passés : Michaël Thomazo, Mélanie König, Despoina Trivela PAGODA (ANR-12-JS02-007-01) 2/22 organisation Structuré autour de 5 tâches : Tâche 1 Coordination Tâche 2 Algorithmique efficace pour l’OBDA Tâche 3 Gestion raisonnée des données incohérentes 1er défi 2e défi Tâche 4 Intégration avec RDF(S) et SPARQL Tâche 5 Cas d’étude, implémentation, expérimentation Chaque tâche fait intervenir des participants de plusieurs sites. PAGODA (ANR-12-JS02-007-01) 3/22 tâche 1 : coordination Deux recrutements : ∙ C. Bourgaux (doctorante, 10/2013 - ...) ∙ F. Ulliana (postdoc, 01/2013 - 12/2013) Mise en place d’un site web pour le projet : http://pagoda.lri.fr/ Mise en place d’un SVN commun pour partager nos documents PAGODA (ANR-12-JS02-007-01) 4/22 tâche 2 : algorithmique efficace pour l’obda Deux paradigmes algorithmiques pour la réponse aux requêtes Saturation : matérialiser les faits inférables Prof(julie) + Prof(x) → EC(x) → ajout de EC(julie) Réécriture : réécrire la requête pour prendre en compte l’ontologie EC(x) + nos deux règles PAGODA (ANR-12-JS02-007-01) → nouvelle requête : EC(x) ∨ Prof(x) ∨ MCF(x) 5/22 tâche 2 : algorithmique efficace pour l’obda Deux paradigmes algorithmiques pour la réponse aux requêtes Saturation : matérialiser les faits inférables Prof(julie) + Prof(x) → EC(x) → ajout de EC(julie) Réécriture : réécrire la requête pour prendre en compte l’ontologie EC(x) + nos deux règles → nouvelle requête : EC(x) ∨ Prof(x) ∨ MCF(x) Travaux découpés en trois sous-tâches: 2.1 Algorithmes «mixtes» qui combinent saturation et réécriture 2.2 Analyse de complexité : comment choisir la bonne approche ? 2.3 Optimisations pour algorithmes OBDA PAGODA (ANR-12-JS02-007-01) 5/22 tâche 2 : résultats Algorithmes de réécriture, algorithmes mixtes (2.1) : ∙ exploration de l’espace des différents opérateurs de réécriture (RR [KLMT13], SWJ [KLMT15]) ∙ algorithmes mixtes pour règles existentielles «fus» (soumis [KLM*]), règles linéaires + règles de transitivité (soumis [BBMR*]), ainsi que pour requêtes arborescentes + ontologie DL-Lite / ELH (IJCAI [BOSX13]) Analyse (2.2) : ∙ critères garantissant la termination de la saturation (ECAI [BGMR13]) ∙ méthodes pour tester s’il existe une réécriture en SQL / Datalog (PODS [BCLW13], IJCAI [BLW13], TODS [BCLW15] ) ∙ complexité de la réécriture et réponse aux requêtes, en fonction de la structure de la requête et de l’ontologie (soumis [BKP*] ) PAGODA (ANR-12-JS02-007-01) 6/22 tâche 2 : résultats Optimisations (2.3) : ∙ réécriture en requêtes semi-conjonctives (IJCAI, [Th13]) ∙ sélection d’une réécriture en fonction du coût d’évaluation estimé (soumis [BGM*]) Requêtes à base de chemins pour l’OBDA (nouveau sujet) : ∙ motivé par l’introduction de SPARQL 1.1 (avec chemins réguliers) ∙ analyse de complexité et algorithmes (dont certains de type mixte) pour diverses logiques de description (IJCAI [BOS13], KR [BCOS13], JAIR [BOS15]) PAGODA (ANR-12-JS02-007-01) 7/22 tâche 3 : gestion raisonnée des données incohérentes Erreurs dans les données ⇒ contradictions, résultats inutilisables MCF(julie), Prof(julie) PAGODA (ANR-12-JS02-007-01) + MCF(x) → ¬Prof(x) ⇝ contradiction! 8/22 tâche 3 : gestion raisonnée des données incohérentes Erreurs dans les données ⇒ contradictions, résultats inutilisables MCF(julie), Prof(julie) + MCF(x) → ¬Prof(x) ⇝ contradiction! Deux approches indépendantes mais complémentaires : Aider l’utilisateur à réparer les données erronées (sous-tâche 3.1) Adopter sémantiques alternatives (sous-tâches 3.2, 3.3) ∙ Identification des cas ayant une complexité polynomiale ∙ Méthodes génériques efficaces en pratique PAGODA (ANR-12-JS02-007-01) 8/22 tâche 3 : résultats Nous avons surtout exploré la 2e approche. Méthodes ayant une complexité polynomiale (3.2) : ∙ deux familles d’approximations de la sémantique «idéale» AR, permettant la réponse aux requêtes en temps polynomial (IJCAI [BR13]) Méthodes génériques (3.3) : ∙ prise en compte d’informations sur la fiabilité des données ∙ approche pratique combinant approximations polynomiales et l’utilisation d’un solveur SAT (AAAI [BBG13]) ∙ CQAPri : premier système OBDA implémentant la sémantique AR ∙ fournir des explications sur les (non-)réponses (soumis [BBG*]) PAGODA (ANR-12-JS02-007-01) 9/22 tâche 4 : intégration avec standards rdf(s) et sparql Faire un pont entre : ∙ le langage RDFS (plutôt simple, mais offrant des possibilités de « meta-modelling») ∙ les langages d’ontologie considérés dans le projet (logiques de description, règles existentielles) Deux sous-tâches : 4.1 Enrichir RDF(S) avec contraintes ontologiques plus expressives 4.2 Transfert des résultats des tâches 2 et 3 vers ce cadre PAGODA (ANR-12-JS02-007-01) 10/22 tâche 5 : cas d’étude, implémentation, experimentation Validation de nos résultats théoriques 5.1 Cas d’étude d’une application à l’anatomie ∙ ontologie My Corporis Fabrica (MyCF), développée par O. Palombi ∙ utilisations : enseigner l’anatomie (aujourd’hui), interroger et visualiser données de patientes (à terme) ∙ but : faire évoluer MyCF - ajout de contraintes, outils de raisonnement 5.2 Implémentation d’une boîte à outils OBDA, algorithmes mixtes 5.3 Expérimentation PAGODA (ANR-12-JS02-007-01) 11/22 tâches 4 et 5 : résultats Cas d’étude (anatomie) : ∙ refonte de l’ontologie MyCF, ajout de raisonnement (JBS, [PUFLR14]) ∙ participation au développement de MyCF Embryo (soumis, [RMURRLP*]) ∙ formalisme choisi : deductive RDF triplestores (RDF + règles) ∙ répond en partie à la sous-tâche 4.1 – enrichir RDFS Cas d’étude ⇒ nouvelles problématiques : ∙ modules paramétrés pour deductive RDF triplestores (AAAI, [UR15]) Prototypes et expérimentations : ∙ plusieurs de nos algorithmes et optimisations (Tâches 2 et 3) ont déjà été implémentés et expérimentés ∙ CQAPri : dépôt APP en cours, développement d’un benchmark PAGODA (ANR-12-JS02-007-01) 12/22 etat sur l’avancement Maintenant A venir Tâche 2 Bon avancement 2.1, 2.2 En avance sur 2.3 Poursuivre travaux sur algos, analyses, optimisations Considérer d’autres aspects (e.g. mises à jour, mappings) Tâche 3 Bon avancement 3.2, 3.3 3.1 remis à plus tard Poursuivre travaux 3.3 Avancer sur 3.1 Tâche 4 4.1 partiellement accompli Ajout de contraintes ontologiques supplémentaires Tâche 5 Cas d’étude (5.1) effectué En avance sur 5.2, 5.3 Poursuivre l’implémentation et l’expérimentation Benchmark pour règles existentielles ? PAGODA (ANR-12-JS02-007-01) 13/22 etat sur le budget Alloué Dépensé Engagé Restant Pourcent Missions Fonctionnement Personnel 82850 24047 0 58803 29% 11450 4377 0 7073 38% 156000 95162 50100 10738 93% A noter : ∙ missions début 2015 ne sont pas prises en compte (comptes fermés) ∙ certains sites ont pu utiliser d’autres contrats jusqu’à présent ∙ importantes dépenses à prévoir pour le workshop (fin du projet) PAGODA (ANR-12-JS02-007-01) 14/22 faits marquants Nombre, qualité, et diversité des publications ∙ 4 articles de revue : JBS, TODS, SWJ, JAIR ∙ 11 articles de conférences : IJCAI (5), AAAI (2), PODS, KR, ECAI, RR ∙ Diversité des supports : IA, bases de données, web sémantique Très bonne interaction entre participants ∙ Réunions, visites, collaborations, ... Promotion de l’OBDA à l’étranger et en France ∙ Cours dans les écoles d’été, conférences invitées, ... PAGODA (ANR-12-JS02-007-01) 15/22 publications Journaux internationaux (4) : [PUFLR14] O.Palombi, F. Ulliana, V. Favier, J.-C. Leon, M.-C. Rousset: My Corporis Fabrica: An Ontology-based Tool for Reasoning and Querying on Complex Anatomical Models. J. Biomedical Semantics (JBS) 5 : 20, 2014. [BCLW14] M. Bienvenu, B. ten Cate, C. Lutz, and F. Wolter: Ontology-based Data Access: A Study through Disjunctive Datalog, CSP, and MMSNP. ACM Transactions on Database Systems (TODS), 39(4): 33, 2014. Numéro spécial : l’un des 3 papiers PODS’13 invités [KLMT15] M. Konig, M. Leclere, M.-L. Mugnier, M. Thomazo: Sound, Complete and Minimal UCQ-Rewriting for Existential Rules. Semantic Web Journal (SWJ), à apparaître. [BOS15] M. Bienvenu, M. Ortiz, and M. Simkus: Regular Path Queries in Lightweight Description Logics: Complexity and Algorithms. Journal of Artificial Intelligence Research (JAIR), accepté. PAGODA (ANR-12-JS02-007-01) 16/22 publications Conférences internationales (11) : [BCLW13] M. Bienvenu, B. ten Cate, C. Lutz, and F. Wolter: Ontology-based Data Access: A Study through Disjunctive Datalog, CSP, and MMSNP. 32nd International Conference on the Principles of Database Systems (PODS’13), 2013. [BLW13] M. Bienvenu, C. Lutz, and F. Wolter: First Order-Rewritability of Atomic Queries in Horn Description Logics. 23rd International Joint Conference on Artificial Intelligence (IJCAI’13), 2013. [BOS13] M. Bienvenu, M. Ortiz, and M. Simkus: Conjunctive Regular Path Queries in Lightweight Description Logics. 23rd International Joint Conference on Artificial Intelligence (IJCAI’13), 2013. [BOSX13] M. Bienvenu, M. Ortiz, M. Simkus, and G. Xiao: Tractable Queries for Lightweight Description Logics. 23rd International Joint Conference on Artificial Intelligence (IJCAI’13), 2013. [BR13] M. Bienvenu and R. Rosati: Tractable Approximations of Consistent Query Answering for Robust Ontology-based Data Access. 23rd International Joint Conference on Artificial Intelligence (IJCAI’13), 2013. PAGODA (ANR-12-JS02-007-01) 17/22 publications [Th13] M. Thomazo: Compact Rewritings for Existential Rules. 23rd International Joint Conference on Artificial Intelligence (IJCAI’13), 2013. [KLMT13] M. König, M. Leclère, M.-L. Mugnier, M. Thomazo: On the Exploration of the Query Rewriting Space with Existential Rules. 7th International Conference on Web Reasoning and Rule Systems (RR’13), 2013. [BGMR14] J.-F. Baget, F. Garreau, M.-L. Mugnier and S. Rocher: Extending Acyclicity Notions for Existential Rules. 21st European Conference on Artificial Intelligence (ECAI’14), 2014. [BBG14] M. Bienvenu, C. Bourgaux, F. Goasdoué: Querying Inconsistent Description Logic Knowledge Bases under Preferred Repair Semantics. 28th AAAI Conference on Artificial Intelligence (AAAI’14), 2014. [BCOS14] M. Bienvenu, D. Calvanese, M. Ortiz, and M. Simkus: Nested Regular Path Queries in Description Logics. Proc. of the 14th International Conference on Principles of Knowledge Representation and Reasoning (KR’14), 2014. [UR15] F. Ulliana, M.-C. Rousset: Extracting Bounded-Level Modules from Deductive RDF Triplestores. 29th AAAI Conference on Artificial Intelligence (AAAI’15), 2015. PAGODA (ANR-12-JS02-007-01) 18/22 publications Articles soumis (6) : [BBG*] M. Bienvenu, C. Bourgaux, F. Goasdoué: Explaining Query Answers under Inconsistency-Tolerant Semantics over Description Logic Knowledge Bases. [BBMR*] J.-F. Baget, M. Bienvenu, M.-L. Mugnier, S. Rocher: Combining Existential Rules and Transitivity: Next Steps. [BGM*] D. Bursztyn, F. Goasdoué, I. Manolescu: Efficient Query Answering in DL-Lite through FOL Reformulation. [KLM*] Mélanie König, Michel Leclère, Marie-Laure Mugnier: Query Rewriting for Existential Rules with Compiled Preorder. [BKP*] M. Bienvenu, S. Kikot, V. Podolskii: Tree-like Queries in OWL 2 QL: Succinctness and Complexity Results . [RMURRLP*] P.-Y. Rabattu, B. Massé, F. Ulliana, M.-C. Rousset, D. Rohmer, J.-C. Léon, O. Palombi: My Corporis Fabrica Embryo: An ontology-based 3D spatio-temporal modeling of human embryo development. PAGODA (ANR-12-JS02-007-01) 19/22 interactions - fédérer une communauté française sur l’obda Réunions annuelles plénières ∙ 28 et 29 mars 2013 à Paris ∙ 20 et 21 février 2014 à Paris ∙ 2 et 3 mars 2015 à Montpellier Visites (hors réunions) ∙ Visite de M. Bienvenu et C. Bourgaux au LIRMM (2013) ∙ Visites régulières de M. Bienvenu (LRI) au LIRMM ∙ Visites régulières de F. Goasdoué (IRISA) au LRI Collaborations ∙ LRI - IRISA [BBG13] [BBG*] ∙ LRI - LIRMM [BBMR*] ∙ LIRMM - LIG [UR13] [RMURRLP*] PAGODA (ANR-12-JS02-007-01) 20/22 promotion de l’obda - visibilité nationale et internationale Tutoriaux dans les écoles d’été et conférences ∙ Ecole thématique BDA 2014 : Web sémantique et Open-linked data (F. Goasdoué) ∙ Ecole d’été Reasoning Web : ∙ 2014 : Ontology-Based Query Answering with Existential Rules (M.-L. Mugnier) ∙ 2015 : Query Answering with Horn Description Logics (M. Bienvenu) ∙ ICDE 2015: Reasoning on Web Data: Algorithms and Performance (F. Goasdoué) Exposés, conférences invitées ∙ Journées INRA 2014 : 3 exposés (M.-L. Mugnier, M.-C. Rousset, F. Ulliana) ∙ Conférence invitée à BDA 2015 : Web sémantique : beaucoup de données, quelques connaissances et un peu de raisonnement (F. Goasdoué et M.-C. Rousset) Présidence de comités de programme ∙ 27th Int. Workshop on Description Logics (DL) 2014 : M. Bienvenu ∙ 8th Int. Conf. of Web Reasoning and Rule Systems (RR) 2014 : M.-L. Mugnier PAGODA (ANR-12-JS02-007-01) 21/22 Questions ? PAGODA (ANR-12-JS02-007-01) 22/22