Moteur de recherche Swoogle
Transcription
Moteur de recherche Swoogle
Cours:IFT 6282 Résponsable de cours :Mr Guy lapalme Samira bouslimi Swoogle: A Search and Metadata Enginefor the Semantic Web Li Ding Tim Finin Anupam Joshi Rong Pan R. Scott Cost Yun PengPavan Reddivari Vishal Doshi Joel Sachs (Ding, Finin et al. 2004) Department of Computer Science and Electronic Engineering University of Maryland Baltimore County, Baltimore MD 21250, USA Sommaire u Introduction u Documents de web sémantique u Architecture de Swoogle u Recherche de SWDs u Les métadonnées de SWD u Classification de SWDs u Indexation et recherche de SWDs u Conclusion Introduction ➢ Recherche d’information requêtes Pages web Indexation Index d1 d2 … Dn R1 R2 … Rn Résultats Recherche Le web sémantique Un ensemble de documents en ligne écrits en RDF ou OWL (SWDs) Les liens sémantiques entre les SWDs Importance d’inventer un moteur de recherche spécialisé au SWDs Objectif générale de l’article u Introduire un prototype de moteur de recherche de web sémantique appelé Swoogle u Faciliter le développement de web sémantique u Trouver l’ontologie appropriée u Trouver les instances des données u u Aider l’usager à intégrer les données de web sémantique Caractériser le web sémantique u Collecter les métadonnées u Utiliser les liens sémantiques entre les SWDs État de l’art (travaux antérieurs ) u Ontology based annotation systems SHOE [15], Ontobroker [9], WebKB [16], QuizRDF [8] and CREAM [11] u Les index des documents basés sur les annotations des documents et ils ne prennent pas en consideration le contenu des documents u Librairies d’ontologies u DAML Ontology Library [1] u SemWebCentral [4] u Schema Web [2] u Le recherche de SWDs n’est pas automatisés.les utilisateurs déterminent les URLs u Ils collectent une petite portion des ontologies de web sémantique u Ontaria [5] developper par W3C u Enregistre tous les graphes RDF des SWDs au lieu de se concentrer sur les métadonnées . Documents de web sémantique Deux types de SWDs : u semantic web ontologies (SWOs) u Une grande proportion des triplets RDF définie des nouveaux termes ( classes, propriétés) ou étend la défintion des termes définies dans d’autre documents SWDs par l’ajout des nouveaux propriétés. u semantic web databases (SWDBs) u u introduire des individus produire des triplets RDF pour ces individus Architecture de Swoogle u Web Crawler ( SWD discovery) u Créateur de metadonnées (metadata creation) u Analyseur de metadonnées (data analysis) u Interface Recherche de SWDs Developpement de (Google crawler ) u Utilisation des services web de Google (offre 1000 résultas pour chaque requête ) u La recherche de SWDs basée sur les extensions des SWDs(.rdf, .owl, .daml, et .n3) u Construire des requêtes plus spécifiques (expansion de requête) u Combiner les résultats Developpement de (Focused Crawler ) u Permet la recherche des SWDs dans les sites web Recherche SWDs avec les liens sémantiques entre SWDs u Développement de JENA2 ( la base de Swoogle crowlers ) u Permet d’analyser le contenu de SWDs u découvrir les nouveaux SWDs en se basant sur des relations sémantiques u u Une grande probabilité qu'un URIref soit un URL de SWD u owl:imports u rdfs:seeAlso property Les métadonnées de SWDs u basic metadata (les métadonnées de base ): considère les critères syntaxiques sémantiques de SWDs : u Les critères Linguistiques: fait référence aux propriétés qui décrient les critères syntaxiques et sémantiques de SWDs. u Encodage qui montre le Syntaxe d’encodage de SWD(RDF/XML,N-TRIPLE et N3) u Le langage qui décrie Les langages de web sémantique (OWL,RDF,RDFS et DAML) u Les espèces de OWL qui montrent les langages de SWDs écrits en OWL (OWL-LITE, OWL-DL et OWL-FULL) u Les statistiques de RDF: fait référence au propriétés de différent nœud de graphe RDF (classes, propriétés et Individus ) u L’annotation d’ontologie : u label. i.e. rdfs:label u 2. comment. i.e. rdfs:comment u 3. versionInfo. i.e. owl:versionInfo and daml:versionInfo u Relation entre SWDs u TM/IN u détermine les relations de référence entre les termes de deux SWDs les relations internes d’ontologie Classification de SWDs u Randon surfing model u PageRank (introduit par google [18, 12]) u Permet de déterminer le nombre aléatoire de navigateur qui visite une page u Rational Random Surfer(RRS): u Compte les liens sémantiques entre SWDs u Swoogle classifie les liens interne entre SWDs en quatre catégories : u Import u Uses –term u Extend u Assert u Désigne un poids pour chacun de ces liens u Swoogle compte la classification de SWDBs et SWOs Indexation et recherche de SWDs u La phase d’indexation u Utilisation de l’approche de N-Grams pour indexer les SWDs u Utilisation de l’approche basé sur des mots pour indexer les SWDsg u La phase de recherche d’information u Basé sur le modèle TF/IDF Conclusion u Swoogle est un système de recherche de web sémantique u Permet de découvrir SWDs u Déterminer les métadonnées de SWDs u Classifier les SWDs en exploitant les relations entre les SWDs u Indexation des SWDs en traitant les URIrefs comme des N-Grams ou terme u Introduire SWoogle2 Référence u [15] S. Luke, L. Spector, D. Rager, and J. Hendler.Ontology-based web agents. In Proceedings of the First International Conference on Autonomous Agents (Agents97), pages 59{66, 1997. u [9] S. Decker, M. Erdmann, D. Fensel, and R. Studer.Ontobroker: Ontology based access to distributed and semistructured information. In DS-8, pages 351{369,1999. u [16] P. Martin and P. Eklund. Embedding knowledge inweb documents. In Proceedings of the 8thInternational World Wide Web Conference (WWW8), pages 324{341, 1999 u [8] J. Davies, R. Weeks, and U. Krohn. Quizrdf: search technology for thesemantic web. In WWW2002 workshop on RDF and Semantic Web Applications,11th International WWW Conference (WWW11),2002. u [11] S. Handschuh and S. Staab. Cream: Creating metadata for the semantic web. Comput. Networks,42(5):579{598, 2003. u [1] http://www.daml.org/ontologies/, daml ontology library, by daml. u [2] http://www.schemaweb.info/, schema web. u [4] http://www.semwebcentral.org/, semwebcentral, by infoether and bbn. u [5] http://www.w3.org/2004/ontaria/, ontaria, by w3c. u [12] T. Haveliwala. E±cient computation of pageRank.Technical Report 1999-31, 1999. u [18] L. Page, S. Brin, R. Motwani, and T. Winograd. The pagerank citation ranking: Bringing order to the web. Technical report, Stanford Digital LibraryTechnologies Project, 1998. Merci pour votre attention