Moteur de recherche Swoogle

Transcription

Moteur de recherche Swoogle
Cours:IFT 6282
Résponsable de cours :Mr Guy lapalme
Samira bouslimi
Swoogle: A Search and Metadata Enginefor the Semantic Web
Li Ding Tim Finin Anupam Joshi Rong Pan R. Scott Cost Yun PengPavan Reddivari
Vishal Doshi Joel Sachs (Ding, Finin et al. 2004)
Department of Computer Science and Electronic Engineering University of
Maryland Baltimore County, Baltimore MD 21250, USA
Sommaire
u
Introduction
u
Documents de web sémantique
u
Architecture de Swoogle
u
Recherche de SWDs
u
Les métadonnées de SWD
u
Classification de SWDs
u
Indexation et recherche de SWDs
u
Conclusion
Introduction ➢ Recherche d’information
requêtes
Pages web
Indexation
Index
d1 d2 …
Dn
R1
R2
…
Rn
Résultats
Recherche
Le web sémantique
Un ensemble de documents en ligne écrits en RDF ou OWL (SWDs)
Les liens sémantiques entre les SWDs
Importance d’inventer un moteur de recherche spécialisé au SWDs
Objectif générale de l’article
u
Introduire un prototype de moteur de recherche de web sémantique appelé
Swoogle
u
Faciliter le développement de web sémantique
u
Trouver l’ontologie appropriée
u
Trouver les instances des données
u
u
Aider l’usager à intégrer les données de web sémantique
Caractériser le web sémantique
u
Collecter les métadonnées
u
Utiliser les liens sémantiques entre les SWDs
État de l’art (travaux antérieurs )
u
Ontology based annotation systems SHOE [15], Ontobroker [9], WebKB [16], QuizRDF [8]
and CREAM [11]
u
Les index des documents basés sur les annotations des documents et ils ne prennent pas en
consideration le contenu des documents
u
Librairies d’ontologies
u
DAML Ontology Library [1]
u
SemWebCentral [4]
u
Schema Web [2]
u
Le recherche de SWDs n’est pas automatisés.les utilisateurs déterminent les URLs
u
Ils collectent une petite portion des ontologies de web sémantique
u
Ontaria [5] developper par W3C
u
Enregistre tous les graphes RDF des SWDs au lieu de se concentrer sur les métadonnées .
Documents de web sémantique
Deux types de SWDs :
u
semantic web ontologies (SWOs)
u
Une grande proportion des triplets RDF définie des nouveaux termes ( classes, propriétés) ou
étend la défintion des termes définies dans d’autre documents SWDs par l’ajout des nouveaux
propriétés.
u
semantic web databases (SWDBs)
u
u
introduire des individus
produire des triplets RDF pour ces individus
Architecture de Swoogle
u
Web Crawler ( SWD discovery)
u
Créateur de metadonnées (metadata creation)
u
Analyseur de metadonnées (data analysis)
u
Interface
Recherche de SWDs
Developpement de (Google crawler )
u
Utilisation des services web de Google
(offre 1000 résultas pour chaque requête )
u
La recherche de SWDs basée
sur les extensions des SWDs(.rdf, .owl, .daml, et .n3)
u
Construire des requêtes plus spécifiques
(expansion de requête)
u
Combiner les résultats
Developpement de (Focused Crawler )
u
Permet la recherche des SWDs dans les sites web
Recherche SWDs avec les liens sémantiques entre SWDs
u
Développement de JENA2 ( la base de Swoogle crowlers )
u
Permet d’analyser le contenu de SWDs
u
découvrir les nouveaux SWDs en se basant sur des relations sémantiques
u
u
Une grande probabilité qu'un URIref soit un URL de SWD
u
owl:imports
u
rdfs:seeAlso property
Les métadonnées de SWDs
u
basic metadata (les métadonnées de base ):
considère les critères syntaxiques sémantiques de SWDs :
u
Les critères Linguistiques: fait référence aux propriétés qui décrient les critères syntaxiques et
sémantiques de SWDs.
u
Encodage qui montre le Syntaxe d’encodage de SWD(RDF/XML,N-TRIPLE et N3)
u
Le langage qui décrie Les langages de web sémantique (OWL,RDF,RDFS et DAML)
u
Les espèces de OWL qui montrent les langages de SWDs écrits en OWL (OWL-LITE, OWL-DL
et OWL-FULL)
u
Les statistiques de RDF: fait référence au propriétés de différent nœud de graphe RDF (classes,
propriétés et Individus )
u
L’annotation d’ontologie :
u
label. i.e. rdfs:label
u
2. comment. i.e. rdfs:comment
u
3. versionInfo. i.e. owl:versionInfo and daml:versionInfo
u
Relation entre SWDs
u
TM/IN
u
détermine les relations de référence entre les termes de deux SWDs
les relations internes d’ontologie
Classification de SWDs
u
Randon surfing model
u
PageRank (introduit par google [18, 12])
u
Permet de déterminer le nombre aléatoire de navigateur qui visite une page
u
Rational Random Surfer(RRS):
u
Compte les liens sémantiques entre SWDs
u
Swoogle classifie les liens interne entre SWDs en quatre catégories :
u
Import
u
Uses –term
u
Extend
u
Assert
u
Désigne un poids pour chacun de ces liens
u
Swoogle compte la classification de SWDBs et SWOs
Indexation et recherche de SWDs
u
La phase d’indexation
u
Utilisation de l’approche de N-Grams pour indexer les SWDs
u
Utilisation de l’approche basé sur des mots pour indexer les SWDsg
u
La phase de recherche d’information
u
Basé sur le modèle TF/IDF
Conclusion
u
Swoogle est un système de recherche de web sémantique
u
Permet de découvrir SWDs
u
Déterminer les métadonnées de SWDs
u
Classifier les SWDs en exploitant les relations entre les SWDs
u
Indexation des SWDs en traitant les URIrefs comme des N-Grams ou terme
u
Introduire SWoogle2
Référence
u
[15] S. Luke, L. Spector, D. Rager, and J. Hendler.Ontology-based web agents. In Proceedings of the First International
Conference on Autonomous Agents
(Agents97), pages 59{66, 1997.
u
[9] S. Decker, M. Erdmann, D. Fensel, and R. Studer.Ontobroker: Ontology based access to distributed and semistructured information. In DS-8, pages 351{369,1999.
u
[16] P. Martin and P. Eklund. Embedding knowledge inweb documents. In Proceedings of the 8thInternational World
Wide Web Conference (WWW8),
pages 324{341, 1999
u
[8] J. Davies, R. Weeks, and U. Krohn. Quizrdf: search technology for thesemantic web. In WWW2002 workshop on RDF
and Semantic Web Applications,11th International WWW Conference (WWW11),2002.
u
[11] S. Handschuh and S. Staab. Cream: Creating metadata for the semantic web. Comput. Networks,42(5):579{598,
2003.
u
[1] http://www.daml.org/ontologies/, daml ontology library, by daml.
u
[2] http://www.schemaweb.info/, schema web.
u
[4] http://www.semwebcentral.org/, semwebcentral, by infoether and bbn.
u
[5] http://www.w3.org/2004/ontaria/, ontaria, by w3c.
u
[12] T. Haveliwala. E±cient computation of pageRank.Technical Report 1999-31, 1999.
u
[18] L. Page, S. Brin, R. Motwani, and T. Winograd. The pagerank citation ranking: Bringing order to the web.
Technical report, Stanford Digital LibraryTechnologies Project, 1998.
Merci pour votre attention

Documents pareils