WebSem2 Onto
Transcription
WebSem2 Onto
Plan du cours ● ● Logiques de description ● Notions de base, définitions ● Raisonnement ● Complexité ● Implémentations ● Applications Ontologies ● Définitions, exemples ● Représentations ● Constructions ● Utilisations Mardi 10 janvier 2006 1 Histoire ● Problèmes de réalisation des Systèmes Experts (bases de connaissances) : ● Complexité ● Coûts financiers et temporels ● Réutilisabilité ● Variété des langages de représentation ● Composabilité ● Interopérabilité ● Etc ... Mardi 10 janvier 2006 2 Définitions ● ● ● ● Ontologies (philo) : partie de la métaphysique qui s'applique à l'être en tant qu'être, indépendamment de ses déterminations particulières Taxinomie (didact) : étude théorique des bases, lois, règles, principes, d'une classification Taxinomie : classification d'éléments Ontologie (IC) : ensemble des objets reconnus comme existant dans le domaine. Construire une ontologie c'est aussi décider de la manière d'être et d'exister des objets Mardi 10 janvier 2006 3 Définitions (suite) ● ● Ontologie : spécification explicite d'une conceptualisation ● Spécification explicite : donc avec un langage ● Conceptualisation : structuration des concepts Concept : désigné de 3 façons : ● Son nom ● Sa signification (sa définition en intension) ● Les objets dénotés (sa définition en extension) Mardi 10 janvier 2006 4 Exemple ● ● ● Voiture, auto, automobile, tacot, ... Véhicule de transport automobile conçu et aménagé pour le transport d'un petit nombre de personnes La 2CV 234 DD 42, la clio truc 543 YA 42, etc... Mardi 10 janvier 2006 5 Relations ● ● Une «relation» peut s'exprimer par son nom, son intension, son extension : ● «auteur» ● personne qui crée une oeuvre ● Hugo est l'auteur de Notre Dame de Paris et Chateaubriand de Mémoires d'outretombe, ... Généralisation (subsomption), spécialisation, composition, ..., est fabriqué en, possède, ... Mardi 10 janvier 2006 6 Objectifs des ontologies ● ● Permettre un traitement symbolique des connaissances, but premier de l'IA, rejoint celui du Web Sémantique. Faire faire des traitements automatiques à des logiciels au sein du Web pour faire interopérer des machines ou des machines et des humains. Mardi 10 janvier 2006 7 Rôle des ontologies ● ● ● ● Vocabulaire, structuration et exploitation des métadonnées Représentation pivot pour l'intégration de sources de données hétérogènes Décrire les services Web ... Mardi 10 janvier 2006 8 Philippe Martin, Griffith University «Introduction to ontologies» An ontology is a list of formal terms, i.e. identifiers for categories of objects, plus machineunderstandable statements defining a formal meaning for these terms, in other words, some of their characteristics or interrelations, rules or constraints of use. These statements permit some semantic checking on the manual introduction of new statements and some logical inferencing to generate new statements, e.g. for information retrieval purposes. Relational database schemas may be viewed as simple forms of ontologies but, although some dependency relations are represented, semantic relations between the terms (column names) are most often not explicited, and hence knowledge representation and inferencing is very limited. In most knowledge based systems (KBSs), the users are allowed to add new categories, relations, rules or constraints. This dynamic modification of the ontology, and the (potential) complexity of the knowledge representations and inferencing, may be the reasons why so few largescale KBSs have been built [...] Mardi 10 janvier 2006 9 Autre définition ● Guarino : En IA, une ontologie représente un artefact d’ingénierie constitué par un vocabulaire spécifique utilisé pour décrire une certaine réalité, accompagné d’un ensemble d’hypothèses implicites concernant la signification des mots de ce vocabulaire Mardi 10 janvier 2006 10 ... C'est ... Ce n'est pas ... Mardi 10 janvier 2006 11 Formalisations ● cf. Nicola Guarino (http://www.loacnr.it/) ● Espace de domaine = <D,W> où D est un domaine, et W un ensemble d'états (ou mondes possibles) n ● n D Relation conceptuelle : : W 2 ● Une conceptualisation pour D : <D,W,R> où R est un ensemble de relations conceptuelles sur <D,W> ● cf. aussi Thomas R. Gruber http://kslweb.stanford.edu/people/gruber/ Mardi 10 janvier 2006 12 Exercices ● ● Synonymie : ● Propos destiné à faire rire ● Assemblage de feuilles imprimées Homonymie : ● ● ● ● Quantité relativement grande et d'un seul tenant d'une matière Marteau à tête lourde et sans panne Parties conductrices d'un appareil par lequel s'effectue le retour du courant au générateur Grandeur fondamentale liée à la quantité de matière que contient un corps Mardi 10 janvier 2006 13 Différents types d'ontologies Concepts très généraux indépendants du problème (espace, temps, événement, action, ...) [Guarino] Toplevel ontology Domain ontology Task ontology Vocabulaires généraux d'un domaine (médecine, automobile, ...) Concepts très spécifiques correspondant aux rôles Application ontology joués par les entités du domaine dans une certaine activité Mardi 10 janvier 2006 14 Exemples d'ontologies ● ● ● Ontologies générales : ● Wordnet / EuroWordNet ● The Upper Cyc Ontology ● IEEE Standard Upper Ontology Ontologies de domaine ● UMLS, RETSINA, Dublin Core, KA2, ... Métaontologies ● Semantic Translation, RDFT, Evolution Ontology Mardi 10 janvier 2006 15 WordNet ● ● http://www.cogsci.princeton.edu/~wn/index.shtml WordNet® is an online lexical reference system whose design is inspired by current psycholinguistic theories of human lexical memory. English nouns, verbs, adjectives and adverbs are organized into synonym sets, each representing one underlying lexical concept. Different relations link the synonym sets. Mardi 10 janvier 2006 16 UMLS ● ● ● Unified Medical Language System http://umlsks.nlm.nih.gov NLM's Unified Medical Language System (UMLS) project develops and distributes multipurpose, electronic "Knowledge Sources" and associated lexical programs. System developers can use the UMLS products to enhance their applications in systems focused on patient data, digital libraries, Web and bibliographic retrieval, natural language processing, and decision support. Researchers will find the UMLS products useful in investigating knowledge representation and retrieval questions. Mardi 10 janvier 2006 17 UMLS (suite) ● ● ● ● ● Metathesaurus Réseau sémantique NLP tools Knowledge Source Server MetamorphoSys Mardi 10 janvier 2006 18 RETSINA SEMANTIC WEB CALENDAR AGENT ● ● http://www.daml.ri.cmu.edu/Cal/ The Retsina Semantic Web Calendar Agent provides interoperability between RDF based calendar descriptions on the web, and Personal Information Manager (PIM) Systems such as Microsoft's Outlook. Schedules and events can be described on the web in RDF, using existing ontologies such as the Hybrid iCallike RDF Schema or the Dublin Core ontology, and linked to individual's contact information described, for example, at their home page. The Retsina Semantic Web Calendar Agent, consists of a Distributed Meeting Scheduling Engine and the RETSINA Semantic Web Calendar Parser. The agent assists in organising and scheduling meetings between several individuals, and coordinates these based on existing schedules maintained by MS Outlook. Mardi 10 janvier 2006 19 Dublin Core ● ● ● http://dublincore.org/ The Dublin Core Metadata Initiative is an open forum engaged in the development of interoperable online metadata standards that support a broad range of purposes and business models. The Dublin Core metadata standard is a simple yet effective element set for describing a wide range of networked resources. The Dublin Core standard includes two levels: Simple and Qualified. Simple Dublin Core comprises fifteen elements; Qualified Dublin Core includes an additional element, Audience, as well as a group of element refinements (also called qualifiers) that refine the semantics of the elements in ways that may be useful in resource discovery Mardi 10 janvier 2006 20 Plan du cours ● ● Logiques de description ● Notions de base, définitions ● Raisonnement ● Complexité ● Implémentations ● Applications Ontologies ● Définitions, exemples ● Représentations ● Constructions ● Utilisations Mardi 10 janvier 2006 21 Paradigmes de représentation ● ● ● ● ● ● ● ● Thésaurus Taxinomies Modèle étendu ER Logiques (des prédicats, de description, ...) Réseaux sémantiques Topic Maps RDF et RDFS ... Mardi 10 janvier 2006 22 Thésaurus ● ● ● ● Graphes dont les arcs sont étiquetés Arcs : similarité, proximité, synonymie, ... Pas d'instances Pas moyen de représenter des concepts un peu compliqués soprano definition The highest category of female (or artificial male) voice. broader term(s) vocalist, singer narrower term(s) lyric soprano, dramatic soprano, coloratura soprano related term(s) mezzosoprano, treble Mardi 10 janvier 2006 23 Topic Maps (1) ● ● ● Standardisation ISO Application XML : XTM But : ● Gérer la surabondance d'informations ● Construire des réseaux de connaissances sur n'importe quelles ressources ● Structurer l'information Mardi 10 janvier 2006 24 Topic Maps (2) A Topic Map defines three main sorts of information: ● ● ● ● Topics, which are things or concepts that you're interested in and their names Associations, which help you relate one topic to another, and therefore help you to navigate around your subject of interest and Occurrences, which are information resources that relate to the topics. You can use them to locate books, articles, files, web pages and other relevant resources. Mardi 10 janvier 2006 ● 25 Topic Maps (3) Gorda Sound see North Sound Little Dix Bay .................... 89 North Sound ....................... 90 Road Harbour see also Road Town ... 73 Road Town ...................... 69,71 Spanish Town ................... 81,82 Tortola ........................... 67 Virgin Gorda ...................... 77 cf. « The Topic Maps Handbook» : http://www.empolis.com/downloads/empolis_TopicMaps_Whitepaper20030206.pdf Mardi 10 janvier 2006 26 Plan du cours ● ● Logiques de description ● Notions de base, définitions ● Raisonnement ● Complexité ● Implémentations ● Applications Ontologies ● Définitions, exemples ● Représentations ● Constructions ● Utilisations Mardi 10 janvier 2006 27 Conception : principes [Thomas R. Gruber] ● ● ● ● ● Clarté : être objectif, documentations Cohérence : chasser les contradictions Extensibilité : spécialisation incrémentale Minimiser le biais du codage : knowledge level Minimiser l'engagement ontologique : partage Mardi 10 janvier 2006 28 Mardi 10 janvier 2006 [Maedche & Staab] Processus de construction 29 Étude de faisabilité ● ● ● ● ● Les systèmes de KM ne fonctionnent correctement que s'ils sont bien intégrés dans l'organisation Plusieurs facteurs (autres que technologiques) déterminent la réussite S'inspirer de Common KADS Bien délimiter le domaine Identifier les personnes impliquées Mardi 10 janvier 2006 30 Démarrage ● ● ● Établir un document de spécifications : ● Domaine, objectif, sources de connaissances disponibles, utilisateurs potentiels, cas d'utilisations, applications Analyser les sources de connaissances (où sont les compétences ? Quels concepts sont pertinents ? Y atil d'autres ontologies utilisables ? ...) Prototype (concepts et relations les plus importants) Mardi 10 janvier 2006 31 Raffinement ● ● ● Acquisition de la connaissance auprès des experts du domaine et de leurs documents Formalisation (DL, RDF, ...) : ● des choix à faire : l'âge d'une personne est une une caractéristique ? un concept ? ... ? Développement et raffinement de l'ontologie cible Mardi 10 janvier 2006 32 Évaluation ● ● ● Vérifier le document de spécifications : Tester avec une application cible Dépoyer l'ontologie Mardi 10 janvier 2006 33 Maintenance et évolutions ● ● Les choses changent : les conditions et les spécifications de l'ontologie aussi : ● Qui s'occupe de la maintenance ? ● Comment estce fait ? Comment évoluent les applications qui utilisent l'ontologie ? Mardi 10 janvier 2006 34 Réutilisation des ontologies ● ● ● C'est l'idée de départ En fait difficile car une ontologie est construite dans l'objectif d'une tâche précise Recherche sur les « upperontologies » Mardi 10 janvier 2006 35 Des outils existent ● ● ● ● ● ● ● OntoEdit / OntoKick KAON Protégé2000 OilEd VerticalNet Ontology Builder WebOde .... Mardi 10 janvier 2006 36 Plan du cours ● ● Logiques de description ● Notions de base, définitions ● Raisonnement ● Complexité ● Implémentations ● Applications Ontologies ● Définitions, exemples ● Représentations ● Constructions ● Utilisations Mardi 10 janvier 2006 37 Utilisations ● ● ● ● ● ● ● ● ● ● Web sémantique ecommerce Gestion des connaissances (compétences) Workflow, TCAO Extraction d'informations, recherche d'informations elearning Ingénierie des bases de données Traduction SMA ............. Mardi 10 janvier 2006 38