WebSem2 Onto
Transcription
WebSem2 Onto
Plan du cours ● Logiques de description ● ● ● ● Définitions Sémantiques Interprétations Ontologies ● ● ● ● Définitions Représentations Constructions Utilisations Lundi 18 octobre 2004 1 Histoire ● Problèmes de réalisation des Systèmes Experts (bases de connaissances) : ● ● ● ● ● ● ● Complexité Coûts financiers et temporels Ré-utilisabilité Variété des langages de représentation Composabilité Inter-opérabilité Etc ... Lundi 18 octobre 2004 2 Définitions ● ● ● ● Ontologies (philo) : partie de la métaphysique qui s'applique à l'être en tant qu'être, indépendamment de ses déterminations particulières Taxinomie (didact) : étude théorique des bases, lois, règles, principes, d'une classification Taxinomie : classification d'éléments Ontologie (IC) : ensemble des objets reconnus comme existant dans le domaine. Construire une ontologie c'est aussi décider de la manière d'être et d'exister des objets Lundi 18 octobre 2004 3 Définitions (suite) ● Ontologie : spécification explicite d'une conceptualisation ● ● ● Spécification explicite : donc avec un langage Conceptualisation : structuration des concepts Concept : désigné de 3 façons : ● ● ● Son nom Sa signification (sa définition en intension) Les objets dénotés (sa définition en extension) Lundi 18 octobre 2004 4 Exemple ● ● ● Voiture, auto, automobile, tacot, ... Véhicule de transport automobile conçu et aménagé pour le transport d'un petit nombre de personnes La 2CV 234 DD 42, la clio truc 543 YA 42, etc... Lundi 18 octobre 2004 5 Relations ● Une «relation» peut s'exprimer par son nom, son intension, son extension : ● ● ● ● «auteur» personne qui crée une oeuvre Hugo est l'auteur de Notre Dame de Paris et Chateaubriand de Mémoires d'outre-tombe, ... Généralisation (subsomption), spécialisation, composition, ..., est fabriqué en, possède, ... Lundi 18 octobre 2004 6 Philippe Martin, Griffith University «Introduction to ontologies» An ontology is a list of formal terms, i.e. identifiers for categories of objects, plus machine-understandable statements defining a formal meaning for these terms, in other words, some of their characteristics or inter-relations, rules or constraints of use. These statements permit some semantic checking on the manual introduction of new statements and some logical inferencing to generate new statements, e.g. for information retrieval purposes. Relational database schemas may be viewed as simple forms of ontologies but, although some dependency relations are represented, semantic relations between the terms (column names) are most often not explicited, and hence knowledge representation and inferencing is very limited. In most knowledge-based systems (KBSs), the users are allowed to add new categories, relations, rules or constraints. This dynamic modification of the ontology, and the (potential) complexity of the knowledge representations and inferencing, may be the reasons why so few large-scale KBSs have been built [...] Lundi 18 octobre 2004 7 Autre définition ● Guarino : En IA, une ontologie représente un artefact d’ingénierie constitué par un vocabulaire spécifique utilisé pour décrire une certaine réalité, accompagné d’un ensemble d’hypothèses implicites concernant la signification des mots de ce vocabulaire Lundi 18 octobre 2004 8 ... C'est ... Ce n'est pas ... Lundi 18 octobre 2004 9 Formalisations ● cf. Nicola Guarino (http://www.loa-cnr.it/) ● ● ● ● Espace de domaine = <D,W> où D est un domaine, et W un ensemble d'états (ou mondes possibles) n D Relation conceptuelle : ρ : W → 2 n Une conceptualisation pour D : <D,W,R> où R est un ensemble de relations conceptuelles sur <D,W> cf. aussi Thomas R. Gruber http://ksl-web.stanford.edu/people/gruber/ Lundi 18 octobre 2004 10 Exercices ● ● Synonymie : ● Propos destiné à faire rire ● Assemblage de feuilles imprimées Homonymie : ● ● ● ● Quantité relativement grande et d'un seul tenant d'une matière Marteau à tête lourde et sans panne Parties conductrices d'un appareil par lequel s'effectue le retour du courant au générateur Grandeur fondamentale liée à la quantité de matière que contient un corps Lundi 18 octobre 2004 11 Différents types d'ontologies Concepts très généraux indépendants du problème (espace, temps, événement, action, ...) [Guarino] Top-level ontology Domain ontology Concepts très spécifiques correspondant aux rôles joués par les entités du domaine dans une certaine activité Lundi 18 octobre 2004 Task ontology Vocabulaires généraux d'un domaine (médecine, automobile, ...) Application ontology 12 Exemples d'ontologies ● Ontologies générales : ● ● ● ● Ontologies de domaine ● ● Wordnet / EuroWordNet The Upper Cyc Ontology IEEE Standard Upper Ontology RDF Site Summary, UMLS, RETSINA, Dublin Core, KA2, ... Méta-ontologies ● Semantic Translation, RDFT, Evolution Ontology Lundi 18 octobre 2004 13 WordNet ● ● http://www.cogsci.princeton.edu/~wn/index.shtml WordNet® is an online lexical reference system whose design is inspired by current psycholinguistic theories of human lexical memory. English nouns, verbs, adjectives and adverbs are organized into synonym sets, each representing one underlying lexical concept. Different relations link the synonym sets. Lundi 18 octobre 2004 14 Rich Site Summary ● ● Anciennement : RDF Site Summary Rich Site Summary (RSS) is a lightweight XML format designed for sharing headlines and other Web content. Think of it as a distributable "What's New" for your site. Each story is defined by an <item> tag, which contains a headline TITLE, URL, and DESCRIPTION : <item> <title>RSS Resources</title> <link>http://www.webreference.com/authoring/languages/xml/rss/</link> <description>Defined in XML, the Rich Site Summary (RSS) format has quietly become a dominant format for distributing headlines on the Web. Our list of links gives you the tools, tips and tutorials you need to get started using RSS. 0323</description> </item> Lundi 18 octobre 2004 15 UMLS ● ● ● Unified Medical Language System http://umlsks.nlm.nih.gov NLM's Unified Medical Language System (UMLS) project develops and distributes multi-purpose, electronic "Knowledge Sources" and associated lexical programs. System developers can use the UMLS products to enhance their applications -- in systems focused on patient data, digital libraries, Web and bibliographic retrieval, natural language processing, and decision support. Researchers will find the UMLS products useful in investigating knowledge representation and retrieval questions. Lundi 18 octobre 2004 16 UMLS (suite) ● ● ● ● ● Metathesaurus Réseau sémantique NLP tools Knowledge Source Server MetamorphoSys Lundi 18 octobre 2004 17 RETSINA SEMANTIC WEB CALENDAR AGENT ● ● http://www.daml.ri.cmu.edu/Cal/ The Retsina Semantic Web Calendar Agent provides interoperability between RDF based calendar descriptions on the web, and Personal Information Manager (PIM) Systems such as Microsoft's Outlook. Schedules and events can be described on the web in RDF, using existing ontologies such as the Hybrid iCal-like RDF Schema or the Dublin Core ontology, and linked to individual's contact information described, for example, at their home page. The Retsina Semantic Web Calendar Agent, consists of a Distributed Meeting Scheduling Engine and the RETSINA Semantic Web Calendar Parser. The agent assists in organising and scheduling meetings between several individuals, and coordinates these based on existing schedules maintained by MS Outlook. Lundi 18 octobre 2004 18 Dublin Core ● http://dublincore.org/ ● The Dublin Core Metadata Initiative is an open forum engaged in the development of interoperable online metadata standards that support a broad range of purposes and business models. ● The Dublin Core metadata standard is a simple yet effective element set for describing a wide range of networked resources. The Dublin Core standard includes two levels: Simple and Qualified. Simple Dublin Core comprises fifteen elements; Qualified Dublin Core includes an additional element, Audience, as well as a group of element refinements (also called qualifiers) that refine the semantics of the elements in ways that may be useful in resource discovery Lundi 18 octobre 2004 19 Plan du cours ● Logiques de description ● ● ● ● Définitions Sémantiques Interprétations Ontologies ● ● ● ● Définitions, exemples Représentations Constructions Utilisations Lundi 18 octobre 2004 20 Paradigmes de représentation ● ● ● ● ● ● ● ● Thésaurus Taxinomies Modèle étendu ER Logiques (des prédicats, de description, ...) Réseaux sémantiques Topic Maps RDF et RDFS ... Lundi 18 octobre 2004 21 Thésaurus ● ● ● ● Graphes dont les arcs sont étiquetés Arcs : similarité, proximité, synonymie, ... Pas d'instances Pas moyen de représenter des concepts un peu compliqués soprano definition The highest category of female (or artificial male) voice. broader term(s) vocalist, singer narrower term(s) lyric soprano, dramatic soprano, coloratura soprano related term(s) mezzo-soprano, treble Lundi 18 octobre 2004 22 Topic Maps (1) ● ● ● Standardisation ISO Application XML : XTM But : ● ● ● Gérer la surabondance d'informations Construire des réseaux de connaissances sur n'importe quelles ressources Structurer l'information Lundi 18 octobre 2004 23 Topic Maps (2) ● A Topic Map defines three main sorts of information: ● Topics, which are things or concepts that you're interested in ● Associations, which help you relate one topic to another, and therefore help you to navigate around your subject of interest and ● Occurrences, which are information resources that relate to the topics. You can use them to locate books, articles, files, web pages and other relevant resources. Lundi 18 octobre 2004 24 Topic Maps (3) Gorda Sound see North Sound Little Dix Bay .................... 89 North Sound ....................... 90 Road Harbour see also Road Town ... 73 Road Town ...................... 69,71 Spanish Town ................... 81,82 Tortola ........................... 67 Virgin Gorda ...................... 77 cf. « The Topic Maps Handbook» : http://www.empolis.com/download/docs/whitepapers/empolistopicmapswhitepaper_eng.pdf Lundi 18 octobre 2004 25 Plan du cours ● Logiques de description ● ● ● ● Définitions Sémantiques Interprétations Ontologies ● ● ● ● Définitions, exemples Représentations Constructions Utilisations Lundi 18 octobre 2004 26 Conception : principes [Thomas R. Gruber] ● ● ● ● ● Clarté : être objectif, documentations Cohérence : chasser les contradictions Extensibilité : spécialisation incrémentale Minimiser le biais du codage : knowledge level Minimiser l'engagement ontologique : partage Lundi 18 octobre 2004 27 Lundi 18 octobre 2004 [Maedche & Staab] Processus de construction 28 Étude de faisabilité ● ● ● ● ● Les systèmes de KM ne fonctionnent correctement que s'ils sont bien intégrés dans l'organisation Plusieurs facteurs (autres que technologiques) déterminent la réussite S'inspirer de Common KADS Bien délimiter le domaine Identifier les personnes impliquées Lundi 18 octobre 2004 29 Démarrage ● Établir un document de spécifications : ● ● ● Domaine, objectif, sources de connaissances disponibles, utilisateurs potentiels, cas d'utilisations, applications Analyser les sources de connaissances (où sont les compétences ? Quels concepts sont pertinents ? Y a-t-il d'autres ontologies utilisables ? ...) Prototype (concepts et relations les plus importants) Lundi 18 octobre 2004 30 Raffinement ● ● Acquisition de la connaissance auprès des experts du domaine et de leurs documents Formalisation (DL, RDF, ...) : ● ● des choix à faire : l'âge d'une personne est une une caractéristique ? un concept ? ... ? Développement et raffinement de l'ontologie cible Lundi 18 octobre 2004 31 Évaluation ● ● ● Vérifier le document de spécifications : Tester avec une application cible Dépoyer l'ontologie Lundi 18 octobre 2004 32 Maintenance et évolutions ● Les choses changent : les conditions et les spécifications de l'ontologie aussi : ● ● ● Qui s'occupe de la maintenance ? Comment est-ce fait ? Comment évoluent les applications qui utilisent l'ontologie ? Lundi 18 octobre 2004 33 Des outils existent ● ● ● ● ● ● ● OntoEdit / OntoKick KAON Protégé-2000 OilEd VerticalNet Ontology Builder WebOde .... Lundi 18 octobre 2004 34 Plan du cours ● Logiques de description ● ● ● ● Définitions Sémantiques Interprétations Ontologies ● ● ● ● Définitions, exemples Représentations Constructions Utilisations Lundi 18 octobre 2004 35 Utilisations ● ● ● ● ● ● ● ● ● ● Web sémantique e-commerce Gestion des connaissances (compétences) Workflow, TCAO Extraction d'informations, recherche d'informations e-learning Ingénierie des bases de données Traduction SMA ............. Lundi 18 octobre 2004 36