WebSem2 Onto

Transcription

WebSem2 Onto
Plan du cours
●
●
Logiques de description
●
Notions de base, définitions
●
Raisonnement
● Complexité
● Implémentations
● Applications
Ontologies
●
Définitions, exemples
● Représentations
● Constructions
●
Utilisations
Mardi 10 janvier 2006
1
Histoire
●
Problèmes de réalisation des Systèmes Experts (bases de connaissances) :
●
Complexité
●
Coûts financiers et temporels
● Ré­utilisabilité
●
Variété des langages de représentation
●
Composabilité
●
Inter­opérabilité
●
Etc ...
Mardi 10 janvier 2006
2
Définitions
●
●
●
●
Ontologies (philo) : partie de la métaphysique qui s'applique à l'être en tant qu'être, indépendamment de ses déterminations particulières
Taxinomie (didact) : étude théorique des bases, lois, règles, principes, d'une classification
Taxinomie : classification d'éléments
Ontologie (IC) : ensemble des objets reconnus comme existant dans le domaine. Construire une ontologie c'est aussi décider de la manière d'être et d'exister des objets
Mardi 10 janvier 2006
3
Définitions (suite)
●
●
Ontologie : spécification explicite d'une conceptualisation
●
Spécification explicite : donc avec un langage
●
Conceptualisation : structuration des concepts
Concept : désigné de 3 façons :
●
Son nom
●
Sa signification (sa définition en intension)
● Les objets dénotés (sa définition en extension)
Mardi 10 janvier 2006
4
Exemple
●
●
●
Voiture, auto, automobile, tacot, ...
Véhicule de transport automobile conçu et aménagé pour le transport d'un petit nombre de personnes
La 2CV 234 DD 42, la clio truc 543 YA 42, etc...
Mardi 10 janvier 2006
5
Relations
●
●
Une «relation» peut s'exprimer par son nom, son intension, son extension :
●
«auteur»
●
personne qui crée une oeuvre
●
Hugo est l'auteur de Notre Dame de Paris et Chateaubriand de Mémoires d'outre­tombe, ...
Généralisation (subsomption), spécialisation, composition, ..., est fabriqué en, possède, ...
Mardi 10 janvier 2006
6
Objectifs des ontologies
●
●
Permettre un traitement symbolique des connaissances, but premier de l'IA, rejoint celui du Web Sémantique.
Faire faire des traitements automatiques à des logiciels au sein du Web pour faire interopérer des machines ou des machines et des humains.
Mardi 10 janvier 2006
7
Rôle des ontologies
●
●
●
●
Vocabulaire, structuration et exploitation des méta­données
Représentation pivot pour l'intégration de sources de données hétérogènes
Décrire les services Web
...
Mardi 10 janvier 2006
8
Philippe Martin, Griffith University «Introduction to ontologies»
An ontology is a list of formal terms, i.e. identifiers for categories of objects, plus machine­understandable statements defining a formal meaning for these terms, in other words, some of their characteristics or inter­relations, rules or constraints of use. These statements permit some semantic checking on the manual introduction of new statements and some logical inferencing to generate new statements, e.g. for information retrieval purposes.
Relational database schemas may be viewed as simple forms of ontologies but, although some dependency relations are represented, semantic relations between the terms (column names) are most often not explicited, and hence knowledge representation and inferencing is very limited. In most knowledge­
based systems (KBSs), the users are allowed to add new categories, relations, rules or constraints. This dynamic modification of the ontology, and the (potential) complexity of the knowledge representations and inferencing, may be the reasons why so few large­scale KBSs have been built [...]
Mardi 10 janvier 2006
9
Autre définition
●
Guarino :
En IA, une ontologie représente un artefact d’ingénierie constitué par un vocabulaire spécifique utilisé pour décrire une certaine réalité, accompagné d’un ensemble d’hypothèses implicites concernant la signification des mots de ce vocabulaire
Mardi 10 janvier 2006
10
... C'est ... Ce n'est pas ...
Mardi 10 janvier 2006
11
Formalisations
●
cf. Nicola Guarino (http://www.loa­cnr.it/)
●
Espace de domaine = <D,W> où D est un domaine, et W un ensemble d'états (ou mondes possibles)
n
●
n
D
Relation conceptuelle :  : W  2
●
Une conceptualisation pour D : <D,W,R>
où R est un ensemble de relations conceptuelles sur <D,W>
●
cf. aussi Thomas R. Gruber
http://ksl­web.stanford.edu/people/gruber/
Mardi 10 janvier 2006
12
Exercices
●
●
Synonymie :
●
Propos destiné à faire rire
●
Assemblage de feuilles imprimées
Homonymie :
●
●
●
●
Quantité relativement grande et d'un seul tenant d'une matière
Marteau à tête lourde et sans panne
Parties conductrices d'un appareil par lequel s'effectue le retour du courant au générateur
Grandeur fondamentale liée à la quantité de matière que contient un corps
Mardi 10 janvier 2006
13
Différents types d'ontologies
Concepts très généraux
indépendants du problème
(espace, temps, événement,
action, ...)
[Guarino]
Top­level ontology
Domain ontology
Task ontology
Vocabulaires généraux
d'un domaine (médecine,
automobile, ...)
Concepts très spécifiques
correspondant aux rôles
Application ontology
joués par les entités du
domaine dans une certaine
activité
Mardi 10 janvier 2006
14
Exemples d'ontologies
●
●
●
Ontologies générales :
●
Wordnet / EuroWordNet
●
The Upper Cyc Ontology
●
IEEE Standard Upper Ontology
Ontologies de domaine
●
UMLS, RETSINA, Dublin Core, KA2, ...
Méta­ontologies
●
Semantic Translation, RDFT, Evolution Ontology
Mardi 10 janvier 2006
15
WordNet
●
●
http://www.cogsci.princeton.edu/~wn/index.shtml
WordNet® is an online lexical reference system whose design is inspired by current psycholinguistic theories of human lexical memory. English nouns, verbs, adjectives and adverbs are organized into synonym sets, each representing one underlying lexical concept. Different relations link the synonym sets. Mardi 10 janvier 2006
16
UMLS
●
●
●
Unified Medical Language System
http://umlsks.nlm.nih.gov
NLM's Unified Medical Language System (UMLS) project develops and distributes multi­purpose, electronic "Knowledge Sources" and associated lexical programs. System developers can use the UMLS products to enhance their applications ­­ in systems focused on patient data, digital libraries, Web and bibliographic retrieval, natural language processing, and decision support. Researchers will find the UMLS products useful in investigating knowledge representation and retrieval questions. Mardi 10 janvier 2006
17
UMLS (suite)
●
●
●
●
●
Metathesaurus
Réseau sémantique
NLP tools
Knowledge Source Server
MetamorphoSys
Mardi 10 janvier 2006
18
RETSINA
SEMANTIC WEB CALENDAR AGENT
●
●
http://www.daml.ri.cmu.edu/Cal/
The Retsina Semantic Web Calendar Agent provides interoperability between RDF based calendar descriptions on the web, and Personal Information Manager (PIM) Systems such as Microsoft's Outlook. Schedules and events can be described on the web in RDF, using existing ontologies such as the Hybrid iCal­like RDF Schema or the Dublin Core ontology, and linked to individual's contact information described, for example, at their home page. The Retsina Semantic Web Calendar Agent, consists of a Distributed Meeting Scheduling Engine and the RETSINA Semantic Web Calendar Parser. The agent assists in organising and scheduling meetings between several individuals, and coordinates these based on existing schedules maintained by MS Outlook. Mardi 10 janvier 2006
19
Dublin Core
●
●
●
http://dublincore.org/
The Dublin Core Metadata Initiative is an open forum engaged in the development of interoperable online metadata standards that support a broad range of purposes and business models.
The Dublin Core metadata standard is a simple yet effective element set for describing a wide range of networked resources. The Dublin Core standard includes two levels: Simple and Qualified. Simple Dublin Core comprises fifteen elements; Qualified Dublin Core includes an additional element, Audience, as well as a group of element refinements (also called qualifiers) that refine the semantics of the elements in ways that may be useful in resource discovery
Mardi 10 janvier 2006
20
Plan du cours
●
●
Logiques de description
●
Notions de base, définitions
●
Raisonnement
● Complexité
● Implémentations
● Applications
Ontologies
●
Définitions, exemples
● Représentations
● Constructions
●
Utilisations
Mardi 10 janvier 2006
21
Paradigmes de représentation
●
●
●
●
●
●
●
●
Thésaurus
Taxinomies
Modèle étendu ER
Logiques (des prédicats, de description, ...)
Réseaux sémantiques
Topic Maps
RDF et RDFS
...
Mardi 10 janvier 2006
22
Thésaurus
●
●
●
●
Graphes dont les arcs sont étiquetés
Arcs : similarité, proximité, synonymie, ...
Pas d'instances
Pas moyen de représenter des concepts un peu compliqués
soprano
definition The highest category of female (or artificial male) voice.
broader term(s) vocalist, singer
narrower term(s) lyric soprano, dramatic soprano, coloratura soprano
related term(s) mezzo­soprano, treble
Mardi 10 janvier 2006
23
Topic Maps (1)
●
●
●
Standardisation ISO
Application XML : XTM
But :
● Gérer la surabondance d'informations
●
Construire des réseaux de connaissances sur n'importe quelles ressources
●
Structurer l'information
Mardi 10 janvier 2006
24
Topic Maps (2)
A Topic Map defines three main sorts of information: ●
●
●
●
Topics, which are things or concepts that you're interested in
and their names
Associations, which help you relate one topic to another, and therefore help you to navigate around your subject of interest and Occurrences, which are information resources that relate to the topics. You can use them to locate books, articles, files, web pages and other relevant resources.
Mardi 10 janvier 2006
●
25
Topic Maps (3)
Gorda Sound see North Sound
Little Dix Bay .................... 89
North Sound ....................... 90
Road Harbour see also Road Town ... 73
Road Town ...................... 69,71
Spanish Town ................... 81,82
Tortola ........................... 67
Virgin Gorda ...................... 77
cf. « The Topic Maps Handbook» :
http://www.empolis.com/downloads/empolis_TopicMaps_Whitepaper20030206.pdf
Mardi 10 janvier 2006
26
Plan du cours
●
●
Logiques de description
●
Notions de base, définitions
●
Raisonnement
● Complexité
● Implémentations
● Applications
Ontologies
●
Définitions, exemples
● Représentations
● Constructions
●
Utilisations
Mardi 10 janvier 2006
27
Conception : principes
[Thomas R. Gruber]
●
●
●
●
●
Clarté : être objectif, documentations
Cohérence : chasser les contradictions
Extensibilité : spécialisation incrémentale
Minimiser le biais du codage : knowledge level
Minimiser l'engagement ontologique : partage
Mardi 10 janvier 2006
28
Mardi 10 janvier 2006
[Maedche & Staab]
Processus de construction
29
Étude de faisabilité
●
●
●
●
●
Les systèmes de KM ne fonctionnent correctement que s'ils sont bien intégrés dans l'organisation
Plusieurs facteurs (autres que technologiques) déterminent la réussite
S'inspirer de Common KADS
Bien délimiter le domaine
Identifier les personnes impliquées
Mardi 10 janvier 2006
30
Démarrage
●
●
●
Établir un document de spécifications :
●
Domaine, objectif, sources de connaissances disponibles, utilisateurs potentiels, cas d'utilisations, applications
Analyser les sources de connaissances (où sont les compétences ? Quels concepts sont pertinents ? Y a­t­il d'autres ontologies utilisables ? ...)
Prototype (concepts et relations les plus importants)
Mardi 10 janvier 2006
31
Raffinement
●
●
●
Acquisition de la connaissance auprès des experts du domaine et de leurs documents
Formalisation (DL, RDF, ...) : ● des choix à faire : l'âge d'une personne est une une caractéristique ? un concept ? ... ?
Développement et raffinement de l'ontologie cible
Mardi 10 janvier 2006
32
Évaluation
●
●
●
Vérifier le document de spécifications :
Tester avec une application cible
Dépoyer l'ontologie Mardi 10 janvier 2006
33
Maintenance et évolutions
●
●
Les choses changent : les conditions et les spécifications de l'ontologie aussi :
●
Qui s'occupe de la maintenance ?
●
Comment est­ce fait ?
Comment évoluent les applications qui utilisent l'ontologie ?
Mardi 10 janvier 2006
34
Réutilisation des ontologies
●
●
●
C'est l'idée de départ
En fait difficile car une ontologie est construite dans l'objectif d'une tâche précise
Recherche sur les « upper­ontologies »
Mardi 10 janvier 2006
35
Des outils existent
●
●
●
●
●
●
●
OntoEdit / OntoKick
KAON
Protégé­2000
OilEd
VerticalNet Ontology Builder
WebOde
....
Mardi 10 janvier 2006
36
Plan du cours
●
●
Logiques de description
●
Notions de base, définitions
●
Raisonnement
● Complexité
● Implémentations
● Applications
Ontologies
●
Définitions, exemples
● Représentations
● Constructions
●
Utilisations
Mardi 10 janvier 2006
37
Utilisations ●
●
●
●
●
●
●
●
●
●
Web sémantique
e­commerce
Gestion des connaissances (compétences)
Workflow, TCAO
Extraction d'informations, recherche d'informations
e­learning
Ingénierie des bases de données
Traduction
SMA
.............
Mardi 10 janvier 2006
38