WebSem2 Onto

Transcription

WebSem2 Onto
Plan du cours
●
Logiques de description
●
●
●
●
Définitions
Sémantiques
Interprétations
Ontologies
●
●
●
●
Définitions
Représentations
Constructions
Utilisations
Lundi 18 octobre 2004
1
Histoire
●
Problèmes de réalisation des Systèmes
Experts (bases de connaissances) :
●
●
●
●
●
●
●
Complexité
Coûts financiers et temporels
Ré-utilisabilité
Variété des langages de représentation
Composabilité
Inter-opérabilité
Etc ...
Lundi 18 octobre 2004
2
Définitions
●
●
●
●
Ontologies (philo) : partie de la métaphysique qui
s'applique à l'être en tant qu'être, indépendamment
de ses déterminations particulières
Taxinomie (didact) : étude théorique des bases,
lois, règles, principes, d'une classification
Taxinomie : classification d'éléments
Ontologie (IC) : ensemble des objets reconnus
comme existant dans le domaine. Construire une
ontologie c'est aussi décider de la manière d'être et
d'exister des objets
Lundi 18 octobre 2004
3
Définitions (suite)
●
Ontologie : spécification explicite d'une
conceptualisation
●
●
●
Spécification explicite : donc avec un langage
Conceptualisation : structuration des concepts
Concept : désigné de 3 façons :
●
●
●
Son nom
Sa signification (sa définition en intension)
Les objets dénotés (sa définition en extension)
Lundi 18 octobre 2004
4
Exemple
●
●
●
Voiture, auto, automobile, tacot, ...
Véhicule de transport automobile conçu et
aménagé pour le transport d'un petit nombre
de personnes
La 2CV 234 DD 42, la clio truc 543 YA 42,
etc...
Lundi 18 octobre 2004
5
Relations
●
Une «relation» peut s'exprimer par son nom,
son intension, son extension :
●
●
●
●
«auteur»
personne qui crée une oeuvre
Hugo est l'auteur de Notre Dame de Paris et
Chateaubriand de Mémoires d'outre-tombe, ...
Généralisation (subsomption), spécialisation,
composition, ..., est fabriqué en, possède, ...
Lundi 18 octobre 2004
6
Philippe Martin, Griffith University
«Introduction to ontologies»
An ontology is a list of formal terms, i.e. identifiers for categories of
objects, plus machine-understandable statements defining a formal
meaning for these terms, in other words, some of their characteristics or
inter-relations, rules or constraints of use. These statements permit some
semantic checking on the manual introduction of new statements and
some logical inferencing to generate new statements, e.g. for information
retrieval purposes.
Relational database schemas may be viewed as simple forms of ontologies
but, although some dependency relations are represented, semantic
relations between the terms (column names) are most often not
explicited, and hence knowledge representation and inferencing is very
limited. In most knowledge-based systems (KBSs), the users are allowed
to add new categories, relations, rules or constraints. This dynamic
modification of the ontology, and the (potential) complexity of the
knowledge representations and inferencing, may be the reasons why so
few large-scale KBSs have been built [...]
Lundi 18 octobre 2004
7
Autre définition
●
Guarino :
En IA, une ontologie représente un artefact
d’ingénierie constitué par un vocabulaire
spécifique utilisé pour décrire une certaine
réalité, accompagné d’un ensemble
d’hypothèses implicites concernant la
signification des mots de ce vocabulaire
Lundi 18 octobre 2004
8
... C'est ... Ce n'est pas ...
Lundi 18 octobre 2004
9
Formalisations
●
cf. Nicola Guarino (http://www.loa-cnr.it/)
●
●
●
●
Espace de domaine = <D,W> où D est un domaine,
et W un ensemble d'états (ou mondes possibles)
n
D
Relation conceptuelle : ρ : W → 2
n
Une conceptualisation pour D : <D,W,R>
où R est un ensemble de relations conceptuelles
sur <D,W>
cf. aussi Thomas R. Gruber
http://ksl-web.stanford.edu/people/gruber/
Lundi 18 octobre 2004
10
Exercices
●
●
Synonymie :
●
Propos destiné à faire rire
●
Assemblage de feuilles imprimées
Homonymie :
●
●
●
●
Quantité relativement grande et d'un seul tenant d'une matière
Marteau à tête lourde et sans panne
Parties conductrices d'un appareil par lequel s'effectue le retour
du courant au générateur
Grandeur fondamentale liée à la quantité de matière que
contient un corps
Lundi 18 octobre 2004
11
Différents types d'ontologies
Concepts très généraux
indépendants du problème
(espace, temps, événement,
action, ...)
[Guarino]
Top-level ontology
Domain ontology
Concepts très spécifiques
correspondant aux rôles
joués par les entités du
domaine dans une certaine
activité
Lundi 18 octobre 2004
Task ontology
Vocabulaires généraux
d'un domaine (médecine,
automobile, ...)
Application ontology
12
Exemples d'ontologies
●
Ontologies générales :
●
●
●
●
Ontologies de domaine
●
●
Wordnet / EuroWordNet
The Upper Cyc Ontology
IEEE Standard Upper Ontology
RDF Site Summary, UMLS, RETSINA, Dublin
Core, KA2, ...
Méta-ontologies
●
Semantic Translation, RDFT, Evolution
Ontology
Lundi 18 octobre 2004
13
WordNet
●
●
http://www.cogsci.princeton.edu/~wn/index.shtml
WordNet® is an online lexical reference system
whose design is inspired by current psycholinguistic
theories of human lexical memory. English nouns,
verbs, adjectives and adverbs are organized into
synonym sets, each representing one underlying
lexical concept. Different relations link the
synonym sets.
Lundi 18 octobre 2004
14
Rich Site Summary
●
●
Anciennement : RDF Site Summary
Rich Site Summary (RSS) is a lightweight XML
format designed for sharing headlines and other
Web content. Think of it as a distributable "What's
New" for your site. Each story is defined by an
<item> tag, which contains a headline TITLE, URL,
and DESCRIPTION :
<item>
<title>RSS Resources</title>
<link>http://www.webreference.com/authoring/languages/xml/rss/</link>
<description>Defined in XML, the Rich Site Summary (RSS) format has quietly become a dominant
format for distributing headlines on the Web. Our list of links gives you the tools, tips and
tutorials you need to get started using RSS. 0323</description>
</item>
Lundi 18 octobre 2004
15
UMLS
●
●
●
Unified Medical Language System
http://umlsks.nlm.nih.gov
NLM's Unified Medical Language System (UMLS) project
develops and distributes multi-purpose, electronic
"Knowledge Sources" and associated lexical programs.
System developers can use the UMLS products to enhance
their applications -- in systems focused on patient data,
digital libraries, Web and bibliographic retrieval, natural
language processing, and decision support. Researchers will
find the UMLS products useful in investigating knowledge
representation and retrieval questions.
Lundi 18 octobre 2004
16
UMLS (suite)
●
●
●
●
●
Metathesaurus
Réseau sémantique
NLP tools
Knowledge Source Server
MetamorphoSys
Lundi 18 octobre 2004
17
RETSINA SEMANTIC WEB CALENDAR AGENT
●
●
http://www.daml.ri.cmu.edu/Cal/
The Retsina Semantic Web Calendar Agent provides
interoperability between RDF based calendar descriptions on the
web, and Personal Information Manager (PIM) Systems such as
Microsoft's Outlook. Schedules and events can be described on
the web in RDF, using existing ontologies such as the
Hybrid iCal-like RDF Schema or the Dublin Core ontology, and
linked to individual's contact information described, for example,
at their home page. The Retsina Semantic Web Calendar Agent,
consists of a Distributed Meeting Scheduling Engine and the
RETSINA Semantic Web Calendar Parser. The agent assists in
organising and scheduling meetings between several individuals,
and coordinates these based on existing schedules maintained by
MS Outlook.
Lundi 18 octobre 2004
18
Dublin Core
●
http://dublincore.org/
●
The Dublin Core Metadata Initiative is an open forum
engaged in the development of interoperable online metadata
standards that support a broad range of purposes and
business models.
●
The Dublin Core metadata standard is a simple yet effective
element set for describing a wide range of networked resources.
The Dublin Core standard includes two levels: Simple and
Qualified. Simple Dublin Core comprises fifteen elements;
Qualified Dublin Core includes an additional element, Audience,
as well as a group of element refinements (also called qualifiers)
that refine the semantics of the elements in ways that may be
useful in resource discovery
Lundi 18 octobre 2004
19
Plan du cours
●
Logiques de description
●
●
●
●
Définitions
Sémantiques
Interprétations
Ontologies
●
●
●
●
Définitions, exemples
Représentations
Constructions
Utilisations
Lundi 18 octobre 2004
20
Paradigmes de représentation
●
●
●
●
●
●
●
●
Thésaurus
Taxinomies
Modèle étendu ER
Logiques (des prédicats, de description, ...)
Réseaux sémantiques
Topic Maps
RDF et RDFS
...
Lundi 18 octobre 2004
21
Thésaurus
●
●
●
●
Graphes dont les arcs sont étiquetés
Arcs : similarité, proximité, synonymie, ...
Pas d'instances
Pas moyen de représenter des concepts un
peu compliqués
soprano
definition
The highest category of female (or artificial male) voice.
broader term(s)
vocalist, singer
narrower term(s)
lyric soprano, dramatic soprano, coloratura soprano
related term(s)
mezzo-soprano, treble
Lundi 18 octobre 2004
22
Topic Maps (1)
●
●
●
Standardisation ISO
Application XML : XTM
But :
●
●
●
Gérer la surabondance d'informations
Construire des réseaux de connaissances sur
n'importe quelles ressources
Structurer l'information
Lundi 18 octobre 2004
23
Topic Maps (2)
●
A Topic Map defines three main sorts of information:
● Topics, which are things or concepts that you're
interested in
● Associations, which help you relate one topic to
another, and therefore help you to navigate around
your subject of interest and
● Occurrences, which are information resources that
relate to the topics. You can use them to locate books,
articles, files, web pages and other relevant resources.
Lundi 18 octobre 2004
24
Topic Maps (3)
Gorda Sound see North Sound
Little Dix Bay .................... 89
North Sound ....................... 90
Road Harbour see also Road Town ... 73
Road Town ...................... 69,71
Spanish Town ................... 81,82
Tortola ........................... 67
Virgin Gorda ...................... 77
cf. « The Topic Maps Handbook» :
http://www.empolis.com/download/docs/whitepapers/empolistopicmapswhitepaper_eng.pdf
Lundi 18 octobre 2004
25
Plan du cours
●
Logiques de description
●
●
●
●
Définitions
Sémantiques
Interprétations
Ontologies
●
●
●
●
Définitions, exemples
Représentations
Constructions
Utilisations
Lundi 18 octobre 2004
26
Conception : principes
[Thomas R. Gruber]
●
●
●
●
●
Clarté : être objectif, documentations
Cohérence : chasser les contradictions
Extensibilité : spécialisation incrémentale
Minimiser le biais du codage : knowledge
level
Minimiser l'engagement ontologique : partage
Lundi 18 octobre 2004
27
Lundi 18 octobre 2004
[Maedche & Staab]
Processus de construction
28
Étude de faisabilité
●
●
●
●
●
Les systèmes de KM ne fonctionnent
correctement que s'ils sont bien intégrés dans
l'organisation
Plusieurs facteurs (autres que
technologiques) déterminent la réussite
S'inspirer de Common KADS
Bien délimiter le domaine
Identifier les personnes impliquées
Lundi 18 octobre 2004
29
Démarrage
●
Établir un document de spécifications :
●
●
●
Domaine, objectif, sources de connaissances
disponibles, utilisateurs potentiels, cas
d'utilisations, applications
Analyser les sources de connaissances (où
sont les compétences ? Quels concepts sont
pertinents ? Y a-t-il d'autres ontologies
utilisables ? ...)
Prototype (concepts et relations les plus
importants)
Lundi 18 octobre 2004
30
Raffinement
●
●
Acquisition de la connaissance auprès des
experts du domaine et de leurs documents
Formalisation (DL, RDF, ...) :
●
●
des choix à faire : l'âge d'une personne est une
une caractéristique ? un concept ? ... ?
Développement et raffinement de l'ontologie
cible
Lundi 18 octobre 2004
31
Évaluation
●
●
●
Vérifier le document de spécifications :
Tester avec une application cible
Dépoyer l'ontologie
Lundi 18 octobre 2004
32
Maintenance et évolutions
●
Les choses changent : les conditions et les
spécifications de l'ontologie aussi :
●
●
●
Qui s'occupe de la maintenance ?
Comment est-ce fait ?
Comment évoluent les applications qui
utilisent l'ontologie ?
Lundi 18 octobre 2004
33
Des outils existent
●
●
●
●
●
●
●
OntoEdit / OntoKick
KAON
Protégé-2000
OilEd
VerticalNet Ontology Builder
WebOde
....
Lundi 18 octobre 2004
34
Plan du cours
●
Logiques de description
●
●
●
●
Définitions
Sémantiques
Interprétations
Ontologies
●
●
●
●
Définitions, exemples
Représentations
Constructions
Utilisations
Lundi 18 octobre 2004
35
Utilisations
●
●
●
●
●
●
●
●
●
●
Web sémantique
e-commerce
Gestion des connaissances (compétences)
Workflow, TCAO
Extraction d'informations, recherche d'informations
e-learning
Ingénierie des bases de données
Traduction
SMA
.............
Lundi 18 octobre 2004
36