Une expérience de construction d`ontologie d`application pour

Transcription

Une expérience de construction d`ontologie d`application pour
Une expérience de construction d'ontologie d’application pour
indexer les ressources d’une formation en statistique
Brigitte Chaput1, Ahcene Benayache2, Catherine Barry3, Marie-Hélène Abel2
1
Equipe SaSo, groupe NTE
Université de Picardie Jules Verne 33 rue Saint Leu Bât F
80039 AMIENS CEDEX 1, France
[email protected]
2
UMR CNRS 6599, BP 20529
60205 COMPIEGNE CEDEX, France
{ahcene.benayache, marie-helene.abel}@hds.utc.fr
3
Laboratoire de Recherche en Informatique d’Amiens (LaRIA),
5 rue Moulin Neuf 80000 AMIENS CEDEX, France
[email protected]
Résumé :
La croissance et la diversité des ressources informationnelles utilisées dans le cadre d’une
formation de type e-learning génèrent des problèmes d’accès, de classification et de gestion. Nous
présentons ici un travail de recherche axé sur l'utilisation d'une mémoire organisationnelle pour
rendre accessibles les différentes ressources liés à une formation. Ceci se fait par l'utilisation
d'ontologies permettant d’une part de définir les notions à appréhender et de les relier entre elles et
d’autre part, d'indexer les ressources décrivant ces notions en tenant compte du contexte de
l’enseignement considéré. Ce travail est en cours de réalisation pour le module B31.1,
"Mathématiques appliquées" dispensé en Licence MIAGE à l'Université Picardie Jules Verne
d'Amiens.
MOTS-CLES : Statistique inférentielle, Mémoire organisationnelle, Ontologie, e-learning.
Summary :
The development and diversity of information resources used in e-learning training generate
problems of access, classification and management. The following research work is about the use of
an organizational memory aiming at providing easy access to the different resources related to a
training course. The process uses ontologies which make it possible not only to define the notions
to be understood and to link them but also to index the resources which describe these notions while
taking into account the context of the considered teaching. This research work is being carried out
for course B 31.1 "Applied mathematics" which is part of Licence MIAGE at the Picardie Jules
Verne University of Amiens.
KEY WORDS : Statistical inference, Organizational memory, Ontology, e-learning.
De nombreux documents et plus généralement de nombreuses ressources peuvent être utilisés dans
le cadre d’une e-formation. Certaines de ces ressources sont produites "en interne" par les différents
acteurs impliqués dans la formation, d’autres sont disponibles sur le Web. Le problème de leur
accès et de leur gestion se trouve ainsi posé, renforcé par le nombre croissant de ressources
disponibles. Les Technologies de l’Information et de la Communication (TIC) peuvent contribuer à
la diffusion des connaissances et des informations pour en favoriser le partage. Cependant, pour
éviter la surinformation, la diffusion doit être guidée pour fournir la bonne information au bon
moment. Cette problématique d’accès et de gestion est abordée dans différents domaines de
recherche tels que, par exemple, l’ingénierie des connaissances qui a permis l'émergence de
méthodes pour capitaliser et rendre explicites des connaissances dans une organisation.
1. Le projet MEMORAe1
Une formation est constituée d’acteurs (apprenants, enseignants, personnels administratifs...), de
différentes ressources (définitions, exercices, études de cas...) rédigées sous différentes formes
(livres, rapports, sites Web...) et sur différents supports (papier, vidéo, audio...), ainsi que de
connaissances et de compétences qu’elle doit apporter. En ce sens, une formation est une
organisation. C’est pourquoi dans le cadre du projet MEMORAe, nous proposons d'en gérer les
ressources, les informations et les connaissances au moyen d’une mémoire organisationnelle de
formation basée sur des ontologies [1], constituées de concepts et de relations qui les relient. Cette
mémoire sera évaluée dans le contexte d’une formation e-learning, elle sera d’ailleurs mise à
disposition des utilisateurs via le Web. Elle se distingue d’une mémoire organisationnelle
classique [2] par sa finalité qui est de mettre à disposition des utilisateurs un contenu et de le
présenter pédagogiquement. Ce contenu est le résultat de la capitalisation des connaissances,
ressources et informations relatives à la formation.
Dans notre mémoire nous distinguons deux types d’ontologies :
1. Une ontologie du domaine qui définit des concepts nécessaires à toute formation, tels que :
livres, supports de cours, enseignants, apprenants, etc.
2. Des ontologies d’applications, une par formation considérée, qui définissent les concepts
propres à une application donnée (notions à appréhender) dans un contexte précis. Dans ce
cadre, nous construisons actuellement une ontologie pour le module B31.1 de mathématiques
appliquées suivi par les étudiants de l’IUP (Institut Universitaire Professionnalisé) MIAGE
(Méthodes Informatiques Appliquées à la Gestion des Entreprises) de l’Université de Picardie
Jules Verne (UPJV) d’Amiens.
2. e-learning
Le terme de e-learning est actuellement très utilisé et fait référence à des notions aussi variées que
celle de logistique, de ressources ou de technologie. Au travers des nombreuses définitions
rencontrées, l'utilisation du réseau et des TICE (Technologies de l'Information et de la
Communication pour l'Enseignement) pour dispenser une formation ainsi que l'accent mis sur
l'apprentissage sont récurrents. On s'accorde généralement à dire que le e-learning ne doit pas se
réduire à l'utilisation de technologies récentes pour des types d'apprentissage anciens, mais qu'il doit
induire de nouvelles formes d'apprentissage. Ceci a un certain nombre de conséquences. Par
exemple, le e-learning nécessite au moins :
– une réflexion sur le contenu : objectifs, concepts étudiés, compétences acquises... ;
– une réflexion sur l'organisation du contenu : relations entre les concepts étudiés ;
– une construction de nouvelles ressources en regard des possibilités offertes par les nouvelles
technologies : la traduction électronique d'anciennes ressources n'étant pas suffisante ;
– la redéfinition des rôles des acteurs : apprenants, enseignants.
1
Projet soutenu dans le cadre du pôle NTE de la région Picardie.
Dans le cadre du projet MEMORAe, nous mettons l’accent sur une définition granulaire du contenu
pédagogique et sa représentation par une ontologie de concepts accessibles de façon non
nécessairement linéaire. Nous considérons en effet que l'apprenant doit avoir un rôle actif dans sa
formation. Les supports mis à sa disposition ne sont pas la mise en ligne pure et simple de supports
de cours dispensé en présentiel, il s'agit au contraire d'un ensemble de ressources, facilement
accessibles, puisque indexées sur une ontologie du domaine de la formation.
Dans cette conception du e-learning, la structuration de l’information et des connaissances est donc
centrale à la fois pour les apprenants et pour les enseignants.
3. Ontologie d’application B31.1
Le module B31.1 "Mathématiques appliquées" est un module de 40 h d’enseignement (20 h de
cours, 20 h de TD) dispensé en présentiel en Licence MIAGE. Il nécessite des connaissances en
statistique descriptive et en dénombrement. Pour combler d’éventuelles lacunes dans ces domaines
détectées par un test de début de semestre, 14 heures de remise à niveau sont proposées en début de
module aux étudiants, trois chapitres y sont abordés : théorie des ensembles, dénombrement et
statistique descriptive à un caractère. Le module lui-même a pour objectif d’apporter des
connaissances appliquées en statistique inférentielle. Il se développe en cinq chapitres : probabilités
élémentaires, variables aléatoires, échantillonnage, estimation et tests.
3.1. Méthode suivie pour la conceptualisation de B31.1
Pour initier la construction de l’ontologie B31.1, nous sommes partis d’un document de travail
(Annexe) résultat de l’analyse de son cours effectuée par l’enseignant de B31.1 (Brigitte Chaput).
Ce document présente les différentes notions à appréhender, regroupées en chapitres. Afin d’être le
plus complet possible, nous avons également utilisé le support de son cours, ses transparents, ses
supports d’explication, ainsi que les différents livres utilisés pour bâtir le cours.
Notre objectif est d’étudier et de présenter avec l’ontologie B31.1 toutes les notions nécessaires à
cet enseignement sous forme de concept ou de relation. Ces notions serviront à structurer la
mémoire du cours ainsi qu’à indexer les ressources de la mémoire.
Il se peut, lors de la définition des notions à appréhender, que l’on ait besoin de définir des notions
non directement présentes dans B31.1. Il s’agit de notions permettant d’affiner les définitions
premières. Les réflexions induites par la construction de l’ontologie permettent d’approfondir au fil
du travail l’analyse que l’enseignant a de son cours.
La construction de l’ontologie B31.1 s’effectue chapitre par chapitre. Notons que, pour l’instant,
nous avons étudié les quatre premiers chapitres de B31.1.
Dans ce qui suit, nous présentons le résultat d’une partie de la construction de l’ontologie B31.1.
3.2. Le résultat de la conceptualisation
L'ontologie présente une organisation des concepts et des relations. (Figures 1 et 2). Les concepts
peuvent se différencier suivant différents axes sémantiques (AS) et une même notion peut figurer
dans le cours sous différents noms.
Pour chaque notion présente dans l'ontologie, nous indiquons au moyen de commentaires si c'est
une notion à appréhender pour la bonne compréhension du cours [COM/*], le ou les chapitres
auxquels elle se rapporte [COM/CH], les documents qui la concernent [COM/DOC], la façon dont
elle se spécialise [COM/AS], des suggestions d'utilisation pédagogique [COM/SUG]. (Figure 3)
3.3. Exploitation de l'ontologie conceptuelle pour accéder aux documents
Dans un premier temps, nous avons listé les documents traitant les notions à appréhender, cela nous
a permis de constituer une base documentaire. Dans un deuxième temps, nous avons exploité ces
informations afin d’alimenter la mémoire en documents et d’indexer ces derniers. Ainsi, l’accès à
un document se fait via l’exploration de l’ontologie où la sélection d’une notion permet diverses
informations liées à la notion et notament l’ensemble des ressources auxquelles elle est associée. Le
choix de ces ressources s’est fait selon un point de vue pédagogique, selon le contexte de la
formation (responsable, public et objectif visés, etc.). Il est possible de mettre à jour (ajouter,
modifier, supprimer) la base documentaire, modifier l’indexation des ressources selon d’autres
besoins pédagogiques.
Ensemble (Univers)
Ensemble infini
AS 1 : cardinal
Ensemble fini
fini/infini
Ensemble vide (Evénement impossible)
AS 1.1 :
Valeur du Singleton (Evénement élémentaire)
Cardinal Paire
Ensemble dénombrable
AS 2 :
dénombrabilité
Ensemble indénombrable
AS 3 :
sous/sur
Sur-ensemble
Sous-ensemble/Partie (Evénement)
AS 3.1 :
Valeur du
Cardinal
AS 4 :
résultat de l’opération
Sous-ensemble plein (Evénement certain)
Sous-ensemble propre
Combinaison
Complémentaire (Evénement contraire)
Figure 1 : Exemple de hiérarchie de concepts
être disjoint de (être incompatible avec)
être le complémentaire de (être le contraire de)
Figure 2 : exemple de hiérarchie de relations
•
Complémentaire (contraire) :
[PE/CNS] Le COMPLEMENTAIRE d'un ENSEMBLE B dans un de ses SUR-ENSEMBLES A est
l’ENSEMBLE des ELEMENTS de A qui n’appartiennent pas à B.
A est le référentiel du COMPLEMENTAIRE.
[COM/*] COMPLEMENTAIRE est une notion à appréhender.
⎯
[COM/*] Le COMPLEMENTAIRE de B dans A se note CBA ou tout simplement B lorsqu'il n'y pas d'ambiguïté
sur le référentiel. On peut aussi utiliser les notations A\B ou A-B qui peuvent être étendues à des ensembles B et
A où B n’est pas nécessairement inclus dans A.
[COM/CH] Cette notion fait partie du chapitre "Théories des ensemble" sous le nom COMPLEMENTAIRE et du
chapitre "Probabilités élémentaires" sous le nom CONTRAIRE.
[COM/DOC] Cette notion est traitée dans le livre : Méthodes mathématiques pour l'informatique, Jacques VELU,
DUNOD, 1994, p. 95
[COM/SUG] Il est préférable dans certaines situation d’utiliser le COMPLEMENTAIRE plutôt que la
REUNION.
Par exemple, si une urne contient 30 billes rouges et 20 billes blanches et que l’on souhaite connaître le nombre
de façons de choisir 5 billes parmi les 50 avec au moins une bille blanche, on peut :
ƒ soit dénombrer les combinaisons de 5 billes avec 1, 2, 3, 4, puis 5 billes blanches, dont la REUNION
correspond aux cas à dénombrer. Cette façon de traiter l'exercice demande cinq calculs.
ƒ soit dénombrer les combinaisons ne comportant pas de billes blanches qui constituent le complémentaire de la
situation précédente, cette façon de traiter l'exercice ne demande que deux calculs.
Figure 3 : exemple de définition d’une notion
4. Prototype MEMORAe
Afin de permettre aux utilisateurs d’aborder la mémoire, nous avons défini le concept de point
d’entrée qui représente l’accès direct à une notion de la mémoire ; ce sont, par exemple, les
définitions-clés de la formation.
La mise en place informatique de cette réflexion conceptuelle, nous a permis de développer un
premier prototype (cf. figure 4) permettant d’accéder aux ressources via l’exploration de points
d’entrée (cf. frame du gauche).
Figure 4 : interface d’interrogation de la mémoire
Il est possible de parcourir la mémoire de deux façons : navigation guidée (où l’utilisateur peut
sélectionner une notion dans la liste des points d’entrée précisée dans le cadre de gauche) et
navigation libre (où l’utilisateur peut choisir une notion présentée dans le frame de droite).
Le frame de droite se présente toujours suivant le même schéma, du haut vers le bas :
– rappel du parcours suivi pour atteindre la notion sélectionnée,
– courte définition textuelle de la notion sélectionnée, tirée de l’ontologie,
– affichage des notions voisines,
– affichage des documents indexés par la notion sélectionnée.
5. Conclusion
Le travail dans le cadre du projet MEMORAe a permis une analyse des notions utilisées en
statistique inférentielle afin de concevoir leur organisation. La structuration du module qui résulte
de l'ontologie rend les notions plus accessibles et réutilisables dans d'autres contextes. La mémoire
pourra facilement évoluer en tenant compte des remarques de chacun des acteurs de la formation
lors de sa mise à disposition des étudiants au premier semestre de l'année universitaire 2004-2005.
Bibliographie
[1] Abel, M.-H., Lenne, D., Moulin, C., Benayache, A. (2003) Gestion des ressources
pédagogiques d’une e-formation, Documents Numériques, Editions Hermès, pp. 111-128.
[2] Dieng, R., Corby O., Giboin, A., Golebiowska, J., Matta, N., Ribière, M. (2000) Méthodes et
outils pour la gestion des connaissances, Editions Dunod.
Annexe
Théorie des ensembles
- Ensemble, élément
- Cardinal
- Sous-ensemble
- Réunion, intersection, complémentaire
- Disjonction
- Produit cartésien
Dénombrement
- Combinaisons
- Arrangements
- n-uplets
Probabilités élémentaires
- Expérience aléatoire
- Univers
- Événements
* certain, impossible
* opérations : ou, et, non
* incompatibles, contraires
- Probabilité, équiprobabilité
- Probabilité conditionnelle
- Événements indépendants
- Formule des probabilités totales
- Formule de Bayes
Variables aléatoires
Statistique descriptive à un caractère
- Qualitatif
* fréquence
- Quantitatif :
* moyenne
* variance
* écart type
* quantiles
* effectifs cumulés
Échantillonnage
- Échantillons bernoulliens et exhaustifs
- Distributions d’échantillonnage
* proportion
* moyenne
* variance
- Théorèmes :
* loi des grands nombres
* théorème central - limite
Estimation
- ponctuelle
* d’une proposition
* d’une moyenne
* d’une variance, d'un écart type
- par intervalle de confiance
* d’une proposition
* d’une moyenne
- Loi de probabilité
- Fonction de répartition
- Espérance, variance, écart type
- Variables aléatoires discrètes
* Formule de calcul
* Exemples : • Lois binomiales
• Lois de Poisson
• Approximations
- Variables aléatoires continues
* Densité
* Formules de calcul
* Exemples : • Lois normales,
• Utilisation de tables
numériques
• Lois exponentielles
• Approximation
Tests de validité d’hypothèse
- sur un paramètre
* proportion
* moyenne
- de comparaison
* proportions
* variances
* moyennes
- sur des effectifs : tests du Khi-deux
Légende : Les flèches représentent des liens de pré-requis

Documents pareils