Proposition de sujet de thèse par Le thanh Nhan

Transcription

Proposition de sujet de thèse par Le thanh Nhan
ED STIC - Proposition de Sujets de Thèse
pour la campagne d'Allocation de thèses 2013
Axe Sophi@Stic :
aucun|
Titre du sujet :
Une plateforme collaborative pour la gestion de marquages du monde
réel
Mention de thèse :
Informatique
HDR Directeur de
thèse inscrit à l'ED
STIC :
Le thanh Nhan
Co-encadrant de thèse éventuel :
Nom :
BUFFA
Prénom :
MICHEL
Email :
[email protected]
Téléphone :
0662659345
Email de contact
pour ce sujet :
[email protected]
Laboratoire
d'accueil :
I3S/INRIA
Description du sujet :
La thèse proposée touche deux domaines de recherche explorés par l’équipe WIMMICS : le
marquage de références web et les wikis sémantiques. Le sujet proposé s’inscrit
dans le cadre du projet ANR e-co-acteurs pour lequel nous devons concevoir une plateforme
spécialisée dans la gestion collaborative de « marquages du monde réel »,
intégrée à un réseau social : les membres du réseau, des touristes, des professionnels du
tourisme ou des activistes (type Greenpeace) « marquent » à l’aide de leur téléphone
ou tablette des lieux réels et envoient ces marques à la plateforme, augmentées par des tags,
icônes, commentaires, etc. Les métadonnées décrivant le lieu sont enregistrées
dans un serveur de ressources sémantiques et une « vue » est créée dans un outil inspiré des
wikis sémantiques mais spécialisé dans la gestion de données géo-localisées .
Page 1/3
Les métadonnées dépendent du contexte (pays, région, profil de la personne qui a fait le
marquage, etc).Les premiers systèmes de stockage de références Web (appelés
favoris, signets, bookmarks) remontent au début du Web (Hotlists de Mosaic, 1993). Le
partage de bookmarks apparaît avec itList (Lajean 2000) en 1996. Le Web 2.0
popularise le social bookmarking (Hammond et al., 2005) avec Delicious (Bildurph 2004) et
Connotea(Lund et al., 2005). Plus récemment on a vu du partage sous forme de
mind maps (Pearltrees) ou de parcours temporel (Jog The Web). Le Social Bookmarking est
indissociable des folksonomies et du Social Tagging (classification par tags),
système de classification léger pour naviguer dans les corpus de références Web). Avec les
réseaux sociaux, le marquage Web a considérablement évolué. Les
métadonnées présentes dans les pages économisent aux utilisateurs la tâche de renseigner
un formulaire de marquage. Un simple bouton "I Like" (Recordon, 2010)
ou "+1" dans une page suffit pour ajouter une référence typée et documentée sur le profil
Facebook ou Google+ de l'internaute. Le marquage et le partage sont
instantanés et la marque est intégrée dans le flux de toutes les autres activités des
utilisateurs. Depuis Firefox, des extensions permettent d'augmenter les capacités
natives du navigateur. Un florilège d'extensions a pu voir le jour, notamment pour la création
d'archives personnelles ou partagées, de tout ou parties de pages Web.
Ces technologies communément appelées Webscraps sont très populaires. Nous citerons
ScrapBook, Wozaik, Zotero, Diigo. Dans le cadre de l'ANR ISICIL l’équipe
INRIA Wimmics a fusionné les différentes approches en créant les "WebMarks" (Buffa and Al.
2012). Les Webmarks scrappés étaient intégrés dans un wiki sémantique. "Un
Wiki sémantique est un Wiki doté de fonctionnalités permettant de formaliser le sens des articles.
Il permet de rajouter des informations sur les métadonnées des articles et
de caractériser leurs relations." Il existe plusieurs catégories de Wikis sémantiques (les
catégories ne sont pas mutuellement exclusives) : 1) des Wikis pour
construire des ontologies, 2) des Wikis exploitant des ontologies pour formaliser les
documents et les rendre intelligibles par des programmes (extensions de
navigateur, code JavaScript embarqué, crawlers), et 3) des Wikis hybrides (ex : Wikis
interagissant avec d'autres systèmes sémantiques, comme un serveurs de tags, un
réseau social, Wiki permettant d'embarquer des applications dans les pages, etc.). Voir (Buffa et
al., 2008 et Buffa et al., 2012) pour un état de l'art complet.
La thèse devra faire un état de l’art sur les outils de marquage, sur les wikis sémantiques et sur
les autres systèmes et modèles spécialisés dans la gestion de données
sémantiques géographiques ou du moins géolocalisées. Les contributions scientifiques sont
attendues dans le domaine de la modélisation du« marquage », dansles techniques
d'agrégation de plusieurs marques géolocalisées (construction de parcours, suggestion,
enrichissement à partir de données du Linked Data) et dans le domaine des outils de
développement basés Web, la plateforme devant être programmable (le domaine de recherche
est alors proche du « End User Programming on the Semantic Web »).
L’exploitation du graphe tri-parite utilisateurs-tags-ressources est aussi attendue, les
raisonnements possibles pouvant servir efficacement un système de filtrage/suggestion ou
de recherche.
Page 2/3
English version:
The proposed thesis addresses two areas of research explored by WIMMICS team: marking web
references and semantic wikis. The subject is part of the ANR project e-coactors for which we must develop a collaborative platform for managing "real world bookmarks,"
integrated into a social network. The members are tourists , tourism
professionals and activists (Greenpeace-type). They "mark" with their phone or tablet real places
and send these marks to the platform, augmented by tags, icons, comments,
etc.. The metadata describing the marked location is stored in a semantic server that holds all
resources and a "view" is created in a semantic platform inspired by wikis but
specialized in the management of geo-localized data. The metadata collected depend on the
context (country, region, profile of the person who did the marking, etc.). The first
“web marking systems” (marks were called favorites, bookmarks, hotlist entries) appeared with
the early Web (Hotlists Mosaic 1993 ). Sharing bookmarks appears with itList
(Lajean 2000) in 1996. Web 2.0 social bookmarking popularized (Hammond et al., 2005) with
Delicious (Bildurph 2004) and Connotea (Lund et al., 2005). More recently there has
been sharing in the form of mind maps (Pearltrees) or time course (Jog The Web). Social
Bookmarking is inseparable from folksonomies and Social Tagging (classification tags),
light classification systems to navigate the body of Web references). With social networking, web
marking has evolved considerably. Metadata present in the pages save users
the task to fill in a form. A button "I Like" (Recordon, 2010) or "1" on a page just add typed
references to the Facebook or Google+ profile of the user. Marking and sharing are
instant and the mark is integrated into the flow of all other user activities. With Firefox,
extensions that can increase the native capabilities of the browser appeared and some of
them could archive entire web pages. These technologies commonly referred as Webscraps are
very popular. We quote ScrapBook, Wozaik, Zotero, Diigo. Within the framework
of the ANR ISICIL, the Wimmics team merged the different approaches in creating "Webmarks"
(Buffa and Al 2012). The Webmarks were integrated in a semantic wiki, as
documents that could be modified and shared after their archivage. "A Semantic Wiki is a Wiki
with features to formalize the meaning of the articles. It allows you to add
metadata information articles and characterize their relationships." There are several categories
of semantic Wikis (categories are not mutually exclusive): 1) Wikis to build
ontologies, 2) Wikis exploiting ontologies to formalize the documents and make them
understandable by programs (browser extensions, code embedded JavaScript, crawlers),
and 3) hybrid Wikis (eg Wikis interacting with other semantic systems, servers as a tag, a social
network, allowing Wiki embed applications in pages, etc).. View (Buffa et al.,
2008 and Buffa et al., 2012) for a complete state of the art.
The thesis will start with a state of the art on web marking tools and models, a state of the art on
semantic wikis and web based IDEs for developing semantic web applications,
a state of the art on systems and models for geographic data or at least geotagged data.
Scientific contributions are expected in the field of web marking, in aggregation
techniques for merging geographic marks (path building, suggestions, enrichment with Linked
Data) and in the field of "End User Programming on the Semantic Web". The use
of tri-parity graphs made of users-tags-resources makes semantic reasoning possible and can
effectively improve filtering system / suggestion or research.
Page 3/3