Sujets des Mémoires de DEA 2001 d`Avignon, Marseille, La

Transcription

Sujets des Mémoires de DEA 2001 d`Avignon, Marseille, La
Sujets des Mémoires du DEA d’Informatique
Universités d’Avignon, Marseille, La Réunion, Toulon
Année 2001 – 2002
Collectés par Nadia CREIGNOU et Victor CHEPOI
Mis en page par Michel VAN CANEGHEM
Version du : 23 novembre 2001
Table des matières
1
Statistiques
3
2
Répartition des mémoires par Laboratoire
4
3
Base de données
6
Calcul des itemsets fermés et itemsets clés fréquents - Application au calcul de la base repésentative des règles
d’association — PHAN LUONG Viet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
Séparation linéaire en contexte semi-supervisé — François DENIS . . . . . . . . . . . . . . . . . . . . . . . .
7
Interogation pipe-line de données XML — Emmanuel Bruno, Jacques Le Maitre . . . . . . . . . . . . . . . .
8
Réécriture de requêtes dans un système de médiation. — Kader Betari et Omar Boucelma . . . . . . . . . . . .
9
XML et données géographiques — Omar Boucelma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
Intégration sémantique de données géographiques — Robert Jeansoulin . . . . . . . . . . . . . . . . . . . . .
11
Codes et cryptographie
12
Protocoles photoniques — Sami Harari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
Primitives de cryptographie solides et économes en ressources — Sami Harari . . . . . . . . . . . . . . . . . .
12
Info-Bio-Math
13
Ordres circulaires Robinsoniens — Bernard Fichet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
4
5
Géneration de règles d’association à partir d’une Hiérarchie faible conceptuelle — Ralambondrainy H., Diatta J. 14
6
Ordre des paralogons dans un génome ancestral — Alain Guénoche . . . . . . . . . . . . . . . . . . . . . . .
15
Contribution au développement d’une suite de logiciels pour l’analyse des réseaux de régulation biologiques :
modélisation et analyse de graphes — Yann Vaxes, Denis Thieffry . . . . . . . . . . . . . . . . . . . . . .
16
Logique et démonstration automatique
17
Heuristiques pour les problèmes de configuration optimale à base de contraintes — Laurent Henocque . . . . .
17
Approximation et compilation des X-logiques par les théories de Horn — Vincent Risch . . . . . . . . . . . .
18
Algorithmes non énumératifs pour le problème SAT — Pierre Siegel . . . . . . . . . . . . . . . . . . . . . . .
19
Couplages dans les graphes biparties et le problème SAT — Belaid Benhamou . . . . . . . . . . . . . . . . . .
20
7
8
9
Génération de modèles finis en logique du premier ordre — Belaid Benhamou et Gilles Audemard . . . . . . .
21
Preuve d’inconsistance par méthodes incomplètes — Philippe Jégou . . . . . . . . . . . . . . . . . . . . . . .
22
Logique dynamique linéaire d’actions pour la planification — Camilla Schwind . . . . . . . . . . . . . . . . .
23
Programmation et logique
24
Bornes inférieures pour les phénomènes de seuil liés à la satisfaisabilité des formules booléennes — Nadia
CREIGNOU, Hervé DAUDE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
Typage et gestion automatique de la mémoire dans un langage à objets — Silvano DAL ZILIO . . . . . . . . .
25
Forme normale de contraintes du premier ordre sur les arbres binaires infinis — Alain Colmerauer . . . . . . .
26
Décidabilité/indécidabilité des propriétés “chaotiques”dans les automates cellulaires — Enrico Formenti . . . .
27
Synthèse d’automates communicants — Rémi MORIN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
Réalisation de HMSC — Rémi MORIN
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
Pavages et complexité — Bruno Durand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
Conservation de l’information dans les automates cellulaires — Bruno Durand . . . . . . . . . . . . . . . . .
31
Analyse des algorithmes adaptatifs de contrôle pour la production de cartes à puce personalisées — Peter
NIEBERT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
Structures discrètes et Recherche Opérationnelle
33
Séparation des contraintes de partition Steiner généralisées — Mohamed DIDI BIHA, Philippe Michelon . . . .
33
Séparer à partir d’appartenir — Jean François Maurras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
Tournées de véhicules avec inventaire — Michel Van Caneghem . . . . . . . . . . . . . . . . . . . . . . . . .
35
Enveloppes de Pareto en normes l1 et l∞ — Victor CHEPOI, Yann VAXES . . . . . . . . . . . . . . . . . . . .
36
Systèmes parallèles et communicants
37
Gestion de la qualité de service dans le cas du multicast dans l’Internet — Abderrahim BENSLIMANE . . . . .
37
Architecture pour les réseaux ad-hoc — Abderrahim BENSLIMANE . . . . . . . . . . . . . . . . . . . . . . .
38
Etude et verification de proprietes du langage Java liees a la concurrence. — Marjorie Russo . . . . . . . . . .
39
Codesign et Java — L.FREUND . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
Synthèse et modélisation — L.FREUND . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
10 Traitement automatique des langues
41
Alignement multilingue basé sur la sémantique — Olivier Kraif, Marc El-Bèze . . . . . . . . . . . . . . . . .
41
Génération automatique de libellés textuels pour les moteurs de " Questions / Réponses " — Patrice Bellot,
Marc El-Bèze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42
Evaluateur de sites Web — Elie Sanchez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
La logique floue dans le Web Sémantique — Elie Sanchez . . . . . . . . . . . . . . . . . . . . . . . . . . . .
44
Formalisation de connaissances épidémiologiques — Michel Roux . . . . . . . . . . . . . . . . . . . . . . . .
45
Grammaire de dépêches épidémiologiques — MIchel Roux, Robert Pasero, Paul Sabatier . . . . . . . . . . . .
45
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
2
1
Statistiques
Filière
Base de données
Codes et cryptographie
Info-Bio-Math
Logique et démonstration automatique
Programmation et logique
Structures discrètes et Recherche Opérationnelle
Systèmes parallèles et communicants
Traitement automatique des langues
Total
Laboratoires
IML
IREMIA
LIA Avignon
LIF
LSIS
MTCD
SIS Toulon
Autres Laboratoires
Total
23 novembre 2001
Nb de sujets
6
2
4
6
10
4
5
6
43
Nb de sujets
1
1
5
17
8
4
3
4
43
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
3
2
Répartition des mémoires par Laboratoire
IML (1)
– Ordre des paralogons dans un génome ancestral — Alain Guénoche
IREMIA (1)
– Géneration de règles d’association à partir d’une Hiérarchie faible conceptuelle — Ralambondrainy H.,
Diatta J.
LIA Avignon (5)
– Alignement multilingue basé sur la sémantique — Olivier Kraif, Marc El-Bèze
– Architecture pour les réseaux ad-hoc — Abderrahim BENSLIMANE
– Génération automatique de libellés textuels pour les moteurs de " Questions / Réponses " — Patrice Bellot,
Marc El-Bèze
– Gestion de la qualité de service dans le cas du multicast dans l’Internet — Abderrahim BENSLIMANE
– Séparation des contraintes de partition Steiner généralisées — Mohamed DIDI BIHA, Philippe Michelon
LIF (17)
– Calcul des itemsets fermés et itemsets clés fréquents - Application au calcul de la base repésentative des
règles d’association — PHAN LUONG Viet
– Conservation de l’information dans les automates cellulaires — Bruno Durand
– Décidabilité/indécidabilité des propriétés “chaotiques”dans les automates cellulaires — Enrico Formenti
– Enveloppes de Pareto en normes l1 et l∞ — Victor CHEPOI, Yann VAXES
– Forme normale de contraintes du premier ordre sur les arbres binaires infinis — Alain Colmerauer
– Pavages et complexité — Bruno Durand
– Réalisation de HMSC — Rémi MORIN
– Séparation linéaire en contexte semi-supervisé — François DENIS
– Séparer à partir d’appartenir — Jean François Maurras
– Synthèse d’automates communicants — Rémi MORIN
– Tournées de véhicules avec inventaire — Michel Van Caneghem
– Typage et gestion automatique de la mémoire dans un langage à objets — Silvano DAL ZILIO
– (LIF et LATP) Bornes inférieures pour les phénomènes de seuil liés à la satisfaisabilité des formules booléennes — Nadia CREIGNOU, Hervé DAUDE
– (LIF et LGPD) Contribution au développement d’une suite de logiciels pour l’analyse des réseaux de régulation biologiques : modélisation et analyse de graphes — Yann Vaxes, Denis Thieffry
– (LIF et LSIS) Réécriture de requêtes dans un système de médiation. — Kader Betari et Omar Boucelma
– (LIF et MTCD) Grammaire de dépêches épidémiologiques — MIchel Roux, Robert Pasero, Paul Sabatier
– (LIF et Cybernetix) Analyse des algorithmes adaptatifs de contrôle pour la production de cartes à puce
personalisées — Peter NIEBERT
LSIS (8)
– Algorithmes non énumératifs pour le problème SAT — Pierre Siegel
– Approximation et compilation des X-logiques par les théories de Horn — Vincent Risch
– Couplages dans les graphes biparties et le problème SAT — Belaid Benhamou
– Heuristiques pour les problèmes de configuration optimale à base de contraintes — Laurent Henocque
– Intégration sémantique de données géographiques — Robert Jeansoulin
– Génération de modèles finis en logique du premier ordre — Belaid Benhamou et Gilles Audemard
– XML et données géographiques — Omar Boucelma
– Preuve d’inconsistance par méthodes incomplètes — Philippe Jégou
MTCD (4)
– La logique floue dans le Web Sémantique — Elie Sanchez
– Evaluateur de sites Web — Elie Sanchez
– Formalisation de connaissances épidémiologiques — Michel Roux
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
4
– Ordres circulaires Robinsoniens — Bernard Fichet
SIS Toulon (3)
– Interogation pipe-line de données XML — Emmanuel Bruno, Jacques Le Maitre
– Primitives de cryptographie solides et économes en ressources — Sami Harari
– Protocoles photoniques — Sami Harari
Autres Laboratoires (4)
– (MAP, CNRS, UMR 694) Logique dynamique linéaire d’actions pour la planification — Camilla Schwind
– (A préciser) Etude et verification de proprietes du langage Java liees a la concurrence. — Marjorie Russo
– (A préciser) Codesign et Java — L.FREUND
– (A préciser) Synthèse et modélisation — L.FREUND
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
5
3
Base de données
1: Calcul des itemsets fermés et itemsets clés fréquents - Application
au calcul de la base repésentative des règles d’association
PHAN LUONG Viet
Laboratoire : LIF equipe Bases de Donnees et Apprentissage Automatique
Contact : Phan Luong Viet, l’Université de Provence,
39, rue F. Joliot Curie, 13453 Cedex 13,
email : [email protected], tel : 04.91.11.36.15
Objectif du stage :
Les itemsets fréquents jouent un rôle très important en fouille de données (règles d’association, motifs séquentiels, indexation, classification, etc). Dans le calcul de règles d’association, en utilisant les itemsets fréquents, le
nombre de règles intéressantes peut être exponentiel par rapport au nombre des items considérés. Ceci pose un
problème de repésentation de règles aux utilisateurs finaux (décideurs). Les solutions connues pour ce problème
consistent en trois concepts : itemsets fermés et itemsets clés fréquents et bases de règles. Il existe plusieurs
algorithms pour calculer les itemsets fermés fréquents, mais peu d’algorithms pour calculer les itemsets clés
fréquents. Or les représentations compactes des règles d’association utilisent ces deux concepts d’itemsets.
Description du travail proposé :
Ce stage a pour but l’étude et l’implémentation d’une méthode qui calcule à la fois les itemsets fermés et clés
fréquents, qui seront utlisés pour calculer la base représentative des règles d’association, qui est connue comme
la représentation la plus compacte et simple. L’implémentation peut être en C ou en C++.
Bibliographie :
V. Phan Luong, “Reasoning on Association Rules”, BDA’2001 (17eme journées Bases de Données Avancées),
29 Oct-2 Nov. 2001, Agadir, Maroc.
Y. Bastide, R. Taouil, N. Pasquier, G. Stumme and L. Lakhal, “Pascal : un algorithme d’extraction des motifs
frequents”, TSI 2000.
Poursuite en thèse : Une poursuite en th=E8se est possible pour ce m=E9moire. Les perspectives de ce stage
sont l’étude d’amélioration de la méthode implémentée, l’extension de la base repésentative pour les règles
d’association générales, et les applications dans d’autres domaines de recherche en fouille de données ou apprentissage automatique.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
6
2: Séparation linéaire en contexte semi-supervisé
François DENIS
Laboratoire : Equipe Bases de Données et Apprentissage, LIF, site de Chateau Gombert
Contact : François Denis, CMI, Technopôle de Chateau Gombert, 39 rue F. Jolliot Curie, 13453 MARSEILLE
CEDEX 13 FRANCE Tel. (33) 04 91 11 36 05 Fax (33) 04 91 11 36 02,
e-mail : [email protected]
Objectif du stage :
L’apprentissage automatique est traditionnellement divisé en apprentissage supervisé et non supervisé. Dans le
premier cas, on suppose que les données de travail sont réparties en classes prédéfinies et la tache principale
est de trouver des méthodes de classification à partir d’un échantillon fini d’exemples étiquetés ; dans le second
cas, le système d’apprentissage doit lui-même définir des classes à partir d’un échantillon d’exemples non préalablement étiquetés. Cette frontière semble moins nette depuis quelques années. En effet, il est fréquent que les
données disponibles soient des deux types, exemples étiquetés et non étiquetés, et il y a tout intérêt à essayer
de prendre en compte toute l’information disponible. C’est par exemple le cas en classification de textes : l’indexation est un processus coûteux et les données disponibles sont composées d’un petit nombre de documents
indexés et d’un nombre pratiquement illimité de documents non indexés. D’autres exemples peuvent facilement
être trouvés dans tous les domaines concernés par l’apprentissage automatique. Cette nouvelle problématique,
intitulée apprentissage semi-supervisé, suscite de nombreux travaux. Il s’agit en particulier d’étudier comment
des algorithmes d’apprentissage classiques peuvent être adaptés à ces nouvelles situations. Depuis quelque
temps, nous nous sommes attaqué à un problème particulier de l’apprentissage semi-supervisé : l’apprentissage
à partir de données non étiquetées et de données appartenant à une seule classe (exemples positifs dans le cas
binaire). Cette problématique est intéressante pour au moins deux raisons :
1. Ce cas de figure se présente naturellement : si par exemple on cherche à construire un classifieur chargé de
détecter automatiquement les mails susceptibles de nous intéresser, les données de travail seront vraisemblablement composées d’un échantillon de mails que nous avons conservé (données positives) et de mails non encore
dépouillés (données non étiquetées).
2. Il permet de traiter le cas de l’apprentissage à partir de données déséquilibrées, c’est-à-dire réparties en n
échantillons S1 , . . ., Sn correspondants aux n classes cibles, dont chacun est représentatif de sa classe mais
dont la réunion n’est pas représentative de la population globale.
Description du travail proposé :
L’étudiant étudiera des techniques de séparation linéaire à partir de données positives et non étiquetées. Il
devra concevoir un algorithme permettant d’effectuer au mieux une telle séparation des données et étudier cet
algorithme d’un point de vue théorique et expérimental.
Bibliographie :
Cette bibliographie sera complétée et précisée avec l’étudiant.
Sur l’apprentissage par exemples positifs et non étiquetés :
- PAC Learning from Positive Statistical Queries, F. Denis (ALT’98), - Positive and Unlabeled Examples help
Learning, F. De Comité, F. Denis, R. Gilleron et F. Letouzey, (ALT 99)
Sur les classifieurs linéaires :
The elements of statistical learning, Hastie, Tibshirani, Friedman, Springer, 2001 (par exemple).
Sur les SVM :
A tutorial on Support Vector Machines for pattern recognition, C. Burges, Knowledge Discovery and Data
Mining, 1998 (par exemple).
Poursuite en thèse : La poursuite en thèse est souhaitée : il sera alors demandé à l’étudiant d’étendre cette
étude aux machines à vecteurs de support (SVM), une des techniques contemporaine les plus performantes de
l’apprentissage automatique, de choisir un terrain d’applications (par exemple en biologie) et d’acquérir une
bonne maîtrise du domaine de l’apprentissage semi-supervisé.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
7
3: Interogation pipe-line de données XML
Emmanuel Bruno, Jacques Le Maitre
Laboratoire : SIS Equipe Informatique, Université de Toulon et du Var
Contact : Jacques Le Maitre Université de Toulon et du Var Laboratoire SIS - Equipe Informatique B.P. 132,
83957 La Garde CEDEX
tel. : +33(0)4 94 14 20 06 e-mail : [email protected]
Objectif du stage :
L’équipe Informatique du SIS travaille depuis plusieurs années sur la manipulation de documents structurés
(SGML et maintenant XML). Ces travaux ont conduit à la spécification d’un langage de requêtes XML : le
langage DQL. Il s’agit maintenant de développer, pour ce type de langage, des techniques de résolution de
requêtes performantes. Ce stage y contribuera.
Description du travail proposé :
Une représentation intéressante d’un document XML consiste à le transformer en un ensemble de régions
imbriquées, repérées chacune par une position de début, une position de fin et un niveau hiérarchique. Sur
ce modèle nous avons développé une algèbre dite "algèbre de régions", jouant le même rôle que l’algèbre
relationnelle pour le modèle relationnel.
Cette algèbre de régions comporte deux familles d’opérateurs :
- des opérateurs de projection, qui permettent de sélectionner des régions en fonction de leur contenu et de leurs
relations hiérarchiques avec d’autres régions ;
- des opérateurs de transformation, qui permettent de transformer un fragment XML par modification de l’ensemble de régions qui le représente.
Chaque opérateur s’applique à un ou plusieurs ensembles de régions et produit un nouvel ensemble de régions.
Le travail à réaliser consistera :
(1) à proposer, pour chaque opérateur, une implantation "pipe-line", c.-à-d. telle que la région résultat soit
produite au fur et à mesure de la lecture des régions arguments,
(2) à évaluer la complexité et les performances de ces implantations.
Bibliographie :
Sera fournie ultérieurement
Poursuite en thèse : Une poursuite en thèse est souhaitée
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
8
4: Réécriture de requêtes dans un système de médiation.
Kader Betari et Omar Boucelma
Laboratoire : LIF et LSIS
Contact : Kader Betari IUT - GTR
Tel : 04 91 17 79 29 mel : [email protected]
Objectif du stage :
Nous nous plaçons dans le cadre de la médiation des données avec l’aproche LAV. Dans cette approche, les
sources de données sont considérées comme des vues sur un schéma global. Pour interroger le schéma global
il faut pouvoir réécrire la requête en terme des schémas sources. Le problème de réécriture de requêtes a déja
été abordé dans un contexte relationnel.
Le contexte de ce sujet est celui où le modèle d’intégration et le modèle de requête sont différents, ce qui est le
cas dans de nombreuses applications réelles.
Description du travail proposé :
Le travail consiste à élaborer et implanter un algorithme de réécriture de requêtes qui permet de reformuler une
requête utilisateur en un ensemble de requêtes sources. Le travail sera réalisé avec l’hypothèse suivante : les
sources sont des données géographiques, et le modèle d’intégration sera basé sur XML.
Bibliographie :
B. Amann, C. Beeri, I. Fundulaki, M. Scholl, A.-M. Vercoustre, "La réécriture et l’évaluation de requêtes arbres
avec XPath.", Proc. BDA2001.
A. Halevy, "Answering Queries Using Views : a Survey", The VLDB Journal, 2001.
Poursuite en thèse : Oui.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
9
5: XML et données géographiques
Omar Boucelma
Laboratoire : LSIS
Contact : Omar Boucelma CMI - 39, rue Joliot-Curie 13453 Marseille Cedex 13
Tel : 04 91 11 36 16 mel : [email protected]
Objectif du stage :
Le sujet de DEA se déroule dans le cadre du projet VirGIS d’intégration des données géographiques résidant
dans plusieurs systèmes d’information géographiques (SIG). La couche basse de l’architecture de VirGIS est
modulaire et composée de wrappers qui accèdent aux données contenues dans les systèmes SIG intégrés et
les retournent en format XML, d’un module de manipulation des données géographiques en format XML.
La couche basse de VirGIS repose sur une représentation des données géographiques en format XML et une
traduction des opérateurs spatiaux en opérations algébriques XML.
Description du travail proposé :
Le travail à réaliser est le suivant :
- l’extension de GML, une représentation limitée des données géographiques en format XML pour permettre
une manipulation spatiale élaborée des données dans VirGIS,
- l’implantation de l’agèbre XML définie et publiée par le groupe de travail XML Query au sein du consortium
Web,
- l’expression d’opérateurs spatiaux en termes d’opérations algébriques XML exprimée dans l’algèbre XML.
Bibliographie :
I. Manolescu, D. Florescu„ D. Kossmann. "Answering XML Queries over Heterogeneous Data Sources", Proc.
VLDB 2001
M. Goodchild, M. J. Egenhofer, R. Fegeas, C. Kottman. Interoperating Geographic Information Systems. Kluwer, 1999
http ://www.opengis.org
Poursuite en thèse : Oui.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
10
6: Intégration sémantique de données géographiques
Robert Jeansoulin
Laboratoire : LSIS
Contact : Robert Jeansoulin CMI - 39, rue Joliot-Curie 13453 Marseille Cedex 13
Tel : 04 91 11 36 08 mel : [email protected]
Objectif du stage :
L’intégration de données résidant dans des systèmes hétérogènes pose de nombreux problèmes sémantiques.
Par exemple, dans le cas d’intégration de données géographiques, les échelles de représentation des données
peuvent être différentes, l’organisation des données peut être différente d’une source à l’autre (une route peut
être représentée dans des granularités ou des découpages différents par des tronçons plus ou moins longs), etc.
Ces problèmes doivent impérativement être maîtrisés et résolus pour favoriser l’intégration des données.
Description du travail proposé :
L’objet de ce projet de DEA consiste en :
- une représentation de l’information sémantique des SIG (échelles, etc.) dans un format à la XML qui s’inscrit
dans l’activité Semantic Web du World Wide Web consortium W3C,
- l’élaboration d’un langage de règles qui capture les correspondances d’intégration sémantique,
- l’implantation d’un moteur d’évaluation des règles de correspondances sémantiques.
Bibliographie :
A. P. Sheth, "Changing focus on interoperability in information systems : from system, syntax, structure, to
semantics", In. Interoperating Geographic Information Systems, pages 5-30, Kluwer, 1999
Y. A. Bishr, "Overcoming the Semantic and Other Barriers to GIS Interoperability", Int. Journal of GIS, 1998.
http ://www.w3c.org (Rubrique Semantic Web)
Poursuite en thèse : Oui.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
11
4
Codes et cryptographie
7: Protocoles photoniques
Sami Harari
Laboratoire : Equipe Informatique du laboratoire SIS de l’université de Toulon
Contact : Sami Harari : [email protected]
Objectif du stage :
Le concept de perte d’information dans les opérations cryptographiques habituelles a été dt’eveloppé pour les
protocoles photoniques, dans le but de les consolider. Son application à d’autres opérations non photoniques
utilisées dans les divers protocoles de cryptologie est possible. Dans ce contexte, il sert d’outil d’évaluation de
la qualité du protocole et conduit à une éventuelle modification.
Description du travail proposé :
Le but du mémoire sera d’étudier des crypto-systèmes à clé publique sous cet aspect et d’en proposer des
modifications.
8: Primitives de cryptographie solides et économes en ressources
Sami Harari
Laboratoire : Equipe Informatique du laboratoire SIS de l’université de Toulon
Contact : Sami Harari : [email protected]
Objectif du stage :
La carte à puce est un ordinateur particulier, à ressources très limitées tant en mémoire vive et de stockage,
qu’en puissance de calcul. C’est pourtant un outil que les cryptologues souhaitent utiliser en raison de ses caractéristiques techniques. A cette fin des primitives de cryptographie solides et économes en ressources doivent
être dt’eveloppées. Une de ces primitives est le HFE, ou Hidden Field Equations qui admet de nombreuses
variantes.
Description du travail proposé :
Le but du mémoire est de passer en revue toutes ces primitives, en faire la comparaison des caractéristiques et
en proposer de nouvelles.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
12
5
Info-Bio-Math
9: Ordres circulaires Robinsoniens
Bernard Fichet
Laboratoire : MTCD. Laboratoire de Biomathématiques
Contact : Bernard Fichet
Laboratoire de Biomathématiques. Faculté de Médecine. 27, Bd. Jean Moulin. 13385 Marseille cedex 5.
Tel. 04 91 79 19 10. e-mail : [email protected]
Objectif du stage :
Les ordres Robinsoniens, à support linéaire ou arboré, mettent en lumière une évolution dans les données,
et sont une composante importante de l’analyse des données et de la classification. Plus récemment, ont été
introduits les ordres circulaires Robinsoniens. Leur définition, leurs propriétés mathématiques et surtout leur
carctérisation algorithmique méritent d’être approfondies. Développer,discuter ces concepts sur la base de travaux existants,et recenser les problèmes mathématiques et algorithmiques ouverts est l’objet de ce mémoire.
Description du travail proposé :
Essentiellement à partir d’un article, développer une approche des ordres circulaires Robinsoniens.
Bibliographie :
Hubert,L.,Arabie,P.,Meulman,J. (1998), Graph-theoretic representations for proximity matrices through stronglyanti-Robinson or circular strongly-anti-Robinson matrices. Psychometrika, 63, 341-358.
Poursuite en thèse : Poursuite en thèse possible à travers les nombreux problèmes mathématiques et algorithmiques ouverts sur le sujet.
Commentaires : Le sujet peut au gré des difficultés rencontrées évoluer dans des directions plus mathématiques
(propriétés des structures introduites, aproximations), ou plus informatiques (algorithmique, NP-complétude),
avec, si poursuite en thèse, son application en relation avec l’évolution.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
13
10: Géneration de règles d’association à partir d’une Hiérarchie faible
conceptuelle
Ralambondrainy H., Diatta J.
Laboratoire : IREMIA Université de la Réunion Equipe ECD (Extraction de Connaissances à partir de Données)
Contact : Mr Ralambondrainy Henri Mr Diatta Jean
Faculté des Sciences 15, avenue René cassin-BP 7151 97715 Saint-Denis Messag Cedex 9, France
E-mail :[email protected] Tel : 0262 93 82 86
Objectif du stage :
Le sujet du mémoire concerne la recherche de règles d’association entre les attributs d’un ensemble de données.
Ce problème a été abordé en Analyse des Données (Data Mining)[2,4] dans la recherche de régularités dans
les données et en Base de Données dans l’étude des dépendances fonctionnelles. Divers algorithmes ont été
proposés fondés sur des treillis ou sous-treillis des attributs et le treillis des concepts [1].
L’objectif du mémoire est l’étude d’une méthode de g énération de règles en s’appuyant sur la structure d’hiérarchie faible conceptuelle [5] que nous proposons dont la complexité est moindre que celle du treillis conceptuelle.
Description du travail proposé :
Le travail du stagiaire consiste, dans un premier temps, à étudier les principaux articles concernant la problématique de génération de règles et de la classification conceptuelle [3]. Dans un deuxième temps, de mettre
au point et tester une méthode de génération de règles s’appuyant sur les propriètès de la hièrarchie faible
conceptuelle [5].
Bibliographie :
[1] N.Pasquier, Y. Bastide, R. Taouil and L. Lakhal Efficient mining of association rules using closed itemset
lattices. Information Systems Vol. 24, N1, pp.25-46, 1999
[2] H. Ralambondrainy, A conceptual version of the k-means algorithm, Pattern Recogn. Lett., 16, p 1147-1157,
1995
[3] R. Wille Restructuring lattice theory ; an approach based on hierarchies of concepts. In I. Rival, editor,
Ordered sets, pp. 445-470, Ridel, 1982, Dordrecht-Boston.
[4] V. Duquenne. On lattice approximations : syntactic aspects. Social networks, 18 :189-199,1996.
[5] J. Diatta, H Ralambondrainy. The conceptual weak hierarchy associated with a dissimilarity measure. Rapport Interne IREMIA. 2001
Poursuite en thèse : Possibilite de poursuite en these.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
14
11: Ordre des paralogons dans un génome ancestral
Alain Guénoche
Laboratoire : IML à Luminy
Contact : Alain Guenoche : [email protected]
Objectif du stage :
Un paralogon, c’est un ensemble de régions qui contiennent des familles de gènes paralogues plus tous les
gènes sans famille qui sont aussi localisés dans ces régions de paralogie. Un paralogon est composé de 4
régions (considérées comme identiques), réparties sur des chromosomes différents. Ils sont de l’ordre de 25
dans le génome humain.
Ces 4 copies, sont vraissemblablement dûes aux duplications du génome d’une espèce ancestrale. De plus les
chromosomes ont, au cours de l’évolution, subit des mutations qui ont provoqué des réarrangements. Si A était
avant B dans le génome ancestrale, il se peut que cet ordre ne soit plus observé dans certaines copies.
Le problème est : connaissant l’ordre des paralogons sur chacun des chromosomes humains, trouver l’ordre des
paralogons dans le génome ancestral, avant duplication. On appliquera le principe de parcimonie. Celui-ci veut
que l’ordre le plus vraisemblable est celui qui permet d’expliquer la situation présente avec le nombre minimum
de réarrangements. La définition des réarrangements est fondamentale : Tout d’abord, nous considèrerons les
inversions de deux paralogons consécutifs.
Description du travail proposé :
Ce mémoire porte sur 2 problèmes :
(i) construire l’ordre le plus parcimonieux sur l’unique chromosome de l’ancêtre,
et (ii) trouver le nombre minimum de chromosomes de l’ancêtre pour qu’il n’y ait pas eu de réarrangement.
Exemple : 7 paralogons A, B, C, D, E, F, G dont les 4 copies sont réparties sur 7 chromosomes. On observe les
ordres ( le signe > est lu " avant ") :
D
A
D
D
B
F
F
>
>
>
>
>
>
>
A
E
A
F
G
E
D
>
>
>
>
>
>
>
B
B
E
C
F
B
C
>
>
>
>
>
>
>
C,
G,
G,
A,
C,
G,
E.
Une méthode de séparation - évaluation permet de construire les deux ordres totaux les plus parcimonieux,
D > F > A > E > B > G > C et
F > D > A > E > B > G > C
qui n’induisent que 5 transpositions ; ce nombre est minimum.
Si on accorde à l’ancêtre 2 chromosomes, alors il existe 3 solutions qui font que les ordres observés sur les
chromosomes humains s’expliquent sans réarrangement du tout. Une méthode (d’énumération des colorations
d’un graphe) permet de construire :
D > A > E > B > G et F > C,
D > A > B > G et F > C > E,
D > B > G > C et F > A > E.
Poursuite en thèse : Ce sujet peut être poursuivi en thèse avec d’autres définitions des réarrangements.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
15
12: Contribution au développement d’une suite de logiciels pour
l’analyse des réseaux de régulation biologiques : modélisation et
analyse de graphes
Yann Vaxes, Denis Thieffry
Laboratoire : LIF : equipe CRO
LGPD (Laboratoire de Génétique et Physiologie du Développement)
Contact : Yann Vaxes email : [email protected]
Denis Thieffry : [email protected]
Objectif du stage :
La plupart de nos cellules contiennent la même panoplie de gènes (env. 10E4-10E5). Néanmoins, au sein de
chaque type cellulaire (par exemple des cellules musculaires), seul un sous ensemble de ces gènes est exprimé et conditionne les caractéristiques morphologiques et fonctionnelles de ces cellules. L’expression de ces
gènes est contrôlée par des gènes dits ’régulateurs’ (env. 10E3). Ces gènes régulateurs se régulent aussi les uns
les autres en formant des réseaux de régulation. Ces réseaux peuvent être représentés formellement par des
graphes orientés et signés ("graphes d’interactions"). Dans ces graphes, les gènes sont les sommets et les arêtes
représentent les régulations. Les arêtes sont étiquetées par un signe : positif en cas d’activation, négatif en cas
d’inhibition. Ces interactions forment des circuits de régulation dotés de propriétés dynamiques spécifiques,
à la base des mécanismes de différenciation cellulaire. D’un point de vue formel, la dynamique d’expression
génétique est aussi représentée par des graphes orientés ("graphes de séquences d’états"), où chaque sommet
représente un état d’expression discret, et où chaque arrête représente une transition permise entre deux états.
Dans ces graphes, les circuits et les composantes fortement connexes représentent des états cellulaires d’intérêt
biologique.
Description du travail proposé :
Il s’agit de concevoir et d’implémenter une série d’outils permettant la visualisation et l’analyse des graphes
d’interaction ainsi que les graphes de séquences d’états logiques. Ce travail s’appuiera sur une nouvelle base de
données relationnelle ("GIN-db") intégrant de nombreuses données sur les réseaux d’interactions moléculaires
et génétiques. Différents types de graphes pourront donc être extraits moyennant l’écriture de requêtes ou de
procédures appropriées. D’autre part, nous exploiterons des librairies de routines Java publiques permettant la
visualisation des graphes, ainsi que leur étiquetage. Certaines de ces routines permettent déjà l’extraction de
chemins, des circuits, ou encore des composantes (fortement) connexes d’un graphe. Ces routines devront être
adaptées et complétées de manière à répondre à diverses questions biologiques ou théoriques. D’un point de vue
théorique, il s’agira surtout d’établir des relations entre la structure des graphes d’interactions et les propriétés
dynamiques correspondantes (séquences d’états logiques). En particulier, nous nous attacherons à caractériser et comparer les attracteurs (noeuds stables, cycles logiques, etc.) et les bassins d’attraction (ensemble des
états qui conduisent vers ces attracteurs) dans les graphes de séquences d’états (synchrones ou asynchrones)
pour différents états initiaux ou différentes valeurs de paramètres, ou encore pour des modifications du graphe
d’interactions.
Poursuite en thèse : possible
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
16
6
Logique et démonstration automatique
13: Heuristiques pour les problèmes de configuration optimale à base
de contraintes
Laurent Henocque
Laboratoire : LSIS équipe InCA
Contact : Laurent Henocque,
Faculté de Saint Jérôme,
tel 06 83 88 20 01, email [email protected]
Objectif du stage :
Dans le cadre d’un projet jeune équipe soutenu par le CNRS portant sur l’étude de la configuration à base de
contraintes, et en partenariat avec la société Ilog, il s’agit d’étudier la génération automatique d’heuristiques
pour les problèmes de configuration optimale, notamment sous leur formulation à base de préférences, qui
permet aussi bien l’utilisation d’algorithmes de branch and bound classiques, que l’utilisation d’algorithmes de
type "Preference Based Search" (PBS) pour l’énumération de solutions
Description du travail proposé :
Cette recherche comporte une composante expérimentale, dans un domaine totalement inexploré. On s’appuiera
sur un solver de configuration sous contraintes écrit en Java, qui intègre une implantation des préréfences et
de l’algorithme PBS. Le travail consistera alors à expérimenter diverses techniques de génération automatique
de préférences permettant d’optenir le plus rapidement possible des solutions optimales ou sub-optimales pour
une fonction de coût donnée.
Bibliographie :
les papiers de deux workshops et de l’ieee, pour se faire une idée
– http ://wwwold.ifit.uni-klu.ac.at/ alf/aaai99/,
– http ://www.cs.hut.fi/ pdmg/IJCAI2001ConfWS/Program.html,
– http ://dblp.uni-trier.de/db/journals/expert/expert13.html,
le site de Ilog pour voir ce qui existe : http ://www.ilog.fr/products/(j)configurator/,
Poursuite en thèse : possible et souhaitée : bourse Cifre acquise
Commentaires : Configurer consiste à simuler la construction d’un produit complexe en organisant des composants dont les types sont connus, mais pas leurs relations, ni leur nombre, ni leurs propriétés. Une approche
scientifique de ce problème se fait via une généralisation de la programmation par contraintes (CSP). Les problèmes de configuration constituent un enjeu majeur pour les technologies de l’information, car ils sont perçus
comme un modèle possible de l’intelligence devant être déployée par les sites internet en particulier, et par
de nombreux programmes d’assistance ou d’intermédiation en général. Toute avancée permettant de simplifier
la mise en oeuvre de solutions de configuration possède un intérêt pratique évident, et un intérêt scientifique
considérable
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
17
14: Approximation et compilation des X-logiques par les théories de
Horn
Vincent Risch
Laboratoire : L.S.I.S., Equipe InCA.
Contact : Vincent Risch, Luminy, Tél. : 04 91 82 90 74, Mail : [email protected]
Objectif du stage :
Etude des conditions d’implantation du concept d’“inférence rapide” approximée par les théories de Horn pour
les X-logiques dans le cas propositionnel fini.
Description du travail proposé :
La formulation d’une logique sur un langage L consiste en la donnée d’une relation entre formules, dite relation
d’inférence, généralement notée `, et caractérisée par un sous-ensemble de L×L. Une logique est monotone si,
quelque soient les formules f, g, h de L, lorsque f ` g alors f ∧h ` g. A contrario, les logiques non-monotones
ne possèdent pas une telle propriété. Elles y gagnent un pouvoir expressif certain, qu’elles paient pourtant au
prix d’une complexification notable des procédures de preuve associées aux formalismes correspondants. Les
X-logiques, introduites par [Siegel, Forget, 1996], apparaissent comme un ambryon d’une théorie de la preuve
pour les formalismes non-monotones, et ce à partir de la notion classique de théorème. Plus précisément, la
relation d’inférence non-monotone `X est telle que f `X g si tout théorème (au sens classique) de f ∧ g qui est
dans X est un théorème de f . La relation `X est non-monotone, quoique monotone sur X, et étend de façon
naturelle la relation classique ` (on retrouve la relation de conséquence classique pour X = L). Il est montré
par [Forget, Risch, Siegel, 2000] que, dans le cas fini, les formalismes non-monotones les plus connus (modèles
préférentiels et raisonnement par défaut) sont des X-logiques. On dispose donc d’un formalisme fédérateur au
sein duquel la notion de théorème classique est centrale. Toutefois la cardinalité de X reste un problème majeur
concernant toute tentative d’implantation d’un démonstrateur pour les X-logiques. De leur côté, Bart Selman et
Henry Kautz [Selman, Kautz, 1996] ont proposé une remarquable technique d’encadrement de tout ensemble
de formules par des ensembles de clauses de Horn, encadrement vu comme une compilation préalable de cet
ensemble de formules avant son traitement par un démonstrateur. Il a été montré dans la littérature que cette
approche permet une amélioration notable des méthodes de démonstration dans le cas général classique. L’enjeu
de ce stage est d’étudier les conditions dans lesquelles adapter cette technique d’encadrement à la notion de
preuve en X-logiques, et d’évaluer son efficacité dans ce contexte particulier.
Bibliographie :
[Eiter, Ibaraki, Makino, 1999] Eiter T., Ibaraki T., Makino K., On the Difference of Horn Theories. Proceedings
of the Symposium on Theoretical Aspects of Computer Science, STACS’99, Trier, Germany, March 4–6, 1999,
C. Meinel, S. Tison (Eds), LNCS 1563, Springer Verlag.
[Forget, Risch, Siegel, 2000] Forget L., Risch V., Siegel P., Preferential Logics Are X-logics. Journal of Logic
and Computation, Vol. 11, N. 1, p. 71–83.
[Lorenzi, 1998] Lorenzi J.-M., Caractérisation des X-logiques. Mémoire de DEA, Université de la Méditerranée, Faculté des Sciences de Luminy, p. 205–221.
[Selman, Kautz, 1996] Selman B., Kautz H., Knowledge Compilation and Theory Approximation. Journal of
the ACM, Vol. 43, n. 2, March 1996, p. 193–224.
[Siegel, Forget, 1996] Siegel P., Forget L., A Representation Theorem for Preferential Logics. Fifth Conference
on the Principles of Knowledge Representation and Reasoning, KR’96, Cambridge, Massachusetts, November
5–8, 1996, Aiello, Doyle, Shapiro (Eds), Morgan Kaufmann Publishers, p. 453–460.
Poursuite en thèse : Souhaitable.
Commentaires : Sujet s’appuyant sur les acquis des options III (“Raisonnement non-monotone”) et IV (“Procédures de preuve : problème SAT, CSP, et raisonnement temporel”).
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
18
15: Algorithmes non énumératifs pour le problème SAT
Pierre Siegel
Laboratoire : LSIS - Equipe INCA
Contact : Pierre Siegel Laboratoire : LSIS équipe InCA Pierre Siegel 04 91 11 36 01
CMI. Technopole de Château Gombert. 39 rue F. Joliot Curie 13453 Marseille Cedex 13
[email protected]
Objectif du stage :
Étude théorique et pratique d’algorithmes non énumératifs pour le problème SAT
Description du travail proposé :
En informatique, le problème SAT (satisfaction d’une formule booléenne) a fait l’objet de très nombreuses
études théoriques et pratiques depuis un vingtaine d’années. Depuis quelques années, une bonne partie de
ces recherches est basée sur des méthodes énumératives, qui reviennent à explorer un arbre de recherche (en
particulier sur la procédure de Davis et Putnam et ses clones). Actuellement, ces méthodes semblent montrer
leurs limites. En particulier, la résolution des problèmes au seuil dans SAT 3, fait très peu de progrès.
Le but du stage est d’étudier, pour SAT, d’autres type d’algorithmes non énumératifs. En simplifiant, ces algorithmes, au lieu de parcourir un arbre de recherche ajoutent à l’ensemble F de formules à étudier des formules
impliquées par F. Dans un premier temps, on partira des classiques (et anciennes) méthodes de résolution.
Après une étude bibliographique de ces méthodes, on étudiera leurs classes polynomiales. On essaiera également d’étudier, pour ces algorithmes les problèmes au seui l
Bibliographie :
Très importante ! Pour commencer à entrer dans le problème, il est possible de lire :
- Étude Comparative de trois formalismes en calcul propositionnel (projet Bahia : Booléen, heuristiques et
Algorithmes pour l’IA. Actes des 4ième et actes des 5ièmes Journées nationales du PRC GDR IA. 1992 et
1995. Teknea.
- Projet inter-PRC " classes polynomiales ", travaux et résultats. Actes des 5ièmes Journées nationales du PRC
GDR IA. 1995. Teknea.
Poursuite en thèse : Possible
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
19
16: Couplages dans les graphes biparties et le problème SAT
Belaid Benhamou
Laboratoire : LSIS, équipe InCA
Contact : Belaid Benhamou Centre de Mathématiques et d’Informatique 39, rue Joliot Curie - 13453 Marseille
cedex 13, France
phone number : 91.11.36.22 e-mail : [email protected]
Objectif du stage :
Un point d’intérêt des travaux de recherches sur le problème SAT est la définition de sous-classes traitables
de ce problème qui soient utilisables pour sa résolution. Nous avons commenc é à explorer une nouvelle voie
pour caractériser des classes polynomiales. Celle-ci consiste à trouver des témoins de satisfiabilité en temps
linéaire en utilisant les proriétés de couplages dans les graphes biparties. Nous pensons notamment à analyser
le nombre d’occurences des variables et les longueurs de clauses. Cela nous a amenés entre autres à définir une
classe polynomiale I qui contient la classe r-r-SAT de Tovey (r-r-SAT : représente la classe des instances SAT
où toutes les clauses sont de longueur r et chaque variable apparait au plus r fois)
Description du travail proposé :
Le travail consistera en l’étude d’un algorithme basé sur la notion de couplage dans les graphes biparties qui
permet de décider, de reconnaître et de résoudre les instances de I. Ce dernier sera implémenté et testé sur
les instances aleatoires de SAT pour mettre en évidence son champs d’application. Enfin nous enviseageons
d’utiliser cet algorithme de couplage dans les méthodes de réparations locales (comme GSAT par exemple).
Nous pensons notamment que la technique de couplages permettrait de fournir une bonnes interprétations de
départ (pas très loin d’une solution) pour les méthodes de recherche locales afin de trouver rapidement la
solution.
Bibliographie :
Un rapport interne
Poursuite en thèse : Possible
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
20
17: Génération de modèles finis en logique du premier ordre
Belaid Benhamou et Gilles Audemard
Laboratoire : LSIS, équipe InCA
Contact : Belaid Benhamou Centre de Mathématiques et d’Informatique 39, rue Joliot Curie - 13453 Marseille
cedex 13, France
phone number : 91.11.36.22 e-mail : [email protected]
Objectif du stage :
La génération de modèles et de contre modèles finis pour une théorie de la logique du premier ordre est une
approche complémentaire à la démonstration automatique de théorèmes. Plusieurs générateurs de modèles finis
ont été élaborés (Falcon, Sem, Fmset etc...). Ces Méthodes ont permis de résoudre des problèmes ouverts dans
plusieurs domaines, notamment la recherche de groupes, d’anneaux et de quasi-groupes finis en mathématiques.
Description du travail proposé :
Le travail consistera dans un premier temps à étudier les techniques de génération de modèles finis présentées dans la thèse de Gilles Audémard et dans un deuxième temps à améliorer les travaux sur la detection et
l’exploitation de la symétrie afin de pouvoir résoudre des problèmes de la librairie TPTP
Bibliographie :
La thèse de Gilles Audemard, "Résolution du problème SAT et génération de modèles finis en logique du
premier ordre", soutenue le 25 octobre 2001 à l’Université de Provence
Poursuite en thèse : Possible
Commentaires : Pour résoudre un problème, les générateurs de modèles finis utilisent souvent la forme clausale
du premier ordre ou une forme simplifiée de celle-ci pour le représenter. Cette contrainte rend moins naturel
le pouvoir expressif de ces méthodes. Pour élargir le champ d’application de ces générateurs de modèles finis,
nous pensons dans le futur (dans le cadre d’une éventuelle poursuite en thèse) à élaborer un système qui serait
basé sur l’énumération et qui accepterait en entrée une représentation de problèmes sous forme de formules
générales de la logique du premier ordre. Cette extension du langage d’entrée faciliterait la représentation de
certains problèmes du domaine de la démonstration automatique et de mathématiques que nous souhaitons
résoudre
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
21
18: Preuve d’inconsistance par méthodes incomplètes
Philippe Jégou
Laboratoire : LSIS équipe InCA (Inférence, Contraintes et Applications)
Contact : Philippe Jégou Faculté des Sciences et Techniques de Saint-Jérôme Av. Escadrille NormandieNiemen - 13397 Marseille Cedex 20
Tél. : 04 91 28 89 37 Email : [email protected]
Objectif du stage :
Depuis quelques années, la résolution pratique de problèmes NP-Complets tels que SAT ou CSP, a fait l’objet
d’une avancée considérable par l’exploitation de méthodes de recherche stochastiques telles que GSAT. Des
jeux de données de taille considérables ont été traités, là où les méthodes complètes échouaient. Toutefois,
l’incomplétude de telles méthodes ne leur permet pas de faire des preuves d’inconsistance. Aussi, lors de
l’IJCAI 1997, dans le cadre du challenge proposé par Bart Selman et Henry Kautz, le problème de la preuve
d’inconsistance par méthodes stochastiques a été identifié parmi les 10 défis mis en concours. À ce jour, aucune
avancée tangible n’a semble-t-il été proposée. L’objet de ce stage est d’explorer une des voies possible.
Description du travail proposé :
Il s’agira dans un premier temps de se familiariser avec les travaux de D.R. Gaur, W.K. Jackson, et W.S.
Havens (voir référence ci-dessous). Il faudra ensuite les adapter et établir expérimentalement leur intérêt dans
le cadre de la preuve dŠinconsistances de CSP par lŠemploi de méthodes stochastiques. Dans un second temps,
il sŠagira d’évaluer cette approche sur les instances SAT. Enfin, la recherche de propriétés similaires à celle
développées par Gaur, Jackson, et Havens sera envisagée par une étude bibliographique.
Bibliographie :
Méthodes stochastiques sur SAT et CSP. Une partie de la littérature sera présentée dans l’option Procédures de
preuve : problème SAT, CSP, et raisonnement temporel ; plusieurs articles sont accessibles à partir de la page
WEB de H. kautz où se trouve la description du Challenge IJCAI : http ://www.cs.washington.edu/homes/kautz/challenge/
D.R. Gaur, W.K. Jackson, and W.S. Havens. Detecting unsatisfiable CSPs by coloring the micro-structure.
In Proceedings of the 14th National Conference on AI, pages 215–220. American Association for Artificial
Intelligence, 1997. http ://www.cs.sfu.ca/research/groups/ISL/papers/gaur-detecting.pdf
Poursuite en thèse : Ce stage a pour objectif normal de déboucher sur une thèse.
Commentaires : Le stage se déroulera au LSIS, à la Faculté des Sciences et Techniques de Saint-Jérôme. Le
stagiaire sera accueilli au sein de l’equipe InCA. Il aura à sa disposition les conditions matérielles minimales
(machine, salle de travail).
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
22
19: Logique dynamique linéaire d’actions pour la planification
Camilla Schwind
Laboratoire : MAP, CNRS, UMR 694
Contact : Camilla Schwind [email protected] tel : 04 91 82 71 90
Objectif du stage :
La logique dynamique linéaire d’actions est basée sur la version produit de DLTL (dynamic linear temporal
logic), qui est une logique temporelle dans laquelle les modalités temporelles peuvent être indexées par des
programmes linéaires.
Elle permet de décrire le comportement d’un réseau d’agents qui co-ordonnent leurs activités et co-opérent
d‘pour exécuter des actions ensemble. Les problèmes de projection temporelle et de planification peuvent être
modélisés comme un problème de satisfaction de la logique DLTL.
Description du travail proposé :
Le travail consistera dans un premier temps à étudier la logique dynamique et à modéliser un (ou des) problèmes
de planification complexe. Dans un deuxième temps, nous envisageons d’élaborer un algorithme pour résoudre
le problème de persistence et de planification par l’approche de satisfaction de modèles.
Bibliographie :
[JGiordanoMartelliSchwind :00] L. Giordano, A. Martelli and C. Schwind, Reasoning about Actions in Dynamic Linear Time Temporal Logic. Logic Journal of the Interest Group in Pure and Applied Logics IGPL,
Oxford University Press, Oxford, UK, vol. 9, no.2, pp.289-303, 2001.
[Henriksen99] J.G. Henriksen and P.S. Thiagarajan, Dynamic Linear Time Temporal Logic. in Annals of Pure
and Applied logic, vol.96, n.1-3, pp.187–207, 1999
[Giunchiglia & Traverso99] F. Giunchiglia and P. Traverso., Planning as Model Checking. In Proc. The 5th
European Conf. on Planning (ECP’99), pp.1–20, Durham (UK), 1999.
Poursuite en thèse : Une poursuite en thèse est possible et souhaitable pour ce mémoire
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
23
7
Programmation et logique
20: Bornes inférieures pour les phénomènes de seuil liés à la satisfaisabilité des formules booléennes
Nadia CREIGNOU, Hervé DAUDE
Laboratoire : LIF (équipe logique et complexité) et LATP (équipe DSA )
Contact : Nadia Creignou, tel. 04 91 82 94 80, email [email protected]
Objectif du stage :
Les phénomènes de seuil sont bien connus sous le nom de changements de phase ou de percolation en physique
et sont très largement étudiés en physique théorique et statistique. Un phénomène de seuil pour la satisfaisabilité de formules Booléennes, mis en évidences expérimentalement il y a quelques quelques années, est le
suivant : quand le nombre de variables tend vers l’infini, une formule CNF dont le rapport nombre de clauses
sur nombre de variables est supérieur à une certaine constante c est presque sûrement insatisfaisable alors que si
ce rapport est inférieur à c alors la formule est presque sûrement satisfaisable. La mise en évidence de tels phénomènes est importante car il s’avère qu’alors seules les formules dont le ratio nombre de clauses sur nombre
de variables avoisine c produisent un matériel fiable pour tester l’efficacité d’ algorithmes. L’existence d’un
tel phénomène n’est pas encore complètement établi pour les formules 3-CNF. En particulier de nombreux
chercheurs s’attachent à établir des bornes aussi précises que possible pour la constante c correspondant à la
transition de phase. Par exemple pour 3-SAT, alors qu’expérimentalement la valeur critique est approximativement c3 = 4, 25 , la meilleure borne supérieure connue est c3 < 4, 506 alors que les meilleurs bornes inférieures
qui ont été successivement obtenues sont c3 > 3, 003, 3, 145, 3, 26. Sur cet exemple on voit qu’il est difficile
d’obtenir des bornes inférieures.
Description du travail proposé :
Le travail consistera dans un premier temps à faire le bilan des diverses techniques utilisées pour obtenir ces
bornes inférieures et dans un deuxième temps à appliquer ces méthodes à un problème similaire : le problème
Monotone-3-SAT. Le but sera alors de cerner la portée des techniques mises en oeuvre.
Bibliographie :
A.M. Frieze and S. Suen. Analysis of two simple heuristic on a random instance of k-SAT. Journal of algorithms
20 (2) :312–355, 1996.
D. Achlioptas and B. Sorkin. Optimal myoptic algotithms for random 3-SAT. In proceedings of the 41st annual
symposium of foundations of computer science, pages 590–600, 2000.
Poursuite en thèse : A priori non, cependant si les résultats trouvés sont encourageants une poursuite en thèse
sur un sujet voisin serait possible
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
24
21: Typage et gestion automatique de la mémoire dans un langage à
objets
Silvano DAL ZILIO
Laboratoire : LIF - Nord
Contact : Silvano DAL ZILIO, CMI, 39 rue Joliot-Curie, 13453 Marseille Cedex 13,
FRANCE, +33 (0)4 91 11 36 25, [email protected]
Objectif du stage :
Il s’agit de développer une méthode d’analyse des programmes objets, basée sur le typage, permettant d’abstraire l’utilisation de la mémoire par un programme.
Cette étude, qui sera menée sur une version simplifiée d’un langage orienté objets, doit permettre de conclure
jusqu’à quel point il est possible de se passer d’un ramasse-miette (garbage collector) tout en assurant une
gestion automatique de la mémoire.
Description du travail proposé :
Une application commune des méthodes d’analyse des programmes par typage est liée à l’optimisation du
temps d’exécution. Ainsi, une analyse fine de la manière dont un programme accède à ses ressources, telle que
la mémoire par exemple, peut permettre d’économiser le recours à des tests dynamique coûteux au moment de
l’exécution.
Cette utilisation des systèmes de types est aujourd’hui encore un domaine de recherche très actif, qui a produit
de nombreux résultats originaux dans le domaine de la programmation fonctionnelle. Un exemple particulièrement élégant de ce type d’analyse est le calcul des régions de Tofte et Talpin [1], qui permet d’optimiser la
gestion de la mémoire d’un programme au moment de sa compilation. Les régions ont par exemple été utilisées dans l’implantation de ML Kit [2], un compilateur pour le langage Standard ML qui n’utilise pas de
ramasse-miettes.
Des recherches plus récentes nous permettent d’espérer atteindre des résultats comparable dans le cas des
langages impératifs et, par exemple, avec les langages à objets concurrents [3, 4].
Le but de ce stage est d’étudier la possibilité de définir un mécanisme de gestion statique de la mémoire pour
un langage de programmation orientés objets simple. Ce mécanisme, basé sur un système de types avec effets
du même genre que celui définit par Tofte et Talpin dans leur implémentation de ML Kit, devrait permettre de
conclure jusqu’à quel point il est possible de se passer d’un ramasse-miette (garbage collector), tout en assurant
une gestion automatique de la mémoire.
Bibliographie :
[1] "A simplified account of region inference." J.-P. Talpin, Rapport de Recherche INRIA 4104, janvier 2001.
[2] "Region-based memory management." M. Tofte et J.-P. Talpin. Information and Computation, Vol. 132(2),
p. 109-176, 1997.
[3] "Featherweight Java : A Minimal Core Calculus for Java and GJ." A. Igarashi, B. Pierce et P. Wadler. POPL,
2001.
[4] "Region Analysis and a pi-calculus with Groups." S. Dal Zilio et A. D. Gordon. Rapport de Recherche
MSR-TR-2000-57, Microsoft Research, août 2000.
Poursuite en thèse : Il serait possible de poursuivre ce travail par une thèse dans le cadre du projet européen
MIKADO, qui fait partie du programme IST-FET sur la programmation globale.
Commentaires : Un intérêt pour la sémantique des langages de programmation et la programmation fonctionnelle est souhaitable. Des notions en analyse statique de programmes ou en typage sont un plus.
Ce stage, qui s’effectuera au sein de l’équipe MOVE au CMI (http ://www.cmi.univ-mrs.fr/ amadio/ModVer/modver.html),
est essentiellement théorique. Le stage nécessite néanmoins un intérêt pour la programmation et pourrait déboucher sur l’implantation d’un prototype logiciel.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
25
22: Forme normale de contraintes du premier ordre sur les arbres
binaires infinis
Alain Colmerauer
Laboratoire : LIF
Contact : Alain Colmerauer, tel : 04 91 40 11 37, e-mail : [email protected]
Objectif du stage :
Mieux maîtriser la résolution de contrainte générales du premier ordre dans les arbres.
Description du travail proposé :
On considère des contraintes du premier ordre (avec égalité) construites sur le langage L = {g, f } ∪ R, où g, f
sont des symboles d’opération d’arité 1 et R un ensemble infini de symbole de relations, tous d’arité 1.
On désigne par A l’ensemble des arbres binaires infinis dont les nœuds sont étiqueté par les éléments de R.
On se place dans la structure A, de domaine A, où chaque symbole s de L est interprété par l’opération ou la
relation s suivante
1. g(x) et d(x) désignent repectivement le fils gauche et le fils droit de l’arbre x,
2. r(x), avec r ∈ R, signifie que la racine de l’arbre x est étiqueté r.
Le travail de recherche consistera tout d’abord à voir comment associer à toute contrainte p une contrainte
équivalente normal(p), qui ne contienne aucune quantification et qui soit une forme normale (si p est équivalent
à q alors normal(p) = normal(q)). Puis à étudier des algorithme pour calculer normal(¬p), normal(p ∧ q) et
normal(∃x p) à partir des formes normales p et q.
Bibliographie :
Résolution de contraintes du premier ordre dans l’algèbre des arbres finis ou infinis. Thèse de Thi Bich Hanh
Dao, LIM, décembre 2000.
Poursuite en thèse : Une poursuite en thèse est possible pour ce mémoire
Commentaires : Si le sujet se révélait trop difficile on pourra se contenter d’un forme canonique ayant des
propriétés intéressantes.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
26
23: Décidabilité/indécidabilité des propriétés “chaotiques”dans les
automates cellulaires
Enrico Formenti
Laboratoire : Laboratoire d’informatique fondamentale de Marseille (LIF).
Centre de Mathématique et Informatique (CMI), 39 rue Joliot-Curie, 13453 Marseille cedex 13
Contact : Enrico Formenti, LIF-CMI.
Tél : +33 (0)4 91 11 36 21 Fax : +33 (0)4 91 11 36 02 Mél : [email protected]
Objectif du stage :
Dans le cadre des systèmes dynamiques discrets plusieurs notions de chaoticité/complexité ont étés introduites
avec des résultats à la fois intriguants et insatisfaisants.
Les automates cellulaires, vus dans l’optique systèmes dynamiques ne font pas exception à ce dualisme. En ce
derniers années nombre de résultats ont étés montres mais l’impression générale est qu’une grande partie reste
encore à faire.
Description du travail proposé :
Le stage devra intervenire dans le cadre ci-dessus en étudiant la décidabilité/inécidabilité des propriétés “chaotiques” des automates cellulaires. On pourra limiter le travail à des classes particulières d’automates comme,
par exemple, les “number-conserving”.
Poursuite en thèse : Possibilité de continuation en thèse.
Commentaires : Les pré-requis nécessaires sont des notions de décidabilité, de la calculabilité et une bonne
dose d’imagination !
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
27
24: Synthèse d’automates communicants
Rémi MORIN
Laboratoire : LIF (Laboratoire d’Informatique Fondamentale de Marseille)
Contact : Rémi MORIN Technopôle Château-Gombert, 39, rue F. Joliot Curie F-13453 Marseille Cedex 13,
France
Mél : [email protected] Web : http ://www.cmi.univ-mrs.fr/˜morin/
Objectif du stage :
Les systèmes de transitions asynchrones forment un modèle très classique de systèmes parallèles. Ils sont reliés
aux réseaux de Petri, aux automates communicants, aux algèbres de processus, etc. Le problème de la synthèse
consiste à construire des composants dont l’interaction réalise une spécification donnée par un automate muni
d’une relation d’indépendence décrivant le parallélisme du système. Ce problème est souvent difficile. Pour
des réalisations sous forme de réseaux de Petri, la complexité de la synthèse est connue et un outil basé sur
l’algorithme du simplexe déja implémenté et utilisé pour la synthèse de contrôleurs. Qu’en est-il pour les
systèmes de processus communicants ? Peut-on faire aussi bien (ou mieux) qu’avec les réseaux de Petri ?
Description du travail proposé :
Il s’agit d’étudier la complexité de la synthèse de systèmes de processus communicants et de rechercher des
algorithmes efficaces de réalisation.On cherchera à s’inspirer des techniques mises en oeuvre et implémentées
pour la synthèse de réseaux de Petri (BDD, simplexe).
Bibliographie :
Une page web http ://www.cmi.univ-mrs.fr/˜morin/StageDEA01.html sera très bientôt disponible. Vous y trouverez la version électronique des principaux articles du domaine et une bibliographie sur la
théorie du contrôle.
Poursuite en thèse : Idéalement, ce stage se poursuivra en une thèse sur les méthodes formelles de validation
de logiciels distribués.
Commentaires : Le cours de complexité de l’option ProgLog sera un atout.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
28
25: Réalisation de HMSC
Rémi MORIN
Laboratoire : LIF (Laboratoire d’Informatique Fondamentale de Marseille)
Contact : Rémi MORIN Technopôle Château-Gombert, 39, rue F. Joliot Curie F-13453 Marseille Cedex 13,
France Mél : [email protected] Web : http ://www.cmi.univ-mrs.fr/˜morin/
Objectif du stage :
Le formalisme des ”message sequence charts” est un standard établi de l’International Telecommunication
Union. Souvent utilisé pour décrire des protocoles dans les premières phases d’une spécification formelle,
il apparaît aussi sous la forme de ”sequence diagrams” dans UML. Fondés sur des schémas graphiques et
intuitifs, les MSC admettent divers opérateurs de composition qui permettent une formalisation hiérarchique
d’ensembles complexes de scénarios sous la forme d’expressions algébriques appelées MSC hiérarchiques
(HMSC). La vérification de ces descriptions formelles a pour but de détecter des erreurs de spécification le
plus tôt possible au cours de la conception. Une propriété principale que nous souhaitons vérifier est que le
comportement décrit par une HMSC correspond bien à celui d’un système de processus communicants, c’està-dire que la HMSC est réalisable.
Description du travail proposé :
Attrayant par sa facilité d’utilisation, le formalisme graphique des MSC peut très vite conduire à des spécifications complexes qui ne peuvent pas être réalisées sous la forme de processus communicants. Nous sommes
face à un problème de synthèse somme toute classique. La première question qu’il faut se poser est bien sûr
de savoir ce qu’est une réalisation acceptable d’un langage de MSC donné. Plusieurs pistes ont été étudiées
[AEY01, AEY00, CDHL00, MNS00], mais d’autres toutes aussi intéressantes sont encore à explorer.
Pour le type de réalisation définie et étudiée par A LUR ET AL . [AEY00, AEY01] un encadrement de la complexité du problème de la synthèse a été récemment proposé pour la sous-classe, relativement réduite, des
langages réguliers : le problème est PSPACE-difficile et EXPSPACE. Cette étude demande à être précisée et
mais aussi généralisée : on ignore en effet encore si le problème est décidable pour les langages non réguliers
(il l’est pour les langages reconnaissables [M02]).
L’approche suivie dans [AEY01, AEY00] se limite aux protocoles qui terminent et ne considère que les exécutions s’achevant sur des canaux communications vidés de leurs messages. Elle suppose en outre que ces
messages circulent de manière FIFO. Il s’agit là d’hypothèses très restrictives concernant les protocoles de
télécommunications et autant de voies nouvelles à explorer.
Bibliographie :
Une présentation plus complète de ce thème de recherche est disponible en http ://www.cmi.univmrs.fr/˜morin/DEA01.html. Elle comprend le cours introductif aux MSC présenté au DEA, ainsi que
des liens vers plusieurs publications récentes.
Poursuite en thèse : Le stage s’appuiera essentiellement sur deux articles récents [AEY01, AY00] (téléchargeables à partir de la page Web de présentation de ce stage). Idéalement, il conduira à une thèse dans ce domaine
en pleine effervescence qui recèle de nombreux problèmes théoriques et pratiques.
Commentaires : Le cours de complexité de l’option ProgLog sera un atout.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
29
26: Pavages et complexité
Bruno Durand
Laboratoire : Laboratoire : LIF (Laboratoire d’Informatique Fondamentale de Marseille) http ://www.lif.univmrs.fr
Contact : Bruno Durand
http ://www.cmi.univ-mrs.fr/ bdurand, email : [email protected]
Objectif du stage :
Les pavages et leur complexité structurelle. L’idée est d’étudier les pavages dits "complexes" c’est à dire les
pavages obtenus par des ensembles de tuiles ne pavant le plan que de façon complexe (plusieurs définitions de
complexité peuvent être fructueusement employées). En général ils sont quasi-périodiques : l’apparition des
motifs finis y est régulière.
Description du travail proposé :
Etudier les liens des diverses propriétés de complexité des pavages avec la quasipériodicité. Par exemple on peut
définir des notions de pavages quasipériodiques "constructibles" en s’inspirant de la construction physique des
quasicristaux par agglomération et étudier s’il peuvent ou non hautement complexes. Le sujet est très ouvert,
moderne (le problème posé en 1972 de construire les pavages les plus complexes possibles a été résolu sulement
en 2001), et nécessite qq prérequis de calculabilité et complexité élémentaire.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
30
27: Conservation de l’information dans les automates cellulaires
Bruno Durand
Laboratoire : Laboratoire : LIF (Laboratoire d’Informatique Fondamentale de Marseille) http ://www.lif.univmrs.fr
Contact : Bruno Durand, Université de Provence.
http ://www.cmi.univ-mrs.fr/ bdurand, email : [email protected]
Objectif du stage :
Certains automates cellulaires ont des propriétés de conservation. On connait par exemple les automates cellulaires "number-conserving". Ces derniers conservent localement la somme des états. Par exemple si on considère une configuration périodique formée de 0 et de 1, le nombre de 1 est localement conservé. Ces automates
sont très utiles pour modéliser des phénomènes ayant une loi de conservation (exemple le traffic routier, les
flux, etc.) On s’est récemment aperçu que bien que très simples, ils avaient des propriétés dynamiques subtiles
et formaient des classes bien plus riches qu’on l’attendait.
Description du travail proposé :
L’idée est d’étudier des lois de conservations plus élaborée que la somme des états et voir si les classes obtenues
sont intéressantes. Il convient d’abord de savoir si la propriété recherchée est décidable (I.E. si on donne un
automate cellulaire, peut-on savoir s’il conserve ou non la loi donnée. C’est le cas pour la somme des états –
et l’algorithme de décision est très élégant. Plus généralement, quel type de loi de conservation locale peut être
décidée ? toute ?
De nombreuses questions sont ouvertes dans ce domaine où des notions de base de calculabilité sont requises.
Le sujet assez ouvert se précisera en fonction des résultats obtenus.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
31
28: Analyse des algorithmes adaptatifs de contrôle pour la production de cartes à puce personalisées
Peter NIEBERT
Laboratoire : Cybernétix Recherche en coopération avec le LIF, Équipe Modélisation et Vérification
Contact : Peter Niebert, LIF, CMI, Château Gombert, 39 rue Joliot Curie, 13013 Marseille,
[email protected]
Objectif du stage :
Cybernétix est une société Marseillaise de robotique et automatique située à Château-Gombert, où se trouve
également leur division recherche. Parmi d’autres activités, Cybernétix s’occupe de machines pour l’assemblage et la personnalisation de cartes à puces. Il s’agit de machines sophistiquées, pouvant atteindre des débits
de 6000 cartes par heure et utilisées pour une fabrication à moyenne échelle.
Pour arriver à ce débit, les machines disposent d’une structure parallèle et modulaire, et traitent les cartes par
lots. En fonctionnement normal, un système de transport va insérer un lot dans les unités de traitements, elles
seront traitées et personnalisées et dans la suite déposées sur une pile triée de cartes. Malheureusement, un
certain nombres de cartes jugées défectueuses par les unités de traitement doivent être éliminées, et remplacées
par d’autres cartes, tout en respectant un certains ordre dans la production.
A cette fin Cybernétix Recherche a développé un algorithme sophistiqué de rattrapage, qui est utilisé dans la
pratique. Le but de cet algorithme est de garantir l’ordre de débit des cartes tout en atteignant la plus grande
vitesse moyenne possible. Des problèmes de re-triage de ce type apparaissent également dans d’autres secteurs
d’activités de Cybernétix.
Le but de ce stage est de modéliser et d’analyser cet algorithme, et éventuellement de considérer des modifications (soit de l’algorithme, soit de l’architecture de la machine) pouvant permettre un traitement plus efficace.
Description du travail proposé :
Dans un premier temps, il s’agit de modéliser le processus de production ainsi que l’algorithme de rattrapage
à un niveau pouvant permettre l’analyse de ses performances. Basé sur un même format d’entrée, il s’agit de
générer automatiquement des modèles pour un simulateur ainsi que pour des outils de vérification de systèmes
à événements discrets (par exemple des automates temporisés).
Le premier but de l’analyse est de vérifier que l’algorithme de rattrapage est correct, c’est à dire qu’il garantit le
bon ordonnancement des cartes. On pourra également essayer de démontrer l’optimalité de l’algorithme pour
une certaine architecture de la machine que l’on se sera fixé à l’avance.
Bibliographie :
Pour avoir une impression du domaine de travail du point de vue scientifique, il est utile d’aller voir les pages
Web du projet européen VHS (vérification des systèmes hybrides, http ://www-verimag.imag.fr/VHS) ainsi que
sur les pages de Cybernétix (http ://www.cybernetix.fr).
Poursuite en thèse : Ce stage à vocation à se poursuivre par une thèse industrielle en collaboration avec
Cybernétix Recherche, financée par une bourse CIFRE ou par une bourse régionale.
Commentaires : Il s’agit d’un travail d’application des méthodes formelles à l’analyse des systèmes de contrôle
adaptatifs. Cet travail se retrouve ainsi à la frontière de la recherche opérationnelle et de la modélisation formelle. Le défi de l’analyse par des telles méthodes provient de la difficulté de la modélisation d’une part et de
la complexité de l’analyse d’autre part.
Une poursuite en thèse pourrait ainsi contribuer à deux buts complémentaires : augmenter le savoir faire de l’entreprise d’accueil pour la conception et programmation des systèmes de contrôle adaptatifs ; guider la recherche
d’algorithmes efficaces d’analyse automatique.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
32
8
Structures discrètes et Recherche Opérationnelle
29: Séparation des contraintes de partition Steiner généralisées
Mohamed DIDI BIHA, Philippe Michelon
Laboratoire : Laboratoire d’Informatique d’Avignon
Contact : M. DIDI BIHA, 339 chemin des Meinajaries, 84911 Avignon, Tél. 04 90 84 35 54, email :
[email protected]
Objectif du stage :
Beaucoup de problèmes réels peuvent se modéliser comme des problèmes d’optimisation combinatoire. Un
coût (ou un poids) ayant été affecté à chaque élément d’un ensemble fini E, il s’agit de choisir un "meilleur"
élément (de coût minimum ou de poids maximum) d’une famille de sous-ensembles de E.
Une approche qui s’est révélée efficace pour ce type de problèmes est l’approche polyédrale. Elle consiste à
décrire l’enveloppe convexe des vecteurs caractéristiques des solutions du problème (le polyèdre associé au
problème) par un système d’inégalités linéaires, et donc à se ramener à la maximisation (ou la minimisation)
d’une fonction linéaire sur un polyèdre.
Soit P ⊆ Rn un polyèdre et τ une classe d’inégalités valides pour P . Le problème de séparation de τ est le
suivant : étant donné un point x ∈ Rn , décider si x satisfait toutes les inégalités de τ et, lorsque ce n’est pas le
cas, trouver une inégalité de τ violée par x. Le problème de séparation est le point essentiel dans l’approche polyédrale. En effet, il y a une équivalence entre la résolution en temps polynomial d’un problème d’optimisation
combinatoire et l’existence d’un algorithme polynomial pour la séparation des inégalités du polyèdre associé à
ce problème.
Un exemple de problèmes d’optimisation combintoire les plus connus est le problème de l’arbre Steiner. Étant
donné un graphe G = (V, E), un sous-ensemble S de V et un vecteur poids associé aux arêtes de G, le problème de l’arbre Steiner consiste à trouver un arbre de G de poids minimum couvrant S. Ce problème a de
nombreuses applications, en particulier dans la conception des circuits électroniques intégrés et des réseaux de
télécommunications.
Nous nous intéressons à une approche polyédrale pour ce problème. En particulier, nous proposons l’étude
d’une nouvelle famille d’inégalités valides dite "contraintes de partition généralisées".
Description du travail proposé :
– Étude de la complexité du problème de séparation de ces contraintes ;
– Conception d’une heuristique efficace pour séparer ces contraintes ;
– Utilisation de ces contraintes dans un algorithme de coupes pour résoudre des instances du problème de
l’arbre Steiner.
Bibliographie :
M. Didi Biha, H. Kerivin, A.R. Mahjoub, Steiner tree and polyhedra, Discrete Applied Mathematics 112 (2001)
101-120
W. R. Pulleyblank, Polyhedral combinatorics, In G. L Nemhauser et al, eds, Handbooks in OR-MS, vol. 1,
North-Holland, Amsterdam, 371-446.
Poursuite en thèse : Une poursuite en thèse est envisageable
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
33
30: Séparer à partir d’appartenir
Jean François Maurras
Laboratoire : LIF : Équipe combinatoire et complexité
Contact : Jean François Maurras, Tel 04 91 82 93 10, e-mail [email protected]
Objectif du stage :
Un théorème de Yudin et Nemirovskiı̆ dit : Soit un convexe centré (K; n, R, r, a0 ) donné par un oracle d’appartenance faible. Il existe un algorithme oracle-polynomial qui résout le problème de faible violation. Un
argument de polarité permet alors de déduire un algorithme oracle-polynomial pour le problème de faible séparation. Cet algorithme utilise deux fois l’algorithme de l’ellipsoïde. J’ai décrit un algorithme oracle-polynomial
"naturel" pour séparer un point d’un polyèdre (P ; n, a0 ) centré au moyen de l’oracle "appartenir". Peut-on
décrire un algorithme oracle-polynomial "naturel" pour le précédent problème ?
Description du travail proposé :
Le travail consistera à comprendre ces deux algorithmes et essayer d’avoir une bonne intuition du problème qui
peut consister à savoir pourquoi il paraît "normal" de savoir séparer à partir d’appartenir, et aussi de sentir les
difficultés qu’il y a à apréhender un convexe à partir de l’oracle appartenir faible ou non.
Bibliographie :
Geometric Algorithm and Combinatorial Optimization, second corrected edition, M Grötschel, L Lovász and
A Schrijver, Springer 1988, 1993
Poursuite en thèse : Poursuite possible pour décrire un ou plusieurs algorithmes "naturels" pour ce problème,
des résultats partiels sont envisageables.
Commentaires : Aimer les polyèdres, les convexes et les algorithmes polynomiaux...
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
34
31: Tournées de véhicules avec inventaire
Michel Van Caneghem
Laboratoire : LIF : Equipe CRO (Combinatoire et Recherche Opérationnelle)
Contact : Michel Van Caneghem : [email protected]
Objectif du stage :
Le problème des tournéees de véhicules (VRP : Vehicle Routing Problem) concerne un fournisseur qui doit
livrer des produits commandés par des clients en utilisant des camions. Une gestion plus efficace consiste à ce
que les clients ne commandent plus les produits. Ils disposent chacun d’un stock et le fournisseur s’arrange de
manière indépendante à réapprovisionner le stock de telle manière qu’il n’y ait pas de ruptures (IRP : Inventory Routing Problem). C’est plus simple pour le client, plus efficace pour le fournisseur, mais beaucoup plus
difficiles pour ceux qui résolvent le problème de manière automatique.
Cela se formalise ainsi : Il s’agit de distribuer de manière répétitive un produit à partir d’une usine ou un dépot
à N clients sur un horizon T . Le client i consomme le produit a un taux ui (volume par jour) et a une capacité
de stockage Ci . Il dispose à l’origine (t = 0) d’un stock Ii . Le fournisseur dispose de M camions homogènes
d’une capacité Q. L’objectif est de minimiser le coût de distribution sur la période de plannification, sans causer
des ruptures de stock. Il y a trois décision à prendre :
– Quand livrer un client ?
– Quelle quantité livrer à ce client ?
– Quelles routes choisir pour les livraisons ?
Description du travail proposé :
Il y a 4 approches possibles pour résoudre ce problème :
– Utiliser des méthodes classiques : le problème peut se découper en deux : un problème de programmation
en nombre entier pour fixer les quantité à livrer, suivi d’un problème de VRP. Le travail consistera a garder
cette approche mais a utiliser de nouveaux outils de résolution.
– Utiliser des méthodes de recherche locales : la méthodes des colonies de fourmis semble avoir donné de
bon résultats sur le problème de VRP avec fenêtre de temps. Le but est d’appliquer cette méthode à notre
problème.
– Il existe un certain nombre d’heuristiques pour résoudre ce problème. Le travail consiste à essayer de prouver
des bornes sur la qualité de la solution obtenue par ces heuristiques. On essayera ensuite de voir si ce travail
peut s’étendre au cas ou la consommation du client est comprise entre deux bornes (intervalles).
– Enfin la dernière approche est stochastique : en réalité on ne connait pas exactement la consommation du
client, mais plutôt une espérance de consommation. Le but est alors de trouver une stratégie de distribution
qui minimise l’espérance du coût de distribution.
L’étudiant choisira une et une seule de ces approches pour essayer de résoudre ce problème. On utilisera
des données trouvéees sur Internet et des données fournies par Air Liquide (distribution d’oxygène ou d’azote
liquide dans les réservoirs de clients [il y en a un à Luminy ! !]).
Bibliographie :
Voici deux références :
IRP : http ://tli.isye.gatech.edu/research/papers/files/misc9916.pdf
Les colonies de fourmis appliqué au VRP : http ://www.idsia.ch/ monaldo/VRP/tr-idsia-06-99.pdf
Poursuite en thèse : Une poursuite en thèse est possible si les résultats trouvés sont encourageants.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
35
32: Enveloppes de Pareto en normes l1 et l∞
Victor CHEPOI, Yann VAXES
Laboratoire : LIF (équipe combinatoire et recherche opérationnelle)
Contact : Victor Chepoi, tel. 04 91 82 94 84, email [email protected]
Objectif du stage :
Soit X = {x1 , ..., xn } un ensemble de points de Rk muni d’une métrique d de type lp . Un point z ∈ Rk est
dominé par un point y ∈ Rk si d(y, xi ) ≤ d(z, xi ) pour tout i = 1, ..., n
et il existe un indice j pour lequel d(y, xj ) < d(z, xj ). L’enveloppe de Pareto P (X) de X est constituée de tous
les points non dominés de Rk . Si d est la métrique euclidienne l2 alors P (X) est l’enveloppe convexe usuelle de
X. Pour les métriques l1 et l∞ la structure de P (X) est plus complexe : par exemple, dans le cas de l1 , c’est une
union de paralélépipèdes de différentes dimensions. Le but de ce mémoire sera (i) de caractériser P (X) pour
les métriques l1 et l∞ dans R3 en établissant des liens avec d’autres structures discrètes (ii) de concevoir des
algorithmes optimaux pour leur construction. Il sera également demandé de montrer que les solutions optimales
de certains problèmes d’optimisation se trouvent dans P (X). Par conséquent, la connaissance de P (X) réduit
l’espace de recherche pour ses problèmes (la plus part d’entre eux sont NP-difficiles).
Description du travail proposé :
Le travail consistera d’un part à établir la structure de l’enveloppe de Pareto et ensuite de l’utiliser pour les
construire en temps O(n log n). Il sera souhaitable que les algorithmes obtenus soient implantés.
Poursuite en thèse : oui
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
36
9
Systèmes parallèles et communicants
33: Gestion de la qualité de service dans le cas du multicast dans
l’Internet
Abderrahim BENSLIMANE
Laboratoire : LIA, Laboratoire d’Informatique d’Avignon
Contact : Abderrahim BENSLIMANE Laboratoire Informatique (LIA/CERI)
Université d’Avignon et des Pays de Vaucluse 339 ch. des Meinajaries Tél. : 04 90 84 35 12 BP 1228 - 84911
AVIGNON CEDEX 9 Fax : 04 90 84 35 01
[email protected]
Objectif du stage :
Avec l’essor actuel de l’Internet associé à l’avènement du multimédia et la possibilité d’accéder à des services
de communication temps réel (visioconférence, jeux distribués interactifs, ressources « real audio » ou « real
video » pour la diffusion de concerts ou d’émissions de radio, etc.), les besoins en termes de services de communication sont radicalement différents. En effet, les services de communication doivent maintenant garantir
la QoS des données transmises, avec une nouvelle dimension importanteă : le temps.
Les propositions de l’IETF dans le domaine : IntServ et DiffServ. Toutefois, il est apparu que IntServ est
inadapté aux grands réseaux, et que DiffServ ne gère la QoS que de façon statistique, et n’apporte donc qu’une
solution grossière au problème posé. Ajoutés à cela, plusieurs protocoles de routage ont été proposés dans le
cas du multicast. Ces protocoles sont plus ou moins intéressants, complexes et inadéquats pour les transferts
vidéo à QoS.
Description du travail proposé :
Le travail consiste à mettre en évidence les architectures et protocoles de communication de groupe pour l’Internet dans les applications multimédia. L’objectif de ce DEA est donc d’étudier tous les mécanismes de gestion de
la QoS dans les réseaux en prenant en compte un certains nombre de caractéristiques des technologies réseaux
qui composent Internet :
– L’étude de protocoles de transport pour les différentes applications ou famille d’applications, et en particulier
pour les applications orientées flux ;
– L’étude des méthodes de compression de flux vidéo hiérarchiques ;
– L’étude des mécanismes d’ordonnancement et de gestion des files d’attente dans les routeurs et de leur adéquation aux besoins des protocoles de transport et des types de trafics générés par les différentes applications.
Bibliographie :
A. Benslimane, and A. Abouaissa, Dynamical Grouping Model for Distributed Real Time Causal Ordering,
Journal of Computer Communication, Elsevier Science, 2001.
A. Benslimane, Real-Time Multimedia Services over Internet, IEEE ECUMN 2000.
Poursuite en thèse : possible si les résultants sont encourageants.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
37
34: Architecture pour les réseaux ad-hoc
Abderrahim BENSLIMANE
Laboratoire : LIA, Laboratoire dŠInformatique dŠAvignon
Contact : Abderrahim BENSLIMANE Laboratoire Informatique (LIA/CERI)
Université d’Avignon et des Pays de Vaucluse 339 ch. des Meinajaries Tél. : 04 90 84 35 12 BP 1228 - 84911
AVIGNON CEDEX 9 Fax : 04 90 84 35 01
[email protected]
Objectif du stage :
La communication sans fil a permis l’émergence de nouveaux types d’applications, en particulier dans le domaine de transport. Dans ce cadre, des clients sur lesquels sont embarqués des équipements de transmission
sans fil, peuvent former un réseau de manière temporaire. Sur ce type de réseau, l’information à délivrer dépend
de la localisation du client.
Description du travail proposé :
L’objectif de ce DEA consiste donc à étudier les architectures et protocoles dans le cas des réseaux mobiles. Ils
seront étudiés principalement, les systèmes 2.5 et 3 G. Le problème qui se pose est celui du routage entre des
noeuds qui peuvent quitter ou joindre le réseau à tout moment. Dans le cas d’un certain domaine d’application
bien défini, le délai est aussi un paramètre non négligeable.
Bibliographie :
A. Benslimane, A Multimedia Multicast in Mobile Computing : Handoff Management, Journal Annals of Software Engineering, Special Volume on Multimedia Software Engineering N 12, Baltzer Science Publishers,
2001.
A. Benslimane, and P. Lorenz, QoS WATM networks in third generation telecommunication systems, ISCOM
99, International Symposium on Communications, Kaohsiung Taiwan, 1999.
Poursuite en thèse : possible si les résultants sont encourageants.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
38
35: Etude et verification de proprietes du langage Java liees a la
concurrence.
Marjorie Russo
Laboratoire : A préciser
Contact : Marjorie Russo
tel : 04 91 82 85 32 mail : [email protected]
ESIL - Luminy case 925 13288 Marseille cedex 09
Objectif du stage :
Le langage Java, de par sa double orientation langage a objets et langage concurrent, comprend de nombreuses
notions, rendant les applications complexes a developper. De nombreuses equipes de recherche travaillent actuellement sur l’etude et la preuve de proprietes du langage ou de programmes, notamment dans le cadre de la
concurrence.
Description du travail proposé :
L’objectif de ce stage est d’une part de realiser un etat de l’art de l’etude des differentes proprietes liees a la
concurrence (un bon debut serait l’etude des travaux cites en [2]). On pourra plus particulierement etudier les
differentes techniques utilisees se basant sur une specification formelle du langage. Par la suite, il peut etre
envisage d’appliquer une de ces techniques a la semantique formelle du langage Java presentee en [1]. Ce
travail pourra etre plus ou moins theorique et formel en fonction des choix effectues en fin de premiere etape.
Bibliographie :
[1] Java et ses Aspects Concurrents : Sémantique Formelle, Visualisation et Propriétés – Marjorie Russo These
de doctorat - juillet 2001
[2] From Executable Formal Specification to Java Property Verification Proceedings of Formal Techniques for
Java Programs - An ECOOP’2000 Workshop, Cannes, June 2000. I. Attali, D. Caromel, H. Nilsson and M.
Russo
Poursuite en thèse : possible
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
39
36: Codesign et Java
L.FREUND
Laboratoire : A préciser
Contact : Freund Laurent 04 91 05 44 24, [email protected]
Objectif du stage :
L’object est d’étudier l’apport de Java lors de la conception des systèmes Codesign (Hardware et Software). Ce
travail portera principalement sur la génération du système d’exploitation.
Description du travail proposé :
L’étudiant devra d’abord étudier les différents travaux existants dans le domaine afin de proposer une nouvelle
approche orientée Java pour la génération du système d’exploitation pour les systèmes temps-réel embarqués.
Ces travaux seront réalisés en collaboration avec l’équipe du TIMA à grenoble
Bibliographie :
Les publications du TIMA peuvent être trouvées à l’addresse suivante :http ://tima.imag.fr/SLS/publications_sls.html
Poursuite en thèse : L’objectif de ce stage est de poursuivre par une thèse à l’ESIM
37: Synthèse et modélisation
L.FREUND
Laboratoire : A préciser et Entreprise Synopsys (grenoble)
Contact : Freund Laurent 04 91 05 44 24, [email protected], Alain Fonkoua (synopsys) [email protected]
Objectif du stage :
La plupart des langages de description utilisés dans les applications de synthese sont astreints a un sous ensemble assez reduit. Ce qui fait que certaines descriptions quoique presentant un resultat de simulation compatible avec une interpretation materielle, ne sont pas acceptes. En fait, dans les outils de synthese actuels, la
projection materiel est effectuee en reconnaissant les formes definies par le sous-ensemble synthese retenu.
Description du travail proposé :
Dans ce projet, il s’agit de realiser l’inference du materiel a partir d’un graphe (CFG/DFG) representant la
semantique de simulation. Cette inference permettra de produire une interpretation materielle de niveau RTL a
partir d’une description synthetisable exprimee dans un des langages de description de materiel VHDL, Verilog
ou SystemC.
Poursuite en thèse : L’objectif de ce stage est de poursuivre par une thèse chez synopsys
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
40
10
Traitement automatique des langues
38: Alignement multilingue basé sur la sémantique
Olivier Kraif, Marc El-Bèze
Laboratoire : Laboratoire d’Informatique d’Avignon (LIA)
Contact : Olivier Kraif, 04 90 84 35 27,
LIA, Agroparc BP 1228, 84911 Avignon Cedex 9
[email protected]
Objectif du stage :
Développer et évaluer une nouvelle méthode d’alignement multilingue au niveau lexical.
Description du travail proposé :
La plupart des techniques d’alignement de corpus parallèles multilingues se basent sur des indices superficiels telles que le rapport des longueurs des segments appariés ou encore la présence de transfuges (chaînes
identiques) et de cognats (chaînes ressemblantes). D’autres techniques sont fondées sur le transfert des unités
lexicales : soit au moyen d’un dictionnaire de transfert indiquant les équivalents potentiels de chaque unité,
soit par l’étude des distributions lexicales, les unités équivalentes ayant généralement des distributions voisines
de chaque côté d’un corpus parallèle. Des ressources telles que les thesaurus, les lexiques sémantiques, les
ontologies, peuvent également fournir des données de premier choix. Une étude expérimentale, fondée sur un
standard d’évaluation tel que celui du projet Arcade (alignement de textes bilingues au niveau des phrases,
et appariement de mots-tests polysémiques), et des informations lexicales telles que celles d’EuroWordNet,
permettra d’étudier :
- Quels types de distorsions sémantiques (synonymie, hyponymie, antonymie, etc.) sont mis en oeuvre dans
la construction de l’équivalence traductionnelle, et avec quelle fréquence. On pourra par exemple étudier les
appariements de référence du projet Arcade, ou un corpus d’appariements lexicaux obtenus automatiquement
avec des méthodes statistiques.
- Comment peut-on prendre en compte le mode d’implantation de ces informations dans un système d’alignement au niveau lexical. On cherchera à identifier quelles sont les informations les plus discriminantes pour
différencier les couples de mots équivalents des appariements erronés. On déterminera les outils statistiques
les plus adaptés à cet effet. L’indice ainsi produit pourra alors être implanté dans le cadre d’un algorithme
d’extraction de correspondances lexicales qui a déjà été précisément évalué. Les résultats obtenus pourront être
comparés avec ceux d’autres méthodes sur l’ensemble des mots-tests d’Arcade.
Bibliographie :
Kraif, O. (2001) Constitution et exploitation de corpus bi-textuels pour l’Aide à la traduction, Thèse de doctorat,
Université de Nice Sophia Antipolis.
Véronis, J. (ed.) (2000) Parallel Text Processing, Kluwer Academic Publisher, Dordrecht, Nederlands.
Poursuite en thèse : Poursuite en thèse possible
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
41
39: Génération automatique de libellés textuels pour les moteurs de
" Questions / Réponses "
Patrice Bellot, Marc El-Bèze
Laboratoire : Laboratoire d’Informatique d’Avignon (LIA)
Contact : Patrice Bellot, 04 90 84 35 31,
LIA, Agroparc BP 1228, 84911 Avignon Cedex 9
[email protected]
Objectif du stage :
Les systèmes de recherche documentaire fournissent à l’utilisateur une liste de documents censés correspondre à la requête qu’il/elle a exprimée. Par opposition aux moteurs de recherche documentaire, le propre des moteurs « Questions
/ Réponses »est de fournir une réponse précise à une question. L ’émergence d’une piste « Questions / Réponses (Q &
A) »durant les campagnes annuelles TREC (Text REtrieval Conference) permet d’une part de disposer d’ une base fiable
d’évaluation de ce type de systèmes et d’autre part de mesurer l’impact de nombreux travaux exploités en recherche
documentaire : classification de textes, segmentation thématique, résumé automatique, désambiguïsation sémantique. Un
processus classique de « Questions / Réponses »se décompose en quatre étapes : analyse de la base documentaire, compréhension de la question, recherche des zones textuelles susceptibles de contenir la réponse et, enfin, extraction de la ou
des réponses les plus probables. L’objectif de ce stage est d’établir une estimation de la validité d’une nouvelle approche
consistant à extraire a priori l’ensemble des éléments informatifs (phrases, groupes nominaux, entités nommées etc.) présents dans les textes de la base documentaire sur lesquels des questions sont susceptibles d’être posées. Les techniques
à employer s’apparentent à celles utilisées en indexation automatique et en résumé automatique dans une perspective
d’interrogation. Cependant, les textes ne sont pas résumés pour donner une vision « objective et complète »du point de
vue de leur auteur mais sont réduits à un ensemble de libellés considérés comme des réponses pré-écrites. Répondre à une
question consiste alors à rechercher dans la liste des libellés, catégorisés en fonction du type d’entitées nommées qu’ils
contiennent (noms propres, lieux, dates, etc.), ceux qui lui correspondent. Les applications de cette stratégie d’interrogation sont nombreuses : moteurs de « Questions / Réponses », constitution automatique de FAQ, réponse automatique à des
courriers électroniques en fonction de bases de connaissances textuelles
Description du travail proposé :
1. Étude bibliographique des méthodes employées dans les moteurs de Questions / Réponses »et dans les systèmes de création de résumés automatiques.
2. Analyse statistique des questions posées dans les FAQ, les forums sur le Web, les moteurs de recherche et,
naturellement, dans les campagnes d’ évaluation des moteurs de « Questions / Réponses »pour déterminer les
types de questions les plus probables et en obtenir une description analytique.
3. Modélisation d’un système de « Questions / Réponses »consistant à extraire d’un texte les zones les plus
informatives en fonction des types de questions détectés dans l’étape précédente. Durant cette phase, des expériences seront conduites en utilisant des outils du LIA : système d’ étiquetage d’entités nommées et moteur de
recherche documentaire.
Bibliographie :
E. Voorhees, « Overview of the TREC-9 Question Answering Track », NIST Special Publication 500-249,
http ://trec.nist.gov/pubs/trec9/papers/qa_overview.pdf
E. Voorhees « The TREC-8 Question Answering Track Report », NIST Special Publication 500-246 : The
Eighth Text REtrieval Conference (TREC 8), http ://trec.nist.gov/pubs/trec8/papers/qa_report.pdf
E. Voorhees, D. Tice, « The TREC-8 Question Answering Track Evaluation », NIST Special Publication 500246 : The Eighth Text REtrieval Conference (TREC 8), http ://trec.nist.gov/pubs/trec8/papers/qa8.pdf
I. Mani, Mark T. Maybury (éditeurs), « Advances in Automatic Text Summarization », The MIT Press, 1999.
F. Béchet, A. Nasr, F. Genet, Tagging Unknown Proper Names Using Decision Trees, 38th Annual Meeting of
the Association for Computational Linguistics, ACL’2000, Hong-Kong, Oct 2000 ; pp. 77-84
Poursuite en thèse : Oui
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
42
40: Evaluateur de sites Web
Elie Sanchez
Laboratoire : MTCD : Faculté de Médecine, 27 Bd Jean Moulin, 13385 Marseille Cedex5
Contact : Elie Sanchez, tél. : 04 91 32 44 22, [email protected]
Objectif du stage :
Il s’agit d’écrire un programme d’évaluation de sites Web, qui intégrera des concepts et techniques basés sur la
logique floue.
Description du travail proposé :
Il faudra écrire en Java un programme permettant d’évaluer les caractères personnalité et émotion de sites Web.
L’impact des couleurs et des formes devra aussi être évalué. Il est fourni un prototype de programme déjà
écrit en Java, ainsi que des articles et des documents décrivant le sujet. A partir de la simple saisie d’un URL
(http ://...) le programme devra faire ressortir automatiquement des histogrammes de personnalité et d’émotion,
sur des valeurs telles que : agréable, consciencieux, négligent, intelligent, ... d’une part, et colère, joie, tristesse,
... d’autre part. Ceci sera fait à partir d’un thésaurus. Enfin et surtout, il faudra étudier et intégrer l’apport de la
logique floue dans l’évaluateur.
Bibliographie :
Deux rapports décrivant le sujet
Accès à une documentation importante sur la logique floue
Poursuite en thèse : oui, en relation avec l’ "e-motion" et le Web Sémantique, sous l’angle de la logique floue.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
43
41: La logique floue dans le Web Sémantique
Elie Sanchez
Laboratoire : MTCD : Faculté de Médecine, 27 Bd Jean Moulin, 13385 Marseille Cedex5
Contact : Elie Sanchez, tél. : 04 91 32 44 22, [email protected]
Objectif du stage :
Il s’agit de faire le point sur les travaux du W3C ("WWW Consortium") sur le Web Sémantique et d’étudier concrètement l’apport de la logique floue. En particulier, il faudra écrire un programme pour construire
automatiquement une ontologie floue de relations à partir de documents, en l’incorporant dans un moteur de
recherche.
Description du travail proposé :
Il consiste à faire le point sur les travaux portant sur le "Web Sémantique", en particulier à partir du modèle
RDF ("Resource Description Framework"), et à étudier l’apport des systèmes flous avec implémentation d’une
application
Bibliographie :
travaux récents de Tim Berners-Lee,
documentation (Internet) sur RDF, sur le groupe W3C (en particulier MIT, INRIA, KEIO),
articles sur la logique floue et Internet.
Poursuite en thèse : oui, avec modélisation et mise au point de systèmes en logique floue dans le Web Sémantique.
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
44
42: Formalisation de connaissances épidémiologiques
Michel Roux
Laboratoire : MTCD : Modélisation, traitement des connaissances et des données
Contact : Michel Roux, [email protected]
Objectif du stage :
Formalisation de connaissances épidémiologiques
Description du travail proposé :
A partir d’une ontologie de concepts épidémiologiques existante, il s’agira de construire une base de connaissances au moyen du formalisme KIF (Knowledge Interchange Format).
Bibliographie :
Mac Gregor R., The evolving technology of classification based knowledge representation system. "Principles
of semantic networks : Explorations in the representation of knowledge", Morgan Kaufmann, San Francisco,
1991 pp 385-400.
Knowledge Interchange Format. Version 3.0 Reference manual, Computer Science Departement, Stanford University.
Poursuite en thèse : oui
43: Grammaire de dépêches épidémiologiques
MIchel Roux, Robert Pasero, Paul Sabatier
Laboratoire : MTCD : Modélisation, traitement des connaissances et des données
LIF : Laboratoire d’Informatique Fondamentale
Contact : Michel Roux (MTCD) , [email protected]
Robert Pasero (LIF) , [email protected]
Paul Sabatier (LIF), Paul [email protected]
Objectif du stage :
Grammaire de dépêches épidémiologiques
Description du travail proposé :
Il s’agira d’étudier 250 dépêches épidémiologiques et de déterminer une grammaire (lexique et syntaxe) en
rendant compte. Le travail sera réalisé au moyen des outils INTEX et ILLICO.
Bibliographie :
Pasero R., Sabatier P., ILLICO : un système générique pour la compréhension d’un sous-ensemble du français,
Rapport de recherche, LIM, 1999.
Silberztein M., Dictionnaires électroniques et analyse automatique de textes : le système INTEX, Masson 1993.
Poursuite en thèse : oui
23 novembre 2001
DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon
45

Documents pareils