Sujets des Mémoires de DEA 2001 d`Avignon, Marseille, La
Transcription
Sujets des Mémoires de DEA 2001 d`Avignon, Marseille, La
Sujets des Mémoires du DEA d’Informatique Universités d’Avignon, Marseille, La Réunion, Toulon Année 2001 – 2002 Collectés par Nadia CREIGNOU et Victor CHEPOI Mis en page par Michel VAN CANEGHEM Version du : 23 novembre 2001 Table des matières 1 Statistiques 3 2 Répartition des mémoires par Laboratoire 4 3 Base de données 6 Calcul des itemsets fermés et itemsets clés fréquents - Application au calcul de la base repésentative des règles d’association — PHAN LUONG Viet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Séparation linéaire en contexte semi-supervisé — François DENIS . . . . . . . . . . . . . . . . . . . . . . . . 7 Interogation pipe-line de données XML — Emmanuel Bruno, Jacques Le Maitre . . . . . . . . . . . . . . . . 8 Réécriture de requêtes dans un système de médiation. — Kader Betari et Omar Boucelma . . . . . . . . . . . . 9 XML et données géographiques — Omar Boucelma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Intégration sémantique de données géographiques — Robert Jeansoulin . . . . . . . . . . . . . . . . . . . . . 11 Codes et cryptographie 12 Protocoles photoniques — Sami Harari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Primitives de cryptographie solides et économes en ressources — Sami Harari . . . . . . . . . . . . . . . . . . 12 Info-Bio-Math 13 Ordres circulaires Robinsoniens — Bernard Fichet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 4 5 Géneration de règles d’association à partir d’une Hiérarchie faible conceptuelle — Ralambondrainy H., Diatta J. 14 6 Ordre des paralogons dans un génome ancestral — Alain Guénoche . . . . . . . . . . . . . . . . . . . . . . . 15 Contribution au développement d’une suite de logiciels pour l’analyse des réseaux de régulation biologiques : modélisation et analyse de graphes — Yann Vaxes, Denis Thieffry . . . . . . . . . . . . . . . . . . . . . . 16 Logique et démonstration automatique 17 Heuristiques pour les problèmes de configuration optimale à base de contraintes — Laurent Henocque . . . . . 17 Approximation et compilation des X-logiques par les théories de Horn — Vincent Risch . . . . . . . . . . . . 18 Algorithmes non énumératifs pour le problème SAT — Pierre Siegel . . . . . . . . . . . . . . . . . . . . . . . 19 Couplages dans les graphes biparties et le problème SAT — Belaid Benhamou . . . . . . . . . . . . . . . . . . 20 7 8 9 Génération de modèles finis en logique du premier ordre — Belaid Benhamou et Gilles Audemard . . . . . . . 21 Preuve d’inconsistance par méthodes incomplètes — Philippe Jégou . . . . . . . . . . . . . . . . . . . . . . . 22 Logique dynamique linéaire d’actions pour la planification — Camilla Schwind . . . . . . . . . . . . . . . . . 23 Programmation et logique 24 Bornes inférieures pour les phénomènes de seuil liés à la satisfaisabilité des formules booléennes — Nadia CREIGNOU, Hervé DAUDE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Typage et gestion automatique de la mémoire dans un langage à objets — Silvano DAL ZILIO . . . . . . . . . 25 Forme normale de contraintes du premier ordre sur les arbres binaires infinis — Alain Colmerauer . . . . . . . 26 Décidabilité/indécidabilité des propriétés “chaotiques”dans les automates cellulaires — Enrico Formenti . . . . 27 Synthèse d’automates communicants — Rémi MORIN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Réalisation de HMSC — Rémi MORIN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Pavages et complexité — Bruno Durand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Conservation de l’information dans les automates cellulaires — Bruno Durand . . . . . . . . . . . . . . . . . 31 Analyse des algorithmes adaptatifs de contrôle pour la production de cartes à puce personalisées — Peter NIEBERT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 Structures discrètes et Recherche Opérationnelle 33 Séparation des contraintes de partition Steiner généralisées — Mohamed DIDI BIHA, Philippe Michelon . . . . 33 Séparer à partir d’appartenir — Jean François Maurras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Tournées de véhicules avec inventaire — Michel Van Caneghem . . . . . . . . . . . . . . . . . . . . . . . . . 35 Enveloppes de Pareto en normes l1 et l∞ — Victor CHEPOI, Yann VAXES . . . . . . . . . . . . . . . . . . . . 36 Systèmes parallèles et communicants 37 Gestion de la qualité de service dans le cas du multicast dans l’Internet — Abderrahim BENSLIMANE . . . . . 37 Architecture pour les réseaux ad-hoc — Abderrahim BENSLIMANE . . . . . . . . . . . . . . . . . . . . . . . 38 Etude et verification de proprietes du langage Java liees a la concurrence. — Marjorie Russo . . . . . . . . . . 39 Codesign et Java — L.FREUND . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 Synthèse et modélisation — L.FREUND . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 10 Traitement automatique des langues 41 Alignement multilingue basé sur la sémantique — Olivier Kraif, Marc El-Bèze . . . . . . . . . . . . . . . . . 41 Génération automatique de libellés textuels pour les moteurs de " Questions / Réponses " — Patrice Bellot, Marc El-Bèze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 Evaluateur de sites Web — Elie Sanchez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 La logique floue dans le Web Sémantique — Elie Sanchez . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 Formalisation de connaissances épidémiologiques — Michel Roux . . . . . . . . . . . . . . . . . . . . . . . . 45 Grammaire de dépêches épidémiologiques — MIchel Roux, Robert Pasero, Paul Sabatier . . . . . . . . . . . . 45 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 2 1 Statistiques Filière Base de données Codes et cryptographie Info-Bio-Math Logique et démonstration automatique Programmation et logique Structures discrètes et Recherche Opérationnelle Systèmes parallèles et communicants Traitement automatique des langues Total Laboratoires IML IREMIA LIA Avignon LIF LSIS MTCD SIS Toulon Autres Laboratoires Total 23 novembre 2001 Nb de sujets 6 2 4 6 10 4 5 6 43 Nb de sujets 1 1 5 17 8 4 3 4 43 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 3 2 Répartition des mémoires par Laboratoire IML (1) – Ordre des paralogons dans un génome ancestral — Alain Guénoche IREMIA (1) – Géneration de règles d’association à partir d’une Hiérarchie faible conceptuelle — Ralambondrainy H., Diatta J. LIA Avignon (5) – Alignement multilingue basé sur la sémantique — Olivier Kraif, Marc El-Bèze – Architecture pour les réseaux ad-hoc — Abderrahim BENSLIMANE – Génération automatique de libellés textuels pour les moteurs de " Questions / Réponses " — Patrice Bellot, Marc El-Bèze – Gestion de la qualité de service dans le cas du multicast dans l’Internet — Abderrahim BENSLIMANE – Séparation des contraintes de partition Steiner généralisées — Mohamed DIDI BIHA, Philippe Michelon LIF (17) – Calcul des itemsets fermés et itemsets clés fréquents - Application au calcul de la base repésentative des règles d’association — PHAN LUONG Viet – Conservation de l’information dans les automates cellulaires — Bruno Durand – Décidabilité/indécidabilité des propriétés “chaotiques”dans les automates cellulaires — Enrico Formenti – Enveloppes de Pareto en normes l1 et l∞ — Victor CHEPOI, Yann VAXES – Forme normale de contraintes du premier ordre sur les arbres binaires infinis — Alain Colmerauer – Pavages et complexité — Bruno Durand – Réalisation de HMSC — Rémi MORIN – Séparation linéaire en contexte semi-supervisé — François DENIS – Séparer à partir d’appartenir — Jean François Maurras – Synthèse d’automates communicants — Rémi MORIN – Tournées de véhicules avec inventaire — Michel Van Caneghem – Typage et gestion automatique de la mémoire dans un langage à objets — Silvano DAL ZILIO – (LIF et LATP) Bornes inférieures pour les phénomènes de seuil liés à la satisfaisabilité des formules booléennes — Nadia CREIGNOU, Hervé DAUDE – (LIF et LGPD) Contribution au développement d’une suite de logiciels pour l’analyse des réseaux de régulation biologiques : modélisation et analyse de graphes — Yann Vaxes, Denis Thieffry – (LIF et LSIS) Réécriture de requêtes dans un système de médiation. — Kader Betari et Omar Boucelma – (LIF et MTCD) Grammaire de dépêches épidémiologiques — MIchel Roux, Robert Pasero, Paul Sabatier – (LIF et Cybernetix) Analyse des algorithmes adaptatifs de contrôle pour la production de cartes à puce personalisées — Peter NIEBERT LSIS (8) – Algorithmes non énumératifs pour le problème SAT — Pierre Siegel – Approximation et compilation des X-logiques par les théories de Horn — Vincent Risch – Couplages dans les graphes biparties et le problème SAT — Belaid Benhamou – Heuristiques pour les problèmes de configuration optimale à base de contraintes — Laurent Henocque – Intégration sémantique de données géographiques — Robert Jeansoulin – Génération de modèles finis en logique du premier ordre — Belaid Benhamou et Gilles Audemard – XML et données géographiques — Omar Boucelma – Preuve d’inconsistance par méthodes incomplètes — Philippe Jégou MTCD (4) – La logique floue dans le Web Sémantique — Elie Sanchez – Evaluateur de sites Web — Elie Sanchez – Formalisation de connaissances épidémiologiques — Michel Roux 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 4 – Ordres circulaires Robinsoniens — Bernard Fichet SIS Toulon (3) – Interogation pipe-line de données XML — Emmanuel Bruno, Jacques Le Maitre – Primitives de cryptographie solides et économes en ressources — Sami Harari – Protocoles photoniques — Sami Harari Autres Laboratoires (4) – (MAP, CNRS, UMR 694) Logique dynamique linéaire d’actions pour la planification — Camilla Schwind – (A préciser) Etude et verification de proprietes du langage Java liees a la concurrence. — Marjorie Russo – (A préciser) Codesign et Java — L.FREUND – (A préciser) Synthèse et modélisation — L.FREUND 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 5 3 Base de données 1: Calcul des itemsets fermés et itemsets clés fréquents - Application au calcul de la base repésentative des règles d’association PHAN LUONG Viet Laboratoire : LIF equipe Bases de Donnees et Apprentissage Automatique Contact : Phan Luong Viet, l’Université de Provence, 39, rue F. Joliot Curie, 13453 Cedex 13, email : [email protected], tel : 04.91.11.36.15 Objectif du stage : Les itemsets fréquents jouent un rôle très important en fouille de données (règles d’association, motifs séquentiels, indexation, classification, etc). Dans le calcul de règles d’association, en utilisant les itemsets fréquents, le nombre de règles intéressantes peut être exponentiel par rapport au nombre des items considérés. Ceci pose un problème de repésentation de règles aux utilisateurs finaux (décideurs). Les solutions connues pour ce problème consistent en trois concepts : itemsets fermés et itemsets clés fréquents et bases de règles. Il existe plusieurs algorithms pour calculer les itemsets fermés fréquents, mais peu d’algorithms pour calculer les itemsets clés fréquents. Or les représentations compactes des règles d’association utilisent ces deux concepts d’itemsets. Description du travail proposé : Ce stage a pour but l’étude et l’implémentation d’une méthode qui calcule à la fois les itemsets fermés et clés fréquents, qui seront utlisés pour calculer la base représentative des règles d’association, qui est connue comme la représentation la plus compacte et simple. L’implémentation peut être en C ou en C++. Bibliographie : V. Phan Luong, “Reasoning on Association Rules”, BDA’2001 (17eme journées Bases de Données Avancées), 29 Oct-2 Nov. 2001, Agadir, Maroc. Y. Bastide, R. Taouil, N. Pasquier, G. Stumme and L. Lakhal, “Pascal : un algorithme d’extraction des motifs frequents”, TSI 2000. Poursuite en thèse : Une poursuite en th=E8se est possible pour ce m=E9moire. Les perspectives de ce stage sont l’étude d’amélioration de la méthode implémentée, l’extension de la base repésentative pour les règles d’association générales, et les applications dans d’autres domaines de recherche en fouille de données ou apprentissage automatique. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 6 2: Séparation linéaire en contexte semi-supervisé François DENIS Laboratoire : Equipe Bases de Données et Apprentissage, LIF, site de Chateau Gombert Contact : François Denis, CMI, Technopôle de Chateau Gombert, 39 rue F. Jolliot Curie, 13453 MARSEILLE CEDEX 13 FRANCE Tel. (33) 04 91 11 36 05 Fax (33) 04 91 11 36 02, e-mail : [email protected] Objectif du stage : L’apprentissage automatique est traditionnellement divisé en apprentissage supervisé et non supervisé. Dans le premier cas, on suppose que les données de travail sont réparties en classes prédéfinies et la tache principale est de trouver des méthodes de classification à partir d’un échantillon fini d’exemples étiquetés ; dans le second cas, le système d’apprentissage doit lui-même définir des classes à partir d’un échantillon d’exemples non préalablement étiquetés. Cette frontière semble moins nette depuis quelques années. En effet, il est fréquent que les données disponibles soient des deux types, exemples étiquetés et non étiquetés, et il y a tout intérêt à essayer de prendre en compte toute l’information disponible. C’est par exemple le cas en classification de textes : l’indexation est un processus coûteux et les données disponibles sont composées d’un petit nombre de documents indexés et d’un nombre pratiquement illimité de documents non indexés. D’autres exemples peuvent facilement être trouvés dans tous les domaines concernés par l’apprentissage automatique. Cette nouvelle problématique, intitulée apprentissage semi-supervisé, suscite de nombreux travaux. Il s’agit en particulier d’étudier comment des algorithmes d’apprentissage classiques peuvent être adaptés à ces nouvelles situations. Depuis quelque temps, nous nous sommes attaqué à un problème particulier de l’apprentissage semi-supervisé : l’apprentissage à partir de données non étiquetées et de données appartenant à une seule classe (exemples positifs dans le cas binaire). Cette problématique est intéressante pour au moins deux raisons : 1. Ce cas de figure se présente naturellement : si par exemple on cherche à construire un classifieur chargé de détecter automatiquement les mails susceptibles de nous intéresser, les données de travail seront vraisemblablement composées d’un échantillon de mails que nous avons conservé (données positives) et de mails non encore dépouillés (données non étiquetées). 2. Il permet de traiter le cas de l’apprentissage à partir de données déséquilibrées, c’est-à-dire réparties en n échantillons S1 , . . ., Sn correspondants aux n classes cibles, dont chacun est représentatif de sa classe mais dont la réunion n’est pas représentative de la population globale. Description du travail proposé : L’étudiant étudiera des techniques de séparation linéaire à partir de données positives et non étiquetées. Il devra concevoir un algorithme permettant d’effectuer au mieux une telle séparation des données et étudier cet algorithme d’un point de vue théorique et expérimental. Bibliographie : Cette bibliographie sera complétée et précisée avec l’étudiant. Sur l’apprentissage par exemples positifs et non étiquetés : - PAC Learning from Positive Statistical Queries, F. Denis (ALT’98), - Positive and Unlabeled Examples help Learning, F. De Comité, F. Denis, R. Gilleron et F. Letouzey, (ALT 99) Sur les classifieurs linéaires : The elements of statistical learning, Hastie, Tibshirani, Friedman, Springer, 2001 (par exemple). Sur les SVM : A tutorial on Support Vector Machines for pattern recognition, C. Burges, Knowledge Discovery and Data Mining, 1998 (par exemple). Poursuite en thèse : La poursuite en thèse est souhaitée : il sera alors demandé à l’étudiant d’étendre cette étude aux machines à vecteurs de support (SVM), une des techniques contemporaine les plus performantes de l’apprentissage automatique, de choisir un terrain d’applications (par exemple en biologie) et d’acquérir une bonne maîtrise du domaine de l’apprentissage semi-supervisé. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 7 3: Interogation pipe-line de données XML Emmanuel Bruno, Jacques Le Maitre Laboratoire : SIS Equipe Informatique, Université de Toulon et du Var Contact : Jacques Le Maitre Université de Toulon et du Var Laboratoire SIS - Equipe Informatique B.P. 132, 83957 La Garde CEDEX tel. : +33(0)4 94 14 20 06 e-mail : [email protected] Objectif du stage : L’équipe Informatique du SIS travaille depuis plusieurs années sur la manipulation de documents structurés (SGML et maintenant XML). Ces travaux ont conduit à la spécification d’un langage de requêtes XML : le langage DQL. Il s’agit maintenant de développer, pour ce type de langage, des techniques de résolution de requêtes performantes. Ce stage y contribuera. Description du travail proposé : Une représentation intéressante d’un document XML consiste à le transformer en un ensemble de régions imbriquées, repérées chacune par une position de début, une position de fin et un niveau hiérarchique. Sur ce modèle nous avons développé une algèbre dite "algèbre de régions", jouant le même rôle que l’algèbre relationnelle pour le modèle relationnel. Cette algèbre de régions comporte deux familles d’opérateurs : - des opérateurs de projection, qui permettent de sélectionner des régions en fonction de leur contenu et de leurs relations hiérarchiques avec d’autres régions ; - des opérateurs de transformation, qui permettent de transformer un fragment XML par modification de l’ensemble de régions qui le représente. Chaque opérateur s’applique à un ou plusieurs ensembles de régions et produit un nouvel ensemble de régions. Le travail à réaliser consistera : (1) à proposer, pour chaque opérateur, une implantation "pipe-line", c.-à-d. telle que la région résultat soit produite au fur et à mesure de la lecture des régions arguments, (2) à évaluer la complexité et les performances de ces implantations. Bibliographie : Sera fournie ultérieurement Poursuite en thèse : Une poursuite en thèse est souhaitée 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 8 4: Réécriture de requêtes dans un système de médiation. Kader Betari et Omar Boucelma Laboratoire : LIF et LSIS Contact : Kader Betari IUT - GTR Tel : 04 91 17 79 29 mel : [email protected] Objectif du stage : Nous nous plaçons dans le cadre de la médiation des données avec l’aproche LAV. Dans cette approche, les sources de données sont considérées comme des vues sur un schéma global. Pour interroger le schéma global il faut pouvoir réécrire la requête en terme des schémas sources. Le problème de réécriture de requêtes a déja été abordé dans un contexte relationnel. Le contexte de ce sujet est celui où le modèle d’intégration et le modèle de requête sont différents, ce qui est le cas dans de nombreuses applications réelles. Description du travail proposé : Le travail consiste à élaborer et implanter un algorithme de réécriture de requêtes qui permet de reformuler une requête utilisateur en un ensemble de requêtes sources. Le travail sera réalisé avec l’hypothèse suivante : les sources sont des données géographiques, et le modèle d’intégration sera basé sur XML. Bibliographie : B. Amann, C. Beeri, I. Fundulaki, M. Scholl, A.-M. Vercoustre, "La réécriture et l’évaluation de requêtes arbres avec XPath.", Proc. BDA2001. A. Halevy, "Answering Queries Using Views : a Survey", The VLDB Journal, 2001. Poursuite en thèse : Oui. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 9 5: XML et données géographiques Omar Boucelma Laboratoire : LSIS Contact : Omar Boucelma CMI - 39, rue Joliot-Curie 13453 Marseille Cedex 13 Tel : 04 91 11 36 16 mel : [email protected] Objectif du stage : Le sujet de DEA se déroule dans le cadre du projet VirGIS d’intégration des données géographiques résidant dans plusieurs systèmes d’information géographiques (SIG). La couche basse de l’architecture de VirGIS est modulaire et composée de wrappers qui accèdent aux données contenues dans les systèmes SIG intégrés et les retournent en format XML, d’un module de manipulation des données géographiques en format XML. La couche basse de VirGIS repose sur une représentation des données géographiques en format XML et une traduction des opérateurs spatiaux en opérations algébriques XML. Description du travail proposé : Le travail à réaliser est le suivant : - l’extension de GML, une représentation limitée des données géographiques en format XML pour permettre une manipulation spatiale élaborée des données dans VirGIS, - l’implantation de l’agèbre XML définie et publiée par le groupe de travail XML Query au sein du consortium Web, - l’expression d’opérateurs spatiaux en termes d’opérations algébriques XML exprimée dans l’algèbre XML. Bibliographie : I. Manolescu, D. Florescu„ D. Kossmann. "Answering XML Queries over Heterogeneous Data Sources", Proc. VLDB 2001 M. Goodchild, M. J. Egenhofer, R. Fegeas, C. Kottman. Interoperating Geographic Information Systems. Kluwer, 1999 http ://www.opengis.org Poursuite en thèse : Oui. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 10 6: Intégration sémantique de données géographiques Robert Jeansoulin Laboratoire : LSIS Contact : Robert Jeansoulin CMI - 39, rue Joliot-Curie 13453 Marseille Cedex 13 Tel : 04 91 11 36 08 mel : [email protected] Objectif du stage : L’intégration de données résidant dans des systèmes hétérogènes pose de nombreux problèmes sémantiques. Par exemple, dans le cas d’intégration de données géographiques, les échelles de représentation des données peuvent être différentes, l’organisation des données peut être différente d’une source à l’autre (une route peut être représentée dans des granularités ou des découpages différents par des tronçons plus ou moins longs), etc. Ces problèmes doivent impérativement être maîtrisés et résolus pour favoriser l’intégration des données. Description du travail proposé : L’objet de ce projet de DEA consiste en : - une représentation de l’information sémantique des SIG (échelles, etc.) dans un format à la XML qui s’inscrit dans l’activité Semantic Web du World Wide Web consortium W3C, - l’élaboration d’un langage de règles qui capture les correspondances d’intégration sémantique, - l’implantation d’un moteur d’évaluation des règles de correspondances sémantiques. Bibliographie : A. P. Sheth, "Changing focus on interoperability in information systems : from system, syntax, structure, to semantics", In. Interoperating Geographic Information Systems, pages 5-30, Kluwer, 1999 Y. A. Bishr, "Overcoming the Semantic and Other Barriers to GIS Interoperability", Int. Journal of GIS, 1998. http ://www.w3c.org (Rubrique Semantic Web) Poursuite en thèse : Oui. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 11 4 Codes et cryptographie 7: Protocoles photoniques Sami Harari Laboratoire : Equipe Informatique du laboratoire SIS de l’université de Toulon Contact : Sami Harari : [email protected] Objectif du stage : Le concept de perte d’information dans les opérations cryptographiques habituelles a été dt’eveloppé pour les protocoles photoniques, dans le but de les consolider. Son application à d’autres opérations non photoniques utilisées dans les divers protocoles de cryptologie est possible. Dans ce contexte, il sert d’outil d’évaluation de la qualité du protocole et conduit à une éventuelle modification. Description du travail proposé : Le but du mémoire sera d’étudier des crypto-systèmes à clé publique sous cet aspect et d’en proposer des modifications. 8: Primitives de cryptographie solides et économes en ressources Sami Harari Laboratoire : Equipe Informatique du laboratoire SIS de l’université de Toulon Contact : Sami Harari : [email protected] Objectif du stage : La carte à puce est un ordinateur particulier, à ressources très limitées tant en mémoire vive et de stockage, qu’en puissance de calcul. C’est pourtant un outil que les cryptologues souhaitent utiliser en raison de ses caractéristiques techniques. A cette fin des primitives de cryptographie solides et économes en ressources doivent être dt’eveloppées. Une de ces primitives est le HFE, ou Hidden Field Equations qui admet de nombreuses variantes. Description du travail proposé : Le but du mémoire est de passer en revue toutes ces primitives, en faire la comparaison des caractéristiques et en proposer de nouvelles. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 12 5 Info-Bio-Math 9: Ordres circulaires Robinsoniens Bernard Fichet Laboratoire : MTCD. Laboratoire de Biomathématiques Contact : Bernard Fichet Laboratoire de Biomathématiques. Faculté de Médecine. 27, Bd. Jean Moulin. 13385 Marseille cedex 5. Tel. 04 91 79 19 10. e-mail : [email protected] Objectif du stage : Les ordres Robinsoniens, à support linéaire ou arboré, mettent en lumière une évolution dans les données, et sont une composante importante de l’analyse des données et de la classification. Plus récemment, ont été introduits les ordres circulaires Robinsoniens. Leur définition, leurs propriétés mathématiques et surtout leur carctérisation algorithmique méritent d’être approfondies. Développer,discuter ces concepts sur la base de travaux existants,et recenser les problèmes mathématiques et algorithmiques ouverts est l’objet de ce mémoire. Description du travail proposé : Essentiellement à partir d’un article, développer une approche des ordres circulaires Robinsoniens. Bibliographie : Hubert,L.,Arabie,P.,Meulman,J. (1998), Graph-theoretic representations for proximity matrices through stronglyanti-Robinson or circular strongly-anti-Robinson matrices. Psychometrika, 63, 341-358. Poursuite en thèse : Poursuite en thèse possible à travers les nombreux problèmes mathématiques et algorithmiques ouverts sur le sujet. Commentaires : Le sujet peut au gré des difficultés rencontrées évoluer dans des directions plus mathématiques (propriétés des structures introduites, aproximations), ou plus informatiques (algorithmique, NP-complétude), avec, si poursuite en thèse, son application en relation avec l’évolution. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 13 10: Géneration de règles d’association à partir d’une Hiérarchie faible conceptuelle Ralambondrainy H., Diatta J. Laboratoire : IREMIA Université de la Réunion Equipe ECD (Extraction de Connaissances à partir de Données) Contact : Mr Ralambondrainy Henri Mr Diatta Jean Faculté des Sciences 15, avenue René cassin-BP 7151 97715 Saint-Denis Messag Cedex 9, France E-mail :[email protected] Tel : 0262 93 82 86 Objectif du stage : Le sujet du mémoire concerne la recherche de règles d’association entre les attributs d’un ensemble de données. Ce problème a été abordé en Analyse des Données (Data Mining)[2,4] dans la recherche de régularités dans les données et en Base de Données dans l’étude des dépendances fonctionnelles. Divers algorithmes ont été proposés fondés sur des treillis ou sous-treillis des attributs et le treillis des concepts [1]. L’objectif du mémoire est l’étude d’une méthode de g énération de règles en s’appuyant sur la structure d’hiérarchie faible conceptuelle [5] que nous proposons dont la complexité est moindre que celle du treillis conceptuelle. Description du travail proposé : Le travail du stagiaire consiste, dans un premier temps, à étudier les principaux articles concernant la problématique de génération de règles et de la classification conceptuelle [3]. Dans un deuxième temps, de mettre au point et tester une méthode de génération de règles s’appuyant sur les propriètès de la hièrarchie faible conceptuelle [5]. Bibliographie : [1] N.Pasquier, Y. Bastide, R. Taouil and L. Lakhal Efficient mining of association rules using closed itemset lattices. Information Systems Vol. 24, N1, pp.25-46, 1999 [2] H. Ralambondrainy, A conceptual version of the k-means algorithm, Pattern Recogn. Lett., 16, p 1147-1157, 1995 [3] R. Wille Restructuring lattice theory ; an approach based on hierarchies of concepts. In I. Rival, editor, Ordered sets, pp. 445-470, Ridel, 1982, Dordrecht-Boston. [4] V. Duquenne. On lattice approximations : syntactic aspects. Social networks, 18 :189-199,1996. [5] J. Diatta, H Ralambondrainy. The conceptual weak hierarchy associated with a dissimilarity measure. Rapport Interne IREMIA. 2001 Poursuite en thèse : Possibilite de poursuite en these. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 14 11: Ordre des paralogons dans un génome ancestral Alain Guénoche Laboratoire : IML à Luminy Contact : Alain Guenoche : [email protected] Objectif du stage : Un paralogon, c’est un ensemble de régions qui contiennent des familles de gènes paralogues plus tous les gènes sans famille qui sont aussi localisés dans ces régions de paralogie. Un paralogon est composé de 4 régions (considérées comme identiques), réparties sur des chromosomes différents. Ils sont de l’ordre de 25 dans le génome humain. Ces 4 copies, sont vraissemblablement dûes aux duplications du génome d’une espèce ancestrale. De plus les chromosomes ont, au cours de l’évolution, subit des mutations qui ont provoqué des réarrangements. Si A était avant B dans le génome ancestrale, il se peut que cet ordre ne soit plus observé dans certaines copies. Le problème est : connaissant l’ordre des paralogons sur chacun des chromosomes humains, trouver l’ordre des paralogons dans le génome ancestral, avant duplication. On appliquera le principe de parcimonie. Celui-ci veut que l’ordre le plus vraisemblable est celui qui permet d’expliquer la situation présente avec le nombre minimum de réarrangements. La définition des réarrangements est fondamentale : Tout d’abord, nous considèrerons les inversions de deux paralogons consécutifs. Description du travail proposé : Ce mémoire porte sur 2 problèmes : (i) construire l’ordre le plus parcimonieux sur l’unique chromosome de l’ancêtre, et (ii) trouver le nombre minimum de chromosomes de l’ancêtre pour qu’il n’y ait pas eu de réarrangement. Exemple : 7 paralogons A, B, C, D, E, F, G dont les 4 copies sont réparties sur 7 chromosomes. On observe les ordres ( le signe > est lu " avant ") : D A D D B F F > > > > > > > A E A F G E D > > > > > > > B B E C F B C > > > > > > > C, G, G, A, C, G, E. Une méthode de séparation - évaluation permet de construire les deux ordres totaux les plus parcimonieux, D > F > A > E > B > G > C et F > D > A > E > B > G > C qui n’induisent que 5 transpositions ; ce nombre est minimum. Si on accorde à l’ancêtre 2 chromosomes, alors il existe 3 solutions qui font que les ordres observés sur les chromosomes humains s’expliquent sans réarrangement du tout. Une méthode (d’énumération des colorations d’un graphe) permet de construire : D > A > E > B > G et F > C, D > A > B > G et F > C > E, D > B > G > C et F > A > E. Poursuite en thèse : Ce sujet peut être poursuivi en thèse avec d’autres définitions des réarrangements. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 15 12: Contribution au développement d’une suite de logiciels pour l’analyse des réseaux de régulation biologiques : modélisation et analyse de graphes Yann Vaxes, Denis Thieffry Laboratoire : LIF : equipe CRO LGPD (Laboratoire de Génétique et Physiologie du Développement) Contact : Yann Vaxes email : [email protected] Denis Thieffry : [email protected] Objectif du stage : La plupart de nos cellules contiennent la même panoplie de gènes (env. 10E4-10E5). Néanmoins, au sein de chaque type cellulaire (par exemple des cellules musculaires), seul un sous ensemble de ces gènes est exprimé et conditionne les caractéristiques morphologiques et fonctionnelles de ces cellules. L’expression de ces gènes est contrôlée par des gènes dits ’régulateurs’ (env. 10E3). Ces gènes régulateurs se régulent aussi les uns les autres en formant des réseaux de régulation. Ces réseaux peuvent être représentés formellement par des graphes orientés et signés ("graphes d’interactions"). Dans ces graphes, les gènes sont les sommets et les arêtes représentent les régulations. Les arêtes sont étiquetées par un signe : positif en cas d’activation, négatif en cas d’inhibition. Ces interactions forment des circuits de régulation dotés de propriétés dynamiques spécifiques, à la base des mécanismes de différenciation cellulaire. D’un point de vue formel, la dynamique d’expression génétique est aussi représentée par des graphes orientés ("graphes de séquences d’états"), où chaque sommet représente un état d’expression discret, et où chaque arrête représente une transition permise entre deux états. Dans ces graphes, les circuits et les composantes fortement connexes représentent des états cellulaires d’intérêt biologique. Description du travail proposé : Il s’agit de concevoir et d’implémenter une série d’outils permettant la visualisation et l’analyse des graphes d’interaction ainsi que les graphes de séquences d’états logiques. Ce travail s’appuiera sur une nouvelle base de données relationnelle ("GIN-db") intégrant de nombreuses données sur les réseaux d’interactions moléculaires et génétiques. Différents types de graphes pourront donc être extraits moyennant l’écriture de requêtes ou de procédures appropriées. D’autre part, nous exploiterons des librairies de routines Java publiques permettant la visualisation des graphes, ainsi que leur étiquetage. Certaines de ces routines permettent déjà l’extraction de chemins, des circuits, ou encore des composantes (fortement) connexes d’un graphe. Ces routines devront être adaptées et complétées de manière à répondre à diverses questions biologiques ou théoriques. D’un point de vue théorique, il s’agira surtout d’établir des relations entre la structure des graphes d’interactions et les propriétés dynamiques correspondantes (séquences d’états logiques). En particulier, nous nous attacherons à caractériser et comparer les attracteurs (noeuds stables, cycles logiques, etc.) et les bassins d’attraction (ensemble des états qui conduisent vers ces attracteurs) dans les graphes de séquences d’états (synchrones ou asynchrones) pour différents états initiaux ou différentes valeurs de paramètres, ou encore pour des modifications du graphe d’interactions. Poursuite en thèse : possible 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 16 6 Logique et démonstration automatique 13: Heuristiques pour les problèmes de configuration optimale à base de contraintes Laurent Henocque Laboratoire : LSIS équipe InCA Contact : Laurent Henocque, Faculté de Saint Jérôme, tel 06 83 88 20 01, email [email protected] Objectif du stage : Dans le cadre d’un projet jeune équipe soutenu par le CNRS portant sur l’étude de la configuration à base de contraintes, et en partenariat avec la société Ilog, il s’agit d’étudier la génération automatique d’heuristiques pour les problèmes de configuration optimale, notamment sous leur formulation à base de préférences, qui permet aussi bien l’utilisation d’algorithmes de branch and bound classiques, que l’utilisation d’algorithmes de type "Preference Based Search" (PBS) pour l’énumération de solutions Description du travail proposé : Cette recherche comporte une composante expérimentale, dans un domaine totalement inexploré. On s’appuiera sur un solver de configuration sous contraintes écrit en Java, qui intègre une implantation des préréfences et de l’algorithme PBS. Le travail consistera alors à expérimenter diverses techniques de génération automatique de préférences permettant d’optenir le plus rapidement possible des solutions optimales ou sub-optimales pour une fonction de coût donnée. Bibliographie : les papiers de deux workshops et de l’ieee, pour se faire une idée – http ://wwwold.ifit.uni-klu.ac.at/ alf/aaai99/, – http ://www.cs.hut.fi/ pdmg/IJCAI2001ConfWS/Program.html, – http ://dblp.uni-trier.de/db/journals/expert/expert13.html, le site de Ilog pour voir ce qui existe : http ://www.ilog.fr/products/(j)configurator/, Poursuite en thèse : possible et souhaitée : bourse Cifre acquise Commentaires : Configurer consiste à simuler la construction d’un produit complexe en organisant des composants dont les types sont connus, mais pas leurs relations, ni leur nombre, ni leurs propriétés. Une approche scientifique de ce problème se fait via une généralisation de la programmation par contraintes (CSP). Les problèmes de configuration constituent un enjeu majeur pour les technologies de l’information, car ils sont perçus comme un modèle possible de l’intelligence devant être déployée par les sites internet en particulier, et par de nombreux programmes d’assistance ou d’intermédiation en général. Toute avancée permettant de simplifier la mise en oeuvre de solutions de configuration possède un intérêt pratique évident, et un intérêt scientifique considérable 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 17 14: Approximation et compilation des X-logiques par les théories de Horn Vincent Risch Laboratoire : L.S.I.S., Equipe InCA. Contact : Vincent Risch, Luminy, Tél. : 04 91 82 90 74, Mail : [email protected] Objectif du stage : Etude des conditions d’implantation du concept d’“inférence rapide” approximée par les théories de Horn pour les X-logiques dans le cas propositionnel fini. Description du travail proposé : La formulation d’une logique sur un langage L consiste en la donnée d’une relation entre formules, dite relation d’inférence, généralement notée `, et caractérisée par un sous-ensemble de L×L. Une logique est monotone si, quelque soient les formules f, g, h de L, lorsque f ` g alors f ∧h ` g. A contrario, les logiques non-monotones ne possèdent pas une telle propriété. Elles y gagnent un pouvoir expressif certain, qu’elles paient pourtant au prix d’une complexification notable des procédures de preuve associées aux formalismes correspondants. Les X-logiques, introduites par [Siegel, Forget, 1996], apparaissent comme un ambryon d’une théorie de la preuve pour les formalismes non-monotones, et ce à partir de la notion classique de théorème. Plus précisément, la relation d’inférence non-monotone `X est telle que f `X g si tout théorème (au sens classique) de f ∧ g qui est dans X est un théorème de f . La relation `X est non-monotone, quoique monotone sur X, et étend de façon naturelle la relation classique ` (on retrouve la relation de conséquence classique pour X = L). Il est montré par [Forget, Risch, Siegel, 2000] que, dans le cas fini, les formalismes non-monotones les plus connus (modèles préférentiels et raisonnement par défaut) sont des X-logiques. On dispose donc d’un formalisme fédérateur au sein duquel la notion de théorème classique est centrale. Toutefois la cardinalité de X reste un problème majeur concernant toute tentative d’implantation d’un démonstrateur pour les X-logiques. De leur côté, Bart Selman et Henry Kautz [Selman, Kautz, 1996] ont proposé une remarquable technique d’encadrement de tout ensemble de formules par des ensembles de clauses de Horn, encadrement vu comme une compilation préalable de cet ensemble de formules avant son traitement par un démonstrateur. Il a été montré dans la littérature que cette approche permet une amélioration notable des méthodes de démonstration dans le cas général classique. L’enjeu de ce stage est d’étudier les conditions dans lesquelles adapter cette technique d’encadrement à la notion de preuve en X-logiques, et d’évaluer son efficacité dans ce contexte particulier. Bibliographie : [Eiter, Ibaraki, Makino, 1999] Eiter T., Ibaraki T., Makino K., On the Difference of Horn Theories. Proceedings of the Symposium on Theoretical Aspects of Computer Science, STACS’99, Trier, Germany, March 4–6, 1999, C. Meinel, S. Tison (Eds), LNCS 1563, Springer Verlag. [Forget, Risch, Siegel, 2000] Forget L., Risch V., Siegel P., Preferential Logics Are X-logics. Journal of Logic and Computation, Vol. 11, N. 1, p. 71–83. [Lorenzi, 1998] Lorenzi J.-M., Caractérisation des X-logiques. Mémoire de DEA, Université de la Méditerranée, Faculté des Sciences de Luminy, p. 205–221. [Selman, Kautz, 1996] Selman B., Kautz H., Knowledge Compilation and Theory Approximation. Journal of the ACM, Vol. 43, n. 2, March 1996, p. 193–224. [Siegel, Forget, 1996] Siegel P., Forget L., A Representation Theorem for Preferential Logics. Fifth Conference on the Principles of Knowledge Representation and Reasoning, KR’96, Cambridge, Massachusetts, November 5–8, 1996, Aiello, Doyle, Shapiro (Eds), Morgan Kaufmann Publishers, p. 453–460. Poursuite en thèse : Souhaitable. Commentaires : Sujet s’appuyant sur les acquis des options III (“Raisonnement non-monotone”) et IV (“Procédures de preuve : problème SAT, CSP, et raisonnement temporel”). 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 18 15: Algorithmes non énumératifs pour le problème SAT Pierre Siegel Laboratoire : LSIS - Equipe INCA Contact : Pierre Siegel Laboratoire : LSIS équipe InCA Pierre Siegel 04 91 11 36 01 CMI. Technopole de Château Gombert. 39 rue F. Joliot Curie 13453 Marseille Cedex 13 [email protected] Objectif du stage : Étude théorique et pratique d’algorithmes non énumératifs pour le problème SAT Description du travail proposé : En informatique, le problème SAT (satisfaction d’une formule booléenne) a fait l’objet de très nombreuses études théoriques et pratiques depuis un vingtaine d’années. Depuis quelques années, une bonne partie de ces recherches est basée sur des méthodes énumératives, qui reviennent à explorer un arbre de recherche (en particulier sur la procédure de Davis et Putnam et ses clones). Actuellement, ces méthodes semblent montrer leurs limites. En particulier, la résolution des problèmes au seuil dans SAT 3, fait très peu de progrès. Le but du stage est d’étudier, pour SAT, d’autres type d’algorithmes non énumératifs. En simplifiant, ces algorithmes, au lieu de parcourir un arbre de recherche ajoutent à l’ensemble F de formules à étudier des formules impliquées par F. Dans un premier temps, on partira des classiques (et anciennes) méthodes de résolution. Après une étude bibliographique de ces méthodes, on étudiera leurs classes polynomiales. On essaiera également d’étudier, pour ces algorithmes les problèmes au seui l Bibliographie : Très importante ! Pour commencer à entrer dans le problème, il est possible de lire : - Étude Comparative de trois formalismes en calcul propositionnel (projet Bahia : Booléen, heuristiques et Algorithmes pour l’IA. Actes des 4ième et actes des 5ièmes Journées nationales du PRC GDR IA. 1992 et 1995. Teknea. - Projet inter-PRC " classes polynomiales ", travaux et résultats. Actes des 5ièmes Journées nationales du PRC GDR IA. 1995. Teknea. Poursuite en thèse : Possible 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 19 16: Couplages dans les graphes biparties et le problème SAT Belaid Benhamou Laboratoire : LSIS, équipe InCA Contact : Belaid Benhamou Centre de Mathématiques et d’Informatique 39, rue Joliot Curie - 13453 Marseille cedex 13, France phone number : 91.11.36.22 e-mail : [email protected] Objectif du stage : Un point d’intérêt des travaux de recherches sur le problème SAT est la définition de sous-classes traitables de ce problème qui soient utilisables pour sa résolution. Nous avons commenc é à explorer une nouvelle voie pour caractériser des classes polynomiales. Celle-ci consiste à trouver des témoins de satisfiabilité en temps linéaire en utilisant les proriétés de couplages dans les graphes biparties. Nous pensons notamment à analyser le nombre d’occurences des variables et les longueurs de clauses. Cela nous a amenés entre autres à définir une classe polynomiale I qui contient la classe r-r-SAT de Tovey (r-r-SAT : représente la classe des instances SAT où toutes les clauses sont de longueur r et chaque variable apparait au plus r fois) Description du travail proposé : Le travail consistera en l’étude d’un algorithme basé sur la notion de couplage dans les graphes biparties qui permet de décider, de reconnaître et de résoudre les instances de I. Ce dernier sera implémenté et testé sur les instances aleatoires de SAT pour mettre en évidence son champs d’application. Enfin nous enviseageons d’utiliser cet algorithme de couplage dans les méthodes de réparations locales (comme GSAT par exemple). Nous pensons notamment que la technique de couplages permettrait de fournir une bonnes interprétations de départ (pas très loin d’une solution) pour les méthodes de recherche locales afin de trouver rapidement la solution. Bibliographie : Un rapport interne Poursuite en thèse : Possible 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 20 17: Génération de modèles finis en logique du premier ordre Belaid Benhamou et Gilles Audemard Laboratoire : LSIS, équipe InCA Contact : Belaid Benhamou Centre de Mathématiques et d’Informatique 39, rue Joliot Curie - 13453 Marseille cedex 13, France phone number : 91.11.36.22 e-mail : [email protected] Objectif du stage : La génération de modèles et de contre modèles finis pour une théorie de la logique du premier ordre est une approche complémentaire à la démonstration automatique de théorèmes. Plusieurs générateurs de modèles finis ont été élaborés (Falcon, Sem, Fmset etc...). Ces Méthodes ont permis de résoudre des problèmes ouverts dans plusieurs domaines, notamment la recherche de groupes, d’anneaux et de quasi-groupes finis en mathématiques. Description du travail proposé : Le travail consistera dans un premier temps à étudier les techniques de génération de modèles finis présentées dans la thèse de Gilles Audémard et dans un deuxième temps à améliorer les travaux sur la detection et l’exploitation de la symétrie afin de pouvoir résoudre des problèmes de la librairie TPTP Bibliographie : La thèse de Gilles Audemard, "Résolution du problème SAT et génération de modèles finis en logique du premier ordre", soutenue le 25 octobre 2001 à l’Université de Provence Poursuite en thèse : Possible Commentaires : Pour résoudre un problème, les générateurs de modèles finis utilisent souvent la forme clausale du premier ordre ou une forme simplifiée de celle-ci pour le représenter. Cette contrainte rend moins naturel le pouvoir expressif de ces méthodes. Pour élargir le champ d’application de ces générateurs de modèles finis, nous pensons dans le futur (dans le cadre d’une éventuelle poursuite en thèse) à élaborer un système qui serait basé sur l’énumération et qui accepterait en entrée une représentation de problèmes sous forme de formules générales de la logique du premier ordre. Cette extension du langage d’entrée faciliterait la représentation de certains problèmes du domaine de la démonstration automatique et de mathématiques que nous souhaitons résoudre 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 21 18: Preuve d’inconsistance par méthodes incomplètes Philippe Jégou Laboratoire : LSIS équipe InCA (Inférence, Contraintes et Applications) Contact : Philippe Jégou Faculté des Sciences et Techniques de Saint-Jérôme Av. Escadrille NormandieNiemen - 13397 Marseille Cedex 20 Tél. : 04 91 28 89 37 Email : [email protected] Objectif du stage : Depuis quelques années, la résolution pratique de problèmes NP-Complets tels que SAT ou CSP, a fait l’objet d’une avancée considérable par l’exploitation de méthodes de recherche stochastiques telles que GSAT. Des jeux de données de taille considérables ont été traités, là où les méthodes complètes échouaient. Toutefois, l’incomplétude de telles méthodes ne leur permet pas de faire des preuves d’inconsistance. Aussi, lors de l’IJCAI 1997, dans le cadre du challenge proposé par Bart Selman et Henry Kautz, le problème de la preuve d’inconsistance par méthodes stochastiques a été identifié parmi les 10 défis mis en concours. À ce jour, aucune avancée tangible n’a semble-t-il été proposée. L’objet de ce stage est d’explorer une des voies possible. Description du travail proposé : Il s’agira dans un premier temps de se familiariser avec les travaux de D.R. Gaur, W.K. Jackson, et W.S. Havens (voir référence ci-dessous). Il faudra ensuite les adapter et établir expérimentalement leur intérêt dans le cadre de la preuve dŠinconsistances de CSP par lŠemploi de méthodes stochastiques. Dans un second temps, il sŠagira d’évaluer cette approche sur les instances SAT. Enfin, la recherche de propriétés similaires à celle développées par Gaur, Jackson, et Havens sera envisagée par une étude bibliographique. Bibliographie : Méthodes stochastiques sur SAT et CSP. Une partie de la littérature sera présentée dans l’option Procédures de preuve : problème SAT, CSP, et raisonnement temporel ; plusieurs articles sont accessibles à partir de la page WEB de H. kautz où se trouve la description du Challenge IJCAI : http ://www.cs.washington.edu/homes/kautz/challenge/ D.R. Gaur, W.K. Jackson, and W.S. Havens. Detecting unsatisfiable CSPs by coloring the micro-structure. In Proceedings of the 14th National Conference on AI, pages 215–220. American Association for Artificial Intelligence, 1997. http ://www.cs.sfu.ca/research/groups/ISL/papers/gaur-detecting.pdf Poursuite en thèse : Ce stage a pour objectif normal de déboucher sur une thèse. Commentaires : Le stage se déroulera au LSIS, à la Faculté des Sciences et Techniques de Saint-Jérôme. Le stagiaire sera accueilli au sein de l’equipe InCA. Il aura à sa disposition les conditions matérielles minimales (machine, salle de travail). 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 22 19: Logique dynamique linéaire d’actions pour la planification Camilla Schwind Laboratoire : MAP, CNRS, UMR 694 Contact : Camilla Schwind [email protected] tel : 04 91 82 71 90 Objectif du stage : La logique dynamique linéaire d’actions est basée sur la version produit de DLTL (dynamic linear temporal logic), qui est une logique temporelle dans laquelle les modalités temporelles peuvent être indexées par des programmes linéaires. Elle permet de décrire le comportement d’un réseau d’agents qui co-ordonnent leurs activités et co-opérent d‘pour exécuter des actions ensemble. Les problèmes de projection temporelle et de planification peuvent être modélisés comme un problème de satisfaction de la logique DLTL. Description du travail proposé : Le travail consistera dans un premier temps à étudier la logique dynamique et à modéliser un (ou des) problèmes de planification complexe. Dans un deuxième temps, nous envisageons d’élaborer un algorithme pour résoudre le problème de persistence et de planification par l’approche de satisfaction de modèles. Bibliographie : [JGiordanoMartelliSchwind :00] L. Giordano, A. Martelli and C. Schwind, Reasoning about Actions in Dynamic Linear Time Temporal Logic. Logic Journal of the Interest Group in Pure and Applied Logics IGPL, Oxford University Press, Oxford, UK, vol. 9, no.2, pp.289-303, 2001. [Henriksen99] J.G. Henriksen and P.S. Thiagarajan, Dynamic Linear Time Temporal Logic. in Annals of Pure and Applied logic, vol.96, n.1-3, pp.187–207, 1999 [Giunchiglia & Traverso99] F. Giunchiglia and P. Traverso., Planning as Model Checking. In Proc. The 5th European Conf. on Planning (ECP’99), pp.1–20, Durham (UK), 1999. Poursuite en thèse : Une poursuite en thèse est possible et souhaitable pour ce mémoire 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 23 7 Programmation et logique 20: Bornes inférieures pour les phénomènes de seuil liés à la satisfaisabilité des formules booléennes Nadia CREIGNOU, Hervé DAUDE Laboratoire : LIF (équipe logique et complexité) et LATP (équipe DSA ) Contact : Nadia Creignou, tel. 04 91 82 94 80, email [email protected] Objectif du stage : Les phénomènes de seuil sont bien connus sous le nom de changements de phase ou de percolation en physique et sont très largement étudiés en physique théorique et statistique. Un phénomène de seuil pour la satisfaisabilité de formules Booléennes, mis en évidences expérimentalement il y a quelques quelques années, est le suivant : quand le nombre de variables tend vers l’infini, une formule CNF dont le rapport nombre de clauses sur nombre de variables est supérieur à une certaine constante c est presque sûrement insatisfaisable alors que si ce rapport est inférieur à c alors la formule est presque sûrement satisfaisable. La mise en évidence de tels phénomènes est importante car il s’avère qu’alors seules les formules dont le ratio nombre de clauses sur nombre de variables avoisine c produisent un matériel fiable pour tester l’efficacité d’ algorithmes. L’existence d’un tel phénomène n’est pas encore complètement établi pour les formules 3-CNF. En particulier de nombreux chercheurs s’attachent à établir des bornes aussi précises que possible pour la constante c correspondant à la transition de phase. Par exemple pour 3-SAT, alors qu’expérimentalement la valeur critique est approximativement c3 = 4, 25 , la meilleure borne supérieure connue est c3 < 4, 506 alors que les meilleurs bornes inférieures qui ont été successivement obtenues sont c3 > 3, 003, 3, 145, 3, 26. Sur cet exemple on voit qu’il est difficile d’obtenir des bornes inférieures. Description du travail proposé : Le travail consistera dans un premier temps à faire le bilan des diverses techniques utilisées pour obtenir ces bornes inférieures et dans un deuxième temps à appliquer ces méthodes à un problème similaire : le problème Monotone-3-SAT. Le but sera alors de cerner la portée des techniques mises en oeuvre. Bibliographie : A.M. Frieze and S. Suen. Analysis of two simple heuristic on a random instance of k-SAT. Journal of algorithms 20 (2) :312–355, 1996. D. Achlioptas and B. Sorkin. Optimal myoptic algotithms for random 3-SAT. In proceedings of the 41st annual symposium of foundations of computer science, pages 590–600, 2000. Poursuite en thèse : A priori non, cependant si les résultats trouvés sont encourageants une poursuite en thèse sur un sujet voisin serait possible 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 24 21: Typage et gestion automatique de la mémoire dans un langage à objets Silvano DAL ZILIO Laboratoire : LIF - Nord Contact : Silvano DAL ZILIO, CMI, 39 rue Joliot-Curie, 13453 Marseille Cedex 13, FRANCE, +33 (0)4 91 11 36 25, [email protected] Objectif du stage : Il s’agit de développer une méthode d’analyse des programmes objets, basée sur le typage, permettant d’abstraire l’utilisation de la mémoire par un programme. Cette étude, qui sera menée sur une version simplifiée d’un langage orienté objets, doit permettre de conclure jusqu’à quel point il est possible de se passer d’un ramasse-miette (garbage collector) tout en assurant une gestion automatique de la mémoire. Description du travail proposé : Une application commune des méthodes d’analyse des programmes par typage est liée à l’optimisation du temps d’exécution. Ainsi, une analyse fine de la manière dont un programme accède à ses ressources, telle que la mémoire par exemple, peut permettre d’économiser le recours à des tests dynamique coûteux au moment de l’exécution. Cette utilisation des systèmes de types est aujourd’hui encore un domaine de recherche très actif, qui a produit de nombreux résultats originaux dans le domaine de la programmation fonctionnelle. Un exemple particulièrement élégant de ce type d’analyse est le calcul des régions de Tofte et Talpin [1], qui permet d’optimiser la gestion de la mémoire d’un programme au moment de sa compilation. Les régions ont par exemple été utilisées dans l’implantation de ML Kit [2], un compilateur pour le langage Standard ML qui n’utilise pas de ramasse-miettes. Des recherches plus récentes nous permettent d’espérer atteindre des résultats comparable dans le cas des langages impératifs et, par exemple, avec les langages à objets concurrents [3, 4]. Le but de ce stage est d’étudier la possibilité de définir un mécanisme de gestion statique de la mémoire pour un langage de programmation orientés objets simple. Ce mécanisme, basé sur un système de types avec effets du même genre que celui définit par Tofte et Talpin dans leur implémentation de ML Kit, devrait permettre de conclure jusqu’à quel point il est possible de se passer d’un ramasse-miette (garbage collector), tout en assurant une gestion automatique de la mémoire. Bibliographie : [1] "A simplified account of region inference." J.-P. Talpin, Rapport de Recherche INRIA 4104, janvier 2001. [2] "Region-based memory management." M. Tofte et J.-P. Talpin. Information and Computation, Vol. 132(2), p. 109-176, 1997. [3] "Featherweight Java : A Minimal Core Calculus for Java and GJ." A. Igarashi, B. Pierce et P. Wadler. POPL, 2001. [4] "Region Analysis and a pi-calculus with Groups." S. Dal Zilio et A. D. Gordon. Rapport de Recherche MSR-TR-2000-57, Microsoft Research, août 2000. Poursuite en thèse : Il serait possible de poursuivre ce travail par une thèse dans le cadre du projet européen MIKADO, qui fait partie du programme IST-FET sur la programmation globale. Commentaires : Un intérêt pour la sémantique des langages de programmation et la programmation fonctionnelle est souhaitable. Des notions en analyse statique de programmes ou en typage sont un plus. Ce stage, qui s’effectuera au sein de l’équipe MOVE au CMI (http ://www.cmi.univ-mrs.fr/ amadio/ModVer/modver.html), est essentiellement théorique. Le stage nécessite néanmoins un intérêt pour la programmation et pourrait déboucher sur l’implantation d’un prototype logiciel. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 25 22: Forme normale de contraintes du premier ordre sur les arbres binaires infinis Alain Colmerauer Laboratoire : LIF Contact : Alain Colmerauer, tel : 04 91 40 11 37, e-mail : [email protected] Objectif du stage : Mieux maîtriser la résolution de contrainte générales du premier ordre dans les arbres. Description du travail proposé : On considère des contraintes du premier ordre (avec égalité) construites sur le langage L = {g, f } ∪ R, où g, f sont des symboles d’opération d’arité 1 et R un ensemble infini de symbole de relations, tous d’arité 1. On désigne par A l’ensemble des arbres binaires infinis dont les nœuds sont étiqueté par les éléments de R. On se place dans la structure A, de domaine A, où chaque symbole s de L est interprété par l’opération ou la relation s suivante 1. g(x) et d(x) désignent repectivement le fils gauche et le fils droit de l’arbre x, 2. r(x), avec r ∈ R, signifie que la racine de l’arbre x est étiqueté r. Le travail de recherche consistera tout d’abord à voir comment associer à toute contrainte p une contrainte équivalente normal(p), qui ne contienne aucune quantification et qui soit une forme normale (si p est équivalent à q alors normal(p) = normal(q)). Puis à étudier des algorithme pour calculer normal(¬p), normal(p ∧ q) et normal(∃x p) à partir des formes normales p et q. Bibliographie : Résolution de contraintes du premier ordre dans l’algèbre des arbres finis ou infinis. Thèse de Thi Bich Hanh Dao, LIM, décembre 2000. Poursuite en thèse : Une poursuite en thèse est possible pour ce mémoire Commentaires : Si le sujet se révélait trop difficile on pourra se contenter d’un forme canonique ayant des propriétés intéressantes. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 26 23: Décidabilité/indécidabilité des propriétés “chaotiques”dans les automates cellulaires Enrico Formenti Laboratoire : Laboratoire d’informatique fondamentale de Marseille (LIF). Centre de Mathématique et Informatique (CMI), 39 rue Joliot-Curie, 13453 Marseille cedex 13 Contact : Enrico Formenti, LIF-CMI. Tél : +33 (0)4 91 11 36 21 Fax : +33 (0)4 91 11 36 02 Mél : [email protected] Objectif du stage : Dans le cadre des systèmes dynamiques discrets plusieurs notions de chaoticité/complexité ont étés introduites avec des résultats à la fois intriguants et insatisfaisants. Les automates cellulaires, vus dans l’optique systèmes dynamiques ne font pas exception à ce dualisme. En ce derniers années nombre de résultats ont étés montres mais l’impression générale est qu’une grande partie reste encore à faire. Description du travail proposé : Le stage devra intervenire dans le cadre ci-dessus en étudiant la décidabilité/inécidabilité des propriétés “chaotiques” des automates cellulaires. On pourra limiter le travail à des classes particulières d’automates comme, par exemple, les “number-conserving”. Poursuite en thèse : Possibilité de continuation en thèse. Commentaires : Les pré-requis nécessaires sont des notions de décidabilité, de la calculabilité et une bonne dose d’imagination ! 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 27 24: Synthèse d’automates communicants Rémi MORIN Laboratoire : LIF (Laboratoire d’Informatique Fondamentale de Marseille) Contact : Rémi MORIN Technopôle Château-Gombert, 39, rue F. Joliot Curie F-13453 Marseille Cedex 13, France Mél : [email protected] Web : http ://www.cmi.univ-mrs.fr/˜morin/ Objectif du stage : Les systèmes de transitions asynchrones forment un modèle très classique de systèmes parallèles. Ils sont reliés aux réseaux de Petri, aux automates communicants, aux algèbres de processus, etc. Le problème de la synthèse consiste à construire des composants dont l’interaction réalise une spécification donnée par un automate muni d’une relation d’indépendence décrivant le parallélisme du système. Ce problème est souvent difficile. Pour des réalisations sous forme de réseaux de Petri, la complexité de la synthèse est connue et un outil basé sur l’algorithme du simplexe déja implémenté et utilisé pour la synthèse de contrôleurs. Qu’en est-il pour les systèmes de processus communicants ? Peut-on faire aussi bien (ou mieux) qu’avec les réseaux de Petri ? Description du travail proposé : Il s’agit d’étudier la complexité de la synthèse de systèmes de processus communicants et de rechercher des algorithmes efficaces de réalisation.On cherchera à s’inspirer des techniques mises en oeuvre et implémentées pour la synthèse de réseaux de Petri (BDD, simplexe). Bibliographie : Une page web http ://www.cmi.univ-mrs.fr/˜morin/StageDEA01.html sera très bientôt disponible. Vous y trouverez la version électronique des principaux articles du domaine et une bibliographie sur la théorie du contrôle. Poursuite en thèse : Idéalement, ce stage se poursuivra en une thèse sur les méthodes formelles de validation de logiciels distribués. Commentaires : Le cours de complexité de l’option ProgLog sera un atout. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 28 25: Réalisation de HMSC Rémi MORIN Laboratoire : LIF (Laboratoire d’Informatique Fondamentale de Marseille) Contact : Rémi MORIN Technopôle Château-Gombert, 39, rue F. Joliot Curie F-13453 Marseille Cedex 13, France Mél : [email protected] Web : http ://www.cmi.univ-mrs.fr/˜morin/ Objectif du stage : Le formalisme des ”message sequence charts” est un standard établi de l’International Telecommunication Union. Souvent utilisé pour décrire des protocoles dans les premières phases d’une spécification formelle, il apparaît aussi sous la forme de ”sequence diagrams” dans UML. Fondés sur des schémas graphiques et intuitifs, les MSC admettent divers opérateurs de composition qui permettent une formalisation hiérarchique d’ensembles complexes de scénarios sous la forme d’expressions algébriques appelées MSC hiérarchiques (HMSC). La vérification de ces descriptions formelles a pour but de détecter des erreurs de spécification le plus tôt possible au cours de la conception. Une propriété principale que nous souhaitons vérifier est que le comportement décrit par une HMSC correspond bien à celui d’un système de processus communicants, c’està-dire que la HMSC est réalisable. Description du travail proposé : Attrayant par sa facilité d’utilisation, le formalisme graphique des MSC peut très vite conduire à des spécifications complexes qui ne peuvent pas être réalisées sous la forme de processus communicants. Nous sommes face à un problème de synthèse somme toute classique. La première question qu’il faut se poser est bien sûr de savoir ce qu’est une réalisation acceptable d’un langage de MSC donné. Plusieurs pistes ont été étudiées [AEY01, AEY00, CDHL00, MNS00], mais d’autres toutes aussi intéressantes sont encore à explorer. Pour le type de réalisation définie et étudiée par A LUR ET AL . [AEY00, AEY01] un encadrement de la complexité du problème de la synthèse a été récemment proposé pour la sous-classe, relativement réduite, des langages réguliers : le problème est PSPACE-difficile et EXPSPACE. Cette étude demande à être précisée et mais aussi généralisée : on ignore en effet encore si le problème est décidable pour les langages non réguliers (il l’est pour les langages reconnaissables [M02]). L’approche suivie dans [AEY01, AEY00] se limite aux protocoles qui terminent et ne considère que les exécutions s’achevant sur des canaux communications vidés de leurs messages. Elle suppose en outre que ces messages circulent de manière FIFO. Il s’agit là d’hypothèses très restrictives concernant les protocoles de télécommunications et autant de voies nouvelles à explorer. Bibliographie : Une présentation plus complète de ce thème de recherche est disponible en http ://www.cmi.univmrs.fr/˜morin/DEA01.html. Elle comprend le cours introductif aux MSC présenté au DEA, ainsi que des liens vers plusieurs publications récentes. Poursuite en thèse : Le stage s’appuiera essentiellement sur deux articles récents [AEY01, AY00] (téléchargeables à partir de la page Web de présentation de ce stage). Idéalement, il conduira à une thèse dans ce domaine en pleine effervescence qui recèle de nombreux problèmes théoriques et pratiques. Commentaires : Le cours de complexité de l’option ProgLog sera un atout. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 29 26: Pavages et complexité Bruno Durand Laboratoire : Laboratoire : LIF (Laboratoire d’Informatique Fondamentale de Marseille) http ://www.lif.univmrs.fr Contact : Bruno Durand http ://www.cmi.univ-mrs.fr/ bdurand, email : [email protected] Objectif du stage : Les pavages et leur complexité structurelle. L’idée est d’étudier les pavages dits "complexes" c’est à dire les pavages obtenus par des ensembles de tuiles ne pavant le plan que de façon complexe (plusieurs définitions de complexité peuvent être fructueusement employées). En général ils sont quasi-périodiques : l’apparition des motifs finis y est régulière. Description du travail proposé : Etudier les liens des diverses propriétés de complexité des pavages avec la quasipériodicité. Par exemple on peut définir des notions de pavages quasipériodiques "constructibles" en s’inspirant de la construction physique des quasicristaux par agglomération et étudier s’il peuvent ou non hautement complexes. Le sujet est très ouvert, moderne (le problème posé en 1972 de construire les pavages les plus complexes possibles a été résolu sulement en 2001), et nécessite qq prérequis de calculabilité et complexité élémentaire. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 30 27: Conservation de l’information dans les automates cellulaires Bruno Durand Laboratoire : Laboratoire : LIF (Laboratoire d’Informatique Fondamentale de Marseille) http ://www.lif.univmrs.fr Contact : Bruno Durand, Université de Provence. http ://www.cmi.univ-mrs.fr/ bdurand, email : [email protected] Objectif du stage : Certains automates cellulaires ont des propriétés de conservation. On connait par exemple les automates cellulaires "number-conserving". Ces derniers conservent localement la somme des états. Par exemple si on considère une configuration périodique formée de 0 et de 1, le nombre de 1 est localement conservé. Ces automates sont très utiles pour modéliser des phénomènes ayant une loi de conservation (exemple le traffic routier, les flux, etc.) On s’est récemment aperçu que bien que très simples, ils avaient des propriétés dynamiques subtiles et formaient des classes bien plus riches qu’on l’attendait. Description du travail proposé : L’idée est d’étudier des lois de conservations plus élaborée que la somme des états et voir si les classes obtenues sont intéressantes. Il convient d’abord de savoir si la propriété recherchée est décidable (I.E. si on donne un automate cellulaire, peut-on savoir s’il conserve ou non la loi donnée. C’est le cas pour la somme des états – et l’algorithme de décision est très élégant. Plus généralement, quel type de loi de conservation locale peut être décidée ? toute ? De nombreuses questions sont ouvertes dans ce domaine où des notions de base de calculabilité sont requises. Le sujet assez ouvert se précisera en fonction des résultats obtenus. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 31 28: Analyse des algorithmes adaptatifs de contrôle pour la production de cartes à puce personalisées Peter NIEBERT Laboratoire : Cybernétix Recherche en coopération avec le LIF, Équipe Modélisation et Vérification Contact : Peter Niebert, LIF, CMI, Château Gombert, 39 rue Joliot Curie, 13013 Marseille, [email protected] Objectif du stage : Cybernétix est une société Marseillaise de robotique et automatique située à Château-Gombert, où se trouve également leur division recherche. Parmi d’autres activités, Cybernétix s’occupe de machines pour l’assemblage et la personnalisation de cartes à puces. Il s’agit de machines sophistiquées, pouvant atteindre des débits de 6000 cartes par heure et utilisées pour une fabrication à moyenne échelle. Pour arriver à ce débit, les machines disposent d’une structure parallèle et modulaire, et traitent les cartes par lots. En fonctionnement normal, un système de transport va insérer un lot dans les unités de traitements, elles seront traitées et personnalisées et dans la suite déposées sur une pile triée de cartes. Malheureusement, un certain nombres de cartes jugées défectueuses par les unités de traitement doivent être éliminées, et remplacées par d’autres cartes, tout en respectant un certains ordre dans la production. A cette fin Cybernétix Recherche a développé un algorithme sophistiqué de rattrapage, qui est utilisé dans la pratique. Le but de cet algorithme est de garantir l’ordre de débit des cartes tout en atteignant la plus grande vitesse moyenne possible. Des problèmes de re-triage de ce type apparaissent également dans d’autres secteurs d’activités de Cybernétix. Le but de ce stage est de modéliser et d’analyser cet algorithme, et éventuellement de considérer des modifications (soit de l’algorithme, soit de l’architecture de la machine) pouvant permettre un traitement plus efficace. Description du travail proposé : Dans un premier temps, il s’agit de modéliser le processus de production ainsi que l’algorithme de rattrapage à un niveau pouvant permettre l’analyse de ses performances. Basé sur un même format d’entrée, il s’agit de générer automatiquement des modèles pour un simulateur ainsi que pour des outils de vérification de systèmes à événements discrets (par exemple des automates temporisés). Le premier but de l’analyse est de vérifier que l’algorithme de rattrapage est correct, c’est à dire qu’il garantit le bon ordonnancement des cartes. On pourra également essayer de démontrer l’optimalité de l’algorithme pour une certaine architecture de la machine que l’on se sera fixé à l’avance. Bibliographie : Pour avoir une impression du domaine de travail du point de vue scientifique, il est utile d’aller voir les pages Web du projet européen VHS (vérification des systèmes hybrides, http ://www-verimag.imag.fr/VHS) ainsi que sur les pages de Cybernétix (http ://www.cybernetix.fr). Poursuite en thèse : Ce stage à vocation à se poursuivre par une thèse industrielle en collaboration avec Cybernétix Recherche, financée par une bourse CIFRE ou par une bourse régionale. Commentaires : Il s’agit d’un travail d’application des méthodes formelles à l’analyse des systèmes de contrôle adaptatifs. Cet travail se retrouve ainsi à la frontière de la recherche opérationnelle et de la modélisation formelle. Le défi de l’analyse par des telles méthodes provient de la difficulté de la modélisation d’une part et de la complexité de l’analyse d’autre part. Une poursuite en thèse pourrait ainsi contribuer à deux buts complémentaires : augmenter le savoir faire de l’entreprise d’accueil pour la conception et programmation des systèmes de contrôle adaptatifs ; guider la recherche d’algorithmes efficaces d’analyse automatique. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 32 8 Structures discrètes et Recherche Opérationnelle 29: Séparation des contraintes de partition Steiner généralisées Mohamed DIDI BIHA, Philippe Michelon Laboratoire : Laboratoire d’Informatique d’Avignon Contact : M. DIDI BIHA, 339 chemin des Meinajaries, 84911 Avignon, Tél. 04 90 84 35 54, email : [email protected] Objectif du stage : Beaucoup de problèmes réels peuvent se modéliser comme des problèmes d’optimisation combinatoire. Un coût (ou un poids) ayant été affecté à chaque élément d’un ensemble fini E, il s’agit de choisir un "meilleur" élément (de coût minimum ou de poids maximum) d’une famille de sous-ensembles de E. Une approche qui s’est révélée efficace pour ce type de problèmes est l’approche polyédrale. Elle consiste à décrire l’enveloppe convexe des vecteurs caractéristiques des solutions du problème (le polyèdre associé au problème) par un système d’inégalités linéaires, et donc à se ramener à la maximisation (ou la minimisation) d’une fonction linéaire sur un polyèdre. Soit P ⊆ Rn un polyèdre et τ une classe d’inégalités valides pour P . Le problème de séparation de τ est le suivant : étant donné un point x ∈ Rn , décider si x satisfait toutes les inégalités de τ et, lorsque ce n’est pas le cas, trouver une inégalité de τ violée par x. Le problème de séparation est le point essentiel dans l’approche polyédrale. En effet, il y a une équivalence entre la résolution en temps polynomial d’un problème d’optimisation combinatoire et l’existence d’un algorithme polynomial pour la séparation des inégalités du polyèdre associé à ce problème. Un exemple de problèmes d’optimisation combintoire les plus connus est le problème de l’arbre Steiner. Étant donné un graphe G = (V, E), un sous-ensemble S de V et un vecteur poids associé aux arêtes de G, le problème de l’arbre Steiner consiste à trouver un arbre de G de poids minimum couvrant S. Ce problème a de nombreuses applications, en particulier dans la conception des circuits électroniques intégrés et des réseaux de télécommunications. Nous nous intéressons à une approche polyédrale pour ce problème. En particulier, nous proposons l’étude d’une nouvelle famille d’inégalités valides dite "contraintes de partition généralisées". Description du travail proposé : – Étude de la complexité du problème de séparation de ces contraintes ; – Conception d’une heuristique efficace pour séparer ces contraintes ; – Utilisation de ces contraintes dans un algorithme de coupes pour résoudre des instances du problème de l’arbre Steiner. Bibliographie : M. Didi Biha, H. Kerivin, A.R. Mahjoub, Steiner tree and polyhedra, Discrete Applied Mathematics 112 (2001) 101-120 W. R. Pulleyblank, Polyhedral combinatorics, In G. L Nemhauser et al, eds, Handbooks in OR-MS, vol. 1, North-Holland, Amsterdam, 371-446. Poursuite en thèse : Une poursuite en thèse est envisageable 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 33 30: Séparer à partir d’appartenir Jean François Maurras Laboratoire : LIF : Équipe combinatoire et complexité Contact : Jean François Maurras, Tel 04 91 82 93 10, e-mail [email protected] Objectif du stage : Un théorème de Yudin et Nemirovskiı̆ dit : Soit un convexe centré (K; n, R, r, a0 ) donné par un oracle d’appartenance faible. Il existe un algorithme oracle-polynomial qui résout le problème de faible violation. Un argument de polarité permet alors de déduire un algorithme oracle-polynomial pour le problème de faible séparation. Cet algorithme utilise deux fois l’algorithme de l’ellipsoïde. J’ai décrit un algorithme oracle-polynomial "naturel" pour séparer un point d’un polyèdre (P ; n, a0 ) centré au moyen de l’oracle "appartenir". Peut-on décrire un algorithme oracle-polynomial "naturel" pour le précédent problème ? Description du travail proposé : Le travail consistera à comprendre ces deux algorithmes et essayer d’avoir une bonne intuition du problème qui peut consister à savoir pourquoi il paraît "normal" de savoir séparer à partir d’appartenir, et aussi de sentir les difficultés qu’il y a à apréhender un convexe à partir de l’oracle appartenir faible ou non. Bibliographie : Geometric Algorithm and Combinatorial Optimization, second corrected edition, M Grötschel, L Lovász and A Schrijver, Springer 1988, 1993 Poursuite en thèse : Poursuite possible pour décrire un ou plusieurs algorithmes "naturels" pour ce problème, des résultats partiels sont envisageables. Commentaires : Aimer les polyèdres, les convexes et les algorithmes polynomiaux... 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 34 31: Tournées de véhicules avec inventaire Michel Van Caneghem Laboratoire : LIF : Equipe CRO (Combinatoire et Recherche Opérationnelle) Contact : Michel Van Caneghem : [email protected] Objectif du stage : Le problème des tournéees de véhicules (VRP : Vehicle Routing Problem) concerne un fournisseur qui doit livrer des produits commandés par des clients en utilisant des camions. Une gestion plus efficace consiste à ce que les clients ne commandent plus les produits. Ils disposent chacun d’un stock et le fournisseur s’arrange de manière indépendante à réapprovisionner le stock de telle manière qu’il n’y ait pas de ruptures (IRP : Inventory Routing Problem). C’est plus simple pour le client, plus efficace pour le fournisseur, mais beaucoup plus difficiles pour ceux qui résolvent le problème de manière automatique. Cela se formalise ainsi : Il s’agit de distribuer de manière répétitive un produit à partir d’une usine ou un dépot à N clients sur un horizon T . Le client i consomme le produit a un taux ui (volume par jour) et a une capacité de stockage Ci . Il dispose à l’origine (t = 0) d’un stock Ii . Le fournisseur dispose de M camions homogènes d’une capacité Q. L’objectif est de minimiser le coût de distribution sur la période de plannification, sans causer des ruptures de stock. Il y a trois décision à prendre : – Quand livrer un client ? – Quelle quantité livrer à ce client ? – Quelles routes choisir pour les livraisons ? Description du travail proposé : Il y a 4 approches possibles pour résoudre ce problème : – Utiliser des méthodes classiques : le problème peut se découper en deux : un problème de programmation en nombre entier pour fixer les quantité à livrer, suivi d’un problème de VRP. Le travail consistera a garder cette approche mais a utiliser de nouveaux outils de résolution. – Utiliser des méthodes de recherche locales : la méthodes des colonies de fourmis semble avoir donné de bon résultats sur le problème de VRP avec fenêtre de temps. Le but est d’appliquer cette méthode à notre problème. – Il existe un certain nombre d’heuristiques pour résoudre ce problème. Le travail consiste à essayer de prouver des bornes sur la qualité de la solution obtenue par ces heuristiques. On essayera ensuite de voir si ce travail peut s’étendre au cas ou la consommation du client est comprise entre deux bornes (intervalles). – Enfin la dernière approche est stochastique : en réalité on ne connait pas exactement la consommation du client, mais plutôt une espérance de consommation. Le but est alors de trouver une stratégie de distribution qui minimise l’espérance du coût de distribution. L’étudiant choisira une et une seule de ces approches pour essayer de résoudre ce problème. On utilisera des données trouvéees sur Internet et des données fournies par Air Liquide (distribution d’oxygène ou d’azote liquide dans les réservoirs de clients [il y en a un à Luminy ! !]). Bibliographie : Voici deux références : IRP : http ://tli.isye.gatech.edu/research/papers/files/misc9916.pdf Les colonies de fourmis appliqué au VRP : http ://www.idsia.ch/ monaldo/VRP/tr-idsia-06-99.pdf Poursuite en thèse : Une poursuite en thèse est possible si les résultats trouvés sont encourageants. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 35 32: Enveloppes de Pareto en normes l1 et l∞ Victor CHEPOI, Yann VAXES Laboratoire : LIF (équipe combinatoire et recherche opérationnelle) Contact : Victor Chepoi, tel. 04 91 82 94 84, email [email protected] Objectif du stage : Soit X = {x1 , ..., xn } un ensemble de points de Rk muni d’une métrique d de type lp . Un point z ∈ Rk est dominé par un point y ∈ Rk si d(y, xi ) ≤ d(z, xi ) pour tout i = 1, ..., n et il existe un indice j pour lequel d(y, xj ) < d(z, xj ). L’enveloppe de Pareto P (X) de X est constituée de tous les points non dominés de Rk . Si d est la métrique euclidienne l2 alors P (X) est l’enveloppe convexe usuelle de X. Pour les métriques l1 et l∞ la structure de P (X) est plus complexe : par exemple, dans le cas de l1 , c’est une union de paralélépipèdes de différentes dimensions. Le but de ce mémoire sera (i) de caractériser P (X) pour les métriques l1 et l∞ dans R3 en établissant des liens avec d’autres structures discrètes (ii) de concevoir des algorithmes optimaux pour leur construction. Il sera également demandé de montrer que les solutions optimales de certains problèmes d’optimisation se trouvent dans P (X). Par conséquent, la connaissance de P (X) réduit l’espace de recherche pour ses problèmes (la plus part d’entre eux sont NP-difficiles). Description du travail proposé : Le travail consistera d’un part à établir la structure de l’enveloppe de Pareto et ensuite de l’utiliser pour les construire en temps O(n log n). Il sera souhaitable que les algorithmes obtenus soient implantés. Poursuite en thèse : oui 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 36 9 Systèmes parallèles et communicants 33: Gestion de la qualité de service dans le cas du multicast dans l’Internet Abderrahim BENSLIMANE Laboratoire : LIA, Laboratoire d’Informatique d’Avignon Contact : Abderrahim BENSLIMANE Laboratoire Informatique (LIA/CERI) Université d’Avignon et des Pays de Vaucluse 339 ch. des Meinajaries Tél. : 04 90 84 35 12 BP 1228 - 84911 AVIGNON CEDEX 9 Fax : 04 90 84 35 01 [email protected] Objectif du stage : Avec l’essor actuel de l’Internet associé à l’avènement du multimédia et la possibilité d’accéder à des services de communication temps réel (visioconférence, jeux distribués interactifs, ressources « real audio » ou « real video » pour la diffusion de concerts ou d’émissions de radio, etc.), les besoins en termes de services de communication sont radicalement différents. En effet, les services de communication doivent maintenant garantir la QoS des données transmises, avec une nouvelle dimension importanteă : le temps. Les propositions de l’IETF dans le domaine : IntServ et DiffServ. Toutefois, il est apparu que IntServ est inadapté aux grands réseaux, et que DiffServ ne gère la QoS que de façon statistique, et n’apporte donc qu’une solution grossière au problème posé. Ajoutés à cela, plusieurs protocoles de routage ont été proposés dans le cas du multicast. Ces protocoles sont plus ou moins intéressants, complexes et inadéquats pour les transferts vidéo à QoS. Description du travail proposé : Le travail consiste à mettre en évidence les architectures et protocoles de communication de groupe pour l’Internet dans les applications multimédia. L’objectif de ce DEA est donc d’étudier tous les mécanismes de gestion de la QoS dans les réseaux en prenant en compte un certains nombre de caractéristiques des technologies réseaux qui composent Internet : – L’étude de protocoles de transport pour les différentes applications ou famille d’applications, et en particulier pour les applications orientées flux ; – L’étude des méthodes de compression de flux vidéo hiérarchiques ; – L’étude des mécanismes d’ordonnancement et de gestion des files d’attente dans les routeurs et de leur adéquation aux besoins des protocoles de transport et des types de trafics générés par les différentes applications. Bibliographie : A. Benslimane, and A. Abouaissa, Dynamical Grouping Model for Distributed Real Time Causal Ordering, Journal of Computer Communication, Elsevier Science, 2001. A. Benslimane, Real-Time Multimedia Services over Internet, IEEE ECUMN 2000. Poursuite en thèse : possible si les résultants sont encourageants. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 37 34: Architecture pour les réseaux ad-hoc Abderrahim BENSLIMANE Laboratoire : LIA, Laboratoire dŠInformatique dŠAvignon Contact : Abderrahim BENSLIMANE Laboratoire Informatique (LIA/CERI) Université d’Avignon et des Pays de Vaucluse 339 ch. des Meinajaries Tél. : 04 90 84 35 12 BP 1228 - 84911 AVIGNON CEDEX 9 Fax : 04 90 84 35 01 [email protected] Objectif du stage : La communication sans fil a permis l’émergence de nouveaux types d’applications, en particulier dans le domaine de transport. Dans ce cadre, des clients sur lesquels sont embarqués des équipements de transmission sans fil, peuvent former un réseau de manière temporaire. Sur ce type de réseau, l’information à délivrer dépend de la localisation du client. Description du travail proposé : L’objectif de ce DEA consiste donc à étudier les architectures et protocoles dans le cas des réseaux mobiles. Ils seront étudiés principalement, les systèmes 2.5 et 3 G. Le problème qui se pose est celui du routage entre des noeuds qui peuvent quitter ou joindre le réseau à tout moment. Dans le cas d’un certain domaine d’application bien défini, le délai est aussi un paramètre non négligeable. Bibliographie : A. Benslimane, A Multimedia Multicast in Mobile Computing : Handoff Management, Journal Annals of Software Engineering, Special Volume on Multimedia Software Engineering N 12, Baltzer Science Publishers, 2001. A. Benslimane, and P. Lorenz, QoS WATM networks in third generation telecommunication systems, ISCOM 99, International Symposium on Communications, Kaohsiung Taiwan, 1999. Poursuite en thèse : possible si les résultants sont encourageants. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 38 35: Etude et verification de proprietes du langage Java liees a la concurrence. Marjorie Russo Laboratoire : A préciser Contact : Marjorie Russo tel : 04 91 82 85 32 mail : [email protected] ESIL - Luminy case 925 13288 Marseille cedex 09 Objectif du stage : Le langage Java, de par sa double orientation langage a objets et langage concurrent, comprend de nombreuses notions, rendant les applications complexes a developper. De nombreuses equipes de recherche travaillent actuellement sur l’etude et la preuve de proprietes du langage ou de programmes, notamment dans le cadre de la concurrence. Description du travail proposé : L’objectif de ce stage est d’une part de realiser un etat de l’art de l’etude des differentes proprietes liees a la concurrence (un bon debut serait l’etude des travaux cites en [2]). On pourra plus particulierement etudier les differentes techniques utilisees se basant sur une specification formelle du langage. Par la suite, il peut etre envisage d’appliquer une de ces techniques a la semantique formelle du langage Java presentee en [1]. Ce travail pourra etre plus ou moins theorique et formel en fonction des choix effectues en fin de premiere etape. Bibliographie : [1] Java et ses Aspects Concurrents : Sémantique Formelle, Visualisation et Propriétés – Marjorie Russo These de doctorat - juillet 2001 [2] From Executable Formal Specification to Java Property Verification Proceedings of Formal Techniques for Java Programs - An ECOOP’2000 Workshop, Cannes, June 2000. I. Attali, D. Caromel, H. Nilsson and M. Russo Poursuite en thèse : possible 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 39 36: Codesign et Java L.FREUND Laboratoire : A préciser Contact : Freund Laurent 04 91 05 44 24, [email protected] Objectif du stage : L’object est d’étudier l’apport de Java lors de la conception des systèmes Codesign (Hardware et Software). Ce travail portera principalement sur la génération du système d’exploitation. Description du travail proposé : L’étudiant devra d’abord étudier les différents travaux existants dans le domaine afin de proposer une nouvelle approche orientée Java pour la génération du système d’exploitation pour les systèmes temps-réel embarqués. Ces travaux seront réalisés en collaboration avec l’équipe du TIMA à grenoble Bibliographie : Les publications du TIMA peuvent être trouvées à l’addresse suivante :http ://tima.imag.fr/SLS/publications_sls.html Poursuite en thèse : L’objectif de ce stage est de poursuivre par une thèse à l’ESIM 37: Synthèse et modélisation L.FREUND Laboratoire : A préciser et Entreprise Synopsys (grenoble) Contact : Freund Laurent 04 91 05 44 24, [email protected], Alain Fonkoua (synopsys) [email protected] Objectif du stage : La plupart des langages de description utilisés dans les applications de synthese sont astreints a un sous ensemble assez reduit. Ce qui fait que certaines descriptions quoique presentant un resultat de simulation compatible avec une interpretation materielle, ne sont pas acceptes. En fait, dans les outils de synthese actuels, la projection materiel est effectuee en reconnaissant les formes definies par le sous-ensemble synthese retenu. Description du travail proposé : Dans ce projet, il s’agit de realiser l’inference du materiel a partir d’un graphe (CFG/DFG) representant la semantique de simulation. Cette inference permettra de produire une interpretation materielle de niveau RTL a partir d’une description synthetisable exprimee dans un des langages de description de materiel VHDL, Verilog ou SystemC. Poursuite en thèse : L’objectif de ce stage est de poursuivre par une thèse chez synopsys 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 40 10 Traitement automatique des langues 38: Alignement multilingue basé sur la sémantique Olivier Kraif, Marc El-Bèze Laboratoire : Laboratoire d’Informatique d’Avignon (LIA) Contact : Olivier Kraif, 04 90 84 35 27, LIA, Agroparc BP 1228, 84911 Avignon Cedex 9 [email protected] Objectif du stage : Développer et évaluer une nouvelle méthode d’alignement multilingue au niveau lexical. Description du travail proposé : La plupart des techniques d’alignement de corpus parallèles multilingues se basent sur des indices superficiels telles que le rapport des longueurs des segments appariés ou encore la présence de transfuges (chaînes identiques) et de cognats (chaînes ressemblantes). D’autres techniques sont fondées sur le transfert des unités lexicales : soit au moyen d’un dictionnaire de transfert indiquant les équivalents potentiels de chaque unité, soit par l’étude des distributions lexicales, les unités équivalentes ayant généralement des distributions voisines de chaque côté d’un corpus parallèle. Des ressources telles que les thesaurus, les lexiques sémantiques, les ontologies, peuvent également fournir des données de premier choix. Une étude expérimentale, fondée sur un standard d’évaluation tel que celui du projet Arcade (alignement de textes bilingues au niveau des phrases, et appariement de mots-tests polysémiques), et des informations lexicales telles que celles d’EuroWordNet, permettra d’étudier : - Quels types de distorsions sémantiques (synonymie, hyponymie, antonymie, etc.) sont mis en oeuvre dans la construction de l’équivalence traductionnelle, et avec quelle fréquence. On pourra par exemple étudier les appariements de référence du projet Arcade, ou un corpus d’appariements lexicaux obtenus automatiquement avec des méthodes statistiques. - Comment peut-on prendre en compte le mode d’implantation de ces informations dans un système d’alignement au niveau lexical. On cherchera à identifier quelles sont les informations les plus discriminantes pour différencier les couples de mots équivalents des appariements erronés. On déterminera les outils statistiques les plus adaptés à cet effet. L’indice ainsi produit pourra alors être implanté dans le cadre d’un algorithme d’extraction de correspondances lexicales qui a déjà été précisément évalué. Les résultats obtenus pourront être comparés avec ceux d’autres méthodes sur l’ensemble des mots-tests d’Arcade. Bibliographie : Kraif, O. (2001) Constitution et exploitation de corpus bi-textuels pour l’Aide à la traduction, Thèse de doctorat, Université de Nice Sophia Antipolis. Véronis, J. (ed.) (2000) Parallel Text Processing, Kluwer Academic Publisher, Dordrecht, Nederlands. Poursuite en thèse : Poursuite en thèse possible 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 41 39: Génération automatique de libellés textuels pour les moteurs de " Questions / Réponses " Patrice Bellot, Marc El-Bèze Laboratoire : Laboratoire d’Informatique d’Avignon (LIA) Contact : Patrice Bellot, 04 90 84 35 31, LIA, Agroparc BP 1228, 84911 Avignon Cedex 9 [email protected] Objectif du stage : Les systèmes de recherche documentaire fournissent à l’utilisateur une liste de documents censés correspondre à la requête qu’il/elle a exprimée. Par opposition aux moteurs de recherche documentaire, le propre des moteurs « Questions / Réponses »est de fournir une réponse précise à une question. L ’émergence d’une piste « Questions / Réponses (Q & A) »durant les campagnes annuelles TREC (Text REtrieval Conference) permet d’une part de disposer d’ une base fiable d’évaluation de ce type de systèmes et d’autre part de mesurer l’impact de nombreux travaux exploités en recherche documentaire : classification de textes, segmentation thématique, résumé automatique, désambiguïsation sémantique. Un processus classique de « Questions / Réponses »se décompose en quatre étapes : analyse de la base documentaire, compréhension de la question, recherche des zones textuelles susceptibles de contenir la réponse et, enfin, extraction de la ou des réponses les plus probables. L’objectif de ce stage est d’établir une estimation de la validité d’une nouvelle approche consistant à extraire a priori l’ensemble des éléments informatifs (phrases, groupes nominaux, entités nommées etc.) présents dans les textes de la base documentaire sur lesquels des questions sont susceptibles d’être posées. Les techniques à employer s’apparentent à celles utilisées en indexation automatique et en résumé automatique dans une perspective d’interrogation. Cependant, les textes ne sont pas résumés pour donner une vision « objective et complète »du point de vue de leur auteur mais sont réduits à un ensemble de libellés considérés comme des réponses pré-écrites. Répondre à une question consiste alors à rechercher dans la liste des libellés, catégorisés en fonction du type d’entitées nommées qu’ils contiennent (noms propres, lieux, dates, etc.), ceux qui lui correspondent. Les applications de cette stratégie d’interrogation sont nombreuses : moteurs de « Questions / Réponses », constitution automatique de FAQ, réponse automatique à des courriers électroniques en fonction de bases de connaissances textuelles Description du travail proposé : 1. Étude bibliographique des méthodes employées dans les moteurs de Questions / Réponses »et dans les systèmes de création de résumés automatiques. 2. Analyse statistique des questions posées dans les FAQ, les forums sur le Web, les moteurs de recherche et, naturellement, dans les campagnes d’ évaluation des moteurs de « Questions / Réponses »pour déterminer les types de questions les plus probables et en obtenir une description analytique. 3. Modélisation d’un système de « Questions / Réponses »consistant à extraire d’un texte les zones les plus informatives en fonction des types de questions détectés dans l’étape précédente. Durant cette phase, des expériences seront conduites en utilisant des outils du LIA : système d’ étiquetage d’entités nommées et moteur de recherche documentaire. Bibliographie : E. Voorhees, « Overview of the TREC-9 Question Answering Track », NIST Special Publication 500-249, http ://trec.nist.gov/pubs/trec9/papers/qa_overview.pdf E. Voorhees « The TREC-8 Question Answering Track Report », NIST Special Publication 500-246 : The Eighth Text REtrieval Conference (TREC 8), http ://trec.nist.gov/pubs/trec8/papers/qa_report.pdf E. Voorhees, D. Tice, « The TREC-8 Question Answering Track Evaluation », NIST Special Publication 500246 : The Eighth Text REtrieval Conference (TREC 8), http ://trec.nist.gov/pubs/trec8/papers/qa8.pdf I. Mani, Mark T. Maybury (éditeurs), « Advances in Automatic Text Summarization », The MIT Press, 1999. F. Béchet, A. Nasr, F. Genet, Tagging Unknown Proper Names Using Decision Trees, 38th Annual Meeting of the Association for Computational Linguistics, ACL’2000, Hong-Kong, Oct 2000 ; pp. 77-84 Poursuite en thèse : Oui 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 42 40: Evaluateur de sites Web Elie Sanchez Laboratoire : MTCD : Faculté de Médecine, 27 Bd Jean Moulin, 13385 Marseille Cedex5 Contact : Elie Sanchez, tél. : 04 91 32 44 22, [email protected] Objectif du stage : Il s’agit d’écrire un programme d’évaluation de sites Web, qui intégrera des concepts et techniques basés sur la logique floue. Description du travail proposé : Il faudra écrire en Java un programme permettant d’évaluer les caractères personnalité et émotion de sites Web. L’impact des couleurs et des formes devra aussi être évalué. Il est fourni un prototype de programme déjà écrit en Java, ainsi que des articles et des documents décrivant le sujet. A partir de la simple saisie d’un URL (http ://...) le programme devra faire ressortir automatiquement des histogrammes de personnalité et d’émotion, sur des valeurs telles que : agréable, consciencieux, négligent, intelligent, ... d’une part, et colère, joie, tristesse, ... d’autre part. Ceci sera fait à partir d’un thésaurus. Enfin et surtout, il faudra étudier et intégrer l’apport de la logique floue dans l’évaluateur. Bibliographie : Deux rapports décrivant le sujet Accès à une documentation importante sur la logique floue Poursuite en thèse : oui, en relation avec l’ "e-motion" et le Web Sémantique, sous l’angle de la logique floue. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 43 41: La logique floue dans le Web Sémantique Elie Sanchez Laboratoire : MTCD : Faculté de Médecine, 27 Bd Jean Moulin, 13385 Marseille Cedex5 Contact : Elie Sanchez, tél. : 04 91 32 44 22, [email protected] Objectif du stage : Il s’agit de faire le point sur les travaux du W3C ("WWW Consortium") sur le Web Sémantique et d’étudier concrètement l’apport de la logique floue. En particulier, il faudra écrire un programme pour construire automatiquement une ontologie floue de relations à partir de documents, en l’incorporant dans un moteur de recherche. Description du travail proposé : Il consiste à faire le point sur les travaux portant sur le "Web Sémantique", en particulier à partir du modèle RDF ("Resource Description Framework"), et à étudier l’apport des systèmes flous avec implémentation d’une application Bibliographie : travaux récents de Tim Berners-Lee, documentation (Internet) sur RDF, sur le groupe W3C (en particulier MIT, INRIA, KEIO), articles sur la logique floue et Internet. Poursuite en thèse : oui, avec modélisation et mise au point de systèmes en logique floue dans le Web Sémantique. 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 44 42: Formalisation de connaissances épidémiologiques Michel Roux Laboratoire : MTCD : Modélisation, traitement des connaissances et des données Contact : Michel Roux, [email protected] Objectif du stage : Formalisation de connaissances épidémiologiques Description du travail proposé : A partir d’une ontologie de concepts épidémiologiques existante, il s’agira de construire une base de connaissances au moyen du formalisme KIF (Knowledge Interchange Format). Bibliographie : Mac Gregor R., The evolving technology of classification based knowledge representation system. "Principles of semantic networks : Explorations in the representation of knowledge", Morgan Kaufmann, San Francisco, 1991 pp 385-400. Knowledge Interchange Format. Version 3.0 Reference manual, Computer Science Departement, Stanford University. Poursuite en thèse : oui 43: Grammaire de dépêches épidémiologiques MIchel Roux, Robert Pasero, Paul Sabatier Laboratoire : MTCD : Modélisation, traitement des connaissances et des données LIF : Laboratoire d’Informatique Fondamentale Contact : Michel Roux (MTCD) , [email protected] Robert Pasero (LIF) , [email protected] Paul Sabatier (LIF), Paul [email protected] Objectif du stage : Grammaire de dépêches épidémiologiques Description du travail proposé : Il s’agira d’étudier 250 dépêches épidémiologiques et de déterminer une grammaire (lexique et syntaxe) en rendant compte. Le travail sera réalisé au moyen des outils INTEX et ILLICO. Bibliographie : Pasero R., Sabatier P., ILLICO : un système générique pour la compréhension d’un sous-ensemble du français, Rapport de recherche, LIM, 1999. Silberztein M., Dictionnaires électroniques et analyse automatique de textes : le système INTEX, Masson 1993. Poursuite en thèse : oui 23 novembre 2001 DEA d’Informatique d’Avignon, Marseille, La Réunion et Toulon 45