Dossier de candidature au poste de Maître de Conférences
Transcription
Dossier de candidature au poste de Maître de Conférences
Cécile Favre [email protected] http://eric.univ-lyon2.fr/~cfavre CV académique Informations générales Activités pédagogiques Activités de recherche Collaborations scientifiques Liste des publications scientifiques Animation scientifique Autres types d’implication – activités collectives 2 6 9 12 13 16 18 version du 15 mars 2009 Informations générales Situation actuelle Docteur en informatique, qualifiée aux fonctions de Maître de Conférences (section 27), ATER Faculté d’Anthropologie et de Sociologie, rattachée au laboratoire ERIC, Université Lumière Lyon 2. État civil Nom Favre Prénom Cécile Naissance Née le 19 août 1980 à Lyon (69) Nationalité Française Situation familiale Célibataire Contact personnel Adresse 68 rue St Maurice 69008 Lyon Téléphone 06 28 06 59 21 Contact professionnel Adresse Université Lumière Lyon 2 Laboratoire ERIC 5 av. Pierre Mendès-France 69676 Bron Cedex Téléphone 04 78 77 31 11 Télécopie 04 78 77 23 75 Courriel [email protected] Web http://eric.univ-lyon2.fr/~cfavre Langues Anglais Avancé (lu, écrit, parlé) Allemand Débutant (pratique scolaire) Français Langue maternelle page 2 sur 18 Diplômes obtenus 2007 Doctorat en Informatique de l’Université Lumière Lyon 2 École Doctorale : Informatique et Information pour la Société Mention : T RÈS H ONORABLE Titre : Évolution de schémas dans les entrepôts de données : mise à jour de hiérarchies de dimension pour la personnalisation des analyses. Accès : http://eric.univ-lyon2.fr/~cfavre/documents/Favre_These.pdf Caractéristique : thèse CIFRE en collaboration avec LCL-Le Crédit Lyonnais. Laboratoire ERIC (Équipe de Recherche en Ingénierie des Connaissances) EA 3083, Université Lyon 2. Encadrement : Omar Boussaid et Fadila Bentayeb Date de soutenance : 12 décembre 2007 Jury : - Présidente : Corine C AUVET (Université Aix-Marseille 3) ; - Rapporteure : Rokia M ISSAOUI (Université du Québec en Outaouais - Canada) ; - Rapporteur : Gilles Z URFLUH (Université Toulouse 2) ; - Examinateur : Djamal B ENSLIMANE (Université Lyon 1) ; - Examinateur : Abdelkader Djamel Z IGHED (Université Lyon 2) ; - Co-directrice : Fadila B ENTAYEB (Université Lyon 2) ; - Directeur : Omar B OUSSAID (Université Lyon 2) ; - Invité : Michel R OUGIÉ (LCL-Le Crédit Lyonnais). 2003 Double diplôme de l’Université Lumière Lyon 2 : DEA ECD (Extraction de Connaissances à partir des Données) Mention : B IEN Sujet : Utilisation des index bitmap pour la fouille de données (voir la partie Recherche pour davantage de détails) Encadrement : Fadila Bentayeb Accès : http://eric.univ-lyon2.fr/~cfavre/documents/Favre_Memoire-DEA.pdf DESS IIDEE (Ingénierie Informatique de la Décision et de l’Évaluation Économique) Mention : T RÈS B IEN, M AJORE DE PROMOTION 2002 Maîtrise IUP ISEA de l’Université Lumière Lyon 2 (Informatique, Statistique et Économétrie Appliquées) Mention : B IEN 2001 Licence IUP ISEA de l’Université Lumière Lyon 2 (Informatique, Statistique et Économétrie Appliquées) Mention : B IEN, M AJORE DE PROMOTION 2000 DEUG MASS de l’Université Claude Bernard Lyon 1 (Mathématiques Appliquées et Sciences Sociales) Mention : A SSEZ B IEN 1998 Baccalauréat scientifique, option Mathématiques Lycée Boissy d’Anglas d’Annonay (Ardèche) page 3 sur 18 Expériences d’enseignement 2008 à 2009 Attachée temporaire d’enseignement et de recherche : poste complet Faculté d’Anthropologie et de Sociologie, Université Lumière Lyon 2 Rattachée au laboratoire ERIC 2007 à 2008 Attachée temporaire d’enseignement et de recherche : 1/2 poste Faculté de Sciences Économiques et de Gestion, Université Lumière Lyon 2 Rattachée au laboratoire ERIC 2004 à 2007 Vacataire, Université Lumière Lyon 2 Expériences professionnelles (hors universitaires) 2004 à 2007 CDD, Chef de projet dans le cadre du projet de la thèse CIFRE LCL-Le Crédit Lyonnais (69) Conception et développement d’une plateforme Web basée sur MySQL pour la gestion et l’analyse des demandes marketing. 2003 : 3 mois Projet d’étude pour entreprise LCL-Le Crédit Lyonnais (69) Développement d’une application sous Access pour gérer le pré-traitement des fichiers à destination d’une plate-forme d’appels téléphoniques et effectuer l’analyse des résultats en les rendant accessibles sur l’Intranet. 2002 : 3 mois Stage professionnel LCL-Le Crédit Lyonnais (69) Création d’un tableau de bord dynamique pour la restitution d’informations commerciales. 2002 : 3 mois Projet d’étude pour entreprise Chambre de Commerce et d’Industrie de Lyon (69) Réalisation d’une enquête sur les besoins en terrains et locaux des entreprises. 2001 : 2,5 mois Stage professionnel ASTRA (38) Informatisation d’un contrôle de qualité d’une entreprise spécialisée dans la sérigraphie et la soudure haute fréquence. 2001 : 1,5 mois CDD, employée pour remplacement estival Charles Jourdan (07) Responsable de magasin en charge de la vente, l’encaissement et la manutention. 2001 : 1,5 mois Intérimaire COSMOPAR, FCA (07) Travail à la chaîne pour le conditionnement de produits cosmétiques et pharmaceutiques. page 4 sur 18 Compétences en informatique Bureautique Logiciels de traitement de texte, de présentation, tableur, LATEX Conception Notation UML, méthodologie Merise Bases données Oracle, MySQL (phpMyAdmin), PostgreSQL (pgAdmin), SqlServer, MsAccess Programmation PL/SQL, VB, VBA, Delphi, C++ Programmation Web Semi structuré PHP, (X)HTML, CSS, Javascript Décisionnel Entrepôts de données, Business Object, etc. Statistique et fouille de données Prévisions à court terme, apprentissage supervisé, apprentissage non supervisé, etc. XML, eXist, XQuery Divers Musique Titulaire d’un Diplôme de Fin de 2ème Cycle en Flûte Traversière, mention Bien Titulaire d’un Diplôme de Fin d’Études de Formation Musicale, mention Bien Pratique de la Flûte Traversière dans l’Ensemble Harmonique d’Annonay (07) Pratique du chant choral dans le groupe vocal Show Choeur Sport Pratique régulière de la natation Participation à des rallyes automobiles en tant que copilote Permis Titulaire du permis de conduire (B) page 5 sur 18 Activités pédagogiques Mes activités pédagogiques s’articulent autour de quatre points principaux qui sont l’enseignement, l’encadrement des étudiants lors de leur stage en entreprise, l’encadrement de mémoire et l’encadrement dans le cadre de projets à l’université. Ces quatre points sont détaillés dans ce qui suit. Enseignements dispensés : synthèse Depuis plusieurs années, j’ai assuré et j’assure différents enseignements à l’Université Lumière Lyon 2, que ce soit pour la Faculté d’Anthropologie et de Sociologie, pour la Faculté de Sciences Économiques et de Gestion (SCECO), pour l’Institut Universitaire de Technologie, ou pour le pôle TICE (Technologie de l’Information et de la Communication pour l’Enseignement). J’ai également fait de la formation en entreprise. Ces enseignements ont été dispensés en tant que vacataire tout d’abord (durant mon contrat de thèse CIFRE), puis en tant qu’ATER. Le tableau qui suit contient une synthèse de ces enseignements (volumes en équivalent TD). Statut Année Enseignement Formation ATER 2008 TICE Excel Licence 2 Anthropologie (3gp) 63 2009 TICE Excel Avancé Licence 2 MISASHS 21 Base de données : modélisation et Access Licence 2 MISASHS 21 Base de données : Access et VBA Licence 3 MISASHS 21 Programmation Web couplée à MySQL Licence 2 MISASHS 21 Bases de données avancées Master 2 IDS Pro IIDEE 15 Bases de données avancées Master 2 IDS Pro IIDEE soir 15 Séries chronologiques saisonnières et prévision Licence 1 SCECO IDEA (3gp) 27 ATER Vol. TD Oracle : administration Master 2 IDS Pro OPSIE 13,5 2007 Système d’Information et Bases de Données Master 1 Informatique 15 2008 Bases de données : programmation (PL/SQL) Master 2 IDS Pro OPSIE 18 Analyse Objet UML Master 2 IDS Pro IIDEE 15 Séries chronologiques et prévision Licence 1 SCECO IDEA (2gp) 21 Langage de requêtes Master 1 Informatique 15 Bases de Données Avancées Master 2 IDS Pro IIDEE soir 15 Vacataire 2006 Système d’Information Décisionnel Licence Pro C.E.STAT (IUT) 25 2007 Système d’Information Décisionnel Licence Pro Logistique Globale (IUT) 20 Stage Prologue TICE Licence 1 (4gp) 48 Vacataire 2004 Langage de requêtes Master 2 IDS Pro SISE et IIDEE 3 2005 Langage de requêtes Master 1 Informatique 18 Algorithmie et programmation VB Licence 2 SCECO (2gp) 42 Algorithmie et programmation VB Licence 2 SCECO 21 Vacataire 2003 2004 Total enseignement universitaire 493,5 Formation en entreprise sur Excel 12 Total 505,5 C.E.STAT : Chargé d’Études STATistiques IDEA : Informatique Décisionnelle et Économétrie Appliquée IDS : Informatique Décisionnelle et Statistique IIDEE : Ingénierie Informatique de la Décision et de l’Évaluation Économique MISASHS : Mathématiques Informatique Statistiques Appliquées aux Sciences Humaines et Sociales OPSIE : Organisation et Protection des Systèmes d’Information dans l’Entreprise SCECO : Sciences Économiques et Gestion SISE : Statistique et Informatique Socio-Économique TICE : Technologies d’Information et de Communication pour l’Enseignement page 6 sur 18 Encadrement d’étudiants L’encadrement d’étudiants a porté sur les stages en entreprise, un mémoire de licence et des projets. Stages professionnels J’ai eu l’occasion d’encadrer différents stages, dont un tableau récapitulatif est présenté ci-dessous. En tant que tuteur, je me suis investie en répondant à des questions par e-mail, en rendant visite aux étudiants sur leur lieu de stage ou en les accueillant dans nos locaux. Ceci permettait de faire le point, de valider des modèles, d’apporter des connaissances et des compétences à la fois sur les bases de données et les entrepôts de données, ou en matière de programmation. En tant que tuteur universitaire, la notation du stage réalisé m’incombait. Pour un des stages chez LCL-Le Crédit Lyonnais, j’étais co-tuteur en entreprise. Il s’agissait donc d’un accompagnement au quotidien de l’étudiant, qui devait permettre à la fois le cadrage du travail mais également la liberté nécessaire à l’étudiant pour qu’il puisse acquérir une expérience professionnelle, une autonomie. Année 2007-2008 Niveau Master 2 OPSIE Master 2 IIDEE Master 2 IIDEE Master 1 Informatique Master 1 Informatique Master 1 Informatique 2006-2007 Master 2 IIDEE Master 2 IIDEE Master 1 Informatique 2005-2006 Master 2 IIDEE Master 1 Informatique Licence 3 IDS 2004-2005 Master 1 Informatique Master 1 Informatique Master 1 Informatique Master 1 Informatique Titre du stage Développement d’une application Web interne sécurisée pour la gestion budgétaire Mise en place d’applications décisionnelles (ETL-Reporting) Mise en place d’univers et report avec Business Object et Report One Développement de sites Internet et E-commerce Réalisation de sites Web marchands Audit de qualité interne et développement d’un outil Intranet de contacts clients Réponse aux besoins en matière d’informatique décisionnelle pour Casino BI Modélisation, alimentation et exploitation d’un data mart Mise en ligne de données pour des actions marketing Construction d’un entrepôt de données médicales Conception d’une base de données sur les revenus fiscaux Gestion des loyers de la région Centre-Est et nationalisation de l’application Traitement et mise en ligne de données commerciales issues de Business Object 1 Création d’une base de données et d’un site Internet La supply chain alimentaire : suivi d’activité d’entrepôt Implémentation d’un nouvel opérateur d’agrégation basé sur la fouille de données sous un environnement Web Lieu du stage Sogeti Keyrus A-SIS DediServices Diplomatic-Cover LCL-Le Crédit Lyonnais Sopra Networkers Interactive SA LCL-Le Crédit Lyonnais HEVA Laboratoire d’Economie des Transports SFR LCL-Le Crédit Lyonnais Société Hardy Agrostar Laboratoire ERIC OPSIE : Organisation et Protection des Systèmes d’Information dans l’Entreprise IIDEE : Ingénierie Informatique de la Décision et de l’Évaluation Économique IDS : Informatique Décisionnelle et Statistique 1. Encadrement de ce stage en tant que co-tuteur entreprise page 7 sur 18 Mémoire de licence Au cours de cette année 2008-2009, j’interviens dans la licence bidisciplinaire MISASHS (Mathématiques Informatique Statistiques Appliquées aux Sciences Humaines et Sociales). Il s’agit d’une licence dans laquelle les étudiants ont choisi une majeure relevant des sciences humaines et sociales (histoire, géographie, psychologie, sciences du langage ou sociologie) et se retrouvent ensemble pour suivre les enseignements de la mineure MISASHS : mathématiques, informatique et statistiques. Durant leur troisième année, ils sont amenés à réaliser un mémoire, sur un sujet de leur choix dans la thématique de leur SHS, en exploitant les enseignements de leur mineure. Afin de réaliser ce mémoire bidisciplinaire, les étudiants sont suivis par deux tuteurs : un tuteur compétent dans leur SHS, et un tuteur les suivant pour la partie MIS. Cette année, j’encadre une de mes étudiantes en histoire sur son mémoire s’intitulant « Une socio topographie de la population lyonnaise au travers de l’étude du livre du Vaillant de 1388 ». Pour réaliser ce mémoire, cette étudiante avait effectivement besoin d’un accompagnement dans la réalisation d’une base de donnée dédiée pour permettre des analyses quantitatives du contenu de ce livre du Vaillant qui est un recueil des biens mobiliers et immobiliers de l’époque. Ce tutorat implique le suivi de l’étudiant (avec des rencontres selon les besoins), un bilan intermédiaire avec l’évaluation d’une première version du mémoire et de la présentation qui donne lieu à une note, et la notation du mémoire final et de sa présentation. Ces évaluations se font avec le tuteur en SHS et le responsable du cours lié à la réalisation de ce mémoire de troisième année. Projets J’ai co-encadré différents projets : – D’une part, avec Jean-Hugues Chauchat (PR), responsable de l’enseignement prévision à court terme (séries chronologiques) de licence 1 IDEA. Ce co-encadrement s’est fait dans le cadre de la réalisation de projets pour l’année universitaire 2007-2008 (il se poursuit pour l’année universitaire 2008-2009), par groupes de trois étudiants sur des données réelles que devaient trouver les étudiants eux-mêmes pour appliquer les méthodes de prévision abordées en cours et en travaux dirigés. Nous avons assuré des permanences pour répondre aux questions des étudiants. – D’autre part, avec Fadila Bentayeb (MCF), responsable de l’enseignement bases de données avancées de master 2 IIDEE. Ce co-encadrement s’est fait dans le cadre de la réalisation de projets pour les années universitaires 2005-2006 et 2006-2007 par petits groupes d’étudiants. Des réunions étaient organisées par groupe, selon les besoins des étudiants. Année 2007-2008 2006-2007 2005-2006 Titre du projet Prévision du chiffre d’affaires pour la Société Fermière du Casino Municipal de Cannes Prévision des ventes de raclette d’une fromagerie de la coopérative du reblochon de Thônes (74) Prévision des ventes de mobil homes d’une entreprise de constructions mobiles Prévision des prêts des bibliothèques universitaires de Chevreuil et de Bron Prévision chiffre d’affaires des ventes de fruits de mer au Vietnam Prévision du chiffre d’affaires de la cafétéria de l’Université Lumière Lyon 2 sur les Quais Prévision des déclarations uniques d’embauche de l’URSSAF du Jura Prévision du montant des ventes de machines de réfrigération industrielles et de machines de traitement industriel d’air comprimé pour l’entreprise espagnole CTA REFRIGECIÓN INDUSTRIAL Prévision du chiffre d’affaires d’un pressing situé à Lomé (capitale du TOGO) Prévision du nombre de transactions mensuelles du restaurant Macdonald’s de Saint Vincent de Tyrosse Mise à jour de hiérarchie de dimension dans un entrepôt de données Constitution d’une charge dans les entrepôts de données évolutifs et évaluation de performances sur un entrepôt de données bancaires Implémentation de la gestion du versionnement de schémas d’un entrepôt de données Gestion de la mise à jour d’un schéma d’entrepôt de données page 8 sur 18 Activités de recherche Personnalisation dans les entrepôts de données : travaux réalisés en thèse et recherches actuelles Je suis titulaire d’un doctorat en informatique, délivré le 12 décembre 2007 par l’Université Lumière Lyon 2. Mes travaux ont été réalisés au sein du laboratoire ERIC, dans le cadre d’une collaboration avec LCL-Le Crédit Lyonnais (LCL) via une Convention Industrielle de Formation par la Recherche (CIFRE). Le mémoire s’intitule « Évolution de schémas dans les entrepôts de données : mise à jour de hiérarchies de dimension pour la personnalisation des analyses ». Le jury de cette thèse était composé comme suit : Corine C AUVET Rokia M ISSAOUI Gilles Z URFLUH Djamal B ENSLIMANE Abdelkader Djamel Z IGHED Fadila B ENTAYEB Omar B OUSSAID Michel R OUGIÉ Université Aix-Marseille 3 Université du Québec en Outaouais - Canada Université Toulouse 2 Université Lyon 1 Université Lyon 2 Université Lyon 2 Université Lyon 2 LCL-Le Crédit Lyonnais présidente rapporteure rapporteur examinateur examinateur co-directrice directeur invité Problématique et objectifs. J’ai réalisé ma thèse en collaboration avec LCL (thèse CIFRE). Le thème de travail proposé par LCL était le marketing local. Les responsables des équipes commerciales sont amenés à faire des demandes marketing. Une demande marketing est la formulation d’une demande de ciblage de clients pour une action marketing ponctuelle (opération spécifique à un produit ou à un événement). La concrétisation de cette demande se traduit par l’extraction d’une liste de clients répondant à certains critères (profils de clients). Cette liste permet aux conseillers commerciaux de contacter leurs clients pour un motif précis. Comme ces demandes étaient formulées sur un support papier, la recherche d’informations était trop coûteuse en temps et en ressources humaines donc inefficace. De plus, ne disposant pas d’un système informatisé, il était très difficile, voire impossible, de capitaliser les connaissances acquises lors des précédentes demandes. Pour l’entreprise, l’objectif était donc de disposer d’un système informatisé qui permette de gérer l’ensemble du processus lié aux demandes marketing. Afin de répondre aux besoins d’analyse concernant ces demandes marketing, il était nécessaire de concevoir un entrepôt de données permettant la consolidation d’informations provenant de sources hétérogènes. Mais LCL est un établissement au sein duquel s’opèrent de nombreux et parfois rapides changements, tels que la modification de structure commerciale suite au rachat de LCL par le Crédit Agricole, la création d’agences dédiées à certains types de clients, etc. En outre, il s’agit d’un établissement regroupant des employés exerçant divers métiers, et ayant donc des besoins d’analyses variés pour leur permettre de prendre des décisions. De ce fait, l’enjeu académique était de proposer une solution d’entreposage de données qui aille au-delà d’une réponse à des besoins d’analyse globaux prévus au moment de la conception du schéma de l’entrepôt. Autrement dit, il s’agissait de pouvoir répondre à des besoins d’analyses personnalisées qui évoluent. Travaux réalisés en thèse et recherches actuelles. Du point de vue académique. Nous nous sommes intéressés dans un premier temps à l’évolution de schéma de l’entrepôt de données pour prendre en compte des besoins d’analyse émergents. Nous avons voulu en particulier placer l’utilisateur au centre du processus, en lui permettant d’obtenir des analyses personnalisées, qui prennent en compte ses besoins et ses propres connaissances du domaine. En effet, l’entreposage de données est une technologie dite centrée utilisateur. Ainsi, de nombreux travaux s’intéressent à l’implication des utilisateurs finaux lors de la conception de l’entrepôt, puisqu’il doit permettre de répondre à leurs besoins d’analyse. Néanmoins, notre étude de l’état de l’art a mis en avant le fait que ce n’était pas page 9 sur 18 le cas en ce qui concerne l’évolution de celui-ci, et plus précisément la prise en compte de l’évolution des besoins d’analyse. Il s’avère que l’ensemble des travaux étudiés n’impliquent pas directement l’utilisateur dans l’évolution du schéma. Dans cette thèse, nous avons donc proposé des solutions pour la personnalisation des analyses dans les entrepôts de données. Ces solutions se basent sur une évolution du schéma de l’entrepôt guidée par les utilisateurs. Il s’agit en effet de recueillir les connaissances de l’utilisateur et de les intégrer dans l’entrepôt de données afin de créer de nouveaux axes d’analyse. Afin de développer cette solution, nous avons proposé quatre contributions majeures : 1. Notre première contribution repose sur la définition d’un modèle formel d’entrepôt de données évolutif, basé sur des règles « si-alors », que nous appelons règles d’agrégation. Ce modèle est composé d’une partie « fixe » et d’une partie « évolutive ». La partie fixe est constituée de la table des faits et des tables de dimension qui lui sont directement reliées. La partie évolutive est composée d’un ensemble de hiérarchies de dimension qui sont mises à jour. Pour assurer la généricité de notre approche, nous proposons également un méta-modèle qui permet de décrire tout entrepôt de données évolutif. 2. Notre modèle d’entrepôt évolutif est soutenu par une architecture qui permet de modéliser le processus de personnalisation. Cette architecture comprend quatre modules (Figure 1) : a. un module d’acquisition des connaissances utilisateurs sous forme de règles d’agrégation ; b. un module d’intégration des règles d’agrégation dans l’entrepôt de données ; c. un module d’évolution du schéma ; d. un module d’analyse permettant à l’utilisateur de réaliser des analyses sur le nouveau schéma. F IGURE 1 – Architecture générale d’entrepôt de données évolutif guidé par les utilisateurs 3. Pour mettre en œuvre cette architecture globale, nous avons proposé un modèle d’exécution avec l’approche relationnelle, qui vise à gérer l’ensemble des processus liés à l’architecture globale. Il est fondé sur la transformation des règles d’agrégation en une table relationnelle de mapping qui permet le stockage, la vérification des règles, la création des niveaux de hiérarchie. 4. Nous nous sommes par ailleurs intéressés à l’évaluation de la performance de notre modèle d’entrepôt de données évolutif. Or, l’évaluation de la performance des modèles est généralement basée sur une charge (ensemble de requêtes utilisateurs). Lorsque des changements au niveau du schéma de l’entrepôt de données se produisent, pour que l’administrateur puisse être pro-actif dans la gestion des performances, nous avons proposé une méthode de mise à jour incrémentale de la charge. Pour valider nos différentes contributions, nous avons développé la plateforme WEDriK (data Warehouse Evolution Driven by Knowledge), qui permet la personnalisation des analyses. Elle se base sur un entrepôt de données évolutif stocké dans le Système de Gestion de Bases de Données (SGBD) relationnel Oracle d’une part et sur une interface Web programmée en PHP d’autre part. Les problèmes posés dans notre thèse sont directement issus de la réalité de l’entreprise LCL avec laquelle nous avons collaboré. LCL a alors constitué un véritable terrain d’application pour mettre en œuvre nos solutions de personnalisation. page 10 sur 18 Après la thèse, nous avons poursuivi nos travaux sur la personnalisation dans les entrepôts de données. Nous nous sommes intéressées plus particulièrement à l’exploitation des solutions proposées dans le contexte des entrepôts de données complexes modélisés en XML (eXtensible Markup Language). Le XML permet la prise en compte de hiérarchies complexes. En outre, nous nous sommes intéressées à l’aspect collaboratif avec l’ajout de nouvelles possibilités d’analyse grâce à l’implication de chacun des utilisateurs. Enfin, nous nous sommes intéressées à l’exploitation de méthodes d’apprentissage non supervisé pour l’extension des possibilités d’analyse des entrepôts de données. L’ensemble des résultats obtenus sur ces travaux ont été publiés dans des revues et conférences, d’audience nationale et internationale (voir la liste des publications). Du point de vue de l’entreprise. Après avoir mené une importante étude de l’existant en utilisant différents moyens (observation, interview et enquête) pour recueillir les besoins des utilisateurs, nous avons conçu un système qui permet de gérer l’ensemble du processus lié aux demandes marketing. Les utilisateurs émettent leur demande grâce à une interface Web, les supérieurs hiérarchiques successifs vont pouvoir la valider. Lors de l’opération marketing, les résultats hebdomadaires des ventes sont mis à disposition, rendant possible le management des conseillers commerciaux par les responsables. Parallèlement, le service qui réalise les ciblages de clients dispose d’un tableau de bord pour mesurer l’activité liée aux demandes marketing. Le cycle de vie d’une demande, qui constitue un véritable workflow, a été modélisé et implémenté, avec un enchaînement semi-automatique des différentes tâches, grâce à un envoi automatisé de mails qui informent les différents acteurs du processus (tâche à réaliser, état de la demande, etc.). Grâce à un important travail de conception, de développement et de test, aucun problème n’a été constaté lors de la mise en exploitation du système. De plus, son utilisation très facile est réellement appréciée des utilisateurs, son automatisation ne nécessite pas de travail particulier au quotidien pour l’administrateur, et la maintenance a été rendue facile. Nous avons ainsi apporté une réponse au besoin d’informatisation du processus des demandes marketing. En tant que chef de projet, j’ai eu l’occasion de découvrir toutes les phases d’un projet de développement telles que : étude de l’existant, recueil des besoins utilisateurs, conception, développement, tests, etc., mais également le rôle du chef de projet : planification des échéances, animation des réunions de travail, encadrement (travail d’un stagiaire sur une partie du développement). Le travail réalisé au sein de LCL a permis de constituer un retour d’expérience sur la mise en œuvre de la personnalisation dans les systèmes d’informations, retour d’expérience que nous avons pu valoriser dans un premier temps avec une publication dans un atelier, puis dans un second temps avec un article de revue nationale. Fouille de données dans les grandes bases de données : stage de recherche de DEA Lors de mon stage de DEA Extraction de Connaissances à partir des Données, j’ai travaillé, sous la direction de Fadila Bentayeb, sur l’exploitation des index bitmap pour faire de la fouille de données en ligne au cœur des SGBD. L’objectif était de pouvoir traiter de grandes bases de données sans être limité par la taille de la mémoire. En particulier, nous avons proposé une approche de fouille qui permet d’appliquer des algorithmes de construction d’arbres de décision en répondant à deux objectifs : (1) traiter des bases volumineuses, (2) en des temps de traitement acceptables. Pour cela, nous avons intégré ces algorithmes au cœur du SGBD Oracle, en exploitant les index bitmap pour représenter la base d’apprentissage, réduisant ainsi à la fois la taille de la base d’apprentissage et les temps de traitement. Nous avons poursuivi ce travail au début de ma thèse en validant notre approche par une étude de complexité et une étude de performances. Nous avons valorisé ce travail par la publication d’articles. De plus, une collaboration avec Fadila Bentayeb, et Jérôme Darmont a permis la publication d’un article de revue internationale sur l’utilisation des concepts bases de données pour la fouille en ligne dans les bases de données volumineuses. page 11 sur 18 Collaborations scientifiques Collaboration avec des chercheurs de l’IRIT Nous collaborons actuellement avec deux enseignants chercheurs de l’Institut de Recherche en Informatique de Toulouse (IRIT) sur une thématique de recherche qui nous était commune : la personnalisation dans les entrepôts de données. Cette collaboration a donné lieu à un article actuellement en cours d’évaluation, soumis à EDA 09 (5èmes journées francophones sur les Entrepôts de Données et l’Analyse en ligne). Cette article vise à dresser un bilan et des perspectives de recherche relevant de la personnalisation dans les entrepôts de données, perspectives que nous comptons explorer par la suite. Membre d’une ACI J’étais membre du groupe de travail Fouille de Données Multi-STratégie (FoDoMuST) 2 . FoDoMuST est un projet de fouille de données multi-stratégie pour extraire et qualifier la végétation urbaine à partir de bases de données d’images. Ce projet a été réalisé dans le cadre de l’ACI Masse de données, avec pour partenaires : la Laboratoire des Sciences de l’Image, de l’Informatique et de la Télédétection (LSIIT) de Strasbourg, le Laboratoire Image et Ville (LIV) de Strasbourg et le laboratoire ERIC. Dans ce groupe de travail, j’ai participé à la conception d’une base de données permettant de stocker et gérer les images satellites, ainsi qu’à la définition d’une ontologie des objets géographiques que l’on voulait extraire de ces images. Incubation d’une entreprise avec Créalys Je suis actuellement impliquée dans une collaboration réalisée dans le cadre de l’incubation d’une entreprise avec l’incubateur Rhône-Alpes Ouest Créalys 3 : le projet de création d’entreprise innovante ProxAn. Ce projet porte sur la réalisation d’une plateforme pour l’aide à la décision d’implantation de commerces. Dans le cadre de cette collaboration, j’ai été amenée à réaliser un état de l’art sur les travaux et outils concernant les modèles d’implantation d’activités commerciales, le géomarketing et l’analyse de données géographiques (entrepôts de données spatiales, data mining spatial). J’ai apporté mon aide pour la réalisation d’une modélisation des traitements grâce à UML. J’apporte également mes conseils lors des réunions sur le projet. Projets internes Mon implication sur des projets internes d’équipe porte sur deux volets essentiellement. Premièrement, je suis impliquée dans un projet impliquant le laboratoire ERIC d’une part et l’Institut des Sciences de l’Homme (ISH 4 ) de Lyon. Il s’agit d’un projet pluridisciplinaire mené sur des données historiques complexes ( comprenant des images, du texte, etc.). L’enjeu de ce projet est d’arriver à proposer un environnement collaboratif pour la recherche d’informations dans les corpus de données historiques en amorçant une nouvelle génération de moteur de recherche. Deuxièmement, dans le pôle Bases de Données Décisionnelles du laboratoire ERIC dont je fais partie, nous travaillons actuellement sur un projet d’entreposage XML 5 . L’objectif du projet est de concevoir une plateforme Web d’entreposage et d’analyse de données complexes, basée sur XML, qui constitue un formalisme approprié pour modéliser, stocker, exploiter les données qualifiées de complexes. Collaboration interne entre doctorants Nous avons travaillé sur une approche de couplage entre la fouille de données et l’analyse en ligne OLAP (On Line Analytical Processing). La technologie OLAP permet de déployer des démarches exploratoires dans les entrepôts de données à l’aide d’opérateurs de navigation dans les cubes de données. Néanmoins, lors de la construction d’un cube de données, la représentation multidimensionnelle engendre une éparsité. Cette éparsité est répartie de façon plus ou moins aléatoire, selon l’existence des faits en fonction de l’ordre naturel des modalités des dimensions, ce qui nuit à la visualisation des données. Pour améliorer cette visualisation en rassemblant les cellules pleines du cube et en les séparant des cellules vides, nous avons proposé de réorganiser les modalités des dimensions grâce aux résultats d’une Analyse des Correspondances Multiples. 2. 3. 4. 5. http://lsiit.u-strasbg.fr/afd/sites/fodomust http://www.crealys.com http ://www.ish-lyon.cnrs.fr/ http://bdd.univ-lyon2.fr/?page_id=4 page 12 sur 18 Liste des publications scientifiques Le tableau suivant synthétise mon activité de publication scientifique : Type de publication Articles dans des revues d’audience internationale Chapitres d’ouvrages d’audience internationale Publications dans des conférences d’audience internationale Article dans une revue d’audience nationale Publications dans des conférences d’audience nationale Publications dans des ateliers avec comité de lecture Total des publications Nombre 2 2 5 1 7 5 22 J’ai eu la charge de présenter l’ensemble de ces travaux lors des conférences et ateliers, internationaux et nationaux, à l’exception de la publication de ASD 06. Articles dans des revues d’audience internationale [1] Fadila Bentayeb, Cécile Favre, et Omar Boussaïd. A User-driven Data Warehouse Evolution Approach for Concurrent Personalized Analysis Needs. Journal of Integrated Computer-Aided Engineering, 15(1) :21–36, 2008. [2] Fadila Bentayeb, Jérôme Darmont, Cécile Favre, et Cédric Udréa. Efficient On-Line Mining of Large Databases. International Journal of Business Information Systems, 2(3) :328–350, 2007. Chapitres d’ouvrages d’audience internationale [1] Fadila Bentayeb, Cécile Favre, et Omar Boussaïd. Dynamic Workload for Schema Evolution in Data Warehouses : a Performance Issue. Advances in Data Warehousing and Mining. IGI Publishing, 2009. À paraître. [2] Cécile Favre, Fadila Bentayeb, et Omar Boussaïd. A Survey of Data Warehouse Model, volume II de Handbook of Research on Innovations in Database Technologies and Applications, pages 129–136. IGI Global, 2009. Publications dans des conférences d’audience internationale [1] Cécile Favre, Fadila Bentayeb, et Omar Boussaïd. Evolution of Data Warehouses’ Optimization : a Workload Perspective. Dans 9th International Conference on Data Warehousing and Knowledge Discovery (DaWaK 07), Regensbourg, Germany, volume 4654 de LNCS, pages 13 – 22. Springer, 2007. Taux de sélection : 30 % [45/150 soumissions]. Dans le TOP 10 de la conférence, sélectionné pour faire l’objet d’un chapitre dans l’ouvrage d’audience internationale [1] en 2009. [2] Cécile Favre, Fadila Bentayeb, et Omar Boussaïd. Dimension Hierarchies Updates in Data Warehouses : a Userdriven Approach. Dans 9th International Conference on Enterprise Information Systems (ICEIS 07), Funchal, Madeira, Portugal, Databases and Information Systems Integration, pages 206 – 211, 2007. Accepté en papier court (6 pages). Taux de sélection des papiers courts : 42 % [(72+198)/644 soumissions]. [3] Cécile Favre, Fadila Bentayeb, et Omar Boussaïd. A Knowledge-driven Data Warehouse Model for Analysis Evolution. Dans 13th ISPE International Conference on Concurrent Engineering : Research and Applications (CE 06), Antibes, France, volume 143 de Frontiers in Artificial Intelligence and Applications, pages 271–278. IOS Press, 2006. Taux de sélection non communiqué. Sélectionné pour faire l’objet d’une extension pour un article dans une revue d’audience internationale [1] en 2008. [4] Cécile Favre, Fadila Bentayeb, et Omar Boussaïd. A Rule-based Data Warehouse Model. Dans 23rd British National Conference on Databases (BNCOD 06), Belfast, Northern Ireland, volume 4042 de LNCS, pages 274–277. Springer, 2006. Accepté en poster (4 pages). page 13 sur 18 Taux de sélection des posters : 54 % [(12+6+13)/58 soumissions]. [5] Cécile Favre et Fadila Bentayeb. Bitmap Index-based Decision Trees. Dans 15th International Symposium on Methodologies for Intelligent Systems (ISMIS 05), New York, USA, volume 3488 de LNCS, pages 65–73. Springer, 2005. Taux de sélection : 35 % [69/200 soumissions]. Article dans une revue d’audience nationale [1] Cécile Favre, Michel Rougié, Fadila Bentayeb, et Omar Boussaïd. Gestion et analyse personnalisées des demandes marketing : cas de LCL-Le Crédit Lyonnais. Ingénierie des Systèmes d’Information, 2009. À paraître. Publications dans des conférences d’audience nationale [1] Cécile Favre, Fadila Bentayeb, et Omar Boussaïd. Maintenance de charges pour l’optimisation des entrepôts de données évolutifs : aide à l’administrateur. Dans 4èmes journées francophones sur les Entrepôts de Données et l’Analyse en ligne (EDA 08), Toulouse, volume B-4 de RNTI, pages 115–122. Cépaduès, 2008. Accepté en papier court (8 pages). Taux de sélection des papiers courts : 67 % [(6+4)/15 soumissions]. [2] Cécile Favre, Fadila Bentayeb, et Omar Boussaïd. Évolution et personnalisation des analyses dans les entrepôts de données : une approche orientée utilisateur. Dans 25ème congrès INFormatique des ORganisations et Systèmes d’Information et de Décision (INFORSID 07), Perros-Guirec, pages 308 – 323, 2007. Taux de sélection : 33 % [31/94 soumissions]. [3] Cécile Favre, Fadila Bentayeb, et Omar Boussaïd. Intégration des connaissances utilisateurs pour des analyses personnalisées dans les entrepôts de données évolutifs. Dans 7èmes journées francophones Extraction et Gestion des Connaissances (EGC 07), Namur, Belgique, volume E-9 de RNTI, pages 217 – 222. Cépaduès, 2007. Accepté en papier court (6 pages). Taux de sélection des papiers courts : 49 % [(57+10)/136 soumissions]. [4] Cécile Favre, Fadila Bentayeb, et Omar Boussaïd. Évolution de modèle dans les entrepôts de données : existant et perspectives. Dans 3èmes journées francophones sur les Entrepôts de Données et l’Analyse en ligne (EDA 07), Poitiers, volume B-3 de RNTI, pages 21–36. Cépaduès, 2007. Taux de sélection : 60 % [12/20 soumissions]. [5] Cécile Favre, Fadila Bentayeb, et Omar Boussaïd. Évolution de schémas dans les entrepôts de données : modèle à base de règles. Dans 2ème journée francophone sur les Entrepôts de Données et l’Analyse en ligne (EDA 06), Versailles, volume B-2 de RNTI, pages 175–176. Cépaduès, 2006. Accepté en poster (2 pages). Taux de sélection des posters : 63 % [(10+2)/19 soumissions]. [6] Riadh BenMessaoud, Kamel Aouiche, et Cécile Favre. Une approche de construction d’espaces de représentation multidimensionnels dédiés à la visualisation. Dans 1ère journée francophone sur les Entrepôts de Données et l’Analyse en ligne (EDA 05), Lyon, volume B-1 de RNTI, pages 34–50. Cépaduès, 2005. Taux de sélection : 50 % [10/20 soumissions]. [7] Cécile Favre et Fadila Bentayeb. Intégration efficace des arbres de décision dans les SGBD : utilisation des index bitmap. Dans 5èmes journées francophones Extraction et Gestion des Connaissances (EGC 05), Paris, volume E-3 de RNTI, pages 319–330. Cépaduès, 2005. Taux de sélection : 31 % [43/138 soumissions]. page 14 sur 18 Publications dans des ateliers avec comité de lecture [1] Cécile Favre, Fadila Bentayeb, et Omar Boussaïd. Personnalisation collaborative pour l’enrichissement des analyses dans les entrepôts de données complexes. Dans 6ème atelier Fouille de Données Complexes dans un processus d’extraction des connaissances (FDC 09), en conjonction avec les 9èmes journées francophones Extraction et Gestion des Connaissances (EGC 09), Strasbourg, pages A4–3 à A4–14, 2009. [2] Cécile Favre, Michel Rougié, Fadila Bentayeb, et Omar Boussaïd. Quels rôles donner aux utilisateurs dans les systèmes d’information ? Retour d’expérience chez LCL-Le Crédit Lyonnais. Dans 2ème Atelier Prise en Compte de l’Utilisateur dans les Systèmes d’Information (PeCUSI 08), en conjonction avec le 26ème Congrès INFormatique des ORganisations et Systèmes d’Information et de Décision (INFORSID 08), Fontainebleau, pages 29–42, 2008. [3] Cécile Favre, Fadila Bentayeb, et Omar Boussaïd. WEDriK : une plateforme pour des analyses personnalisées dans les entrepôts de données évolutifs. Dans 1er Atelier Systèmes Décisionnels (ASD 06) en conjonction avec la 9th Maghrebian Conference on Software Engineering and Artificial Intelligence (MCSEAI 06), Agadir, Maroc, 2006. [4] Cécile Favre, Fadila Bentayeb, et Omar Boussaïd. Modèle d’entrepôt de données à base de règles. Dans 3ème atelier Fouille de Données Complexes dans un processus d’extraction des connaissances (FDC 06), en conjonction avec les 6èmes journées francophones Extraction et Gestion des Connaissances (EGC 06), Lille, pages 39–50, 2006. [5] Cécile Favre, Fadila Bentayeb, Omar Boussaïd, et Nicolas Nicoloyannis. Entreposage virtuel de demandes marketing : de l’acquisition des objets complexes à la capitalisation des connaissances. Dans 2ème atelier Fouille de Données Complexes dans un processus d’extraction des connaissances (FDC 05), en conjonction avec les 5èmes journées francophones Extraction et Gestion des Connaissances (EGC 05), Paris, pages 65–68, 2005. Position paper (4 pages). Mémoires [1] Cécile Favre. Évolution de schémas dans les entrepôts de données : mise à jour de hiérarchies de dimension pour la personnalisation des analyses. Thèse de doctorat, Université Lumière Lyon 2, Décembre 2007. [2] Cécile Favre. Utilisation des index bitmap pour la fouille de données. Mémoire de DEA, Université Lumière Lyon 2, Septembre 2003. page 15 sur 18 Animation scientifique Membre de comités de programme Année 2009 Nom DEXA 09 EDA 09 MajecSTIC 09 2008 ASD 08 MajecSTIC 08 2007 CJCSC 07 Description 20th International Conference on Database and Expert Systems Applications, Linz (Austria), septembre 2009 http://www.dexa.org 5ème Journées Francophones sur les Entrepôts de données et l’Analyse en ligne, Montpellier, juin 2009 http://www.lirmm.fr/EDA09 7ème Manifestation des Jeunes Chercheurs en Sciences et Technologies de l’Information et de la Communication, Avignon, octobre 2009 http://majecstic2009.univ-avignon.fr 3ème Atelier sur les Systèmes Décisionnels, Mohammedia (Maroc), octobre 2008 http://eric.univ-lyon2.fr/~asd/asd2008 6ème Manifestation des Jeunes Chercheurs en Sciences et Technologies de l’Information et de la Communication, Marseille, octobre 2008 (Présidente d’une session) http://www.lsis.org/~addl/fr/manifs/majecstic08 7ème édition du Colloque des Jeunes Chercheurs en Sciences Cognitives, Lyon, juin 2007 http://fresco.risc.cnrs.fr/cjcsc2007 Relecteur additionnel, membre de comités étendus de relecteurs Année 2009 Nom DMIN 09 MIK 09 EGC 09 Numéro RNTI 2008 DMIN 08 MCD 08 JFO 08 ICAE 2007 Handbook EDA 07 2006 ASD 06 Description 5th International Conference on Data Mining, Las Vegas (Nevada, USA), juillet 2009 http://www.dmin--2009.com Session spéciale Mining Interesting Knowledge, en conjonction avec la 22nd International Conference on Industrial, Engineering & Other Applications of Applied Intelligent Systems (IEA-AIE 09), Tainan City (Taiwan), juin 2009 http://web.nutn.edu.tw/IEA-AIE2009/Session3.htm 9ème journées francophones Extraction et Gestion des Connaissances, Strasbourg, janvier 2009 https://lsiit.u-strasbg.fr/egc09 2ème numéro spécial Fouille de Données Complexes, RNTI (Cépaduès) http://www.antsearch.univ-tours.fr/rnti 4th International Conference on Data Mining, Las Vegas (Nevada, USA), juillet 2008 http://www.dmin-2008.com 4th International Workshop on Mining Complex Data, en conjonction avec la conférence 8th IEEE International Conference on Data Mining, Pisa (Italy), décembre 2008 http://eric.univ-lyon2.fr/~mcd/2008 2ème Journée Francophone sur les Ontologies, Lyon, décembre 2008 http://jfo2008.aigtunisie.org International Journal Integrated Computer-Aided Engineering (IOS Press) http://iospress.metapress.com/content/103160/ Handbook of Research on Innovations in Database Technologies and Applications, Vol II (IGI Global) http://www.igi-global.com/reference/details.asp?ID=33444 3ème journées francophones sur les Entrepôts de Données et l’Analyse en ligne, Poitiers, juin 2007 http://www.info.univ-tours.fr/eda2007/ Atelier Systèmes Décisionnels, en conjonction avec la conférence MCSEAI 06 (9th Maghrebian Conference on Information Technologies), Agadir (Maroc), décembre 2006 http://eric.univ-lyon2.fr/~asd/asd2006/ page 16 sur 18 Organisation de conférences et d’ateliers Année 2009 Nom MEDES 09 MEDES-SW 09 2005 EDA 05 2003 JDS 03 Description International ACM Conference on Management of Emergent Digital EcoSystems, Lyon, octobre 2009 http://sigappfr.acm.org/MEDES/09 Student Workshop of the International ACM Conference on Management of Emergent Digital EcoSystems, Lyon, octobre 2009 http://sigappfr.acm.org/MEDES/09/ workshops/student 1ère journée francophone sur les Entrepôts de Données et l’Analyse en ligne, Lyon, juin 2005 http://eric.univ-lyon2.fr/~eda05 35ème Journées De Statistique, Lyon, juin 2003 http://eric.univ-lyon2.fr/~jds03 Rôle Co-présidente du comité d’organisation Co-organisatrice de l’atelier Membre du comité d’organisation : participation au développement et à l’administration du site Web ; accueil des participants Participation à l’organisation : préparation en amont ; accueil des participants page 17 sur 18 Autres types d’implication – activités collectives Organisation de la JED 2009 J’ai participé activement à l’organisation de la seconde édition de la Journée Entreprises Doctorants qui s’est déroulée à Lyon en janvier dernier (http://www.jed2009.fr/). Cette journée visait à faciliter la rencontre entre le milieu de la recherche (les doctorants en particulier) et le monde industriel. La thématique principale de cette seconde édition se situait autour de la chimie, de l’environnement, des matériaux, de l’énergie et du transport. Toutefois afin de pérenniser les contacts établis lors de la première édition de la journée (JED 08), l’après midi était dédiée également à la rencontre entre les doctorants en informatique, mathématiques, électronique, électrotechnique, automatique et les entreprises. J’étais en charge de l’organisation de cette après-midi. Dans ce contexte, j’ai été amenée à chercher des sponsors, à gérer une petite équipe de doctorants impliqués dans l’organisation de l’après-midi, à coordonner l’organisation de l’après-midi avec l’organisation générale de la journée, à gérer le site Web de la journée, à prendre des contacts non seulement avec des institutionnels pour des interventions, mais également des entreprises pour le forum et le job-dating, etc. Représentante des doctorants au conseil du laboratoire J’ai été représentante des doctorants au conseil du laboratoire de 2005 à 2008. En plus d’assister au conseil du laboratoire ERIC qui a lieu de façon mensuelle et d’être une interface entre les doctorants et les permanents, j’ai participé au recensement des publications pour le rapport d’activité quadriennal 2002-2005. J’ai également coordonné la production des posters des doctorants en établissant un modèle de poster, en centralisant leur récupération et en me rapprochant du service d’édition pour les réaliser, lors de deux campagnes de réalisation. J’ai participé à l’organisation de l’évaluation du laboratoire qui s’est déroulée au mois de février 2008. Je participe toujours activement à diverses tâches dans la vie quotidienne du laboratoire. Promotion de filières Dans le cadre de mes deux contrats d’ATER, j’ai participé deux années consécutives au salon de l’étudiant de Lyon (pour la Faculté d’Anthropologie et de Sociologie en janvier 2009 et pour le compte de la Faculté de Sciences Économiques et de Gestion en janvier 2008), en assurant des permanences d’environ un jour et demi. Lors de ces permanences, j’ai eu l’occasion de promouvoir les filières en renseignant au mieux les étudiants selon leurs attentes et leurs profils. Implication dans des diplômes Mon implication porte sur trois aspects principalement : – Master 2 Extraction de Connaissance à Partir des Données. Pour l’année universitaire 2007-2008, j’ai participé à l’évaluation de rapports. – Licence MISASHS. Je participe à la mise à jour du site valorisant cette formation. – Licence Informatique Décisionnelle et Statistique (IDS) niveau L3 et Licence Informatique Décisionnelle et Économétrie Appliquée (IDEA) niveau L1. Dans le cadre de la campagne de recrutement pour l’année universitaire 2006-2007 de la Licence IDS niveau L3 de l’Université Lumière Lyon 2, j’ai participé à l’évaluation de dossiers de candidature. Lors de la campagne de recrutement pour l’année universitaire 2007-2008, j’ai réalisé l’affiche pour la promotion de la filière et contribué à sa diffusion dans l’université et auprès des Services Communs Universitaires d’Information et d’Orientation (SCUIO). J’ai décliné une version de cette affiche pour la Licence bidisciplinaire IDEA lors de la création de cette licence pour la rentrée universitaire 2007-2008. page 18 sur 18