Fiche recherche - Walid BEN AHMED - LGI
Transcription
Fiche recherche - Walid BEN AHMED - LGI
Ecole Doctorale en Sciences de l’Ingénieur de l’ECP Formation doctorale en Génie Industriel SAFE- NEXT : une approche systémique pour l’extraction de connaissances de données. Application à la construction et à l’interprétation de scénarios d’accidents de la route par Walid BEN AHMED Résumé de thèse Doctorat de Génie Industriel Laboratoire Génie Industriel - Ecole Centrale Paris Ecole Centrale de Lille Ecole Centrale de Lyon N°11 - Janvier 2005 Walid Ben Ahmed est né le 29 mars 1976 à Kélibia (Tunisie). En 2000, il a obtenu le Diplôme d’Ingénieur en Génie Mécanique de l’Ecole Nationale d’Ingénieurs de Tunis (ENIT). En 2001, il a obtenu le Diplôme d’Etudes Approfondies (DEA) de Génie des Systèmes Industriels de l’Ecole Centrale Paris. De 2002 à 2005, il a effectué une thèse en convention CIFRE au sein de la Direction de la Recherche de la société Renault. Son travail de recherche a été réalisé au Laboratoire Génie Industriel (LGI) de l’Ecole Centrale Paris Thèse soutenue le 17 janvier 2005 à l’Ecole Centrale Paris Devant le jury composé de : Directeur de thèse : Mounib MEKHILEF HDR à l’Université d’Orléans Co-directeur de thèse : Michel BIGAND Maître de Conférence, Ecole Centrale Lille Jury: Daniel COUTELLIER Professeur ENSIAME Valenciennes et DG AIP-PRIMECA, Président Rose DIENG Chef du projet ACACIA, INRIA Sophia Antipolis, Rapporteur Christian TAHON Maître de conférence, Université de Valenciennes, Rapporteur Claudia ECKERT Professeur Engineering Design Center, Un. of Cambridge, Examinateur Yves PAGE Adj. du Directeur du LAB PSA Peugeot-Citroën Renault, Examinateur Michel TOLLENAERE Professeur INPG, Grenoble, Examinateur Le mémoire de thèse et les publications sont disponibles auprès de : Anne PREVOT Laboratoire Génie Industriel Ecole Centrale Paris Grande Voie des Vignes 92295 Châtenay Malabry Cedex Tél : 01 41 13 13 88 – E-mail : [email protected] Abstract Nowadays, given the automation of data collection, very large databases are constructed. The exploitation of these data in accidentology and several others fields (e.g. marketing, engineering, etc.) requires automatic techniques of Knowledge Discovery in Databases (KDD). Incorporating expert knowledge in the KDD process is fundamental to handle the complexity of data, domain and knowledge. This necessitates the development of approaches, methods and techniques intended to identify, represent and operationalize expert knowledge. In this dissertation, we propose a new approach, SAFE-Next (Systemic Approach For Enhanced kNowledge EXTraction), which integrates the following four approaches: the first one, ASMEC (Approche Systémique de ModElisation des Connaissances), allows knowledge modeling according to multiple viewpoints and granularity levels. The second approach, AICEF (Approche d’Incorporation des Connaissances Expertes dans la Fouille de données), uses the ASMEC knowledge model to elaborate multi-view metadata. It then uses these metadata as a tool for incorporating expert knowledge into the KDD process. The third approach, ASAIC (Approche Systémique d’Analyse d’Impact de Changement), uses the ASMEC knowledge model to carry out multi-view change impact analysis. The fourth approach, ASEM (Approche Systémique d’Evaluation de Modèles), provides an assessment framework for knowledge models. The epistemological and methodological foundations of our work are constructivism and systemic approach (or cybernetics). Based on these backgrounds, our research contributions concern several disciplines, ranging from Accidentology, Knowledge Engineering, Knowledge Discovery in Databases and Design. In accidentology, SAFE-Next provides experts with an efficient tool for knowledge management. It enables the elaboration of multi-view accident scenarios, which are a powerful tool for understanding accident mechanisms in order to develop safety counter-measures. Furthermore, SAFE-Next provides a knowledge capitalization tool. In knowledge engineering, SAFE-Next supplies, via ASMEC, a multi-view knowledge model and thereby allows the integration of different viewpoints stemming from different users. Furthermore, it provides a multi-granularity knowledge model and in that way addresses the difficulty of knowledge identification and formalization. At the same time, SAFE-Next permits, via ASEM, the evaluation of knowledge models, an issue rarely addressed in literature. In Knowledge Discovery in Database, SAFE-Next enables, via AICEF, the incorporation of domain knowledge in the data preprocessing step (i.e. the first step in a KDD process) and more specifically in the attribute selection task. Likewise, the multi-view metadata enables the incorporation of domain knowledge in the interpretation step (i.e. the last step in a KDD process). In design, SAFE-Next provides safety system developers with an efficient tool to construct the design space. Scenarios enable them to understand complex behaviors and thereby to define solutions and alternatives. SAFE-Next also provides, via ASAIC, an approach for multi-view change impact analysis. Moreover, it proposes an extension of the change impact analysis to the use process of a given product as well as the evaluation process instead of limiting it to the design process. Keywords: Knowledge Engineering, Knowledge Discovery in Databases, Knowledge Modeling, Complex System Modeling, Cybernetics, Systemic Approach, Change Impact Analysis, New System Design, Model Assessment. Résumé Aujourd’hui, l’informatisation des saisies de données et la puissance des systèmes de collecte conduisent à la construction de grandes Bases de Données (BD). L’exploitation de ces millions de données en accidentologie et dans beaucoup d’autres domaines (e.g. management, marketing, etc.) fait appel à des techniques d’Extraction de Connaissances de Données (ECD). La complexité des données, du domaine d’application et des connaissances recherchées rendent fondamentale l’intégration des connaissances expertes dans le processus d’ECD. Cela nécessite la mise en place d’approches, méthodes et techniques d’identification, de représentation et d’opérationnalisation de ces connaissances. Dans ce travail de thèse, nous proposons une nouvelle approche, appelée SAFE-Next (Systemic Approach For Enhanced kNowledge EXTraction, approche systémique pour l’extraction des connaissances) qui intègre les quatre approches suivantes : La première est appelée ASMEC (Approche Systémique de ModElisation des Connaissances). Elle consiste en une méthode de modélisation des connaissances multi-vues et selon une architecture à plusieurs niveaux d’abstraction. La deuxième approche, AICEF (Approche d’Incorporation des Connaissances Expertes dans la Fouille de données), propose l’élaboration et l’utilisation de méta-données multi-vues comme un moyen pour l’incorporation des connaissances formalisées par ASMEC dans le processus d’ECD. La troisième approche, ASAIC (Approche Systémique d’Analyse d’Impact de Changement), utilise le modèle de connaissances d’ASMEC pour une analyse interactive et multi-vues de l’impact d’un changement sur un système. La quatrième approche, ASEM (Approche Systémique d’Evaluation de Modèles), fournit un modèle général d’évaluation de modèles de connaissances. Les fondements épistémologiques et méthodologiques de nos travaux sont respectivement le constructivisme et la systémique (ou cybernétique). En se basant sur ces fondements, nos travaux de recherche ont conduit à des contributions réparties en quatre domaines : En accidentologie, SAFE-Next fournit un outil efficace pour l’élaboration des STA permettant une meilleure analyse et compréhension de l’accident. Elle fournit aussi un moyen de capitalisation des connaissances offrant une vision synthétique des différents types de connaissances du domaine de l’accidentologie. En Ingénierie des Connaissances (IC), SAFE-Next propose un modèle général multi-vues et multi-niveaux d’abstraction de modélisation des connaissances pour le développement des Systèmes à Base de Connaissances (SBC). Elle permet aussi de guider l’élicitation des connaissances selon un modèle multi-vues. En ECD, SAFE-Next propose l’utilisation des métadonnées multi-vues pour l’incorporation des connaissances expertes du domaine dans la première et la dernière phase du processus d’ECD (i.e. préparation des données et interprétation des résultats). En conception de nouveaux systèmes, SAFE-Next fournit à travers les STA un moyen de communication entre les accidentologistes et les concepteurs des systèmes de sécurité embarqués dans les véhicules. Cette interface entre les deux métiers (i.e. conception et accidentologie) permet la construction de l’espace de conception pour développer et évaluer les systèmes de sécurité. Elle offre aussi un moyen d’analyse de l’impact d’un changement (e.g. introduction d’un nouveau système de sécurité) sur le comportement du système Conducteur-Véhicule-Environnement. Mots clefs : Ingénierie des Connaissances, Extraction de Connaissances de Données, Modélisation des connaissances, Modélisation des systèmes complexes, Cybernétique, Systémique, Analyse de changement, Conception de nouveaux systèmes, Evaluation de modèles L’Ecole Doctorale de l’Ecole Centrale Paris Pluridisciplinaire, l’Ecole Doctorale en Sciences pour l’Ingénieur de l’ECP permet aux doctorants d’effectuer un travail de recherche dans l’une des disciplines des sciences pour l’ingénieur et des sciences pour l’entreprise, ce qui, pour bon nombre d’entre eux complète utilement leur formation de base. Elle permet par ailleurs de concrétiser des liens entre les laboratoires et de mutualiser les moyens matériels et humains. Le Laboratoire Génie Industriel Le Laboratoire Génie Industriel (LGI) de l'École Centrale Paris élabore des méthodes d'aide à la décision en conception et optimisation de produits, services et systèmes industriels et logistiques. Il s'organise autour de trois thèmes génériques : • o o Thème 1 : Conception de produits, de systèmes et de services Axe 1.1 - Ingénierie projet Axe 1.2 - Instrumentation et méthodologies de préconception • o o Thème 2 : Management des connaissances et des savoir-faire Axe 2.1 – Echange et capitalisation d’informations, processus de décision Axe 2.2 - Apprentissage collectif, gestion des compétences et innovation • o o o Thème 3 : Optimisation des systèmes industriels et logistiques Axe 3.1 - Conception et pilotage de systèmes de production et de chaînes logistiques Axe 3.2 - Conception et exploitation de systèmes sûrs Axe 3.3 - Pilotage de la performance et du progrès continu des entreprises L'activité de recherche du Laboratoire s'applique aux méthodes d'organisation, de gestion et d'exécution de la conception, de la production et de la distribution des produits manufacturés et, d'une manière plus générale, à l'ensemble des objets, activités et processus de leur cycle de vie. Elle a pour finalité de fournir aux entreprises manufacturières de distribution et de transport, les méthodes nécessaires à l'amélioration de leur compétitivité en termes de performances (qualité, coût, délai). Centrale Génie Industriel Depuis 2000, les quatre Ecole Centrale ont signé un accord cadre ayant pour objectif de fédérer les actions de formation et de recherche en Génie Industriel. Cette fédération Centrale Génie Industriel se traduit dans le domaine de la recherche par un DEA en Génie des Systèmes Industriels co-habilité Ecole Centrale Paris, Ecole Centrale de Lille, Ecole Centrale de Lyon, par l’inscription d’étudiants en thèse à l’Ecole Doctorale de l’ECP et par un nombre important de co-encadrements de thèses.