PROPOSITION DE THESE Laboratoire Central de la Préfecture de
Transcription
PROPOSITION DE THESE Laboratoire Central de la Préfecture de
PROPOSITION DE THESE Laboratoire Central de la Préfecture de Police de Paris / AgroParisTech Apport de méthodes chimiométriques pour la comparaison de profils chromatographiques de liquides inflammables Le Laboratoire Central de la Préfecture de Police est requis pour son expertise technique et scientifique à la demande des instances judiciaires ou policières, tant pour intervenir sur site afin d’effectuer des enquêtes techniques, que pour réaliser des analyses approfondies en laboratoire. Il est notamment chargé d’apporter des éléments de réponse ou de preuve scientifique dans le cadre d’enquêtes de police judiciaire. C’est particulièrement le cas à la suite d’un incendie. Il est alors nécessaire d’identifier précisément les éventuelles traces de liquides inflammables restant présentes sur les débris prélevés sur site. Cette identification s’inscrit dans un ensemble d’investigations scientifiques. Il s’agit d’un élément d’information technique majeur de l’enquête judiciaire conduite afin d’identifier la cause de l’incendie. Les méthodes classiquement mises en œuvre pour l’analyse des liquides inflammables sont basées sur la chromatographie en phase gazeuse couplée à la spectrométrie de masse. La thermodésorption a été introduite depuis plusieurs années au Laboratoire central pour capter et concentrer sur un adsorbant (Tenax) les vapeurs présentes dans l’espace de tête (headspace) des prélèvements. Si cette méthode, accréditée depuis 2010, remplit les exigences des analyses quotidiennes pour la recherche et l’identification des traces de produits pétroliers, elle ne permet pas en l’état de répondre aux questions fréquemment posées par les enquêteurs concernant les comparaisons des produits identifiés. Il est en effet courant qu’une telle demande soit faite au laboratoire pour établir un lien entre le produit inflammable mis en œuvre comme accélérant d’incendie dans une affaire et un liquide de même type découvert par ailleurs, à proximité de la scène de crime ou chez une personne mise en cause. Le terme « liquide inflammable » regroupe une grande variété de produits commerciaux (essence pour automobiles, essences spéciales, white-spirit, pétrole lampant, alcool à brûler, combustibles divers, gazole...), ayant tous des profils chromatographiques clairement différents. En revanche, pour un type de produit donné, les différences entre les lots ou les marques sont parfois très subtiles. Le principe de base est la recherche de ces différences sur les chromatogrammes obtenus. Si parfois la seule observation visuelle parait suffisante, il est clair aujourd'hui qu'une approche chimiométrique est nécessaire pour traiter 1 au mieux la masse d'informations contenue dans un seul chromatogramme. La plupart des liquides contiennent en effet plusieurs centaines de composés dont les proportions relatives constituent autant de points de comparaison. Les problèmes soulevés par cette approche sont nombreux, à commencer par le fait que tous ces liquides inflammables sont par principe volatils. Les résidus imbrûlés détectés dans les prélèvements présentent toujours une composition différente du produit initial, avec une perte préférentielle des composés les plus légers au profit des plus lourds. Beaucoup de différences observées sont ainsi attribuables à la dégradation du produit. L'effet matrice est par ailleurs extrêmement important dans ce type d’échantillons. Les cendres analysées émettent de nombreux composés générés au moment de la pyrolyse qui se superposent aux profils chromatographiques des liquides inflammables. Il en résulte des problèmes de coélution, qui peuvent être résolus en optimisant la séparation chromatographique ou en utilisant les avantages de la spectrométrie de masse. Mais beaucoup de produits de pyrolyse sont également des hydrocarbures entrant dans la composition des liquides inflammables recherchés. De fait, une altération des profils est systématiquement constatée, ce qui limite considérablement la pertinence des comparaisons faites. Certains laboratoires étudient les potentialités de la chromatographie bidimentionnelle ou l'analyse des rapports isotopiques par spectrométrie de masse. Notre objectif serait d'utiliser un simple couplage GC/MS qui, pour les produits commerciaux recherchés, permet déjà une excellente séparation. La mise en oeuvre d’outils statistiques de traitement de données multivariées devrait permettre d'exploiter au mieux les nombreuses informations que contient chaque chromatogramme. E Proposition de démarche dans l’analyse des données Trois approches complémentaires sont envisageables à des degrés divers et l’un des objectifs pourra être de déterminer laquelle ou lesquelles sont les plus pertinentes dans le cadre de ce projet. 1) Approches exploratoires Ces méthodes sont utilisées pour l'analyse exploratoire des données, qui vise à déterminer, sans a priori, s'il y a des informations pertinentes dans les signaux mesurés. Cet axe de recherche tire ses outils du domaine de l’analyse factorielle multivariée et ne nécessite pas d’avoir une connaissance a priori des groupes d’échantillons recherchés. Les outils utiles et utilisables dans cette catégorie sont pour certains sur la recherche des directions de dispersion maximale des échantillons dans l'espace des variables de départ (exemple l’Analyse en Composantes Principales – ACP, ou l’analyse multivariée de la 2 variance – multivariate ANOVA) et pour d’autres sur une recherche des "signaux sources" mélangés ensemble dans chaque signal mesuré (Analyse en Composantes Indépendantes – ICA). Ces deux méthodes ont des objectifs différents: alors que l'ACP permet d'étudier la dispersion des échantillons, et donc de pointer les échantillons les plus semblables / différents, l'ICA permet d'extraire les sources pures mélangées dans les signaux mesurés. Dans un premier temps, les échantillons analysés seront des références connues de liquides inflammables non altérés d’origines et de marques variées. Ces liquides seront ensuite évaporés ou brûlés pour se rapprocher des profils détectés dans des cas réels. L’effet des matrices sera enfin pris en compte en fabricant des échantillons de résidus carbonisés contenant des traces de liquides inflammables. D’autres outils d’analyse tels que ComDim (dit aussi ACCPS pour Analyse en Composantes Communes à Poids Spécifiques) peuvent être des pistes intéressantes de traitement en donnant accès à ce qui est commun à plusieurs tableaux de données et l’ampleur des liens reliant les variables de ces divers tableaux. Dans ce projet, les différents tableaux seraient obtenus soit en segmentant, de façon intelligente, les chromatogrammes originaux, soit en attribuant chaque chromatogramme ionique à un tableau différent. Ceci nous permettrait de regarder localement où sont les informations communes et complémentaires dans les signaux. Compte tenu de la nature complexe des données, une approche exploratoire constituera une première étape dans l’étude du problème et précédera nécessairement la phase de recherche et de construction de modèles descriptifs. Il faut également envisager une phase de recherche visant à déterminer quel type de prétraitement des chromatogrammes sera le plus pertinent. En effet, on ne peut pas savoir à l’avance si les chromatogrammes fournis seront utilisables directement ou non dans un processus chimiométrique. Un certains nombre d’algorithmes de prétraitement seront sans doute nécessaires à une mise en forme optimale des données : correction de ligne de base, filtrage, lissage, recalage, normalisation, sélection de variables… Dans le domaine, le nombre de solutions est immense et un certain nombre d’outils devront être testés afin d’améliorer la qualité initiale des données. 2) Approches prédictives Cet axe de recherche vise à utiliser les connaissances a priori concernant la nature des échantillons et en particulier leur appartenance à des groupes dont la définition provient soit d’une propriété connue de l’échantillon (propriété chimique : alcool, ester, hydrocarbure…, propriété physique : volatilité, densité des liquides, point flash etc…), soit à un critère de classement extérieur à la chimie du produit (marque, le type de produit, etc…) 3 Ces informations permettent de définir une classification des produits utilisables par certains outils chimiométriques tels que l’analyse factorielles discriminante (et ses diverses variantes) ou bien d’autres algorithmes de classification supervisés. Ces techniques permettent de créer des espaces vectoriels orientés pour mettre en évidence des différences entre les échantillons sur la base des informations de classification imposées. Il est possible d'utiliser en entrée de ces calculs discriminants, les données initiales ou une fraction des données initiales après prétraitement ou bien les résultats d’autres techniques non supervisées comme ACP, ICA ou ComDim. Dans certains cas, la discrimination s’en trouve améliorée car la première étape de l’analyse a pour effet de réduire la complexité des données et a souvent l’effet d’un filtrage des données. Nous pourrons aussi tester la méthode des K plus proches voisins (KNN) qui utilise l'information sur les groupes d’appartenance d'un ensemble d'échantillons de référence pour prédire les groupes d'appartenance des échantillons inconnus. 3) Approches par apprentissage Dans ce contexte, on cherche à établir des modèles de reconnaissance des différents types d’empreintes chromatographiques rangées dans des catégories connues à priori. Ces modèles sont des modèles de classification supervisés qui nécessitent une phase d’apprentissage qui consiste en l’ajustement de poids ou coefficients associés aux variables du problème. L’ajustement de ces poids se fait selon des méthodes mathématiques qui prennent en compte la topologie de l’espace multivarié dans lequel se distribuent les empreintes chromatographiques des échantillons. Plusieurs méthodes existent et peuvent être appliquées au problème de la reconnaissance des produits inflammables, en particulier les réseaux de neurones et les méthodes telles que les SVM (Support Vector Machine). Ces deux méthodes peuvent être complémentaires dans la mesure où la première peut traiter les problèmes complexes ou intriqués en fournissant une solution non linéaire, et l’autre possède une très grande capacité d’adaptation aux problèmes complexes mais toujours en fournissant des solutions linéaires. Dans les deux cas, la phase la plus délicate est la phase d’apprentissage et le dimensionnement des ensembles de données servant à cet apprentissage. La méthode KNN citée précédemment dans les approches prédictives peut également être complémentaire dans la mesure où elle aussi est mise en œuvre avec une phase d’apprentissage pour établir le modèle de classification. Quelle que soit la technique utilisée ici, la principale limitation que l’on rencontrera est la quasi impossibilité de fournir une interprétation chimique du résultat de la classification car peu d’outils aujourd’hui ont été développés pour rendre lisibles les résultats fournis par les modèles issus de ces méthodes. 4 Mais ce point peut faire l’objet d’un aspect du travail du doctorant qui tenterait de relier un résultat de classification obtenu par ces modèles avec les données chromatographiques obtenues par l’expérimentation. En revanche, ces outils peuvent fournir un résultat avec une certaine probabilité et peuvent selon le cas trouver des solutions à des problèmes extrêmement complexes là où les méthodes décrites dans les §1 et 2 n’auraient pas donné satisfaction. Toutes ces pistes sont donc complémentaires et pourront être mises en œuvre par le doctorant et par l’équipe durant le projet. Lieu de travail : Laboratoire Central de la Préfecture de Police, 39bis, rue de Dantzig, 75015 Paris et AgroParisTech, UMR 1145 Ingénierie Procédés Aliments, 16, rue Claude Bernard, 75005 Paris Financement : Contrat doctoral du Laboratoire Central de la Préfecture de Police de Paris 01/01/2015 – 31/12/2017 Directeur de thèse : Pr. Douglas N. RUTLEDGE, AgroParisTech Encadrement: Dr. Christophe B.Y. CORDELLA, AgroParisTech Dr. Delphine JOUAN-RIMBAUD BOUVERESSE, AgroParisTech; Xavier ARCHER, Laboratoire Central de la Préfecture de Police de Paris Ecole doctorale de rattachement : ABIES Contacts: Douglas RUTLEDGE : [email protected] tél. : 01 44 08 16 48 Xavier ARCHER : [email protected] tél. : 01 55 76 25 88 5