PROPOSITION DE THESE Laboratoire Central de la Préfecture de

Transcription

PROPOSITION DE THESE Laboratoire Central de la Préfecture de
PROPOSITION DE THESE
Laboratoire Central de la Préfecture de Police de Paris / AgroParisTech
Apport de méthodes chimiométriques pour la comparaison de profils
chromatographiques de liquides inflammables
Le Laboratoire Central de la Préfecture de Police est requis pour son expertise
technique et scientifique à la demande des instances judiciaires ou policières, tant pour
intervenir sur site afin d’effectuer des enquêtes techniques, que pour réaliser des analyses
approfondies en laboratoire. Il est notamment chargé d’apporter des éléments de réponse ou
de preuve scientifique dans le cadre d’enquêtes de police judiciaire. C’est particulièrement le
cas à la suite d’un incendie. Il est alors nécessaire d’identifier précisément les éventuelles
traces de liquides inflammables restant présentes sur les débris prélevés sur site. Cette
identification s’inscrit dans un ensemble d’investigations scientifiques. Il s’agit d’un élément
d’information technique majeur de l’enquête judiciaire conduite afin d’identifier la cause de
l’incendie.
Les méthodes classiquement mises en œuvre pour l’analyse des liquides
inflammables sont basées sur la chromatographie en phase gazeuse couplée à la
spectrométrie de masse. La thermodésorption a été introduite depuis plusieurs années au
Laboratoire central pour capter et concentrer sur un adsorbant (Tenax) les vapeurs
présentes dans l’espace de tête (headspace) des prélèvements. Si cette méthode,
accréditée depuis 2010, remplit les exigences des analyses quotidiennes pour la recherche
et l’identification des traces de produits pétroliers, elle ne permet pas en l’état de répondre
aux questions fréquemment posées par les enquêteurs concernant les comparaisons des
produits identifiés. Il est en effet courant qu’une telle demande soit faite au laboratoire pour
établir un lien entre le produit inflammable mis en œuvre comme accélérant d’incendie dans
une affaire et un liquide de même type découvert par ailleurs, à proximité de la scène de
crime ou chez une personne mise en cause.
Le terme « liquide inflammable » regroupe une grande variété de produits
commerciaux (essence pour automobiles, essences spéciales, white-spirit, pétrole lampant,
alcool à brûler, combustibles divers, gazole...), ayant tous des profils chromatographiques
clairement différents. En revanche, pour un type de produit donné, les différences entre les
lots ou les marques sont parfois très subtiles. Le principe de base est la recherche de ces
différences sur les chromatogrammes obtenus. Si parfois la seule observation visuelle parait
suffisante, il est clair aujourd'hui qu'une approche chimiométrique est nécessaire pour traiter
1
au mieux la masse d'informations contenue dans un seul chromatogramme. La plupart des
liquides contiennent en effet plusieurs centaines de composés dont les proportions relatives
constituent autant de points de comparaison.
Les problèmes soulevés par cette approche sont nombreux, à commencer par le fait
que tous ces liquides inflammables sont par principe volatils. Les résidus imbrûlés détectés
dans les prélèvements présentent toujours une composition différente du produit initial, avec
une perte préférentielle des composés les plus légers au profit des plus lourds. Beaucoup de
différences observées sont ainsi attribuables à la dégradation du produit. L'effet matrice est
par ailleurs extrêmement important dans ce type d’échantillons. Les cendres analysées
émettent de nombreux composés générés au moment de la pyrolyse qui se superposent aux
profils chromatographiques des liquides inflammables. Il en résulte des problèmes de coélution, qui peuvent être résolus en optimisant la séparation chromatographique ou en
utilisant les avantages de la spectrométrie de masse. Mais beaucoup de produits de pyrolyse
sont également des hydrocarbures entrant dans la composition des liquides inflammables
recherchés. De fait, une altération des profils est systématiquement constatée, ce qui limite
considérablement la pertinence des comparaisons faites.
Certains
laboratoires
étudient
les
potentialités
de
la
chromatographie
bidimentionnelle ou l'analyse des rapports isotopiques par spectrométrie de masse. Notre
objectif serait d'utiliser un simple couplage GC/MS qui, pour les produits commerciaux
recherchés, permet déjà une excellente séparation. La mise en oeuvre d’outils statistiques
de traitement de données multivariées devrait permettre d'exploiter au mieux les
nombreuses informations que contient chaque chromatogramme.
E
Proposition de démarche dans l’analyse des données
Trois approches complémentaires sont envisageables à des degrés divers et l’un des
objectifs pourra être de déterminer laquelle ou lesquelles sont les plus pertinentes dans le
cadre de ce projet.
1)
Approches exploratoires
Ces méthodes sont utilisées pour l'analyse exploratoire des données, qui vise à
déterminer, sans a priori, s'il y a des informations pertinentes dans les signaux mesurés. Cet
axe de recherche tire ses outils du domaine de l’analyse factorielle multivariée et ne
nécessite pas d’avoir une connaissance a priori des groupes d’échantillons recherchés. Les
outils utiles et utilisables dans cette catégorie sont pour certains sur la recherche des
directions de dispersion maximale des échantillons dans l'espace des variables de départ
(exemple l’Analyse en Composantes Principales – ACP, ou l’analyse multivariée de la
2
variance – multivariate ANOVA) et pour d’autres sur une recherche des "signaux sources"
mélangés ensemble dans chaque signal mesuré (Analyse en Composantes Indépendantes –
ICA). Ces deux méthodes ont des objectifs différents: alors que l'ACP permet d'étudier la
dispersion des échantillons, et donc de pointer les échantillons les plus semblables /
différents, l'ICA permet d'extraire les sources pures mélangées dans les signaux mesurés.
Dans un premier temps, les échantillons analysés seront des références connues de liquides
inflammables non altérés d’origines et de marques variées. Ces liquides seront ensuite
évaporés ou brûlés pour se rapprocher des profils détectés dans des cas réels. L’effet des
matrices sera enfin pris en compte en fabricant des échantillons de résidus carbonisés
contenant des traces de liquides inflammables.
D’autres outils d’analyse tels que ComDim (dit aussi ACCPS pour Analyse en
Composantes Communes à Poids Spécifiques) peuvent être des pistes intéressantes de
traitement en donnant accès à ce qui est commun à plusieurs tableaux de données et
l’ampleur des liens reliant les variables de ces divers tableaux. Dans ce projet, les différents
tableaux seraient obtenus soit en segmentant, de façon intelligente, les chromatogrammes
originaux, soit en attribuant chaque chromatogramme ionique à un tableau différent. Ceci
nous permettrait de regarder localement où sont les informations communes et
complémentaires dans les signaux.
Compte tenu de la nature complexe des données, une approche exploratoire
constituera une première étape dans l’étude du problème et précédera nécessairement la
phase de recherche et de construction de modèles descriptifs.
Il faut également envisager une phase de recherche visant à déterminer quel type de
prétraitement des chromatogrammes sera le plus pertinent. En effet, on ne peut pas savoir à
l’avance si les chromatogrammes fournis seront utilisables directement ou non dans un
processus chimiométrique. Un certains nombre d’algorithmes de prétraitement seront sans
doute nécessaires à une mise en forme optimale des données : correction de ligne de base,
filtrage, lissage, recalage, normalisation, sélection de variables… Dans le domaine, le
nombre de solutions est immense et un certain nombre d’outils devront être testés afin
d’améliorer la qualité initiale des données.
2)
Approches prédictives
Cet axe de recherche vise à utiliser les connaissances a priori concernant la nature
des échantillons et en particulier leur appartenance à des groupes dont la définition provient
soit
d’une
propriété
connue
de
l’échantillon
(propriété
chimique :
alcool,
ester,
hydrocarbure…, propriété physique : volatilité, densité des liquides, point flash etc…), soit à
un critère de classement extérieur à la chimie du produit (marque, le type de produit, etc…)
3
Ces informations permettent de définir une classification des produits utilisables par
certains outils chimiométriques tels que l’analyse factorielles discriminante (et ses diverses
variantes) ou bien d’autres algorithmes de classification supervisés.
Ces techniques permettent de créer des espaces vectoriels orientés pour mettre en
évidence des différences entre les échantillons sur la base des informations de classification
imposées.
Il est possible d'utiliser en entrée de ces calculs discriminants, les données initiales
ou une fraction des données initiales après prétraitement ou bien les résultats d’autres
techniques non supervisées comme ACP, ICA ou ComDim.
Dans certains cas, la discrimination s’en trouve améliorée car la première étape de
l’analyse a pour effet de réduire la complexité des données et a souvent l’effet d’un filtrage
des données.
Nous pourrons aussi tester la méthode des K plus proches voisins (KNN) qui utilise
l'information sur les groupes d’appartenance d'un ensemble d'échantillons de référence pour
prédire les groupes d'appartenance des échantillons inconnus.
3)
Approches par apprentissage
Dans ce contexte, on cherche à établir des modèles de reconnaissance des
différents types d’empreintes chromatographiques rangées dans des catégories connues à
priori. Ces modèles sont des modèles de classification supervisés qui nécessitent une phase
d’apprentissage qui consiste en l’ajustement de poids ou coefficients associés aux variables
du problème. L’ajustement de ces poids se fait selon des méthodes mathématiques qui
prennent en compte la topologie de l’espace multivarié dans lequel se distribuent les
empreintes chromatographiques des échantillons. Plusieurs méthodes existent et peuvent
être appliquées au problème de la reconnaissance des produits inflammables, en particulier
les réseaux de neurones et les méthodes telles que les SVM (Support Vector Machine). Ces
deux méthodes peuvent être complémentaires dans la mesure où la première peut traiter les
problèmes complexes ou intriqués en fournissant une solution non linéaire, et l’autre
possède une très grande capacité d’adaptation aux problèmes complexes mais toujours en
fournissant des solutions linéaires.
Dans les deux cas, la phase la plus délicate est la phase d’apprentissage et le
dimensionnement des ensembles de données servant à cet apprentissage.
La méthode KNN citée précédemment dans les approches prédictives peut
également être complémentaire dans la mesure où elle aussi est mise en œuvre avec une
phase d’apprentissage pour établir le modèle de classification. Quelle que soit la technique
utilisée ici, la principale limitation que l’on rencontrera est la quasi impossibilité de fournir une
interprétation chimique du résultat de la classification car peu d’outils aujourd’hui ont été
développés pour rendre lisibles les résultats fournis par les modèles issus de ces méthodes.
4
Mais ce point peut faire l’objet d’un aspect du travail du doctorant qui tenterait de relier un
résultat de classification obtenu par ces modèles avec les données chromatographiques
obtenues par l’expérimentation.
En revanche, ces outils peuvent fournir un résultat avec une certaine probabilité et
peuvent selon le cas trouver des solutions à des problèmes extrêmement complexes là où
les méthodes décrites dans les §1 et 2 n’auraient pas donné satisfaction.
Toutes ces pistes sont donc complémentaires et pourront être mises en œuvre par le
doctorant et par l’équipe durant le projet.
Lieu de travail :
Laboratoire Central de la Préfecture de Police, 39bis, rue de Dantzig, 75015 Paris
et
AgroParisTech, UMR 1145 Ingénierie Procédés Aliments, 16, rue Claude Bernard, 75005
Paris
Financement :
Contrat doctoral du Laboratoire Central de la Préfecture de Police de
Paris
01/01/2015 – 31/12/2017
Directeur de thèse : Pr. Douglas N. RUTLEDGE, AgroParisTech
Encadrement: Dr. Christophe B.Y. CORDELLA, AgroParisTech
Dr. Delphine JOUAN-RIMBAUD BOUVERESSE, AgroParisTech;
Xavier ARCHER, Laboratoire Central de la Préfecture de Police de Paris
Ecole doctorale de rattachement :
ABIES
Contacts:
Douglas RUTLEDGE :
[email protected]
tél. : 01 44 08 16 48
Xavier ARCHER :
[email protected]
tél. : 01 55 76 25 88
5