PROPOSITION DE STAGE : APPLICATION DES ALGORITHMES

Transcription

PROPOSITION DE STAGE : APPLICATION DES ALGORITHMES
PROPOSITION DE STAGE : APPLICATION DE L’ANALYSE
KRIGEANTE AUX DONNEES SUR LES CONTAMINANTS DU GIS
SOL.
INRA, Unité INFOSOL
Centre de Recherche d’Orléans
BP 20619 Ardon
45166 OLIVET cedex
Contacts :
[email protected]
[email protected] (X2000)
Contexte
Les sols se situent à l’interface des principaux compartiments de l’environnement
(lithosphère, hydrosphère, biosphère et atmosphère) et jouent un rôle fondamental
dans les grands cycles biogéochimiques. On observe actuellement des demandes
croissantes sur les nombreux services qu’ils assurent (stockage de carbone,
épuration des eaux, réservoir de biodiversité, etc). Les sols constituent cependant
une ressource fragile et non renouvelable à l’échelle des générations humaines, qu’il
est donc important de préserver.
Les sols et leurs fonctions restent toutefois largement méconnus et peu pris en
compte par les citoyens, les décideurs et les aménageurs. Le Groupement d’Intérêt
Scientifique Sol (GIS Sol) a été mis en place en 2001 afin de disposer, au niveau
français, d’un système d’acquisition, de gestion et de diffusion d’informations sur les
sols. Dans ce cadre, l’unité Infosol a pour mission de constituer le système
d’information national sur les sols de France et l’évolution de leur qualité. L’unité
pilote ainsi notamment les programmes suivants :
 Le programme Réseau de Mesure de la Qualité des Sols (RMQS) repose sur
le suivi temporel de plus de 2000 points répartis uniformément sur le territoire
français. Le RMQS permettra de disposer d’un bilan national de l’état et de
l’évolution des sols à travers le suivi d’un grand nombre de propriétés du sol
(agronomique, contaminants)
 Le programme Base de Données d’Analyse des Terres (BDAT) vise à
regrouper dans une banque de données les résultats des analyses
demandées par les agriculteurs pour mieux gérer la fertilisation de leurs sols.
 Le programme Base de données des Eléments Traces Métalliques (BDETM)
vise à regrouper dans une banque de données les résultats d’analyses
réglementaires préalables à l’épandage de boue de stations d’épuration.
Présentation générale de la problématique
La mise en place de politiques de protection des sols se traduit notamment par
l’identification de zones à risques. Pour cela, il convient de disposer d’informations
précises et distribuées sur la variabilité des propriétés des sols dans l’espace et dans
le temps. Il s’avère donc nécessaire de mettre en place des dispositifs de mesure de
la qualité des sols à forte résolution spatiale couplés à des méthodes statistiques
adaptées à la nature et à l’extension spatiale de l’information traitée. Les méthodes
géostatiques classiques sont connues pour leur efficacité dans la représentation de
données à composante spatio-temporelle. Pour répondre aux besoins de la
surveillance de la qualité des sols, les modèles usuels pêchent cependant par leur
manque de flexibilité quant au type de dépendances spatiales qu’elles sont capables
de décrire, et de ce fait, leur manque de précision. Des travaux ont été conduits, au
sein de l’unité INFOSOL, afin d’explorer le potentiel de modèles géostatistiques plus
généralistes permettant de mieux appréhender l’origine de la distribution spatiale des
contaminants du sol à l’échelle du territoire français.
L’analyse de la distribution spatiale des polluants organiques persistants (POP) à
partir du RMQS s’est basée sur un modèle statistique à 2 composantes (Villanneau
et al., 2011). Ces composantes correspondent à celles décrites par le modèle linéaire
à effets mixtes (MLM) (Lark and Cullis, 2004). La première composante correspond
au déterminisme des facteurs de la pédogénèse ou de l’occupation du sol ; elle est
représentée par l’effet fixe du MLM. La deuxième composante correspond aux
variations au sein de chaque modalité de l’effet fixe ; elle est représentée par l’effet
aléatoire du MLM.
Nous avons complexifié ce modèle dans le cadre de l’étude de la distribution spatiale
des éléments trace métalliques (Marchant et al., 2010; Saby et al., 2011). Une
troisième composante a été ajoutée, correspondant au processus spatial secondaire
issu de la présence de fortes valeurs dans le jeu de données qui correspondent à
des pollutions locales en ETM. Cette dernière composante nécessite pour sa
modélisation d’employer des techniques robustes permettant d’identifier ces valeurs
dites « outliers ». Les outliers détectés peuvent ainsi être « winsorizées » (Hawkins &
Cressie, 1984).
Nous avons aussi exploré le bénéfice apporté par le recours à la théorie des copules
(Marchant et al., 2011). Ces méthodes appliquées dans le cadre de MLM ont
l’avantage de permettre la modélisation des dépendances spatiales sans se
préoccuper des lois marginales. On montre ainsi qu’un modèle basé sur cette théorie
et relativement simple permet de disposer de prédictions plus fiables que celles
produites par les géostatistiques classiques. Cependant, des limites techniques de
maximisation de la vraisemblance rendent nécessaires des recherches plus
approfondies.
Parmi les techniques encore à explorer dans ce contexte, l’analyse krigeante semble
prometteuse. La technique consiste à décomposer une ou plusieurs variables en
composantes correspondant à différentes échelles de variabilité. Les matrices de
palier permettent alors d’établir des corrélations entre variables, différentiées selon
les échelles de variabilité (par exemple de Fouquet et al., 2007). L’estimation des
différentes composantes a déjà été utilisée à des fins de prospection géochimique
(Wackernagel et al., 1993)
Objectif du stage
Ce stage a pour objectif d’améliorer les cartographies et de mieux appréhender les
déterminants de la distribution spatiale des contaminants à partir des données
collectées dans le cadre des programmes du GIS Sol (RMQS en priorité). :
 Analyse exploratoire pour caractériser les corrélations spatiales multivariables
;



Tester la théorie de l’analyse krigeante sur les données sur les ETMs et les
POPs (RMQS et BDETM), en l'adaptant si nécessaire aux corrélations
différées ;
Comparer les résultats de l’analyse krigeante à ceux obtenus dans le cadre
des précédents travaux,
Proposer un cadre statistique pour l’application de l’analyse krigeante aux
données du RMQS.
Connaissances et compétences souhaitées :
Connaissances générales en statistique.
Connaissance du logiciel R appréciée.
Connaissances en géostatistique et en probabilités, permettant d’appréhender
l’analyse krigeante.
Conditions du stage
Ce travail se fera en collaboration avec l’école des mines de Paris (Chantal de
Fouquet) et l’UR sol (Hocine Bourennane)
Le stagiaire sera basé à Orléans.
Il recevra une indemnité de stage.
Bibliographie
de Fouquet C., Gallois D., Perron G. 2007. Geostatistical characterization of the
nitrogen dioxyde concentration in an urban area. Part I: spatial variability and
cartography of the annual concentration. Atmospheric Environment.
41(2007)6701-6714
Lark, R.M., Cullis, B.R., 2004. Model-based analysis using REML for inference from
systematically sampled data on soil. Eur J Soil Sci 55(4), 799-813.
Marchant, B.P., Saby, N.P.A., Jolivet, C.C., Arrouays, D., Lark, R.M., 2011. Spatial
prediction of soil properties with copulas. Geoderma 162(3-4), 327-334.
Marchant, B.P., Saby, N.P.A., Lark, R.M., Bellamy, P.H., Jolivet, C.C., Arrouays, D.,
2010. Robust analysis of soil properties at the national scale: cadmium content
of French soils. Eur J Soil Sci 61(1), 144-152.
Saby, N.P.A., Marchant, B.P., Lark, R.M., Jolivet, C.C., Arrouays, D., 2011. Robust
geostatistical prediction of trace elements across France. Geoderma 162(3-4),
303-311.
Villanneau, E., Saby, N.P.A., Marchant, B.P., Jolivet, C., Boulonne, L., Caria, G.,
Barriuso, E., Briand, O., D., A., 2011. Which persistent organic pollutants can
we map in soil using a large spacing systematic soil monitoring design? A
case study in Northern France. Sci Total Environ 409, 3719–3731.
Wackernagel H., Sanguinetti H. 1993. Gold prospecting with factirial cokriging in the
Limousin, France. In : Davis J.C. & herzfeld UC (eds) Computers in geology :
25 years of progress. Studies in Mathematical geology, vol 5,33-43. Oxford
University press.