PROPOSITION DE STAGE : APPLICATION DES ALGORITHMES
Transcription
PROPOSITION DE STAGE : APPLICATION DES ALGORITHMES
PROPOSITION DE STAGE : APPLICATION DE L’ANALYSE KRIGEANTE AUX DONNEES SUR LES CONTAMINANTS DU GIS SOL. INRA, Unité INFOSOL Centre de Recherche d’Orléans BP 20619 Ardon 45166 OLIVET cedex Contacts : [email protected] [email protected] (X2000) Contexte Les sols se situent à l’interface des principaux compartiments de l’environnement (lithosphère, hydrosphère, biosphère et atmosphère) et jouent un rôle fondamental dans les grands cycles biogéochimiques. On observe actuellement des demandes croissantes sur les nombreux services qu’ils assurent (stockage de carbone, épuration des eaux, réservoir de biodiversité, etc). Les sols constituent cependant une ressource fragile et non renouvelable à l’échelle des générations humaines, qu’il est donc important de préserver. Les sols et leurs fonctions restent toutefois largement méconnus et peu pris en compte par les citoyens, les décideurs et les aménageurs. Le Groupement d’Intérêt Scientifique Sol (GIS Sol) a été mis en place en 2001 afin de disposer, au niveau français, d’un système d’acquisition, de gestion et de diffusion d’informations sur les sols. Dans ce cadre, l’unité Infosol a pour mission de constituer le système d’information national sur les sols de France et l’évolution de leur qualité. L’unité pilote ainsi notamment les programmes suivants : Le programme Réseau de Mesure de la Qualité des Sols (RMQS) repose sur le suivi temporel de plus de 2000 points répartis uniformément sur le territoire français. Le RMQS permettra de disposer d’un bilan national de l’état et de l’évolution des sols à travers le suivi d’un grand nombre de propriétés du sol (agronomique, contaminants) Le programme Base de Données d’Analyse des Terres (BDAT) vise à regrouper dans une banque de données les résultats des analyses demandées par les agriculteurs pour mieux gérer la fertilisation de leurs sols. Le programme Base de données des Eléments Traces Métalliques (BDETM) vise à regrouper dans une banque de données les résultats d’analyses réglementaires préalables à l’épandage de boue de stations d’épuration. Présentation générale de la problématique La mise en place de politiques de protection des sols se traduit notamment par l’identification de zones à risques. Pour cela, il convient de disposer d’informations précises et distribuées sur la variabilité des propriétés des sols dans l’espace et dans le temps. Il s’avère donc nécessaire de mettre en place des dispositifs de mesure de la qualité des sols à forte résolution spatiale couplés à des méthodes statistiques adaptées à la nature et à l’extension spatiale de l’information traitée. Les méthodes géostatiques classiques sont connues pour leur efficacité dans la représentation de données à composante spatio-temporelle. Pour répondre aux besoins de la surveillance de la qualité des sols, les modèles usuels pêchent cependant par leur manque de flexibilité quant au type de dépendances spatiales qu’elles sont capables de décrire, et de ce fait, leur manque de précision. Des travaux ont été conduits, au sein de l’unité INFOSOL, afin d’explorer le potentiel de modèles géostatistiques plus généralistes permettant de mieux appréhender l’origine de la distribution spatiale des contaminants du sol à l’échelle du territoire français. L’analyse de la distribution spatiale des polluants organiques persistants (POP) à partir du RMQS s’est basée sur un modèle statistique à 2 composantes (Villanneau et al., 2011). Ces composantes correspondent à celles décrites par le modèle linéaire à effets mixtes (MLM) (Lark and Cullis, 2004). La première composante correspond au déterminisme des facteurs de la pédogénèse ou de l’occupation du sol ; elle est représentée par l’effet fixe du MLM. La deuxième composante correspond aux variations au sein de chaque modalité de l’effet fixe ; elle est représentée par l’effet aléatoire du MLM. Nous avons complexifié ce modèle dans le cadre de l’étude de la distribution spatiale des éléments trace métalliques (Marchant et al., 2010; Saby et al., 2011). Une troisième composante a été ajoutée, correspondant au processus spatial secondaire issu de la présence de fortes valeurs dans le jeu de données qui correspondent à des pollutions locales en ETM. Cette dernière composante nécessite pour sa modélisation d’employer des techniques robustes permettant d’identifier ces valeurs dites « outliers ». Les outliers détectés peuvent ainsi être « winsorizées » (Hawkins & Cressie, 1984). Nous avons aussi exploré le bénéfice apporté par le recours à la théorie des copules (Marchant et al., 2011). Ces méthodes appliquées dans le cadre de MLM ont l’avantage de permettre la modélisation des dépendances spatiales sans se préoccuper des lois marginales. On montre ainsi qu’un modèle basé sur cette théorie et relativement simple permet de disposer de prédictions plus fiables que celles produites par les géostatistiques classiques. Cependant, des limites techniques de maximisation de la vraisemblance rendent nécessaires des recherches plus approfondies. Parmi les techniques encore à explorer dans ce contexte, l’analyse krigeante semble prometteuse. La technique consiste à décomposer une ou plusieurs variables en composantes correspondant à différentes échelles de variabilité. Les matrices de palier permettent alors d’établir des corrélations entre variables, différentiées selon les échelles de variabilité (par exemple de Fouquet et al., 2007). L’estimation des différentes composantes a déjà été utilisée à des fins de prospection géochimique (Wackernagel et al., 1993) Objectif du stage Ce stage a pour objectif d’améliorer les cartographies et de mieux appréhender les déterminants de la distribution spatiale des contaminants à partir des données collectées dans le cadre des programmes du GIS Sol (RMQS en priorité). : Analyse exploratoire pour caractériser les corrélations spatiales multivariables ; Tester la théorie de l’analyse krigeante sur les données sur les ETMs et les POPs (RMQS et BDETM), en l'adaptant si nécessaire aux corrélations différées ; Comparer les résultats de l’analyse krigeante à ceux obtenus dans le cadre des précédents travaux, Proposer un cadre statistique pour l’application de l’analyse krigeante aux données du RMQS. Connaissances et compétences souhaitées : Connaissances générales en statistique. Connaissance du logiciel R appréciée. Connaissances en géostatistique et en probabilités, permettant d’appréhender l’analyse krigeante. Conditions du stage Ce travail se fera en collaboration avec l’école des mines de Paris (Chantal de Fouquet) et l’UR sol (Hocine Bourennane) Le stagiaire sera basé à Orléans. Il recevra une indemnité de stage. Bibliographie de Fouquet C., Gallois D., Perron G. 2007. Geostatistical characterization of the nitrogen dioxyde concentration in an urban area. Part I: spatial variability and cartography of the annual concentration. Atmospheric Environment. 41(2007)6701-6714 Lark, R.M., Cullis, B.R., 2004. Model-based analysis using REML for inference from systematically sampled data on soil. Eur J Soil Sci 55(4), 799-813. Marchant, B.P., Saby, N.P.A., Jolivet, C.C., Arrouays, D., Lark, R.M., 2011. Spatial prediction of soil properties with copulas. Geoderma 162(3-4), 327-334. Marchant, B.P., Saby, N.P.A., Lark, R.M., Bellamy, P.H., Jolivet, C.C., Arrouays, D., 2010. Robust analysis of soil properties at the national scale: cadmium content of French soils. Eur J Soil Sci 61(1), 144-152. Saby, N.P.A., Marchant, B.P., Lark, R.M., Jolivet, C.C., Arrouays, D., 2011. Robust geostatistical prediction of trace elements across France. Geoderma 162(3-4), 303-311. Villanneau, E., Saby, N.P.A., Marchant, B.P., Jolivet, C., Boulonne, L., Caria, G., Barriuso, E., Briand, O., D., A., 2011. Which persistent organic pollutants can we map in soil using a large spacing systematic soil monitoring design? A case study in Northern France. Sci Total Environ 409, 3719–3731. Wackernagel H., Sanguinetti H. 1993. Gold prospecting with factirial cokriging in the Limousin, France. In : Davis J.C. & herzfeld UC (eds) Computers in geology : 25 years of progress. Studies in Mathematical geology, vol 5,33-43. Oxford University press.