Revue méthodologique sur la relation température-mortalité
Transcription
Revue méthodologique sur la relation température-mortalité
Alerte aux Canicules Au Sahel et à leurs Impacts sur la Santé Institut de Recherche pour le Développement Revue méthodologique sur la relation température-mortalité Papa Daouda Amad DIENE Ingénieur Statisticien INTRODUCTION L'exposition à des températures ambiantes, basses et hautes augmente le risque de décès. Les projections climatiques indiquent une augmentation en fréquence et en intensité des vagues de chaleur en Afrique. En Afrique, le climat est plus chaud et les capacités d’adaptation sont plus faibles. Il faudrait donc mettre en œuvre des actions pour détecter et évaluer leurs impacts: ACASIS Le projet s'appuie sur des analyses statistiques, des exercices de modélisation climatique, des enquêtes de terrain et le traitement de ces données. Il subsiste cependant des questions méthodologiques lors de l'examen de la relation entre la température et de la mortalité. 2 PLAN DE PRESENTATION 1. ETAT DES LIEUX SUR LA MODELISATION 2. 3. PRESENTATION DES METHODES 2.1 MODELES DE SERIES TEMPORELLES 2.2 MODELES A EFFETS RETARDES (DLM ou DLNM) 2.2 MODELES DE CAS-CROISES 2.4 MODELES SPATIO-TEMPORELS EXEMPLES D’ARTICLES UTILISANT CES METHODES CONCLUSION 3 1. ETAT DES LIEUX SUR LA MODELISATION 1. ETAT DES LIEUX SUR LA MODELISATION Les modèles les plus utilisés sont les modèles de séries temporelles et les cas-croisés Dans plusieurs études, la relation entre la température et la mortalité a été étudiée compte non-tenue des polluants atmosphériques. Récemment les études se sont intéressés à l’évaluation de l’effet potentiel des polluants atmosphériques sur l’association Température-Mortalité, la détection des sous groupes vulnérables, mais également sur le déplacement de la mortalité. Les outputs de ces études sont généralement: un coefficient de régression, risque relatif (séries chronologiques), odds ratio (cas-croisé). Pour améliorer leur estimation, les auteurs prennent souvent le nombre de décès compte non-tenue des décès par accident et les décès dus au maladies cardiovasculaires et respiratoires. 4 2. PRESENTATION DES METHODES 2.1 Modèles de Séries temporels 2.1 Modèles GLM Principe !~#↓%&' )=*[!] +=,()) +=-. Y = (Y1, Y2, …, Yi, …, Yn)’ est le vecteur des variables aléatoires, µ = (µ , µ , …, µ , …, µ )’ est le vecteur des espérances, 1 2 i n η = (η , η , …, η , …, η )’ est le vecteur des prédicteurs, 1 2 i n β = (β , β , …, β , …, β )’ est le vecteur des paramètres à déterminer 1 2 j p X est la matrice des cofacteurs g est la fonction de lien donne la forme de la relation entre (l’espérance de) la variable expliquée et les variables explicatives. 5 2. PRESENTATION DES METHODES 2.1 Modèles de Séries temporelles 2.1 Modèles GLM Principe !~#↓%&' )=*[!] +=,()) +=-. ,(*[!↓1 ])=∑↑▒.↓7 -↓17 Estimations Les équations qui déterminent les paramètres au sens du maximum de vraisemblance sont non linéaires Cela nécessite donc une utilisation d’algorithmes itératifs. 6 2. PRESENTATION DES METHODES 2.1 Modèles de Séries temporelles 2.1 Modèles GLM Adéquation au modèle On utilise généralement deux statistiques: La déviance normalisée (scaled deviance) 8=29:,(#(;↓<=& , >)/#(;, >) ) Lorsque le modèle étudié est exact, la déviance normalisée D suit approximativement une loi du khi-deux à n-K degrés de liberté 2. PRESENTATION DES METHODES 2.1 Modèles de Séries temporelles 2.1 Modèles GLM Adéquation au modèle La statistique du khi-deux de Pearson @↑2 =∑↑▒( >−A↓1 )↑2 ∕C(A↓1 ) Cette statistique est distribuée approximativement selon une loi du khi-deux à n-K degrés de liberté si le modèle étudié est exact Il faut par la suite procéder à des tests de surdispersion tels que le test de Wald et le test de LRT. 2. PRESENTATION DES METHODES 2.1 Modèles de Séries temporelles 2.2 Modèles GAM Principe !~#↓%&' )=*[!] +=,()) +=D(-) ,(*[!↓1 ])=∑↑▒E↓7 (-↓17 ) Estimations Utilisation de fonctions non paramétrique de lissage. L’algorithme du « Backfitting » est utilisé. 9 2. PRESENTATION DES METHODES 2.1 Modèles de Séries temporelles 2.2 Modèles GAM Estimations Les fonctions +, sont initialisées par des estimations à partir des fonctions splines ou fonctions LOESS Pour chaque variable -,, sa fonction de dépendance +, est ré-estimée en prenant comme input les estimations initiales des fonctions des autres variables La procédure précédant est réitérée jusqu’à ce que les fonctions de dépendance estimées convergent 10 2. PRESENTATION DES METHODES 2.1 Modèles de Séries temporelles 2.2 Modèles GAM Validation du modèle Critère d’information d’Akaïke Validation Croisée Généralisée (GCV) 11 2. PRESENTATION DES METHODES 2.1 Modèles de Séries temporelles 2.2 Comparaison des deux modèles • GLM (Régression de Poisson) Avantages Simple d’utilisation Adaptée à la structure des données (journalière) Inconvénients Problème de dispersion quasi-systématique Nécessité d’avoir une variable dépendante Poissonienne Hypothèse trop forte de linéarité de l’association Température-Mortalité 12 2. PRESENTATION DES METHODES 2.1 Modèles de Séries temporelles 2.2 Comparaison des deux modèles • GAM Avantages Levée de l’hypothèse de linéarité de l’association température-Mortalité Permet le calcul des RR Inconvénients Seul, ne permet pas de prendre en compte les effets retardés de cette relation 13 2. PRESENTATION DES METHODES 2.2 Modèles à effets retardés (DLM ou DLNM) Le modèle à effets retardés (distributed lag model) a été appliqué afin d’explorer l'effet retardé de la température sur la mortalité. Estimation: méthodes de lissage telles que les splines cubiques naturelles, les polynômiales ou retards stratifiés Récemment, un « distributed lag non-linear model » (DLNM) a été développé pour estimer simultanément les effets non-linéaires et différés de la température sur la mortalité (ou de morbidité). Les DLNMs utilisent une fonction "cross-basis" 14 2. PRESENTATION DES METHODES 2.2 Modèles à effets retardés (DLM ou DLNM) 3-D plot of RR along temperature and lags, using data from NMMAPS for Chicago during the period 1987–2000. 15 2. PRESENTATION DES METHODES 2.2 Modèles à effets retardés (DLM ou DLNM) Le DLNM peut modéliser de manière adéquate les principaux effets de la température (Armstrong, 2006) DLNM est combiné avec un modèle de régression Avantages Permet de prendre en compte l’effet retardée de la température sur la mortalité Permet le calcul des RR Inconvénients Fixation du maximum de retards et des degrés de liberté par l’expérimentateur 16 2. PRESENTATION DES METHODES 2.3 Modèles des cas-croisés Il permet étudier les effets de l'exposition aux événements transitoires Il y a également un contrôle des variables de confusion La sensibilité ne peut pas être étudiée en incluant un terme d'interaction entre la mortalité et température Il nécessite dès fois l’usage de modèle de régression des séries temporelles ou d’un modèle logistique conditionnel Ce type d’étude est simple d’emploi Il donne des résultats similaires aux modèles de Poisson Il est particulièrement adapté à la recherche des facteurs modifiant la relation entre pollution et santé (facteurs d’interaction). 17 2. PRESENTATION DES METHODES 2.4 Modèles spatio-temporels Les zones urbaines ont généralement des températures plus élevées en raison de l'effet d'îlot de chaleur. Des techniques de géo-statistiques ont été utilisées pour modéliser les températures régionales Différentes techniques (interpolation de la distance inverse pondérée, analyse de régression, et les méthodes géo-statistique) ont été développées pour prédire la température régionale de la station données (Bhowmik & Cabral, 2011). Ces modèles ont également été utilisées pour estimer les effets de la pollution de l'air sur la santé dans les villes (Lee & Shaddick, 2010; Shaddick, et al., 2008; Whitworth, et al., 2011) 18 3. EXEMPLES D’ARTICLES UTILISANT CES METHODES 3.1 Modèles GLM H. Tsangari, A. Paschalidou, S.Vardoulakis, C. Heaviside, et al. (2015). Human mortality in Cyprus: the role of temperature and particulate air pollution. REGIONAL ENVIRONMENTAL CHANGE. L’objectif de cette étude est d’évaluer les effets de la température sur la mortalité en Chypre. Données Démographiques: Nombre de décès par âge (toutes causes de décès). Météorologiques: Température maximale par jour à la surface, humidité relative à 8h00, humidité relative à 13h00. Pollution atmosphérique: Concentration journalière de PM10(Particulate matter). 19 3. EXEMPLES D’ARTICLES UTILISANT CES METHODES 3.1 Modèles GLM Période de l’étude 2007-2009 L'analyse est concentrée sur les périodes chaudes (Avril à Septembre) de chaque année, pour examiner les effets de la chaleur. Modélisation Statistique Utilisation d’un GLM combiné à un DLNM. Stratification des effets délayés: retards (0-1), retards(2-5), retards (6,10). Contrôle de la saisonnalité et de la tendance. 20 3. EXEMPLES D’ARTICLES UTILISANT CES METHODES 3.1 Modèles GLM Résultats Les températures élevées ont un effet significatif sur la mortalité en Chypre. L’effet de la pollution atmosphérique n’est pas significatif sur la mortalité. 21 3. EXEMPLES D’ARTICLES UTILISANT CES METHODES 3.1 Modèles GLM Résultats 22 3. EXEMPLES D’ARTICLES UTILISANT CES METHODES 3.1 Modèles GLM Résultats Les températures élevées ont un effet significatif sur la mortalité moindre en zone urbaine plutôt qu’en zone rurale. Limites Période de l’étude Pas de prise en compte d’autres paramètres de pollution atmosphérique. 23 3. EXEMPLES D’ARTICLES UTILISANT CES METHODES 3.2 Modèles GAM Li et al. (2014). Association between high temperature and mortality in metropolitan areas of four cities in various climatic zones in China: a time-series study. Environmental Health. L’objectif de cette étude est d’évaluer la relation entre la température et la mortalité dans 4 régions de la chine (avec des caractéristiques climatiques différentes). Données Démographiques: Nombre de décès (toutes causes de décès). Météorologiques: Température maximale par jour, Température minimale par jour, Température moyenne par jour, humidité relative. Pollution atmosphérique: Concentration journalière de PM10(Particulate matter), dioxyde d’azote (NO2), dioxyde de soufre (SO2). 24 3. EXEMPLES D’ARTICLES UTILISANT CES METHODES 3.2 Modèles GAM Période de l’étude Du fait de la disponibilité des données, les périodes d’étude sont différentes d’une région à une autre. Harbin: 1ier Janvier 2008-31 décembre 2010. Nanjing: 1ier Janvier 2004-31 décembre 2010. Shenzhen: 1ier Janvier 2004-31 décembre 2010. Chongqing: 1ier Janvier 2011-31 décembre 2012. 25 3. EXEMPLES D’ARTICLES UTILISANT CES METHODES 3.2 Modèles GAM Modélisation Statistique Détermination des optima thermiques. Termes du modèle GAM: la température quotidienne maximale moins le seuil de température, l'humidité relative, l’étendue de la température journalière, le jour de la semaine, le mois, la tendance à long-terme, SO2, NO2, et les PM10. Seuls les mois chauds sont considérés dans l’analyse. 26 3. EXEMPLES D’ARTICLES UTILISANT CES METHODES 3.2 Modèles GAM Résultats Seuils thermiques 27 3. EXEMPLES D’ARTICLES UTILISANT CES METHODES 3.2 Modèles GAM Résultats Il existe une relation significative entre la température et la mortalité en Chine. La pollution atmosphérique a un effet significatif sur la mortalité en Chine. 28 3. EXEMPLES D’ARTICLES UTILISANT CES METHODES 3.2 Modèles GAM Résultats Résultats de la relation entre la température et la mortalité pour les populations vulnérables. 29 3. EXEMPLES D’ARTICLES UTILISANT CES METHODES 3.2 Modèles GAM Limites Non prise en compte des indicateurs de morbidité. La différence des périodes d’étude. 30 CONCLUSION Le choix du modèle adéquat est une étape cruciale dans la modélisation de la relation entre la température et la mortalité. Les modèles de séries temporelles et les cas-croisés sont les plus utilisés. GAM et GLM les méthodes de séries temporelles usuelles. Nécessité de les combiner avec les modèles à effets retardés. 31 MERCI DE VOTRE ATTENTION 32