Epidémiologie géographique JOSE 2012bis

Transcription

Epidémiologie géographique JOSE 2012bis
Apports de l'épidémiologie
géographique à l'étude des relations
santé-environnement
Pr. Jean-François Viel
IRSET - INSERM U 1085, Faculté de Médecine, CHU, Rennes
[email protected]
JOSE, 6 septembre 2012
Intérêts de l'épidémiologie spatiale
Triade épidémiologique : qui ? quand ? où ?
On peut observer une hétérogénéité géographique :
des indicateurs de santé :
pourquoi ?
des expositions environnementales dans leur intensité, leur
fréquence et leur composition :
quel(s) risque(s) posent-elles ?
JOSE, 6 septembre 2012
Intérêts de l'épidémiologie spatiale
La société s'interroge sur les inégalités d’exposition et d'état
de santé selon le lieu de résidence :
justice environnementale.
Les populations se déplacent et sont donc soumises à des
expositions variées :
il est important de savoir où et quand l'exposition survient.
La géographie procure un "laboratoire naturel" où étudier les
relations entre environnement et santé.
JOSE, 6 septembre 2012
Plan
Cartographie du risque :
identifier des répartitions ou tendances spatiales.
Agrégats (spatiaux ou spatio-temporels) :
tester des répartitions ou tendances spatiales.
Modélisation spatiale :
expliquer des répartitions ou tendances spatiales.
JOSE, 6 septembre 2012
Plan
Cartographie du risque :
identifier des répartitions ou tendances spatiales.
Agrégats (spatiaux ou spatio-temporels) :
tester des répartitions ou tendances spatiales.
Modélisation spatiale :
expliquer des répartitions ou tendances spatiales.
JOSE, 6 septembre 2012
Cartographie du risque sanitaire
Les taux de maladie représentent une mesure "classique" du
risque sanitaire.
La cartographie de ces taux peut indiquer des zones de risque
sanitaire plus élevé, et donc donner des pistes
(éventuellement environnementales) sur l'étiologie de la
maladie.
Le but est :
de visualiser la répartition spatiale du risque sanitaire pour
donner une idée de la variation géographique,
tout en tenant compte de la problématique des petits effectifs.
JOSE, 6 septembre 2012
Taux (bruts) de natalité, Ille-et-Vilaine, 2010
0 - 10 ‰
10 - 20 ‰
20 - 30 ‰
30 - 40 ‰
40 - 50 ‰
JOSE, 6 septembre 2012
Taux (bruts) de natalité, Ille-et-Vilaine, 2010
Lanrigan :
6/128 = 47‰
St Léger des Près :
9/221 = 41‰
Aubigné :
15/222 = 42‰
JOSE, 6 septembre 2012
Instabilité et variance des taux
La cartographie des taux peut masquer le "signal" (risque)
sous-jacent à cause du "bruit" généré par la variabilité aléatoire.
La variance des taux est proportionnelle à 1 / population :
plus la population sous-jacente est faible, plus la variance est
grande, plus les estimations des taux sont imprécises,
plus la population sous-jacente est importante, plus la variance est
faible, plus les estimations des taux sont précises et
statistiquement significatives.
JOSE, 6 septembre 2012
Interprétation des taux
Les petites populations tendent à générer les taux les plus
extrêmes, même si les risques sont homogènes entre les
unités spatiales, attirant l'attention du lecteur sur les zones les
moins fiables quand il examine une carte !
Les effectifs nuls, qu'ils soient observés dans une population
faible ou importante, ne sont pas différenciés.
Il faut faire appel au lissage spatial pour diminuer l’influence
des variations aléatoires.
JOSE, 6 septembre 2012
Lissage spatial
Le lissage spatial des taux de maladie a pour objectifs de :
identifier le signal,
réduire le bruit aléatoire,
réduire le nombre de valeurs extrêmes (incluant les effectifs nuls).
Il représente un compromis entre la résolution géographique
(contraste) et la variabilité des estimateurs cartographiés.
Il implique souvent des hypothèses supplémentaires ou de
nouveaux termes dans les modèles statistiques.
JOSE, 6 septembre 2012
Lissage spatial Bayésien
Basé sur un modèle.
Le risque est supposé varier selon la distribution:
θi ~ Gamma(α, β)
α et β sont inconnus et on peut :
essayer de les estimer à partir des données :
α et β sont supposés fixes,
méthode Bayésienne empirique,
leur imposer une distribution, ex : α ~ exp(υ), β ~ exp(ρ)
méthode Bayésienne hiérarchique.
JOSE, 6 septembre 2012
Méthode empirique Bayésienne
Maximum de vraisemblance marginal :
p(θi/yi) ~ Gamma(yi+α, ei+β)
θi = (yi+α) / (ei+β)
Moyenne (θ) = (α / β), variance (θ) = (α / β²)
Quand la population de l'unité spatiale i est grande :
une crédibilité (poids) important est attribuée aux observations,
le taux lissé est proche du taux observé (θi ≈ yi / ei).
Quand la population de l'unité spatiale i est petite :
une crédibilité (poids) faible est attribuée aux observations,
les taux lissés sont "rétrécis" vers la moyenne globale (θi ≈ α / β).
JOSE, 6 septembre 2012
Taux lissés de natalité, Ille-et-Vilaine, 2010
0 - 10 ‰
10 - 20 ‰
20 - 30 ‰
30 - 40 ‰
40 - 50 ‰
JOSE, 6 septembre 2012
Taux (bruts) de natalité, Ille-et-Vilaine, 2010
0 - 10 ‰
10 - 20 ‰
20 - 30 ‰
30 - 40 ‰
40 - 50 ‰
JOSE, 6 septembre 2012
Comparaison des taux
Commune
Saint-Gonlay
Rennes
Lanrigan
Population
Naissances
Taux bruts ‰
Taux lissés ‰
10,81
341
1
2,93
206 655
2 682
12,98
12,98
128
6
46,88
16,87
JOSE, 6 septembre 2012
ν ui
i
Cartographie du risque sanitaire
Toute carte, tout atlas de pathologies (cancers,…) doit reposer sur une
méthode de lissage.
Il existe différentes techniques de lissage pouvant conduire à des
écarts dans les estimations.
A une échelle géographique fine, les contrastes dans les taux peuvent
être dus aux variations de facteurs de risque :
environnementaux,
mais aussi socio-économiques,
ou comportementaux (tabagisme…).
JOSE, 6 septembre 2012
Plan
Cartographie du risque :
montrer des répartitions ou tendances spatiales.
Agrégats (spatiaux ou spatio-temporels) :
tester des répartitions ou tendances spatiales.
Modélisation spatiale :
expliquer des répartitions ou tendances spatiales.
JOSE, 6 septembre 2012
Trop = combien ?
Quand l'alarme de santé publique doit-elle se déclencher ?
Pour le charbon et la variole :
un cas (aucune analyse statistique n'est nécessaire) !
car maladies suffisamment rares et dangereuses.
Mais qu'en est-il d'une situation plus subtile ?
5 cas de grippe le même jour,
20 crises d'asthme dans le même quartier, etc.
On cherche à détecter des "anomalies" ou regroupements de
cas "inattendus", ou "agrégats" (ou "clusters").
JOSE, 6 septembre 2012
Questions
Les agrégats observés sont-ils dû à la variabilité aléatoire
"naturelle" dans la population d'étude ?
A quelle échelle géographique ces agrégats surviennent-ils ?
Ne sont-ils pas simplement le reflet d'une hétérogénéité
attendue dans la région d'étude (ex : ethnie…) ?
Sont-ils situés à proximité de points source de pollution, ou de
voies de transport ?
Les évènement de santé agrégés dans l'espace, le sont-ils
également dans le temps ?
JOSE, 6 septembre 2012
Interprétation
Qu'il existe ou non une authentique variation géographique
des risques, des agrégats apparaîtront toujours à l'œil nu :
l'être humain a tendance à rechercher des contrastes là où il
n'en existe pas,
faux positifs, générateurs de craintes infondées.
Comme dans toute recherche médicale, il est important de
vérifier si les résultats / contrastes observés peuvent être dus
au seul hasard.
Des dizaines de tests ont été décrits dans la littérature.
JOSE, 6 septembre 2012
"How bizarre?"
Calcul d'une statistique (variable selon le test) sur le jeu de
données observées, Tobs.
Simulation de k jeux de données (méthode de Monte Carlo).
Calcul de la statistique de test sur chaque jeu de données
simulées (T1,T2,…,Tk).
p = proportion des statistiques de test issues des simulations
excédant Tobs (fraction des T > Tobs).
JOSE, 6 septembre 2012
Le test de balayage spatial (SaTScan)
JOSE, 6 septembre 2012
Le test de balayage spatial
Pour chaque cercle :
on estime le nombre de cas observés et attendus à l'intérieur
et à l'extérieur,
on calcule la "vraisemblance" que le risque est plus élevé à
l'intérieur du cercle.
Comparaison des cercles :
le cercle (comprenant une ou plusieurs unités spatiales) à la
vraisemblance la plus élevée est considéré comme l'agrégat le
plus vraisemblable,
la localisation de l'agrégat n'est qu'indicative, ses limites étant
administratives.
JOSE, 6 septembre 2012
Etude de cas : sex-ratio
Le sex-ratio pourrait décroître en présence d'une pollution
environnementale, et donc représenter un indicateur de
surveillance sanitaire et environnementale.
Il se prête bien à l'utilisation du StaTScan (variable binaire)
pour mettre en évidence une éventuelle hétérogénéité
spatiale.
JOSE, 6 septembre 2012
Sex-ratio dans le département du Doubs
30
25
Count
Incinérateur
d'ordures
ménagères
Besançon
15
0.1
10
Proportion per bar
0.2
20
5
0
0.9
1.0
1.1
Sex ratio
0.0
1.2
Le Russey
250
200
0.2
[1.00 - 1.05[
Count
< 1.00
150
100
0.1
[1.05 - 1.10[
≥ 1.10
N
50
0
0
10
km
Proportion per bar
Sex ratio
5
10
Log likelihood ratio
0.0
15
Vraisemblance = 3,82, 292ème valeur sur 1000,
Seuil 5 % = 5,39
JOSE, 6 septembre 2012
p = 0,292
Plan
Cartographie du risque :
montrer des répartitions ou tendances spatiales.
Agrégats (spatiaux ou spatio-temporels) :
tester des répartitions ou tendances spatiales.
Modélisation spatiale :
expliquer des répartitions ou tendances spatiales.
JOSE, 6 septembre 2012
Objectifs
Ces études cherchent à décrire la relation entre la variation
spatiale d'une maladie et la variation spatiale d'une exposition.
L'unité statistique est une unité spatiale et non un individu.
L'objectif habituel est de transférer l'inférence du groupe à
l'individu.
Incidence
Incidence
Exposition
JOSE, 6 septembre 2012
Exposition
Intérêts
Examiner et générer de nouvelles hypothèses.
Étudier des expositions qui ne peuvent pas être mesurées
de façon pertinente au niveau individuel (radon, nitrates
dans l'eau de boisson, pollution atmosphérique…).
Possibilité d'étudier une population importante, et donc de
détecter des risques de faible amplitude.
Disponibilité fréquente de données de santé et d'expositions
environnementales, géocodées.
JOSE, 6 septembre 2012
Inconvénient : erreur écologique
Zone
%
cancer
1
A
C
B
r=1
A
0
B
0
C
E
1 % chapeau
C
T
1
5
5
4
_
E
JOSE, 6 septembre 2012
OR = 4/25 = 0,16
RR = 1/6:5/9 = 0,30
Modèles hybrides
L'objectif est de tirer parti des avantages respectifs des
modèles individuels et des modèles écologiques, tout en
minimisant leurs inconvénients.
Modèles multi-niveau ou hiérarchiques.
Méthodes statistiques complexes.
JOSE, 6 septembre 2012
Trachome de l'enfant au Mali
30% de prévalence dans les années 1990-2000.
A quel "niveau" préférentiel s'effectue la
contamination ?
Quels sont les facteurs de risque individuels, mais
aussi socio-démographiques et environnementaux ?
JOSE, 6 septembre 2012
Modèles multi-niveau
JOSE, 6 septembre 2012
Trachome de l'enfant au Mali
Mali
Village (n=203)
Niveau
%
Village
36,7
Concession
13,3
Mère
25,3
Enfant
24,7
Concession (n=2269)
Mère (n=6251)
Enfant (n=14627)
JOSE, 6 septembre 2012
Facteurs de risque
Village :
température annuelle moyenne, fraction d'ensoleillement,
jours de pluie,
association de femmes.
Concession :
poste de radio, mobilette.
Mère :
essuyage après la toilette de l'enfant.
Enfant :
âge entre 3 et 5 ans,
salissures sur le visage, mouches sur le visage.
JOSE, 6 septembre 2012
Conclusion
JOSE, 6 septembre 2012
L'analyse réfléchie, prudente et imaginative de la distribution spatiale
des maladies peut générer de nouvelles connaissances sur leurs
éventuelles causes environnementales et orienter les efforts de
prévention.
Les études géographiques sont capitales pour répondre aux
inquiétudes du public quand aux effets possibles de la pollution
environnementale sur la santé.
Il est donc essentiel de les conduire en respectant un haut standard
de qualité, tout en gardant à l'esprit les forces, les faiblesses, et la
complexité de ces méthodes.
JOSE, 6 septembre 2012
Je vous remercie de votre attention.
JOSE, 6 septembre 2012