ETUDES CAS-TEMOINS NICHEES AU SEIN DE COHORTES

Transcription

ETUDES CAS-TEMOINS NICHEES AU SEIN DE COHORTES
ETUDES CAS-TEMOINS NICHEES
AU SEIN DE COHORTES
◆ "Nested case-control design"
◆ "Case-cohort design"
F. Valente
Département de biostatistique
Atelier méthodo, avril 2004
INTRODUCTION
■
Etudes cas-témoins nichées dans une cohorte :
◆
◆
■
Point de départ : Etude de cohorte traditionnelle ⇒
cas incidents identifiés.
Cas incidents comparés à un sous-échantillon de
non- cas sélectionnés dans la cohorte.
Deux designs selon mode de sélection des témoins:
◆
"Nested case-control" (Mantel (73), Liddel et al. (77))
◆
"Case-cohort" (Prentice (86b))
2
INTRODUCTION
■
Avantages par rapport à l'étude de cohorte
◆
Réduire le coût du recueil des covariables à l'entrée
dans l'étude.
Précision de l'estimation du RR est surtout fonction du
nombre de cas incidents ⇒ taille importante des cohortes
⇒ limiter le recueil de covariables coûteuses à obtenir
aux seuls cas et à un sous-échantillon de non-cas.
◆
Exemples : analyses biochimiques, questionnaires
alimentaires. Prélèvement sanguin, questionnaire brut
obtenus pour tous les sujets de la cohorte mais traités
seulement pour les cas et le sous-échantillon de témoins.
◆
3
INTRODUCTION
■
Avantages par rapport à une étude cas-témoins classique
◆
Evitent le biais de sélection lors du choix des témoins.
◆
Evitent les biais d'information.
Permettent d'estimer les rapport de taux qui seraient
obtenus si on analysait la cohorte entière avec le modèle
des hazards proportionnels de Cox.
◆
4
NESTED CASE-CONTROL DESIGN
■
SELECTION DU GROUPE TEMOIN
(Lubin et al.(84); Robins et al.(86); Prentice(86a))
But : Eviter que la sélection des témoins ne soit
biaisée par les perdus de vue ou "competing risks".
◆
Chaque cas incident est apparié à M témoins
sélectionnés parmi les membres de la cohorte à risque
pour la maladie juste avant le moment où le cas est
diagnostiqué (risk set) = DENSITY SAMPLING.
◆
5
Sujet
er
(1
cas)
----------------1
*
Fin d'observation: * cas
--------------------2----------------------------------------------------°
° non cas
--------------------3 --------------°
--------------------4----------------------------------°
e
--------------------5-------------------------------------* (2 cas)
t
risk set 1 : sujets nos 1 (1er cas), 2, 3, 4, 5
risk set 2 : sujets nos 5 (2e cas), 2, 4
6
NESTED CASE-CONTROL DESIGN
■
SELECTION DU GROUPE TEMOIN (suite)
Point essentiel : sélection indépendante d'un risk set à
l'autre.
◆
Reproduit la façon dont les non-cas sont traités dans
une analyse de survie.
◆
Un témoin présent dans plusieurs "risk sets" peut être
sélectionné plusieurs fois.
■
Tout témoin présent dans un "risk set" peut être
sélectionné même si c'est un futur cas.
■
7
NESTED CASE-CONTROL DESIGN
■
ANALYSE
Les cas et les témoins sont appariés sur le temps
d'observation⇒ en tenir compte dans l'analyse.
◆
But : estimer une mesure d'association entre les
covariables et la maladie.
◆
Régression logistique conditionnelle : la fonction de
vraisemblance développée pour la régression logistique
conditionnelle est mathématiquement équivalente à la
fonction de vraissemblance utilisée dans le modèle de
Cox (Hazards proportionnels) si risk sets indépendants
(Prentice et Breslow (78); Oakes (81); Prentice (86a))
◆
8
NESTED CASE-CONTROL DESIGN
■
ANALYSE : LOGICIELS
Procédures de régression des hazards proportionnels
stratifiée (strates = risk sets); par exemple :
◆
●
COXREG de SPSS (SPSS Inc, Chicago, Illinois,USA)
●
PHREG de SAS (SAS Institute, Cary, North Carolina,USA)
SCOX de SPIDA (Statistical Computing Lab., Macquarie
Univ., Sydney, NSW, Australia)
●
9
NESTED CASE-CONTROL DESIGN
■
ANALYSE : LOGICIELS (suite)
Procédures de régression logistique conditionnelle qui
autorisent 1 cas et un nombre variable de témoins par cas;
par exemple:
◆
CLOGISTIC de Epi Info (Centers for Disease Control and
Prevention, Atlanta, Georgia, USA)
●
EGRET (Cytel Software Corporation, Cambridge,
Massachusetts, USA)
●
10
Exemple : modèle de Cox stratifié avec SPSS
11
12
----------------- Variables in the Equation ---------Variable
SELEN_3
SELEN_3(1)
SELEN_3(2)
B_CAROT3
B_CAROT3(1)
B_CAROT3(2)
CIGARETT
B
S.E.
.5025
.2817
.2209
.2212
.5437
.4888
.9070
.2234
.2218
.2262
Wald
df
Sig
5.1769
5.1750
1.6222
6.8568
5.9211
4.8554
16.0791
2
1
1
2
1
1
1
.0751
.0229
.2028
.0324
.0150
.0276
.0001
13
95% CI for Exp(B)
Variable
Exp(B)
SELEN_3(1)
SELEN_3(2)
B_CAROT3(1)
B_CAROT3(2)
CIGARETT
1.6528
1.3253
1.7224
1.6303
2.4769
Lower
Upper
1.0720
.8592
1.1116
1.0555
1.5899
2.5481
2.0445
2.6689
2.5181
3.8586
14
NESTED CASE-CONTROL DESIGN
■
QUALITE DES ESTIMATEURS
Si density sampling, les OR dérivés de la regression
logistique conditionnelle sont des estimateurs non
biaisés des RR que l'on aurait obtenus en analysant
toute la cohorte. (Prentice et Breslow (78); Greenland et Thomas
(82); Lubin et Gail (84))
◆
Les erreurs standards des coefficients β sont plus
grandes que celles obtenues avec l'ensemble de la
cohorte ⇒ efficacité statistique plus faible que celle
de l'analyse de l'ensemble de la cohorte
(
Breslow
et al.(83))
◆
15
NESTED CASE-CONTROL DESIGN
■
QUALITE DES ESTIMATEURS (suite)
L'efficacité relative du nested case-control par rapport
à l'analyse de la cohorte entière dépend de:
◆
●
Nombre de témoins par cas
●
Grandeur du RR
●
Proportion d'exposés chez les témoins
en général, avec 3-4 témoins, l'efficacité est d'environ
70-80%
◆
Si RR important ( ≥ 5) et exposition rare (5 à 10 %)
minimum 8 témoins pour atteindre 70%
◆
16
CASE-COHORT DESIGN
■
SELECTION DU GROUPE TEMOIN
Témoins sélectionnés à l'entrée dans l'étude (donc
indépendamment du statut) par échantillonnage aléatoire
et simple (ou stratifié) représentant une fraction α de la
cohorte.
◆
L'analyse portera sur tous les cas incidents et les noncas sélectionnés pour la sous-cohorte.
◆
Parmi les cas incidents, une fraction α appartiendra à
la sous-cohorte de témoins ⇒ utilisés comme témoins
pour les cas qui leur sont antérieurs.
◆
17
CASE-COHORT DESIGN
■
SELECTION DU GROUPE TEMOIN (suite)
Les sujets de la sous-cohorte sont utilisés comme
témoins pour tous les cas survenant pendant qu'ils sontà
risque.
◆
Un cas incident qui n'appartient pasà la sous-cohorte,
n'intervient que dans le risk set ùo se produit son '
échec'
⇒ les risk sets consécutifs ne sont pas nichés.
◆
Conséquence
Risk sets non indépendants ⇒ On ne peut pas définir une
fonction de vraisemblance mais une pseudo-vraisemblance
(Prentice (86b)) ⇒ Les logiciels usuels ne peuvent être utilisés
18
CASE-COHORT DESIGN
■
ANALYSE (Barlow et al. (99))
Moyennant une manipulation des données, les
procédures de régression de Cox pondérée autorisant
l'introduction dutemps sous la forme (t début, t fin) des
logiciels statistiques classiques (exemple: PHREG de SAS
et COXPH de Splus) peuvent être utilisées pour estimer
les paramètres β.
◆
19
CASE-COHORT DESIGN
■
ANALYSE (suite)
Les erreurs standards usuelles données par ces
programmes ne peuvent être utilisées à cause de la
non indépendance des risk sets. Différentes méthodes
d'estimation de la variance ontété développées (Prentice(86b);
Self et Prentice(88); Barlow(94)): l'estimation robuste de la
variance de Barlow semble être la plus utilisée (macro SAS
disponible sur internet).
◆
20
CASE-COHORT DESIGN
■
ANALYSE (suite)
L'analyse compliquée a freiné l'utilisation de ce design
d'étudemais de nouveaux programmes apparaissent
Programme EPICURE (Hirosoft International, Seattle,
Washington, USA)
◆
SAS 8.1 propose une estimation robuste de la variance
équivalente à celle de Barlow.
◆
21
CASE-COHORT OU NESTED CASE-CONTROL
CHOIX DU DESIGN
■
EFFICACITE RELATIVE
L' efficacité relative de ces designs par rapport à l'analyse de
la cohorte entière dépend du type de cohorte et n'est pas
encore complètement étudiée (Self et Prentice (88); Langholz et
Thomas (90, 91); Wacholder et al. (91)).
◆
Cohorte ouverte et/ou données censurées importantes
(perdus de vue ou "competing risks")
nested casecontrol
■
■
Cohorte fermée et très peu de données censurées
case-cohort
22
CASE-COHORT OU NESTED CASE-CONTROL
CHOIX DU DESIGN
■
CONSIDÉRATIONS PRATIQUES
L' efficacité relative des deux designs est en général
acceptable si le nombre de témoins est suffisant ( > 70 %) ⇒
baser le choix sur des considérations pratiques (Wacholder (91))
◆
Nested case-control : plus facile à analyser avec les
logiciels statistiques classiques.
■
Case-cohort : - plus flexible : analyse de plusieurs
"endpoints" ou selon différents axes du temps avec le
même groupe témoin.
- La sous-cohorte permet d'estimer la
distribution, dans la cohorte entière, du facteur dont la
23
mesure est limitée à la sous-cohorte.
■