ETUDES CAS-TEMOINS NICHEES AU SEIN DE COHORTES
Transcription
ETUDES CAS-TEMOINS NICHEES AU SEIN DE COHORTES
ETUDES CAS-TEMOINS NICHEES AU SEIN DE COHORTES ◆ "Nested case-control design" ◆ "Case-cohort design" F. Valente Département de biostatistique Atelier méthodo, avril 2004 INTRODUCTION ■ Etudes cas-témoins nichées dans une cohorte : ◆ ◆ ■ Point de départ : Etude de cohorte traditionnelle ⇒ cas incidents identifiés. Cas incidents comparés à un sous-échantillon de non- cas sélectionnés dans la cohorte. Deux designs selon mode de sélection des témoins: ◆ "Nested case-control" (Mantel (73), Liddel et al. (77)) ◆ "Case-cohort" (Prentice (86b)) 2 INTRODUCTION ■ Avantages par rapport à l'étude de cohorte ◆ Réduire le coût du recueil des covariables à l'entrée dans l'étude. Précision de l'estimation du RR est surtout fonction du nombre de cas incidents ⇒ taille importante des cohortes ⇒ limiter le recueil de covariables coûteuses à obtenir aux seuls cas et à un sous-échantillon de non-cas. ◆ Exemples : analyses biochimiques, questionnaires alimentaires. Prélèvement sanguin, questionnaire brut obtenus pour tous les sujets de la cohorte mais traités seulement pour les cas et le sous-échantillon de témoins. ◆ 3 INTRODUCTION ■ Avantages par rapport à une étude cas-témoins classique ◆ Evitent le biais de sélection lors du choix des témoins. ◆ Evitent les biais d'information. Permettent d'estimer les rapport de taux qui seraient obtenus si on analysait la cohorte entière avec le modèle des hazards proportionnels de Cox. ◆ 4 NESTED CASE-CONTROL DESIGN ■ SELECTION DU GROUPE TEMOIN (Lubin et al.(84); Robins et al.(86); Prentice(86a)) But : Eviter que la sélection des témoins ne soit biaisée par les perdus de vue ou "competing risks". ◆ Chaque cas incident est apparié à M témoins sélectionnés parmi les membres de la cohorte à risque pour la maladie juste avant le moment où le cas est diagnostiqué (risk set) = DENSITY SAMPLING. ◆ 5 Sujet er (1 cas) ----------------1 * Fin d'observation: * cas --------------------2----------------------------------------------------° ° non cas --------------------3 --------------° --------------------4----------------------------------° e --------------------5-------------------------------------* (2 cas) t risk set 1 : sujets nos 1 (1er cas), 2, 3, 4, 5 risk set 2 : sujets nos 5 (2e cas), 2, 4 6 NESTED CASE-CONTROL DESIGN ■ SELECTION DU GROUPE TEMOIN (suite) Point essentiel : sélection indépendante d'un risk set à l'autre. ◆ Reproduit la façon dont les non-cas sont traités dans une analyse de survie. ◆ Un témoin présent dans plusieurs "risk sets" peut être sélectionné plusieurs fois. ■ Tout témoin présent dans un "risk set" peut être sélectionné même si c'est un futur cas. ■ 7 NESTED CASE-CONTROL DESIGN ■ ANALYSE Les cas et les témoins sont appariés sur le temps d'observation⇒ en tenir compte dans l'analyse. ◆ But : estimer une mesure d'association entre les covariables et la maladie. ◆ Régression logistique conditionnelle : la fonction de vraisemblance développée pour la régression logistique conditionnelle est mathématiquement équivalente à la fonction de vraissemblance utilisée dans le modèle de Cox (Hazards proportionnels) si risk sets indépendants (Prentice et Breslow (78); Oakes (81); Prentice (86a)) ◆ 8 NESTED CASE-CONTROL DESIGN ■ ANALYSE : LOGICIELS Procédures de régression des hazards proportionnels stratifiée (strates = risk sets); par exemple : ◆ ● COXREG de SPSS (SPSS Inc, Chicago, Illinois,USA) ● PHREG de SAS (SAS Institute, Cary, North Carolina,USA) SCOX de SPIDA (Statistical Computing Lab., Macquarie Univ., Sydney, NSW, Australia) ● 9 NESTED CASE-CONTROL DESIGN ■ ANALYSE : LOGICIELS (suite) Procédures de régression logistique conditionnelle qui autorisent 1 cas et un nombre variable de témoins par cas; par exemple: ◆ CLOGISTIC de Epi Info (Centers for Disease Control and Prevention, Atlanta, Georgia, USA) ● EGRET (Cytel Software Corporation, Cambridge, Massachusetts, USA) ● 10 Exemple : modèle de Cox stratifié avec SPSS 11 12 ----------------- Variables in the Equation ---------Variable SELEN_3 SELEN_3(1) SELEN_3(2) B_CAROT3 B_CAROT3(1) B_CAROT3(2) CIGARETT B S.E. .5025 .2817 .2209 .2212 .5437 .4888 .9070 .2234 .2218 .2262 Wald df Sig 5.1769 5.1750 1.6222 6.8568 5.9211 4.8554 16.0791 2 1 1 2 1 1 1 .0751 .0229 .2028 .0324 .0150 .0276 .0001 13 95% CI for Exp(B) Variable Exp(B) SELEN_3(1) SELEN_3(2) B_CAROT3(1) B_CAROT3(2) CIGARETT 1.6528 1.3253 1.7224 1.6303 2.4769 Lower Upper 1.0720 .8592 1.1116 1.0555 1.5899 2.5481 2.0445 2.6689 2.5181 3.8586 14 NESTED CASE-CONTROL DESIGN ■ QUALITE DES ESTIMATEURS Si density sampling, les OR dérivés de la regression logistique conditionnelle sont des estimateurs non biaisés des RR que l'on aurait obtenus en analysant toute la cohorte. (Prentice et Breslow (78); Greenland et Thomas (82); Lubin et Gail (84)) ◆ Les erreurs standards des coefficients β sont plus grandes que celles obtenues avec l'ensemble de la cohorte ⇒ efficacité statistique plus faible que celle de l'analyse de l'ensemble de la cohorte ( Breslow et al.(83)) ◆ 15 NESTED CASE-CONTROL DESIGN ■ QUALITE DES ESTIMATEURS (suite) L'efficacité relative du nested case-control par rapport à l'analyse de la cohorte entière dépend de: ◆ ● Nombre de témoins par cas ● Grandeur du RR ● Proportion d'exposés chez les témoins en général, avec 3-4 témoins, l'efficacité est d'environ 70-80% ◆ Si RR important ( ≥ 5) et exposition rare (5 à 10 %) minimum 8 témoins pour atteindre 70% ◆ 16 CASE-COHORT DESIGN ■ SELECTION DU GROUPE TEMOIN Témoins sélectionnés à l'entrée dans l'étude (donc indépendamment du statut) par échantillonnage aléatoire et simple (ou stratifié) représentant une fraction α de la cohorte. ◆ L'analyse portera sur tous les cas incidents et les noncas sélectionnés pour la sous-cohorte. ◆ Parmi les cas incidents, une fraction α appartiendra à la sous-cohorte de témoins ⇒ utilisés comme témoins pour les cas qui leur sont antérieurs. ◆ 17 CASE-COHORT DESIGN ■ SELECTION DU GROUPE TEMOIN (suite) Les sujets de la sous-cohorte sont utilisés comme témoins pour tous les cas survenant pendant qu'ils sontà risque. ◆ Un cas incident qui n'appartient pasà la sous-cohorte, n'intervient que dans le risk set ùo se produit son ' échec' ⇒ les risk sets consécutifs ne sont pas nichés. ◆ Conséquence Risk sets non indépendants ⇒ On ne peut pas définir une fonction de vraisemblance mais une pseudo-vraisemblance (Prentice (86b)) ⇒ Les logiciels usuels ne peuvent être utilisés 18 CASE-COHORT DESIGN ■ ANALYSE (Barlow et al. (99)) Moyennant une manipulation des données, les procédures de régression de Cox pondérée autorisant l'introduction dutemps sous la forme (t début, t fin) des logiciels statistiques classiques (exemple: PHREG de SAS et COXPH de Splus) peuvent être utilisées pour estimer les paramètres β. ◆ 19 CASE-COHORT DESIGN ■ ANALYSE (suite) Les erreurs standards usuelles données par ces programmes ne peuvent être utilisées à cause de la non indépendance des risk sets. Différentes méthodes d'estimation de la variance ontété développées (Prentice(86b); Self et Prentice(88); Barlow(94)): l'estimation robuste de la variance de Barlow semble être la plus utilisée (macro SAS disponible sur internet). ◆ 20 CASE-COHORT DESIGN ■ ANALYSE (suite) L'analyse compliquée a freiné l'utilisation de ce design d'étudemais de nouveaux programmes apparaissent Programme EPICURE (Hirosoft International, Seattle, Washington, USA) ◆ SAS 8.1 propose une estimation robuste de la variance équivalente à celle de Barlow. ◆ 21 CASE-COHORT OU NESTED CASE-CONTROL CHOIX DU DESIGN ■ EFFICACITE RELATIVE L' efficacité relative de ces designs par rapport à l'analyse de la cohorte entière dépend du type de cohorte et n'est pas encore complètement étudiée (Self et Prentice (88); Langholz et Thomas (90, 91); Wacholder et al. (91)). ◆ Cohorte ouverte et/ou données censurées importantes (perdus de vue ou "competing risks") nested casecontrol ■ ■ Cohorte fermée et très peu de données censurées case-cohort 22 CASE-COHORT OU NESTED CASE-CONTROL CHOIX DU DESIGN ■ CONSIDÉRATIONS PRATIQUES L' efficacité relative des deux designs est en général acceptable si le nombre de témoins est suffisant ( > 70 %) ⇒ baser le choix sur des considérations pratiques (Wacholder (91)) ◆ Nested case-control : plus facile à analyser avec les logiciels statistiques classiques. ■ Case-cohort : - plus flexible : analyse de plusieurs "endpoints" ou selon différents axes du temps avec le même groupe témoin. - La sous-cohorte permet d'estimer la distribution, dans la cohorte entière, du facteur dont la 23 mesure est limitée à la sous-cohorte. ■