Principes des études diagnostiques

Transcription

Contexte
Principes des études
diagnostiques
Caroline Elie
URC Paris Centre
Hôpital Necker
symptômes
1
2
Objectifs d’une étude diagnostique
Démarche diagnostique
Symptômes, histoire de la
maladie, ATCD, examens
complémentaire…
=Evaluation d’un nouveau test diagnostique

Probabilité pré-test
= prévalence de la maladie

Résultats du test

Un préalable = fiabilité (reproductibilité)
Apport informationnel = qualité du test :
augmenter la certitude de la présence ou
de l’absence de maladie (validité)
Ensuite = apport décisionnel : améliorer la
prise en charge clinique et l’évolution clinique
Probabilité post-test
3
Created with novaPDF Printer (www.novaPDF.com). Please register to remove this message.
4
Fiabilité


Validité
Fiabilité = propriété d’un test dont les résultats
peuvent être reproduits aussi longtemps que les
conditions du test ne changent pas
= mesure de la concordance entre deux
mesures répétées (reproductibilité) :




2 mesures de deux observateurs différents
(repro inter-observateurs )
2 mesures d’un même observateur
(repro intra-observateur)
Validité = propriété d’un test qui se
définit par la capacité à mesurer ce qu’il
est censé mesurer (ici la maladie)
Comparaison par rapport à un test de
référence (appelé « gold standard »)
5
6
Etude diagnostique : principe général
Symptômes, histoire de la
maladie, ATCD, examens…

Échantillon de patients suspectés
d’avoir la maladie
Nouveau test

Test de référence
Une « maladie » : le plus souvent une
maladie particulière, mais aussi un
stade de maladie, une mutation …
Un « test » : un examen de laboratoire,
d'imagerie, des épreuves fonctionnelles,
l'anatomopathologie, un signe clinique…
Confrontation des résultats
7
8
Un exemple

Etude diagnostique : résultats
Diagnostic de corps étranger intra-bronchique
chez l’enfant


Test de référence
Test de référence = endoscopie bronchique (invasif)
Nouveau test = le scanner (non invasif mais ne
permet pas l’extraction)
 Évaluation des performances du scanner
Nouveau
test
Malade
M+
Non malade
M-
Positif T+
Vrais positifs
VP
Faux positifs
FP
Négatif T-
Faux négatifs Vrais négatifs
FN
VN
9
Les indices informationnels
10
Test de référence
Test de référence
Nouveau
test
M+
M-
Nouveau
test
M+
M-
T+
T-
VP
FN
FP
VN
T+
T-
95
10
35
70
Sensibilité
Spécificité
Sensibilité
Spécificité
proportion de tests (+) chez
les malades
proportion de tests (-) chez
les non-malades
proportion de tests+ chez
les malades
proportion de tests- chez les
non-malades
Se=P(T+/M+)
Sp=P(T-/M-)
Se=95/(95+10)
Sp=70/(70+35)
Se=VP/(VP+FN)
Sp=VN/(FP+VN)
Se=90%
Sp=67%
11
12
Interprétation


Sensibilité = P(T+/M+) : capacité à
détecter les malades (dépistage)
Spécificité = P(T-/M-) : capacité à
détecter les non malades
Nouveau
test
T+
T-
Test de référence
Valeur Prédictive Positive
M+
M-
proportion de malades parmi les
patients ayant un test (+)
VP
FN
FP
VN
VPP=P(M+/T+)
VPP=VP/(VP+FP)
Valeur Prédictive Négative
proportion de non-malades parmi les
patients ayant un test (-)
VPN=P(M-/T-)
VPN=VN/(FN+VN)
VVP = proba post-test
13
14
Test de référence
Nouveau
test
T+
T-
M+
M-
95
35
10
70
Interprétation
Valeur Prédictive Positive
VPP=95/(95+35)
VPP=73%

VPP = P(M+/T+) et VPN = P(M-/T-)
Probabilités post-test
VVP = proba post-test
Valeur Prédictive Négative
VPN=70/(10+70)
VPN=88%
15
16
Test quantitatif (ex: dosage)
Courbe ROC
Le nouveau test est une mesure continue (dosage)
→ trouver un seuil
Sujets non malades
Sujets malades
VN
VP
FN FP
S
T-
Valeurs du Test
T+
 FP
 FN
17
18
Recherche diagnostique
Courbe ROC : exemple
Exemple : diagnostic de l’insuffisance cardiaque
gauche par le dosage du BNP
100%
80
(Sackett, BMJ, 2002)
40
sensibilité
80%
60%
Phase I : les résultats du test sont-il différents
chez les malades et chez les sujets normaux?

200
40%
20%
0%
0%
20%
40%
60%
80%
100%
1-spécificité
19
20
Recherche diagnostique (Sackett, BMJ, 2002)

Phase II : les patients ayant un résultat positif au test sontils plus susceptibles d’avoir la maladie que les autres ?

Phase III : le test permet-il de distinguer les malades des
non malades parmi les patients suspects de présenter la
maladie ?
21

22
Planification de l’étude
1) Population (design, mode de recrutement,
nb sujets, spectre…)
2) Le test de référence (choix, propriétés…)
3) Le nouveau test (propriétés, exécution…)
4) Déroulement de l’étude (vérification, critère
de jugement…)
5) Interprétation des tests (modalités de
lecture)
6) Analyse (analyse de sous-groupes,
précision, résultats indéterminés, seuil…)
Phase IV : les patients bénéficiant du test seront-ils
dans un meilleur état de santé que des patients
similaires n’ayant pas eu le test ?
→ Essais randomisés
23
24
Population

1) La population



Cas témoins ou étude transversale/cohorte ?
Nombre de sujets
Prospectif ou rétrospectif
Sélection des patients :




Critères d’inclusion, de non inclusion
Caractéristiques démographiques
Prévalence de la maladie
Sévérité de la maladie
25
(non malades)
2 témoins par cas
1 témoin par cas
M+ M40
T-
60 70
100 150
10
50
80
T+ 40
20 60
T- 10
30 40
50
Cas témoins: problèmes

M+ M-
T+ 40
26
population
Cas (malades) témoins



Sens=80%
Spe=60%
VPP=50%
VPN=86%




population
Choix du rapport cas\témoins (ou prévalence de
la maladie)
 modifie les performances du test
50 100


population
Sens=80%
Spe=60%
VPP=67% 
VPN=75% 
Choix des cas et des témoins :


27
Cas très malades (the sickest of the sick) :  Se
Témoins très normaux (the wellest of the well) :  Spe
28
population
Caractéristiques démographiques



Performances d’un test variables en fonction
des caractéristiques de la population +++
 biais de sélection
Population : résumé

Représentativité de la population cible ++
Description de la population : au moins age,
sexe, symptomatologie, stade de la maladie
+ variables pertinentes pour maladie étudiée
 donne une idée de la représentativité des
sujets inclus (validité externe)



Choix de la population +++
 « cohorte » : échantillon représentatif de la
population cible du test, patients inclus
consécutivement
 cas témoins : biais +++
Calcul d’un nombre de sujets nécessaire
Critères d’inclusion et de non inclusion pertinents
Description de la population +++
29
32
Choix du test de référence

2) Test de référence
(« Reference standard », « gold standard »)






33
population
test référence
Admis comme la référence pour établir le
diagnostic final
Bonnes propriétés métrologiques (fiable)
Doit pouvoir être appliqué à tous les sujets
Identique pour tous les sujets et ne doit pas être
modifié en cours d’étude
Modalités de réalisation standardisées
Définition des critères de positivité
Fait par ceux qui le font en pratique
34
test référence
Pas de bon test de référence



Solutions
Souvent !
Si imparfait ? Erreurs de classifications
Si moins bon que le nouveau test ? Erreurs de

classifications

Si n’existe pas ? Dans certaines pathologies

(psychiatrie, migraine, syndrome, maladies
infectieuses…)


Si existe mais très invasif ? Laparotomie pour

douleurs abdominales…
Critère pragmatique (exple : valeur
seuil d’un questionnaire mesurant la
dépression)
Panel d’experts indépendants
Suivi clinique
Autre ?
35
36
Le nouveau test
3) Le nouveau test

(« Index test »)





37
test référence
nouveau test
Bonnes propriétés métrologiques (fiable)
Doit pouvoir être appliqué à tous les sujets
Identique pour tous les sujets et ne doit
pas être modifié en cours d’étude
Modalités de réalisation standardisées
Définition des critères de positivité
Entrainement +/- nécessaire
38
vérification
Test de référence et vérification
Biais de vérification (« verification bias »
ou « work-up bias »)
4) Déroulement de l’étude

Si les deux tests sont effectués à des
temps « éloignés » :


Evolution propre de la maladie
Evolution liée au traitement : le traitement
est débuté sur le résultat du test effectué
en premier
39
Biais de vérification

vérification
Si absence de vérification systématique par
le test de référence


40
Surtout quand le test de référence est invasif :

Diagnostic de maladie coronarienne

Si une partie des patients seulement sont
vérifiés par le test de référence (souvent pas
chez les négatifs au nouveau test)
Si le test de référence n’est pas le même en
fonction du résultat du nouveau test



Nouveau test : scintigraphie de perfusion au thallium
(non invasif)
Référence : coronarographie (invasif)
Diagnostic de trisomie 21

41
vérification
Nouveau test : clarté nucale (non invasif)
Référence : amniocentèse (invasif)
42
Effect of study design on the association between nuchal
translucency (NT) measurement and Down syndrome
Mol BW, Obstetrics & Gynecology, 1999, 94(5 part 2):864-9.
Études avec biais de vérification (n=10)
Études sans biais de vérification (n=15)
T21
NT+
Nuchal translucency measurement and Down syndrome
caryotype
normal
NT
T21
NT-
fœtus/bébé
normal
sen
avec biais de vérification 77%
sans biais de vérification 55%
Problème : si T21, fausses couches spontanées
 si NT+ : diagnostic posé dans 100% des cas
 si NT- : diagnostic posé dans <100% des cas


spé
97%
96%
prév
0,4%
1,1%
vérification
Tous les patients doivent avoir le nouveau
test ET le test de référence, dans un laps
de temps minimum
5) Interprétation
Si impossible (trop coûteux ou trop
risqué), obtention du diagnostic possible
par le suivi, plus ou moins long, des
patients
45
46
Lecture des tests

interprétation
L’interprétation d’un test est influencée par le
résultat de l’autre test (non indépendance de
l’interprétation des deux tests)
Informations cliniques

 Évaluations indépendantes, en « aveugle »

lecture
Disponibilité et utilisation de l’information clinique
pour interpréter le nouveau test et\ou le test de
référence
Modifie le résultat du nouveau test (et du test de
référence)… mais plus proche de la pratique


Contre (évaluation des propriétés du test seul)
Pour : « Accuracy of diagnostic test with and without
clinical information ». Loy CT et al, JAMA 2004
47
48
Précision des indices informationnels

6) Analyse
Toujours associer une estimation
ponctuelle d’un intervalle de confiance
Résultats précis :
sens = 80% [78-82]
 Manque de précision :
sens = 80% [61-99]

49
50
Résultats indéterminés




analyse
Parfois informatifs !
Nécessitent de répéter le test ou de faire
des investigations supplémentaires
Ex : patients qui n’atteignent pas la FC
max lors d’une épreuve d’effort, gaz
digestifs à la radio…
Fait partie des critères de qualité d’un test
Résultats indéterminés


Préciser leur fréquence
Préciser la façon dont ils ont été analysés
(si classés +  sens et  spé, si classés – c’est
l’inverse, exclusion des sujets) et\ou analyses
de sensibilité (classés + puis -)

Pas de biais s’ils sont peu nombreux,
aléatoires et que le test est répétable
51
Analyse par sous-groupes


analyse
analyse
52
Exemple
analyse
Présenter les performances dans les sousgroupes appropriés (âge, sévérité…) à
moins que le spectre de la maladie soit
réduit
Recommandé mais…


Limites des analyses en sous-groupe
Préférer la modélisation
53
Courbes ROC de l’ACE dans le diagnostic de
cancer colorectal
54
Évaluation d’une étude diagnostique

Évaluation d’une étude diagnostique
Grille STARD (http://www.stard-statement.org)
Éléments devant figurer dans un article rapportant les
résultats d’une étude diagnostique


Exemple Item 4 : Décrire le recrutement des participants : le
recrutement était-il fondé sur des symptômes présentés, sur des
résultats d'examens antérieurs ou sur le fait que les participants
ont subi le nouvel test ou le test de référence ?
Grille QUADAS (http://www.biomedcentral.com/14712288/3/25)
Évaluation de la qualité des études diagnostiques à
inclure dans les revues systématiques
55
STARD
METHODES
Participants
56
STARD
METHODES
Décrire
3 la population étudiée : les critères d’inclusion et d’exclusion, la
mise en oeuvre, les structures et les lieux où les données ont
été collectées
4 le recrutement des participants : était-il fondé sur des
symptômes présentés, des résultats d’examens antérieurs ou
sur le fait que le nouveau test ou le test de référence a été
réalisé chez les participants ?
Méthodes
des tests
Décrire
7
le test de référence et son rationnel
8
les spécifications techniques des matériaux et des méthodes
utilisés, y compris comment et quand les mesures ont été
réalisées ou/et citer les références utilisées pour le nouveau test
et pour le test de référence
9
la définition et le rationnel pour les unités, les seuils et/ou les
catégories utilisées pour exprimer les résultats du nouveau test
et du test de référence
5 l’échantillonnage des participants : s’agissait-il d’une série
consécutive de participants définis par des critères de sélection
des items (3) et (4) ? Si non, spécifier la façon dont les patients
ont été sélectionnés.
10 le nombre, la formation et le degré d’expertise des personnes
(a) réalisant et (b) interprétant le nouveau test et le test de
référence
6 la collecte des données : le recueil des données a-t-il été
planifié avant que le nouveau test et le test de référence aient
été réalisés (étude prospective) ou après (étude rétrospective) ?
11 si les évaluateurs du nouveau test, respectivement du test de
référence, ont réalisé en aveugle (masqués) la lecture de l’un, et
de l’autre test ; et toute autre information clinique dont ils
disposaient
57
58
STARD
RESULTATS
Résultats
des tests
STARD
RESULTATS
Notifier
17 l’intervalle de temps entre la réalisation du nouveau test et du
test de référence et tout traitement administrer dans l’intervalle
Estimation
18 la distribution de la sévérité de la maladie (définir des critères)
chez ceux qui présentent l’affection étudiée ; décrire les autres
diagnostics pour les participants ne présentant pas l’affection
étudiée
19 un tableau croisé des résultats du nouveau test (incluant les
données manquantes ou indéterminées) selon les résultats du
test de référence ; pour les résultats de variables continues,
décrire la distribution des résultats du nouveau test selon les
résultats du test de référence
DISCUSSION
Notifier
22
comment les résultats indéterminés, les réponses
manquantes, et les “outliers” du nouveau test ont été pris en
compte
23
les estimations de la variabilité de la précision diagnostique
entre sous-groupes de participants, évaluateurs ou centres,
le cas échéant
24
les estimations de la reproductibilité, le cas échéant
25
Discuter de l’applicabilité clinique des résultats de l’étude
20 tout événement indésirable résultant de la réalisation du
nouveau test et du test de référence
21 les estimations de la précision diagnostique et des mesures
d’incertitude statistique (i.e. intervalles de confiance 95%)
59
60

Principes des études diagnostiques

Transcription

Documents pareils

PROTOCOLE D`INTERVENTION EN CAS D

PROJET D`ACCUEIL INDIVIDUALISE

Je n`ai pas d`utérus - Hôpital Necker

Programme de l`Internat en Pharmacie

Printer HEAVY T

Morsures - Vazquez - 08-09-2015