Le risque relatif d`une maladie sachant un test positif est

Transcription

Le risque relatif d`une maladie sachant un test positif est
Les tests diagnostiques : ce dont on parle.
Claudine Schwartz
Le dépistage de nombreuses pathologies repose en partie, mais en partie seulement,
sur les résultats d’un ou plusieurs tests. Dans un monde parfait, un test dirait à coup sûr si on
est malade, ou si on ne l’est pas. La réalité est évidemment autre, et différents paramètres
doivent être introduits pour pouvoir interpréter un test diagnostique. A quoi servent ces
paramètres ? Nous proposons d’en délimiter le sens et les usages, en distinguant deux points
de vue. Celui de la « santé publique » qui porte son regard sur toute la population et celui d’un
individu qui cherche à savoir s’il est ou non malade.
I- Le point de vue de la santé publique
On dispose d’un test dépistage d’une
certaine maladie M. On aimerait savoir au
minimum quel pourcentage de cas seront
repérés par ce test.
Lorsqu’un fabriquant livre un test, il fournit en général deux caractéristiques techniques :
La sensibilité
C’est la probabilité d’avoir un test positif sachant qu’on a la pathologie M ; nous la
noterons PM (T+).
On souhaite que la sensibilité soit proche de 1.
Avec une sensibilité 0,8, environ 80% des malades auront un test positif (ce sont les
«vrais positifs ») et seront ainsi repérés ; 20% auront un test négatif (ce sont les « faux
négatifs ») et sont susceptibles de ne pas recevoir les soins appropriés. Ces résultats portent
sur l’ensemble de la population ciblée par le test et est donc d’intérêt pour les institutions de
santé publique. Ils ne sont pas interprétables pour un usager individuel du test qui ignore s’il
est malade et qui utilise le test pour le savoir (voir la partie II : le point de vue de l’individu).
La spécificité
Un test toujours positif aurait une sensibilité égale à 1, et n’aurait pourtant aucun intérêt : on
ne peut pas se contenter, pour juger de l’efficacité d’un test, de sa seule sensibilité. Une
mesure de la spécificité du test vis à vis de M doit être connue. Cette mesure est ici la
probabilité d’avoir un test négatif sachant qu’on n’a pas la pathologie M ; nous la noterons
1
P M (T-).
On souhaite que la spécificité soit proche de 1.
Si un test a une spécificité 0,9, environ 90% de ceux qui ne sont pas atteints par M auront
un test négatif (ce sont les «vrais négatifs ») ; 10% auront un test positifs (ce sont les « faux
positifs ») et seront inquiétés à tort par le fait d’avoir subi le test.
De nombreux tests reposent sur la valeur de certaines variables
(marqueurs spécifiques, etc.). Si X est une telle variable, avec
une tendance à être plus élevée chez les malades, on fixe un
seuil a : le test sera dit positif pour X>a (ou X≥a) et négatif
sinon. Dans cette situation, si on élève le seuil a, la sensibilité
diminue, mais la spécificité augmente et si on abaisse a, c’est
l’inverse : il y a donc un choix à optimiser qui peut être soutenu
par une représentation graphique (voir courbes ROC
http://pagesperso-orange.fr/jpq/proba/roc/index.html).
Pour éviter de manipuler deux paramètres, on caractérise souvent un test par son
rapport de vraisemblance, noté LR d’après la terminologie anglaise (Likelihood Ratio) :
PM (T  )
Sensibilit é
LR=

1  Spécificit é PM (T  )
Ainsi, un test qui a une sensibilité 0,8 et une spécificité 0,9 a un rapport de
vraisemblance LR=0,8/0,1=8. Cela signifie qu’un individu malade a 8 fois plus de chances
d’avoir un test positif qu’un individu non atteint par M.
On notera que le rapport de vraisemblance ne dépend pas de la probabilité P(M) (appelée
prévalence de la pathologie) d’être malade dans la population ciblée par le test, au moment ou
celui-ci sera utilisé (une telle prévalence est en effet susceptible d’évoluer au cours du temps).
Le rapport de vraisemblance est un paramètre technique propre au test.
Remarques :
Le test étant utilisé dans le processus de diagnostic de la pathologie M, une exigence minimale est que le
rapport de vraisemblance soit supérieur à 1. Il en découle que la probabilité d’avoir un test positif est plus élevée
chez les malades que dans la population ciblée, quelque soit la prévalence P(M) de la pathologie.
P (T+) = PM(T+) × P (M) + P M (T+) × (1-P (M)) < PM(T+)
Combinaisons de tests
Considérons deux tests T1 et T2 relatifs à la même maladie M. Savoir que l’un des deux est
positif (resp. négatif) rend plus probable la probabilité d’avoir (ou de ne pas avoir) M et donc
que le second test soit positif. Autrement dit, les résultats des tests ne sont pas indépendants.
Par contre, il arrive fréquemment que les résultats des tests soient indépendants
conditionnellement au fait d’avoir ou non la maladie M, soit :
PM( T1 et T2 )= PM( T1 )× PM( T2 )
P M ( T1 et T2 )= P M ( T1 )× P M ( T2 )
Supposons qu’il en soit ainsi. Un test T construit en disant qu’il est positif si et
seulement si les deux tests T1 et T2 le sont admet alors pour rapport de vraisemblance le
produit des rapports des deux tests :
2
PM (Ti  )
PM (Ti  )
Si on combine de même plusieurs tests ayant entre eux cette propriété d’indépendance
conditionnelle, le rapport de vraisemblance final est le produit des rapports de chacun d’eux.
LR=LR1× LR2
où
LRi 
Remarques :
-L’hypothèse d’indépendance conditionnelle est néanmoins assez forte : pour combiner des résultats de tests et
inclure des facteurs de risques (tels l’âge) pour aider au diagnostic, d’autres techniques sont souvent plus
pertinente (la régression logistique notamment).
-La sensibilité et la spécificité sont intrinsèques au test et s’appliquent sur toute population sous réserve que
celle-ci ne soit pas définie à partir d’un critère en interaction avec les résultats de ce test. En effet, imaginons que
T1 et T2 n’aient pas la propriété d’indépendance conditionnelle énoncée ci-dessus et que lorsqu’un individu est
malade un seul des deux tests puisse être positif, l’autre étant alors forcément négatif. Si on se restreint à la
population des individus pour lesquels le premier test est positif, la sensibilité dans cette population du deuxième
test est alors nulle.
II- Le point de vue d’un usager
Abordons maintenant le point de vue du
médecin et de son patient : on connaît le
résultat du test, on cherche à inférer la
probabilité que l’individu soit ou non atteint
par la pathologie M.
- Si le test est positif, on s’intéresse à la probabilité d’avoir effectivement la pathologie ; cette
probabilité, appelée la valeur prédictive positive s’écrit aussi :
P(T   M )
PM (T  )
VPP = PT  (M)=
= P(M) 
P(T  )
P(T  )
D’après la remarque ci-dessus, PM (T  ) P(T  ) >1, la valeur prédictive est toujours supérieure à la
prévalence p=P(M) de la pathologie dans la population cible du test (soit : VPP>p).
On peut exprimer ce paramètre en fonction des caractéristiques du test, et en particulier de sa
vraisemblance :
p  LR
VPP=
1  p  ( LR  1)
Cette écriture fait bien apparaître la dépendance de la VPP par rapport à p : il n’est pas
intuitif a priori que la performance d’un test, en termes de diagnostic individuel, dépend de la
prévalence de la pathologie dans la population à laquelle appartient l’individu. Mais on peut le
comprendre avec un exemple :
Soit un test ayant une sensibilité 0,8 et une spécificité 0,9 et dix mille résultats de ce test. Supposons
que la pathologie ait une faible prévalence, disons p=1/100, ce qui correspond à environ 100 malades pour les
10 000 individus testés ; le nombre de vrais positifs est de l’ordre de 0,8×100=80 ; le nombre de faux positifs est
de l’ordre de 0,1× 9 900=990 ; il y a ainsi environ 990+80=1 070 tests positifs, dont 80 seulement correspondant
à des malades : les faux positifs sont beaucoup plus nombreux que les vrais positifs. On a : VPP=80/1070= 0,075
3
(7,5%) : c’est faible ; néanmoins l’information apportée par le résultat positif du test a multiplié par 7,5 la
probabilité d’être malade.
Par contre si la pathologie est fréquente, le test devient un bon prédicteur de M : comme on peut le voir
sur le graphique ci-dessous, si p=0,3,VPP≈0,78 et si p=0,5, VPP≈0,9 (on a ici LR=8)
Remarque : Imaginons qu’on fasse passer deux tests T1 et T2 indépendants conditionnellement au fait d’avoir
ou non la maladie. Si le premier test est positif, l’individu se trouve avoir une probabilité p1 d’être malade qui
est la VPP de ce test. Si le second test est positif, la probabilité p12 d’être malade est donnée par la VPP du
second test, calculée pour une population où la prévalence de M est p1. On trouve alors :
p12=
p1  LR2
p  LR1  LR2
p  LR1  LR2


1  p1  ( LR2  1) 1  p  ( LR1  1)  p  LR1  ( LR2  1) 1  p  ( LR1  LR2  1)
On retrouve, fort heureusement, que p12 est la VPP du test combiné T1 et T2 , dont nous avons vu que la
vraisemblance était le produit des vraisemblances de chaque test.
- Si le test est négatif, on s’intéresse à la probabilité de ne pas avoir la pathologie ; cette
probabilité, appelée la valeur prédictive négative est :
P(T   M )
PM (T  )
VPN = PT  ( M )=
= P( M ) 
P(T  )
P(T  )
Un raisonnement analogue à celui qui a été fait précédemment montre que PM (T  ) P(T  ) >1. La
valeur prédictive négative est toujours supérieure à la probabilité 1-p de ne pas avoir la pathologie
dans la population cible du test, autrement dit le résultat négatif du test apporte lui aussi de
l’information vis-à-vis de l’absence de M.
On peut exprimer ce paramètre en fonction des caractéristiques du test :
(1  p)  sp
VPN=
p  (1  se)  (1  p)  sp
Comme la VPP, la VPN dépend de la prévalence.
Pour symétriser au niveau des calculs la situation entre VPP et VPN, on pourrait introduire une rapport
de vraisemblance négative (LR*=sp/(1-se)) pour avoir une formule analogue à celle de la VPP, soit ici VPN=
q×LR*/ (1+q×(LR*-1)), avec q=1-p) mais ce n’est pas l’usage.
4
Reprenons l’exemple précédent. Soit un test ayant une sensibilité 0,8 et une spécificité 0,9 et dix mille
résultats de ce test. Supposons que la pathologie ait une faible prévalence, disons p=1/100, ce qui correspond à
environ 100 malades pour les 10 000 individus testés ; le nombre de vrais négatifs serait de l’ordre de
0,9×9900=8910 ; le nombre de faux négatifs serait de l’ordre de 0,2×100=20 ; il y aura ainsi 8910+20=8930 tests
négatifs, dont 8910 correspondant à des malades : les vrais négatifs sont beaucoup plus nombreux que les faux
négatifs et on aura : VPN=8910/8930= 0,998 (99,8%) ; l’information apportée par le résultat négatif du test
permet de passer d’une probabilité 0,99 à une probabilité 0,998 de ne pas être atteint de la pathologie M. Le
résultat constitue ainsi un argument fort en faveur de l’absence de pathologie. Dans le cadre de dépistage
automatique, ce test peut servir à éliminer de individus jugés indemnes de M, les autres (ceux qui ont un test
positif) subissant de nouvelles procédures de diagnostic.
De même qu’on a synthétisé la spécificité et la sensibilité avec un seul paramètre, le
rapport de vraisemblance, on peut synthétiser les deux paramètres VPP et VPN en un seul qui
est appelé risque relatif dans le champ d’étude des facteurs de risques. 1
RR(T+)=
P (M )
VVP
 T
1  VPN PT  ( M )
Un risque relatif de 8 indique qu’on a 8 fois plus de chances d’être atteint de M si on a un test
positif que si on a un test négatif.
En conclusion, quatre paramètres sont utilisés lorsqu’on parle de test diagnostique en
médecine :
-la sensibilité se et la spécificité sp. Ce sont des paramètres techniques intrinsèques au test et
qui permettent d’évaluer sa qualité au niveau d’une population. Le rapport de vraisemblance
combine ces deux paramètres.
-les valeurs prédictives positive et négative VPP et VPN qui renseignent l’individu sur ses
chances d’être malade ou non, calculées à partir de l’information apportée par le résultat de
son test. Ces paramètres dépendent à la fois des caractéristiques du test et de la prévalence de
la pathologie dans la population. La VPP et la VPN sont d’autant meilleures que la sensibilité
et la spécificité sont élevées, mais plus la pathologie est rare, meilleure est la VPN et moins
bonne est la VPP. Le rapport VPP/(1-VPN), appelé risque relatif est le rapport de la
probabilité d’être malade dans les populations test positif et à test négatif.
Au temps des oracles on n’avait pas à
réfléchir, toutes ces considérations étaient
hors propos….mais l’espérance de vie était
courte.
1
Avoir un test positif peut en effet être assimilé à un « facteur de risque » d’avoir la maladie M, facteur à
prendre en compte dans un processus de diagnostic.
5