Principes statistiques de l`essai clinique

Transcription

Principes statistiques de l`essai clinique
Objectifs du cours
Principes statistiques
de l’essai clinique
•
•
•
•
Rappeler le principe d’un test statistique
Comprendre les risques associés
Savoir poser les hypothèses dans le cadre de la recherche clinique
Comprendre le problème des tests multiples
Lectures à recommander
Sylvie CHABAUD
Unité de Biostatistique et d' Evaluation des Thérapeutiques
•
•
•
Centre Léon Bérard
Lecture critique et interprétation des résultats des essais cliniques pour la pratique
médicale. Cucherat, Lièvre, Leizorovicz, Boissel – Flammarion: Médecine-Science
Méthodes statistiques appliquées à la recherche clinique en cancérologie. Kramar,
Mathoulin-Pélissier – John Libbey eurotext, collection l’innovation thérapeutique en cancérologie
Méthodes statistiques en expérimentation biologique. Lellouch, Lazar - Flammarion:
Médecine-Science, collection statistique en biologie et médecine
•
Méthodes statistiques appliquées à la recherche clinique (+ Exercices corrigés).
Laplanche, Com-Nougué, Flamant - Flammarion: Médecine-Science, collection statistique en biologie
et médecine
Principe des statistiques
Estimation d’une réalité inconnue
Essai clinique randomisé en 2 groupes parallèles
Population générale
Echantillonnage
Réalité,
inconnue
échantillonnage
(expérience)
Patients inclus
Randomisation (T=0)
inférence
(estimation)
Groupe Traité
Groupe Contrôle
Suivi (T=t)
Observation,
mesure
Mesure (T=24 mois)
Taux de décès
Risque T = 7.5%
Risque C = 15%
1
Fluctuations aléatoires
Fluctuations aléatoires
Population générale
Echantillon 1
Echantillon 2
Echantillon 3
Risque 1=9%
Risque 2=12%
Risque 3=16%
Rt=9%
Rc=9%
Rt=6%
Diff 1=0%
Rc=18%
Rt=19%
Diff 2=9%
• Fortes pour des effectifs petits et moyens
• Faibles pour des grands effectifs
• Jamais nulles
Risque 4=26%
Rc=13%
Rt=25%
Diff 3 = -6%
Risque : Fréquence de survenue d’un événement
Diff : Différence de risque contrôle - traité
Echantillon 4
Rc=27%
• Conséquences en pratique ?
Diff 4 =2%
Réelle différence ou fluctuation aléatoire ?
Essai clinique randomisé en 2 groupes parallèles
Problématique des comparaisons
Population générale
Echantillonnage
• la différence observée de -7.5% est-elle ?
Patients inclus
Randomisation (T=0)
– une manifestation des fluctuations aléatoires,
donc due uniquement au hasard
Groupe Traité
Groupe Contrôle
– la traduction d’une réelle différence entre les
deux groupes,
donc d’un effet non nul du traitement
Suivi (T=t)
Mesure (T=24 mois)
Risque T = 7.5%
Test statistique
Risque C = 15%
Différence de risque
observée = 7.5%
Réelle différence ou fluctuation aléatoire ?
2
Conséquences des fluctuations aléatoires sur les décisions
Fluctuation
aléatoire
En pratique
• Comment conclure ?
Réelle
différence
– toute conclusion est potentiellement erronée
Différence observée
-7.5%
• Test statistique
– moyen de contrôler le risque d'erreur que l'on
prend en faisant une conclusion (maîtrise du
risque alpha)
– permet de prendre une décision en
connaissance de cause
Si conclusion = ‘Il existe une différence’
Adoption le nouveau traitement
Conclusion
erronée
Conclusion
exacte
Test statistique : interprétation
Conséquences des fluctuations aléatoires : conclusions
•
A partir d’une différence observée
– La conclusion « Il existe une différence » est elle exacte
ou erronée ?
Il est peu probable que la
différence observée soit due
au hasard
Différence significative
Différence
observée
Test
la probabilité que la
différence observée soit due
au hasard est forte
Différence non significative
•
Comment conclure ?
Echantillon 3
Risque 3=16%
– toute conclusion est potentiellement erronée
•
Test statistique
– moyen de contrôler le risque d'erreur que l'on prend en
faisant une conclusion
– permet de prendre une décision en connaissance de
cause
Rt=19%
Rc=13%
Diff 3 = -6%
Calcul de la probabilité p
p : probabilité que la différence observée soit due uniquement au hasard
p : représente le risque de faire une conclusion erronée si l'on décidait de
conclure
On ne conclut que si ce risque d'erreur est suffisamment petit
3
Test statistique
Différence non significative
• Seuil de risque de conclusion erronée
acceptable
Absence
Absenceréelle
réelle
d'effet
d'effet
– seuil de risque alpha = 5%
Résultat
Résultat
non
nonsignificatif
significatif
• p < 5%
– on prend le risque de conclure
• p > 5%
– on ne conclut pas
?
Manque
Manquede
de
puissance
puissance
• Impossible de conclure
• Ne pas conclure à l’absence de différence
• «L’absence de preuve n’est pas la preuve
de l’absence»
Essai clinique : hypothèses
Risques d’erreur statistique
H0 : Hypothèse nulle
C’est l’hypothèse que l’on cherche à réfuter.
C’est celle qui est vrai tant que l’on a pas démontré le contraire
•
Risque Alpha
– Risque de conclure à une différence qui n’existe pas
– Considérer comme efficace un traitement qui ne l’est pas
H1 : Hypothèse alternative
Hypothèse contraire de l’hypothèse nulle.
C’est celle que l’on cherche à démontrer
•
– Risque de ne pas mettre en évidence une différence qui existe
réellement
– Ne pas conclure alors que le traitement est efficace
Dans un protocole d’essai clinique :
H0 : Taux de décès non différent entre les 2 bras de traitement
H1 : Taux de décès différents entre les 2 bras de traitement
En fin d’essai :
On observe les taux de décès dans les 2 bras et on réalise un test.
Si p < α : On rejette H0 et on accepte H1
Si p ≥ α : On conserve H0
Risque Béta
•
Puissance
– (1-Béta) : Probabilité de mettre en évidence une différence qui
existe réellement
– Montrer l’efficacité d’un traitement réellement efficace
4
Risques d’erreur statistique
Test statistique : conclusion
•
Risque Alpha :
Vrai valeur
Rt=12%
Vrai valeur
Rc=12%
Échantillon
Rt=7.5%
Échantillon
Rc=15%
Risque Béta :
Vrai valeur
Rt=12%
Échantillon 1
Rt=15%
Vrai valeur
RC=19%
Échantillon 2
Rc=15%
Différence
non réelle
Seuil de risque de conclusion erronée acceptable
– seuil de risque alpha = 5%
Il est peu probable que la différence
observée soit due au hasard
p < 5% Différence significative
On peut conclure sans prendre trop de
risque, à l'existence de la différence
Différence
observée
Test
p
la probabilité que la différence observée
soit due au hasard est forte
Différence non significative
p > 5%
- Absence réelle d’effet ?
- Manque de puissance ?
On ne peut pas conclure
Fausse absence
de différence
p : Probabilité que la différence observée soit due au hasard
Puissance
•
•
•
Aptitude d'une comparaison à mettre en évidence une différence qui
existe réellement
Pour une situation donnée, dépend du nombre de sujets
La puissance est fonction
–
–
–
–
•
du nombre de sujets : n
de la taille de la différence réelle : d
du risque de base
du risque alpha choisi : a
Essai clinique randomisé en 2 groupes parallèles
Population générale
Echantillonnage
Patients inclus
Randomisation (T=0)
Groupe Traité
Groupe Contrôle
Conséquences des études sous dimensionnées :
– estimation imprécise de l'effet
– risque de ne pas mettre en évidence un traitement efficace (Forte
probabilité d'obtenir un résultat négatif)
• coût
– Force de conviction faible des petits essais
– Difficulté d'interprétation d'une différence non significative
Suivi (T=t)
Mesure (T=24 mois)
Risque T = 7.5%
Risque C = 15%
Différence de risque
observée = 7.5%
Test statistique
5
Comparabilité initiale des 2 groupes
Groupe Traité
Comparaisons multiples
Groupe Contrôle
Critère
Critère
Aux dés, la probabilité d ’obtenir un six est
plus forte avec 3 dés qu ’avec un seul
Test 1
7.5%
0
24 mois
t
La différence observée en fin d’essai
représente l’effet du traitement
groupes initialement comparables
7.5%
0
24 mois
t
La différence observée en fin d’essai
est identique à la différence initiale
Risque de
conclure à tort à
une différence
= 5%
Test 2
Risque de
conclure à tort à
une différence
= 5%
Test 3
Risque de
conclure à tort à
une différence
= 5%
Test 4
Risque de
conclure à tort à
une différence
= 5%
Globalement, le risque de
conclure à tort à une différence
lors de ces 4 comparaisons est
bien plus important que 5%.
RANDOMISATION
6