Principes statistiques de l`essai clinique
Transcription
Principes statistiques de l`essai clinique
Objectifs du cours Principes statistiques de l’essai clinique • • • • Rappeler le principe d’un test statistique Comprendre les risques associés Savoir poser les hypothèses dans le cadre de la recherche clinique Comprendre le problème des tests multiples Lectures à recommander Sylvie CHABAUD Unité de Biostatistique et d' Evaluation des Thérapeutiques • • • Centre Léon Bérard Lecture critique et interprétation des résultats des essais cliniques pour la pratique médicale. Cucherat, Lièvre, Leizorovicz, Boissel – Flammarion: Médecine-Science Méthodes statistiques appliquées à la recherche clinique en cancérologie. Kramar, Mathoulin-Pélissier – John Libbey eurotext, collection l’innovation thérapeutique en cancérologie Méthodes statistiques en expérimentation biologique. Lellouch, Lazar - Flammarion: Médecine-Science, collection statistique en biologie et médecine • Méthodes statistiques appliquées à la recherche clinique (+ Exercices corrigés). Laplanche, Com-Nougué, Flamant - Flammarion: Médecine-Science, collection statistique en biologie et médecine Principe des statistiques Estimation d’une réalité inconnue Essai clinique randomisé en 2 groupes parallèles Population générale Echantillonnage Réalité, inconnue échantillonnage (expérience) Patients inclus Randomisation (T=0) inférence (estimation) Groupe Traité Groupe Contrôle Suivi (T=t) Observation, mesure Mesure (T=24 mois) Taux de décès Risque T = 7.5% Risque C = 15% 1 Fluctuations aléatoires Fluctuations aléatoires Population générale Echantillon 1 Echantillon 2 Echantillon 3 Risque 1=9% Risque 2=12% Risque 3=16% Rt=9% Rc=9% Rt=6% Diff 1=0% Rc=18% Rt=19% Diff 2=9% • Fortes pour des effectifs petits et moyens • Faibles pour des grands effectifs • Jamais nulles Risque 4=26% Rc=13% Rt=25% Diff 3 = -6% Risque : Fréquence de survenue d’un événement Diff : Différence de risque contrôle - traité Echantillon 4 Rc=27% • Conséquences en pratique ? Diff 4 =2% Réelle différence ou fluctuation aléatoire ? Essai clinique randomisé en 2 groupes parallèles Problématique des comparaisons Population générale Echantillonnage • la différence observée de -7.5% est-elle ? Patients inclus Randomisation (T=0) – une manifestation des fluctuations aléatoires, donc due uniquement au hasard Groupe Traité Groupe Contrôle – la traduction d’une réelle différence entre les deux groupes, donc d’un effet non nul du traitement Suivi (T=t) Mesure (T=24 mois) Risque T = 7.5% Test statistique Risque C = 15% Différence de risque observée = 7.5% Réelle différence ou fluctuation aléatoire ? 2 Conséquences des fluctuations aléatoires sur les décisions Fluctuation aléatoire En pratique • Comment conclure ? Réelle différence – toute conclusion est potentiellement erronée Différence observée -7.5% • Test statistique – moyen de contrôler le risque d'erreur que l'on prend en faisant une conclusion (maîtrise du risque alpha) – permet de prendre une décision en connaissance de cause Si conclusion = ‘Il existe une différence’ Adoption le nouveau traitement Conclusion erronée Conclusion exacte Test statistique : interprétation Conséquences des fluctuations aléatoires : conclusions • A partir d’une différence observée – La conclusion « Il existe une différence » est elle exacte ou erronée ? Il est peu probable que la différence observée soit due au hasard Différence significative Différence observée Test la probabilité que la différence observée soit due au hasard est forte Différence non significative • Comment conclure ? Echantillon 3 Risque 3=16% – toute conclusion est potentiellement erronée • Test statistique – moyen de contrôler le risque d'erreur que l'on prend en faisant une conclusion – permet de prendre une décision en connaissance de cause Rt=19% Rc=13% Diff 3 = -6% Calcul de la probabilité p p : probabilité que la différence observée soit due uniquement au hasard p : représente le risque de faire une conclusion erronée si l'on décidait de conclure On ne conclut que si ce risque d'erreur est suffisamment petit 3 Test statistique Différence non significative • Seuil de risque de conclusion erronée acceptable Absence Absenceréelle réelle d'effet d'effet – seuil de risque alpha = 5% Résultat Résultat non nonsignificatif significatif • p < 5% – on prend le risque de conclure • p > 5% – on ne conclut pas ? Manque Manquede de puissance puissance • Impossible de conclure • Ne pas conclure à l’absence de différence • «L’absence de preuve n’est pas la preuve de l’absence» Essai clinique : hypothèses Risques d’erreur statistique H0 : Hypothèse nulle C’est l’hypothèse que l’on cherche à réfuter. C’est celle qui est vrai tant que l’on a pas démontré le contraire • Risque Alpha – Risque de conclure à une différence qui n’existe pas – Considérer comme efficace un traitement qui ne l’est pas H1 : Hypothèse alternative Hypothèse contraire de l’hypothèse nulle. C’est celle que l’on cherche à démontrer • – Risque de ne pas mettre en évidence une différence qui existe réellement – Ne pas conclure alors que le traitement est efficace Dans un protocole d’essai clinique : H0 : Taux de décès non différent entre les 2 bras de traitement H1 : Taux de décès différents entre les 2 bras de traitement En fin d’essai : On observe les taux de décès dans les 2 bras et on réalise un test. Si p < α : On rejette H0 et on accepte H1 Si p ≥ α : On conserve H0 Risque Béta • Puissance – (1-Béta) : Probabilité de mettre en évidence une différence qui existe réellement – Montrer l’efficacité d’un traitement réellement efficace 4 Risques d’erreur statistique Test statistique : conclusion • Risque Alpha : Vrai valeur Rt=12% Vrai valeur Rc=12% Échantillon Rt=7.5% Échantillon Rc=15% Risque Béta : Vrai valeur Rt=12% Échantillon 1 Rt=15% Vrai valeur RC=19% Échantillon 2 Rc=15% Différence non réelle Seuil de risque de conclusion erronée acceptable – seuil de risque alpha = 5% Il est peu probable que la différence observée soit due au hasard p < 5% Différence significative On peut conclure sans prendre trop de risque, à l'existence de la différence Différence observée Test p la probabilité que la différence observée soit due au hasard est forte Différence non significative p > 5% - Absence réelle d’effet ? - Manque de puissance ? On ne peut pas conclure Fausse absence de différence p : Probabilité que la différence observée soit due au hasard Puissance • • • Aptitude d'une comparaison à mettre en évidence une différence qui existe réellement Pour une situation donnée, dépend du nombre de sujets La puissance est fonction – – – – • du nombre de sujets : n de la taille de la différence réelle : d du risque de base du risque alpha choisi : a Essai clinique randomisé en 2 groupes parallèles Population générale Echantillonnage Patients inclus Randomisation (T=0) Groupe Traité Groupe Contrôle Conséquences des études sous dimensionnées : – estimation imprécise de l'effet – risque de ne pas mettre en évidence un traitement efficace (Forte probabilité d'obtenir un résultat négatif) • coût – Force de conviction faible des petits essais – Difficulté d'interprétation d'une différence non significative Suivi (T=t) Mesure (T=24 mois) Risque T = 7.5% Risque C = 15% Différence de risque observée = 7.5% Test statistique 5 Comparabilité initiale des 2 groupes Groupe Traité Comparaisons multiples Groupe Contrôle Critère Critère Aux dés, la probabilité d ’obtenir un six est plus forte avec 3 dés qu ’avec un seul Test 1 7.5% 0 24 mois t La différence observée en fin d’essai représente l’effet du traitement groupes initialement comparables 7.5% 0 24 mois t La différence observée en fin d’essai est identique à la différence initiale Risque de conclure à tort à une différence = 5% Test 2 Risque de conclure à tort à une différence = 5% Test 3 Risque de conclure à tort à une différence = 5% Test 4 Risque de conclure à tort à une différence = 5% Globalement, le risque de conclure à tort à une différence lors de ces 4 comparaisons est bien plus important que 5%. RANDOMISATION 6