Plan d`analyses statistiques pour un essai clinique
Transcription
Plan d`analyses statistiques pour un essai clinique
DEVOIR – RECHERCHE CLINIQUE Plan d’analyse d’un essai thérapeutique Pierre-François BUSSON M2 MSR – Mars 2009 SOMMAIRE Contexte..................................................................................................................................... 3 Critères de jugement principaux et secondaires ................................................................... 4 Calcul du nombre de sujets nécessaire ................................................................................... 4 Variables à mesurer ................................................................................................................. 5 Traitement des données manquantes et aberrantes.............................................................. 5 Description des variables ......................................................................................................... 6 Croisement des variables ......................................................................................................... 6 Evaluation des critères de jugement....................................................................................... 6 1. Critère de jugement principal ............................................................................................. 6 2. Critères de jugement secondaires ....................................................................................... 7 2 CONTEXTE La poliomyélite est une infection virale dont les symptômes peuvent se révéler désastreux si le virus atteint la circulation sanguine. En effet, des paralysies sont susceptibles d’apparaître, ainsi que des atrophies musculaires. Il n’y a pas de remède contre cette maladie, on se focalise alors sur l’atténuation des symptômes, l’accélération du rétablissement et la prévention des complications. Le syndrome post-polio se traduit par une fatigue progressive, des douleurs, un affaiblissement des muscles et une atrophie, qui se manifestent plusieurs années après la rémission de la poliomyélite. On pense qu’il touche environ la moitié des survivants à la maladie. Le Modafinil est utilisé dans le traitement de la narcolepsie, et dans le traitement de la fatigue liée à d’autres affections, comme la sclérose multiple. Le but de cet essai est de déterminer si ce médicament est efficace dans le traitement de la fatigue chez les patients souffrant du syndrome post-polio. 3 CRITERES DE JUGEMENT PRINCIPAUX ET SECONDAIRES L’état de fatigue des patients participant à l’étude est mesuré au moyen de l’échelle FIS (Fatigue Impact Scale). Cette échelle est un ensemble de 40 questions auto-administrées, cotées de 0 à 4, que l’on peut regrouper en trois groupes : cognitif, physique et fonctionnement psychosocial. Les patients de l’étude remplissent ce questionnaire à plusieurs reprises : au début de la première période, au milieu de la première période (3 semaines), à la fin de la première période (6 semaines), à la fin de la période de wash-out, qui correspond au début de la deuxième période (8 semaines), au milieu de la deuxième période (11 semaines), et à la fin de la deuxième période (14 semaines). Afin de mesurer l’effet du médicament sur la fatigue, nous allons utiliser comme critère de jugement principal la différence entre le score à l’échelle FIS en début de période et le score à l’échelle FIS en fin de période. Etant donné que chaque patient reçoit successivement le traitement au Modafinil et un placebo, on aura deux évaluations du critère de jugement principal par individu. Les patients inclus dans l’étude remplissent de plus à chaque visite un questionnaire évaluant la dépression (par exemple l’échelle SCL90). Le premier critère de jugement secondaire pourra alors être la différence entre le score à l’échelle de dépression en début de période et le score à l’échelle de dépression en fin de période. On mesure ainsi l’effet qu’aurait une éventuelle réduction de la fatigue sur le moral des individus. On pourra de plus évaluer la tolérance du Modafinil en comparant le pourcentage d’effets indésirables survenus pendant la période de traitement au Modafinil au pourcentage d’effets indésirables survenus pendant la période de prise du placebo. CALCUL DU NOMBRE DE SUJETS NECESSAIRE On calcule le nombre de sujets nécessaire en utilisant la formule : On prendra un risque de 5%, donc zα/2 vaudra 1,96. La puissance sera fixée à 90% donc zpuis vaudra 1,28. On considèrera l’écart-type égal à 4, et on voudra mettre en évidence une différence de 3 points au minimum entre les deux périodes. On aboutit à un nombre total de sujets égal à 76, soit 38 sujets dans chaque groupe. Cependant, comme on réalise un essai en cross-over, on peut calculer le nombre de sujets réellement nécessaire grâce à la formule : n = (N / 2) x (1 - ρ) où ρ est le coefficient de corrélation entre les réponses de chaque sujet aux deux traitements, généralement estimé à 0,5. On obtient donc un nombre de sujets égal à 19 dans chaque groupe, soit 38 sujets à inclure au total. 4 VARIABLES A MESURER On considère que l’étude est multicentrique. La variable Centre devra impérativement être présente dans les données recueillies. Chaque sujet sera évidemment identifié par un numéro dans le jeu de données, afin de garantir son anonymat lors de l’analyse. Son sexe sera renseigné. Le numéro du groupe de traitement sera aussi inclus dans les données. On établira par exemple que le groupe 1 reçoit d’abord le Modafinil puis le placebo, et inversement pour le groupe 2. La base de données contiendra les antécédents médicaux de chaque sujet, ainsi que les résultats des différentes analyses qu’il passe en début d’étude. On peut envisager des analyses hématologiques, des tests de fonctionnement des reins, du foie et de la thyroïde, un électrocardiogramme et un électromyogramme. Les résultats de l’étude du sommeil des patients et de la ponction lombaire feront aussi partie des données recueillies. A la fin des périodes de traitement, on inclura dans le jeu de données les résultats du « journal de sommeil » que les patients auront rempli au cours de l’étude, de l’échelle de dépression et de l’échelle de fatigue. Les évènements adverses seront aussi renseignés. La totalité de ces variables ne servira pas dans l’étude décrite ici, mais on les renseigne quand même afin de constituer une base de données complète qui pourra être réutilisée pour des analyses ultérieures. TRAITEMENT DES DONNEES MANQUANTES ET ABERRANTES Dans le but d’éviter les données manquantes et aberrantes, on prévoit de réaliser un contrôle de qualité des données. Des Assistants de Recherche Clinique se déplaceront dans les différents centres afin de vérifier la concordance entre les données des cahiers d’observation et celles du dossier médical des patients. Si la proportion de sujets présentant des données manquantes ou aberrantes est inférieure à 5% par rapport au nombre total de sujets inclus, on retirera ces sujets de l’analyse. Dans le cas contraire, on utilisera la méthode LOCF (Last Observation Carried Forward) pour imputer les données manquantes, dans le cas des variables dont la mesure est répétée au cours de l’étude (échelle de fatigue, de dépression). Dans les autres cas, les données manquantes et aberrantes seront remplacées par les valeurs calculées par une imputation simple. Le modèle de prédiction utilisé contiendra toutes les autres variables. 5 DESCRIPTION DES VARIABLES La description des variables binaires se fera au moyen d’un simple tableau. Les variables qualitatives à plusieurs classes seront représentées avec des diagrammes en bâtons. On décrira les variables quantitatives par le biais d’histogrammes, et de statistiques simples comprenant la moyenne, l’écart-type, le minimum, le maximum, la médiane et l’intervalle interquartiles. CROISEMENT DES VARIABLES On étudiera ensuite les relations existant entre tous les couples de variables. Pour tester la liaison entre deux variables qualitatives, on utilisera le test du Chi-2, à condition que les effectifs théoriques calculés soient supérieurs à 5. Si ce n’est pas le cas on utilisera le test exact de Fischer. Pour le test de la liaison entre une variable qualitative et une variable quantitative, on emploiera le test de comparaison de moyennes de Student si la variable qualitative est binaire, si la variable quantitative suit une loi normale et si les variances sont égales dans les deux groupes. Si la normalité n’est pas respectée on utilisera un test de Mann & Whitney. Si la variable qualitative a plus de deux modalités on fera une analyse de variance, qui permet de comparer plusieurs moyennes. Enfin, la liaison entre deux variables quantitatives s’évalue au moyen d’un test de nullité du coefficient de corrélation entre ces deux variables. Il faut que l’une au moins des variables suive une loi normale pour que le test soit valide, cela sera vérifié au moyen des histogrammes réalisés lors de la description des variables. EVALUATION DES CRITERES DE JUGEMENT 1. CRITERE DE JUGEMENT PRINCIPAL Malgré la période de wash-out, on peut parfois observer une interaction entre le traitement et le placebo, l’effet carry-over. Cette interaction sera testée grâce à la statistique : Où AB représente la séquence traitement-placebo, alors que BA représente la séquence placebo-traitement. bAB et bBA représentent pour chaque sujet la somme des deux mesures du critère de jugement. S²b est la variance intergroupes. En l’absence d’interaction, la somme des deux périodes pour la séquence AB est égale à la somme des deux périodes pour la séquence BA. On compare donc les moyennes de bAB et bBA par un test de Student à 36 degrés de liberté. Si l’interaction ne se révèle pas significative, on teste l’effet période et l’effet traitement séparément en utilisant les statistiques : 6 wAB et wBA représentent pour chaque sujet la différence entre la mesure du critère de jugement réalisée à la première période et celle réalisée à la seconde période. C’est de nouveau un test de Student à 36 degrés de liberté qui permet de tester ces effets. 2. CRITERES DE JUGEMENT SECONDAIRES Le premier critère de jugement secondaire étant la différence entre le score à l’échelle de dépression en début de période et le score à l’échelle de dépression en fin de période, il s’évalue de la même manière que le critère de jugement principal. On teste d’abord l’interaction entre le Modafinil et le placebo, puis si cette interaction n’est pas significative, on évalue l’effet de la période et du traitement sur le score de dépression. Pour évaluer le deuxième critère de jugement secondaire, on comparera dans un premier temps le pourcentage d’évènements indésirables graves survenus lors de la prise du Modafinil dans le groupe prenant le traitement en première période, au pourcentage d’évènements indésirables graves survenus lors de la prise du Modafinil dans le groupe prenant le traitement en deuxième période. On fera la même comparaison pour le placebo. Si les deux tests se révèlent non significatifs – c'est-à-dire si la période n’a pas d’effet sur le nombre d’évènements indésirables graves – on comparera le pourcentage d’évènements indésirables graves survenus lors de la prise du Modafinil, toutes périodes confondues, au pourcentage d’évènements indésirables graves survenus lors de la prise du placebo, toutes périodes confondues. On utilisera pour ça des tests du Chi-2, ou des tests exacts de Fischer si les effectifs théoriques sont inférieurs à 5. 7