Plan d`analyses statistiques pour un essai clinique

Transcription

Plan d`analyses statistiques pour un essai clinique
DEVOIR – RECHERCHE CLINIQUE
Plan d’analyse d’un essai thérapeutique
Pierre-François BUSSON
M2 MSR – Mars 2009
SOMMAIRE
Contexte..................................................................................................................................... 3
Critères de jugement principaux et secondaires ................................................................... 4
Calcul du nombre de sujets nécessaire ................................................................................... 4
Variables à mesurer ................................................................................................................. 5
Traitement des données manquantes et aberrantes.............................................................. 5
Description des variables ......................................................................................................... 6
Croisement des variables ......................................................................................................... 6
Evaluation des critères de jugement....................................................................................... 6
1. Critère de jugement principal ............................................................................................. 6
2. Critères de jugement secondaires ....................................................................................... 7
2
CONTEXTE
La poliomyélite est une infection virale dont les symptômes peuvent se révéler désastreux si
le virus atteint la circulation sanguine. En effet, des paralysies sont susceptibles d’apparaître,
ainsi que des atrophies musculaires. Il n’y a pas de remède contre cette maladie, on se focalise
alors sur l’atténuation des symptômes, l’accélération du rétablissement et la prévention des
complications.
Le syndrome post-polio se traduit par une fatigue progressive, des douleurs, un
affaiblissement des muscles et une atrophie, qui se manifestent plusieurs années après la
rémission de la poliomyélite. On pense qu’il touche environ la moitié des survivants à la
maladie.
Le Modafinil est utilisé dans le traitement de la narcolepsie, et dans le traitement de la fatigue
liée à d’autres affections, comme la sclérose multiple. Le but de cet essai est de déterminer si
ce médicament est efficace dans le traitement de la fatigue chez les patients souffrant du
syndrome post-polio.
3
CRITERES DE JUGEMENT PRINCIPAUX ET SECONDAIRES
L’état de fatigue des patients participant à l’étude est mesuré au moyen de l’échelle FIS
(Fatigue Impact Scale). Cette échelle est un ensemble de 40 questions auto-administrées,
cotées de 0 à 4, que l’on peut regrouper en trois groupes : cognitif, physique et
fonctionnement psychosocial. Les patients de l’étude remplissent ce questionnaire à plusieurs
reprises : au début de la première période, au milieu de la première période (3 semaines), à la
fin de la première période (6 semaines), à la fin de la période de wash-out, qui correspond au
début de la deuxième période (8 semaines), au milieu de la deuxième période (11 semaines),
et à la fin de la deuxième période (14 semaines). Afin de mesurer l’effet du médicament sur la
fatigue, nous allons utiliser comme critère de jugement principal la différence entre le score à
l’échelle FIS en début de période et le score à l’échelle FIS en fin de période. Etant donné que
chaque patient reçoit successivement le traitement au Modafinil et un placebo, on aura deux
évaluations du critère de jugement principal par individu.
Les patients inclus dans l’étude remplissent de plus à chaque visite un questionnaire évaluant
la dépression (par exemple l’échelle SCL90). Le premier critère de jugement secondaire
pourra alors être la différence entre le score à l’échelle de dépression en début de période et le
score à l’échelle de dépression en fin de période. On mesure ainsi l’effet qu’aurait une
éventuelle réduction de la fatigue sur le moral des individus.
On pourra de plus évaluer la tolérance du Modafinil en comparant le pourcentage d’effets
indésirables survenus pendant la période de traitement au Modafinil au pourcentage d’effets
indésirables survenus pendant la période de prise du placebo.
CALCUL DU NOMBRE DE SUJETS NECESSAIRE
On calcule le nombre de sujets nécessaire en utilisant la formule :
On prendra un risque de 5%, donc zα/2 vaudra 1,96. La puissance sera fixée à 90% donc zpuis
vaudra 1,28. On considèrera l’écart-type égal à 4, et on voudra mettre en évidence une
différence de 3 points au minimum entre les deux périodes. On aboutit à un nombre total de
sujets égal à 76, soit 38 sujets dans chaque groupe.
Cependant, comme on réalise un essai en cross-over, on peut calculer le nombre de sujets
réellement nécessaire grâce à la formule :
n = (N / 2) x (1 - ρ)
où ρ est le coefficient de corrélation entre les réponses de chaque sujet aux deux traitements,
généralement estimé à 0,5. On obtient donc un nombre de sujets égal à 19 dans chaque
groupe, soit 38 sujets à inclure au total.
4
VARIABLES A MESURER
On considère que l’étude est multicentrique. La variable Centre devra impérativement être
présente dans les données recueillies. Chaque sujet sera évidemment identifié par un numéro
dans le jeu de données, afin de garantir son anonymat lors de l’analyse. Son sexe sera
renseigné. Le numéro du groupe de traitement sera aussi inclus dans les données. On établira
par exemple que le groupe 1 reçoit d’abord le Modafinil puis le placebo, et inversement pour
le groupe 2.
La base de données contiendra les antécédents médicaux de chaque sujet, ainsi que les
résultats des différentes analyses qu’il passe en début d’étude. On peut envisager des analyses
hématologiques, des tests de fonctionnement des reins, du foie et de la thyroïde, un
électrocardiogramme et un électromyogramme. Les résultats de l’étude du sommeil des
patients et de la ponction lombaire feront aussi partie des données recueillies.
A la fin des périodes de traitement, on inclura dans le jeu de données les résultats du « journal
de sommeil » que les patients auront rempli au cours de l’étude, de l’échelle de dépression et
de l’échelle de fatigue. Les évènements adverses seront aussi renseignés.
La totalité de ces variables ne servira pas dans l’étude décrite ici, mais on les renseigne quand
même afin de constituer une base de données complète qui pourra être réutilisée pour des
analyses ultérieures.
TRAITEMENT DES DONNEES MANQUANTES ET ABERRANTES
Dans le but d’éviter les données manquantes et aberrantes, on prévoit de réaliser un contrôle
de qualité des données. Des Assistants de Recherche Clinique se déplaceront dans les
différents centres afin de vérifier la concordance entre les données des cahiers d’observation
et celles du dossier médical des patients.
Si la proportion de sujets présentant des données manquantes ou aberrantes est inférieure à
5% par rapport au nombre total de sujets inclus, on retirera ces sujets de l’analyse.
Dans le cas contraire, on utilisera la méthode LOCF (Last Observation Carried Forward) pour
imputer les données manquantes, dans le cas des variables dont la mesure est répétée au cours
de l’étude (échelle de fatigue, de dépression).
Dans les autres cas, les données manquantes et aberrantes seront remplacées par les valeurs
calculées par une imputation simple. Le modèle de prédiction utilisé contiendra toutes les
autres variables.
5
DESCRIPTION DES VARIABLES
La description des variables binaires se fera au moyen d’un simple tableau. Les variables
qualitatives à plusieurs classes seront représentées avec des diagrammes en bâtons. On décrira
les variables quantitatives par le biais d’histogrammes, et de statistiques simples comprenant
la moyenne, l’écart-type, le minimum, le maximum, la médiane et l’intervalle interquartiles.
CROISEMENT DES VARIABLES
On étudiera ensuite les relations existant entre tous les couples de variables.
Pour tester la liaison entre deux variables qualitatives, on utilisera le test du Chi-2, à condition
que les effectifs théoriques calculés soient supérieurs à 5. Si ce n’est pas le cas on utilisera le
test exact de Fischer.
Pour le test de la liaison entre une variable qualitative et une variable quantitative, on
emploiera le test de comparaison de moyennes de Student si la variable qualitative est binaire,
si la variable quantitative suit une loi normale et si les variances sont égales dans les deux
groupes. Si la normalité n’est pas respectée on utilisera un test de Mann & Whitney. Si la
variable qualitative a plus de deux modalités on fera une analyse de variance, qui permet de
comparer plusieurs moyennes.
Enfin, la liaison entre deux variables quantitatives s’évalue au moyen d’un test de nullité du
coefficient de corrélation entre ces deux variables. Il faut que l’une au moins des variables
suive une loi normale pour que le test soit valide, cela sera vérifié au moyen des
histogrammes réalisés lors de la description des variables.
EVALUATION DES CRITERES DE JUGEMENT
1. CRITERE DE JUGEMENT PRINCIPAL
Malgré la période de wash-out, on peut parfois observer une interaction entre le traitement et
le placebo, l’effet carry-over. Cette interaction sera testée grâce à la statistique :
Où AB représente la séquence traitement-placebo, alors que BA représente la séquence
placebo-traitement. bAB et bBA représentent pour chaque sujet la somme des deux mesures du
critère de jugement. S²b est la variance intergroupes. En l’absence d’interaction, la somme des
deux périodes pour la séquence AB est égale à la somme des deux périodes pour la séquence
BA. On compare donc les moyennes de bAB et bBA par un test de Student à 36 degrés de liberté.
Si l’interaction ne se révèle pas significative, on teste l’effet période et l’effet traitement
séparément en utilisant les statistiques :
6
wAB et wBA représentent pour chaque sujet la différence entre la mesure du critère de jugement
réalisée à la première période et celle réalisée à la seconde période. C’est de nouveau un test
de Student à 36 degrés de liberté qui permet de tester ces effets.
2. CRITERES DE JUGEMENT SECONDAIRES
Le premier critère de jugement secondaire étant la différence entre le score à l’échelle de
dépression en début de période et le score à l’échelle de dépression en fin de période, il
s’évalue de la même manière que le critère de jugement principal. On teste d’abord
l’interaction entre le Modafinil et le placebo, puis si cette interaction n’est pas significative,
on évalue l’effet de la période et du traitement sur le score de dépression.
Pour évaluer le deuxième critère de jugement secondaire, on comparera dans un premier
temps le pourcentage d’évènements indésirables graves survenus lors de la prise du Modafinil
dans le groupe prenant le traitement en première période, au pourcentage d’évènements
indésirables graves survenus lors de la prise du Modafinil dans le groupe prenant le traitement
en deuxième période. On fera la même comparaison pour le placebo. Si les deux tests se
révèlent non significatifs – c'est-à-dire si la période n’a pas d’effet sur le nombre
d’évènements indésirables graves – on comparera le pourcentage d’évènements indésirables
graves survenus lors de la prise du Modafinil, toutes périodes confondues, au pourcentage
d’évènements indésirables graves survenus lors de la prise du placebo, toutes périodes
confondues. On utilisera pour ça des tests du Chi-2, ou des tests exacts de Fischer si les
effectifs théoriques sont inférieurs à 5.
7