méthodologie des essais cliniques dans le domaine de la douleur

Transcription

méthodologie des essais cliniques dans le domaine de la douleur
17/10/02
16:12
Page 1
MÉTHODOLOGIE DES ESSAIS CLINIQUES DANS LE DOMAINE DE LA DOULEUR
UPSA couv Méthodologie
MÉTHODOLOGIE
DES ESSAIS CLINIQUES
DANS LE DOMAINE
DE LA DOULEUR
Upsa Méthodo essais 2002
18/10/02
15:57
Page 1
MÉTHODOLOGIE
DES ESSAIS CLINIQUES
DANS LE DOMAINE
DE LA DOULEUR
Upsa Méthodo essais 2002
18/10/02
15:57
Page 2
MÉTHODOLOGIE DES ESSAIS CLINIQUES
DANS LE DOMAINE DE LA DOULEUR
Dr Jacques Wrobel, Coordinateur
INSTITUT UPSA DE LA DOULEUR
3, rue Joseph Monier - BP325
92506 Rueil-Malmaison Cedex
Tél : 01 58 83 89 94
Fax : 01 58 83 89 01
E-mail : [email protected]
Site : institut-upsa-douleur.org
Les notions exposées dans ce livre sont destinées
à compléter et non à remplacer les connaissances médicales
des professionnels formés en la matière.
Les auteurs et le coordinateur déclinent toute responsabilité
directe ou indirecte dans l’usage
pouvant être fait de cet ouvrage.
ISBN : 2 - 910844 - 10 - 2
Conception A Éditorial Paris 01 42 40 23 00
Illustration de couverture d’après René Descartes
Dépôt légal 4e trimestre 2002
Upsa Méthodo essais 2002
18/10/02
15:57
Page 3
MÉTHODOLOGIE
DES ESSAIS CLINIQUES
DANS LE DOMAINE
DE LA DOULEUR
“En médecine, ce qui n’est pas scientifique
n’est pas éthique”
Pr Jean Bernard
Upsa Méthodo essais 2002
18/10/02
15:57
Page 4
LES AUTEURS
Nadine ATTAL
C.E.T.D., Hôpital Ambroise Paré, 92104 Boulogne-Billancourt cedex
Éric BOCCARD
Laboratoire BMS-UPSA, 92506 Rueil-Malmaison cedex
François BOUREAU
C.E.T.D., Hôpital Saint-Antoine, 75012 Paris
Paul DESJARDINS
SCIREX Corp. Austin,Texas, U.S.A.
Jules DESMEULES
Division de Pharmacologie Clinique, Hôpital Cantonal
1211 Genève, Suisse
Claude DUBRAY
Laboratoire de Pharmacologie, Faculté de médecine
63001 Clermont-Ferrand cedex
Jocelyne FEINE
Faculté de médecine dentaire, Université McGill,
H3A2B2, Montréal PQ, Canada
Dominique FLETCHER
C.E.T.D., Hôpital Ambroise Paré, 92104 Boulogne-Billancourt cedex
Hervé GANRY
Laboratoire BMS-UPSA, 92506 Rueil-Malmaison cedex
Annie GAUVAIN-PIQUARD
Unité de Psychiatrie et d'Onco-Psychologie, Institut Gustave Roussy
94805 Villejuif cedex
Michel LANTERI-MINET
C.E.T.D., Hôpital Pasteur, 06002 Nice cedex
Jacques WROBEL
Institut UPSA de la Douleur, 92506 Rueil-Malmaison cedex
Remerciements : au Dr François CHAST et à Dorothée WROBEL
pour leur relecture “méthodique” concernant le fond et la forme.
4
Upsa Méthodo essais 2002
18/10/02
15:57
Page 5
SOMMAIRE
■ 1. Introduction ----------------------------------------------------------------------------------------------------------------------------------------------------- 7
Jean-Marie Besson
■ 2. Principes méthodologiques
généraux des essais cliniques ----------------------------------------------------------------------------Claude Dubray
9
■ 3. Évaluation de la douleur --------------------------------------------------------------------------------------- 29
• Évaluation de la douleur provoquée
chez le volontaire sain
Claude Dubray
• Évaluation de la douleur clinique chez l'adulte - - - - - - - - - - - 43
François Boureau
• Évaluation de la douleur clinique chez l'enfant - - - - - - - - - - - - 55
Annie Gauvain-Piquard
• Le soulagement : indice de la douleur - - - - - - - - - - - - - - - - - - - - 63
ou de la qualité de vie
Jocelyne Feine
• Place de la pharmacocinétique
dans les essais cliniques des antalgiques
Jules Desmeules
• Le développement clinique des antalgiques - - - - - - - - - - - - - - - - 73
Hervé Ganry
• Les paramètres de quantification de l'efficacité - - - - - - - - - - - - - 85
clinique des antalgiques
Paul Desjardins
• Les standards de quantification de l'efficacité - - - - - - - - - - - - - - 91
clinique des antalgiques
Claude Dubray
• L'antalgique de secours dans les essais cliniques - - - - - - - - - - - - 97
Éric Boccard
• Les contraintes des essais cliniques en pédiatrie - - - - - - - - - - - 109
Jacques Wrobel
SOMMAIRE
■ 4. Essais cliniques des antalgiques -------------------------------------------------- 67
…/…
5
Upsa Méthodo essais 2002
18/10/02
15:57
Page 6
■ 5. Essais cliniques
dans les pathologies douloureuses ---------------------------------------- 115
• Évaluation de la douleur post-opératoire
Dominique Fletcher
• Exigences méthodologiques pour les essais - - - - - - - - - - - - - - 121
thérapeutiques dans les douleurs neuropathiques
Nadine Attal
• Méthodes de développement clinique - - - - - - - - - - - - - - - - - - 129
des anti-migraineux
Michel Lantéri-Minet
6
Upsa Méthodo essais 2002
18/10/02
15:57
Page 7
1. INTRODUCTION
Jean-Marie Besson
Unité 161, INSERM, Paris
Président du Conseil Scientifique, Institut UPSA de la Douleur
De nouvelles méthodes ont permis d’améliorer sensiblement l’évaluation et le traitement de la douleur. Cependant, en raison des
impératifs de maîtrise des dépenses de santé, les laboratoires pharmaceutiques doivent évaluer les substances antalgiques qu’ils
commercialisent avec une rigueur croissante. Une rigueur identique
est exigée pour l’évaluation des traitements non pharmacologiques,
par exemple certaines techniques de neurostimulation. Dans ce
domaine, les sanctions ne se font pas attendre puisque les compagnies d’assurances de certains États américains refusent d’ores et déjà
de financer la neurostimulation. Par ailleurs, il faut savoir qu’au
Royaume-Uni, les dépenses afférentes au traitement journalier d’un
douloureux chronique sont chiffrées au dixième de livre près.
Mon expérience m’a appris que le traitement de la douleur était un
domaine thérapeutique très sensible aux phénomènes de mode.
Régulièrement, de nouvelles substances connaissent leur heure de
gloire dans toutes les publications et dans tous les pays. Mais ces
produits miracles présentés dans les congrès ne se révèlent pas toujours
aussi efficaces sur le terrain, ce qui explique que nous accordions une
importance croissante à l’évaluation.
Il faut tenir compte des différences entre les pathologies dans l’évaluation des substances et des techniques antidouleur. Par exemple, si
l’on ne prend pas en considération le fait que la douleur neuropathique revêt des tableaux très différents selon les syndromes dont
souffrent les patients, les données obtenues sont très hétérogènes.
Dès lors, on comprend très bien pourquoi l’utilisation de certaines
substances pharmacologiques dans les neuropathies est si controversée. Dans l’intérêt des patients, il faut espérer que nous saurons
isoler les syndromes de la neuropathie pour lesquels des molécules
spécifiques présenteront une action bénéfique.
INTRODUCTION
■ LES PROGRÈS CONSTATÉS DANS L’ÉVALUATION
DE LA DOULEUR
7
Upsa Méthodo essais 2002
8
18/10/02
15:57
Page 8
Upsa Méthodo essais 2002
18/10/02
15:57
Page 9
2. PRINCIPES MÉTHODOLOGIQUES
GÉNÉRAUX DES ESSAIS CLINIQUES
Claude Dubray
■ LA MÉTHODOLOGIE
◗ Définition
La méthodologie appliquée aux essais cliniques est un ensemble de
règles qui a pour objectif d’en garantir la validité scientifique. La valeur
des conclusions que l’on tire d’une étude dépend donc étroitement de
la méthodologie qui a été mise en œuvre.
Schématiquement, on distingue deux grandes catégories que sont les
études descriptives et les études explicatives.
Les études descriptives
On classe dans cette catégorie les comptes rendus de cas, les séries de
cas cliniques ou les enquêtes démographiques.
Leur objectif vise essentiellement à révéler et à documenter des
observations cliniques, de faire partager des idées nouvelles ou de
générer des hypothèses. On ne doit pas leur en demander plus et, dès
que l’on veut raisonner en termes de causalité, il faut avoir recours à
des études explicatives.
Les études explicatives
Elles peuvent être fondées sur l’observation ou sur une expérimentation véritable.
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
◗ Choix d’un type d’étude adapté aux objectifs
de la recherche
9
Upsa Méthodo essais 2002
18/10/02
15:57
Page 10
• Les études explicatives basées sur l’observation
Elles recouvrent essentiellement le domaine de l’épidémiologie. Selon
le mode de recueil des données, on parle d’études “cas-témoins”,
d’études en cohorte ou d’analyses transversales. Dans tous les cas, les
données sont recueillies et analysées sans intervenir sur la situation des
sujets observés.
Le plus souvent, on a recours à ces études pour faire apparaître une
relation entre un facteur d’exposition, un indice biologique, un signe
clinique… et la survenue d’une maladie. Le simple constat de cette
relation ne signifie en aucune manière qu’il existe un lien de causalité
entre les deux phénomènes observés !
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
Dans le cas des études d’observation “cas-témoins”, le mode d’entrée
se fait par la maladie. On identifie des groupes de sujets qui présentent ou ne présentent pas une pathologie spécifique et, grâce à une
enquête rétrospective, on recherche ensuite dans chacun de ces
groupes la présence ou l’exposition à un facteur de risque particulier.
10
Dans les études d’observation en cohorte, encore appelées études
d’incidence, le mode d’entrée est l’exposition à un facteur de risque
qui est supposé intervenir dans la survenue d’une maladie spécifique.
On va donc constituer des échantillons de la population, regroupés en
cohortes (d’où le nom de ce type d’étude), qui seront suivies dans le
temps pour mettre en évidence la survenue de la pathologie étudiée.
On réalise simultanément ce suivi sur un groupe qui présente le
facteur de risque et sur un autre groupe, en tous points identique au
premier (autant que faire se peut), mais qui ne présente pas ce facteur
de risque. Ce deuxième échantillon constitue le groupe témoin.
Les études d’observation transversales ou études de prévalence ont
comme mode d’entrée l’exposition à un facteur de risque supposé
intervenir dans la survenue d’une maladie spécifique. Toutefois, à la
différence des études en cohorte, le comptage des sujets présentant la
pathologie étudiée se fait à un moment donné, à la fois dans le groupe
à risque et dans un groupe témoin. Il n’y a pas ici de suivi des patients
dans le temps.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 11
• Les études explicatives basées sur l’expérimentation
À la différence des situations précédentes,il faut ici établir un plan expérimental qui, d’une manière ou d’une autre, interfère sur la situation des
sujets observés. On inclut dans cette catégorie : les essais cliniques, les
interventions éducatives, les stratégies de prise en charge médicale.
- L’intervention pédagogique : elle permet d’étudier ici l’influence
de différents types de recommandations adressées à un échantillon
de population (par exemple : habitudes alimentaires, exercices
physiques, hygiène bucco-dentaire…) sur la survenue ou l’évolution
d’une pathologie spécifique.
- Les essais sur les stratégies de soins ou modalités de prise en charge
médicale : ces essais consistent à étudier l’influence d’un mode de
prise en charge médicale (structure de soins,qualification des soignants,
modalités de surveillance clinique…) sur la survenue ou sur l’évolution
d’une pathologie spécifique.
◗ Les essais thérapeutiques
Ils ont pour objectif de mettre en évidence les effets d’un traitement sur
l’évolution d’une pathologie, sur un critère de substitution, voire sur un
critère purement pharmacodynamique. Comme on l’a vu précédemment, si l’on veut pouvoir mesurer l’effet propre d’un médicament, il
faut avoir recours à une étude explicative du type essai clinique. On
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
- Les essais cliniques : dans ce cas, le mode d’entrée est l’exposition à un
facteur qui est supposé modifier l’évolution d’une maladie spécifique.
Ce facteur peut, par exemple, être la prise d’un médicament. L’approche
est ici très voisine de celle des études en cohorte, mais avec une différence essentielle qui tient à l’attribution aléatoire du facteur pouvant
modifier l’évolution de la maladie étudiée. On passe donc d’une situation de simple observation à une situation d’intervention. Comme dans
les études en cohorte, on suit dans chacun des deux groupes (exposés
et non-exposés) l’évolution, soit de la maladie (en termes de morbidité
ou de mortalité), soit d’un indice reflétant l’évolution de la maladie (à
l’aide d’un ou plusieurs critères de substitution). Cette approche expérimentale permet d’établir s’il existe un lien de causalité entre le facteur
étudié et l’évolution de la maladie.
11
Upsa Méthodo essais 2002
18/10/02
15:57
Page 12
devra donc constituer deux groupes de sujets, un recevant le traitement
à étudier (groupe traité) et l’autre un médicament de référence ou un
placebo (groupe témoin). À la fin de l’étude,il est vraisemblable que l’on
montrera certaines différences entre le groupe traité et le groupe témoin
et, très naturellement, on aura tendance à penser que les différences
observées sont le résultat de l’action pharmacologique directe du médicament étudié. En fait, il ne s’agit que d’un effet apparent qui est la
somme de l’effet pharmacologique du médicament et de multiples
facteurs appelés facteurs confondants. Ceux-ci incluent l’état initial du
patient,l’évolution spontanée de la maladie,des facteurs non spécifiques
(généralement impossibles à identifier de façon exhaustive) et les variabilités individuelles aléatoires. La méthodologie, mise en œuvre dans les
essais thérapeutiques, a pour objectif de supprimer ou d’atténuer ces
facteurs “parasites”, de manière à ce que l’effet apparent, qui est le seul
observable, reflète le plus fidèlement possible les propriétés pharmacologiques intrinsèques du médicament que l’on étudie.
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
Les moyens pour supprimer les facteurs confondants
12
• Prise en compte de l’état initial et l’évolution spontanée de la maladie.
On comprend intuitivement que ces deux facteurs peuvent avoir une
influence considérable sur l’effet apparent du traitement. Le moyen le
plus commode pour atténuer l’influence de ces facteurs est de faire en
sorte que le groupe traité et le groupe témoin soient aussi comparables
que possible. Pour cela, on sélectionne les patients inclus dans l’étude à
l’aide de critères d’inclusion et d’exclusion qui permettent de constituer des groupes aussi comparables que possible. À l’issue de l’étude,
au moment où on analyse les résultats, on vérifie soigneusement les
caractéristiques physiologiques et physiopathologiques de chacun
des groupes pour s’assurer qu’il n’y a pas de différence significative
entre les deux populations. Si c’était le cas, ce constat pourrait
remettre totalement en cause les conclusions de l’étude.
• Prise en compte des facteurs non-spécifiques. Certains sont identifiables, d’autres sont soupçonnés, mais la plupart restent totalement
méconnus. Bien que masqués, ces facteurs peuvent avoir parfois une
influence considérable sur l’évolution d’une pathologie,que l’on impute
à tort à l’effet du médicament. Ces facteurs étant pour la plupart nonidentifiables, on ne peut pas les éliminer à l’aide des critères d’inclusion
Upsa Méthodo essais 2002
18/10/02
15:57
Page 13
qui sélectionnent les sujets admis dans une étude. Le moyen le plus
efficace que l’on ait trouvé pour atténuer l’influence de ces facteurs
est de faire en sorte que les deux groupes de sujets inclus dans l’essai
thérapeutique se trouvent dans un environnement (au sens large du
terme) aussi identique que possible. Pour répondre à cette exigence,
il faut qu’au moment de leur inclusion dans l’essai thérapeutique, les
patients soient tirés au sort pour être affectés dans le groupe traité ou
dans le groupe témoin.
La méthodologie que l’on utilise dans les essais cliniques doit mettre
en œuvre les recommandations énumérées précédemment pour que
la différence des effets apparents, observés entre le groupe témoin et
le groupe traité, reflète le plus fidèlement possible l’effet propre du
médicament étudié.
◗ Quelques autres principes qui guident
la méthodologie appliquée aux essais thérapeutiques
Lorsque l’on s’engage dans un essai thérapeutique, il faut accepter trois
règles principales :
• le principe de comparaison : le nouveau médicament que l’on teste
est-il meilleur (du point de vue de l’efficacité, de la tolérance, de la
commodité d’emploi…) que ceux qui existent déjà sur le marché ?
• le principe de causalité : l’effet observé est-il bien lié aux propriétés
pharmacologiques du médicament ou résulte-t-il des facteurs confondants dont nous avons parlé précédemment ?
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
• Prise en compte des facteurs de variabilité individuelle aléatoires. La
variabilité est inhérente au monde biologique. Au sein d’une même
espèce, aucun individu n’a le même patrimoine génétique et donc le
même phénotype. Cette variabilité biologique, plus ou moins importante selon la nature du paramètre étudié, est à l’origine d’un “bruit de
fond” qui parasite la mesure de nos critères d’évaluation. Le seul
moyen de surpasser cette variabilité individuelle est de la prendre en
compte en travaillant sur un échantillon de population qui ait une
taille suffisante pour que le bruit de fond devienne négligeable par
rapport à l’effet propre du produit que l’on étudie.
13
Upsa Méthodo essais 2002
18/10/02
15:57
Page 14
• le principe de signification : le résultat observé a-t-il bien été obtenu
grâce au médicament étudié ou est-il le fruit du hasard ?
La comparaison
Dans le domaine des essais cliniques, on travaille toujours de façon
comparative.On peut comparer la situation actuelle à une situation antérieure (c’est ce que l’on appelle un “essai rétrospectif”). Mais le plus
souvent, on va comparer un nouveau traitement à une situation sans
traitement (lorsque l’on donne un placebo, par exemple), ou à un autre
traitement (traitement dit de “référence”). Mais pour qu’une comparaison puisse être extrapolée, il est essentiel qu’elle ait une valeur
générale. Pour cela, il faut travailler sur un échantillon véritablement
représentatif des patients auxquels s’adresse le traitement à l’étude.
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
La causalité
14
Il est essentiel que les groupes comparés soient véritablement comparables. Ce principe est à la base de la démarche expérimentale qui vise
à rattacher les différences observées à la fin de l’essai à l’effet du traitement. La seule solution est donc de constituer un groupe témoin et un
groupe traité parfaitement identiques du point de vue de leurs caractéristiques physiologiques et physiopathologiques.
Cette comparabilité entre les deux groupes est fondamentale. Elle n’est
pas très difficile à obtenir au départ, pour peu que l’on prenne certaines
précautions dans la présélection puis le tirage au sort des sujets.
Toutefois, il est tout aussi important que cette comparabilité soit maintenue tout au long de l’essai. La meilleure solution, pour ne pas introduire de biais, consiste à travailler au minimum en simple aveugle
(seul le patient ne connaît pas la nature du médicament administré)
ou, de préférence, en double aveugle (ni le patient ni le médecin ne
connaissent la nature du médicament administré). Il est nécessaire que
cette règle soit maintenue jusqu’à la fin de l’analyse statistique.
La signification
On ne peut imputer un effet thérapeutique à un traitement que si la
randomisation a été parfaitement respectée, sinon, on s’expose à des
Upsa Méthodo essais 2002
18/10/02
15:57
Page 15
■ LES QUESTIONS À SE POSER AVANT D’ENGAGER
UN TRAVAIL DE RECHERCHE CLINIQUE
◗ Quels objectifs ?
On s’aperçoit très souvent que les objectifs fixés lors de la mise en
place d’un protocole ne sont pas assez clairement définis. Beaucoup
de chercheurs cliniciens fixent plusieurs objectifs à une seule étude,
dans l’espoir de recueillir un maximum d’informations. Ceci peut
paraître tout à fait louable d’un point de vue éthique, mais est souvent
désastreux au plan méthodologique. On peut dire aujourd’hui que,
pour chaque essai, il faut se fixer un objectif prioritaire, sous peine de
parvenir à des résultats totalement inexploitables car trop compliqués à analyser. Il faut également éviter de refaire des études qui ont
déjà été réalisées. Il faut enfin pouvoir justifier le projet sur le plan
scientifique.
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
biais majeurs qui peuvent fausser totalement les résultats et leur enlever
toute pertinence.Grâce à un test statistique qui est choisi en fonction du
plan expérimental utilisé,des caractéristiques du critère de jugement,de
la taille de l’échantillon, on conclut que les effets observés dans le
groupe témoin et le groupe traité sont significativement différents ou
qu’ils ne le sont pas. Compte tenu de la variabilité biologique et de l’interférence possible des facteurs confondants que nous avons évoqués
précédemment, on ne peut jamais exclure que la différence observée
soit le seul fait du hasard. Dans la communauté scientifique, il y a un
consensus pour considérer que l’effet du médicament A est différent de
celui du médicament B lorsque le test statistique sort le presque
mythique “p ≤ 0,05”. En fait ce “p ≤ 0,05” signifie simplement qu’il y a
95 % de chances que la conclusion que l’on tire à partir de l’échantillon
sur lequel on a travaillé corresponde bien à la “réalité”. On accepte aussi
le risque de conclure à tort dans 5 % des cas. Si l’on est plus exigeant, on
peut n’accepter qu’un risque à 1 % ou 0,1 % de se tromper dans les
conclusions. Cette “barrière” du “p ≤ 0,05” est trop souvent érigée en
dogme sans que les utilisateurs des tests statistiques ou les lecteurs des
rapports d’études en comprennent correctement le sens.
15
Upsa Méthodo essais 2002
18/10/02
15:57
Page 16
◗ Quelle population étudier ?
La pathologie concernée
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
Lorsque l’on réalise une étude sur un médicament, il faut savoir précisément à quelle pathologie on s’adresse et souvent même à quel stade
d’évolution de cette pathologie. Par exemple, les médicaments utiles
pour traiter une insuffisance cardiaque de stade I ne sont pas les mieux
adaptés au traitement d’une insuffisance cardiaque au stade IV. Les
efforts accomplis dans le domaine de la recherche thérapeutique ont
d’ailleurs fait progresser de façon incontestable la nosologie. Nous en
avons une excellente illustration dans le domaine des psychotropes.
Pour étudier cette famille de médicaments, nous avions besoin d’avoir
une classification très précise des maladies psychiques, notamment
pour inclure des groupes de patients homogènes et pouvoir comparer
les résultats d’études réalisées par différentes équipes. Ce travail nosographique a débouché sur la classification DSM III puis DSM IV qui est
devenue un outil quasi indispensable, bien sûr dans le cadre des essais
cliniques, mais aussi en pratique psychiatrique quotidienne.
16
Constitution de l’échantillon et critères d’inclusion
Il faut sélectionner les malades sur des critères bien précis et définir la
taille de l’échantillon. En effet, lorsque l’on réalise un essai clinique, il ne
faut jamais perdre de vue, même si l’on doit inclure plusieurs centaines
de patients, que l’on travaille sur un petit échantillon, si l’on se rapporte
à l’ensemble de la population à laquelle s’adresse potentiellement le
médicament. Pour que l’on puisse extrapoler les résultats obtenus à partir
des patients inclus dans un essai à l’ensemble de la population cible, il est
donc indispensable que cet échantillon soit véritablement représentatif de
l’ensemble de la population à laquelle est destiné le traitement. Les caractéristiques physiologiques et physiopathologiques de cette population
doivent donc se retrouver dans l’échantillon et vice versa.
Ce problème est loin d’être simple. Dans le domaine des antihypertenseurs par exemple, on a découvert tardivement que la population noire répond moins bien aux inhibiteurs d’enzymes de conversion
ou aux bêta-bloquants que la population blanche. On observe par
ailleurs une sous-représentativité chronique des femmes dans les essais
thérapeutiques. Cela tient au fait que l’on veut éviter, à juste titre, que
Upsa Méthodo essais 2002
18/10/02
15:57
Page 17
Avant de commencer une étude, il faut clairement définir la procédure
de sélection. Pour cela, on s’appuie sur des critères d’inclusion et
d’exclusion qui sont spécifiés dans le protocole d’étude. Cette sélection
a pour but de constituer des groupes homogènes, notamment par
rapport au (x) critère(s) d’évaluation, ce qui en diminue la variabilité et
permet de conclure sur un échantillon de plus petite taille. Mais il faut
savoir que ce principe de sélection est un mal nécessaire. Certes, en
sélectionnant, on constitue un échantillon homogène, mais cet échantillon risque de ne plus vraiment être représentatif de la population
globale. C’est classiquement le cas des études réalisées sur des populations de malades très sélectionnées en milieu hospitalier.
Il faut également avoir une approche réaliste du recrutement. Lorsque
l’on souhaite lancer un essai thérapeutique, on demande généralement
aux cliniciens d’estimer combien ils sont capables d’inclure de patients
présentant une pathologie donnée. En règle générale, ces cliniciens affirment voir en consultation ou en hospitalisation un nombre considérable
de patients répondant aux critères attendus et ils en concluent qu’il
devrait être possible de recruter très rapidement le nombre de patients
requis. Malheureusement, dans cette première approximation, ils
oublient que certains de leurs patients n’accepteront pas de participer
à l’essai, que d’autres ont des pathologies associées, prennent des traitements qui sont contre-indiqués, autant de facteurs qui ne permettent
pas in fine de les inclure dans un protocole. C’est pour cela qu’il faut
conserver une approche réaliste car les capacités réelles de recrutement
ne représentent parfois que 10 % de l’estimation de départ.
Enfin, il est important de respecter des principes éthiques quand on
sélectionne des sujets, notamment lorsque l’on souhaite réaliser des
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
survienne une grossesse chez des femmes à qui l’on administre un
nouveau médicament encore très imparfaitement évalué. Cela impose
que la femme ait une contraception efficace, que l’on fasse des tests de
grossesse répétés… Autant de facteurs qui font qu’il est plus simple de
n’inclure que des hommes ! Cette commodité a son revers, car sauf si
l’on étudie un médicament destiné au traitement de l’adénome de la
prostate, peut-on extrapoler à l’ensemble de la population les résultats exclusivement obtenus sur un échantillon d’hommes ? La
réponse est clairement non !
17
Upsa Méthodo essais 2002
18/10/02
15:57
Page 18
essais médicamenteux. Le fait de participer à un essai clinique ne doit
pas entraîner pour le malade “une perte de chance” en termes de guérison ou de survie par rapport aux possibilités thérapeutiques du
moment.
Nombre de sujets nécessaires
Pour calculer le nombre de sujets nécessaires, en considérant que l’on
a défini un plan expérimental et choisi un test statistique précis,
quatre paramètres doivent être pris en considération.
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
• Il faut tout d’abord se demander quelle sera,sur le critère d’évaluation,
la différence que l’on considère comme cliniquement pertinente entre
les deux groupes à l’issue du traitement. Sur une population en insuffisance cardiaque de stade IV par exemple, gagner 15 jours de survie
a-t-il une signification sur le plan clinique ? On peut penser que non. On
se fixe donc pour objectif de gagner au moins trois mois de survie.
Contrairement à ce que croient la plupart des investigateurs, plus la
différence recherchée est faible, plus il faut inclure de patients.
18
• Le deuxième paramètre est la variabilité du critère principal d’évaluation. Pour reprendre l’exemple de l’insuffisance cardiaque, le critère
d’évaluation est le temps de survie exprimé en semaines.Mais ce temps
de survie varie d’un sujet à l’autre, même lorsque les malades se trouvent au même stade. C’est pour cela que l’on parle de variabilité du
critère d’évaluation. Or, plus la variabilité de ce critère est grande,
plus il faut inclure de sujets pour pouvoir conclure du point de vue
statistique.
• Le troisième paramètre est le risque de “première espèce α”. Il s’agit
du risque de conclure à une différence entre deux traitements alors
qu’en réalité, elle n’existe pas. En général, on fixe ce risque à 5 %, mais
on peut être plus exigeant et l’abaisser à 1 % ou 0,1 %. Naturellement,
plus on est exigeant, plus il faut inclure de sujets dans l’échantillon.
• Le quatrième paramètre est la puissance du test de comparaison qui
est l’inverse du risque de “deuxième espèce β”. Ce risque β correspond
au risque que l’on s’accorde de conclure à une absence de différence
entre deux traitements lorsque celle-ci existe vraiment. Dans ce
18/10/02
15:57
Page 19
domaine, on accepte généralement un risque β de 0,20 à 0,05 (ce qui
correspond à une puissance du test de 80 % à 95 %). Assez logiquement, plus on exige une forte puissance du test de comparaison, plus il
faut de sujets. Ce risque β est essentiel lorsque l’on compare des traitements dont on pense a priori que leur efficacité est très voisine et que
l’on cherche à démontrer l’équivalence des deux médicaments. On ne
peut affirmer cette équivalence que si l’on dispose d’une puissance de
test suffisante.
Pour illustrer cette problématique du nombre de sujets, prenons
l’exemple d’une comparaison entre deux hypnotiques. On retient pour
critère d’évaluation principal la durée du sommeil, exprimée en heures.
On considère qu’une différence peut être mise en évidence si l’un de
ces deux traitements fait dormir deux heures de plus que l’autre. Si l’on
se fixe par ailleurs un risque α à 5 %, une puissance de test à 95 % et si
l’on considère que la variance de la durée du sommeil dans la population globale est de 3 heures, il faut, d’après nos calculs, inclure au
minimum 39 sujets dans chaque groupe – soit 78 personnes au total
– pour aboutir à des conclusions significatives sur le plan statistique.
Mais, si l’on veut montrer que l’un de ces traitements ne fait dormir
qu’une heure et demie de plus que l’autre, il faut porter le nombre de
sujets à 52 par groupe, soit 104 au total.
Le choix du plan expérimental et du test statistique a également une
incidence sur le nombre de sujets nécessaires. Ainsi, au cours d’un essai
croisé dans lequel chaque sujet est son propre témoin (il reçoit successivement les différents traitements testés), on gomme la variabilité intraindividuelle et on peut ainsi diminuer le nombre de sujets par un facteur
trois à quatre (dans le meilleur des cas). De même, en reprenant
l’exemple précédent relatif à l’essai d’un hypnotique, si l’on n’utilise
plus un test de comparaison bilatéral (dans lequel on ne préjuge pas que
le traitement A est supérieur à B ou l’inverse) mais un test unilatéral
(où l’on se fixe pour hypothèse de départ que l’un des traitements est
plus efficace que l’autre),les tests permettent d’observer des différences
statistiquement intéressantes avec moins de sujets, à savoir 32 au lieu
de 38. Enfin, le fait d’utiliser un test statistique paramétrique (lorsque les
conditions l’y autorisent) permet habituellement d’avoir la même puissance statistique avec un peu moins de sujets. Mais, ici, le gain en effectifs n’est pas aussi important que le croient beaucoup de cliniciens.
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
Upsa Méthodo essais 2002
19
Upsa Méthodo essais 2002
18/10/02
15:57
Page 20
◗ Quels traitements comparer ?
Si nous nous plaçons dans le cas où nous avons à tester un nouveau
médicament.Il faut savoir si on le compare à un placebo ou à un produit
de référence. Le placebo présente un avantage incontestable : il permet
de mettre en évidence l’efficacité intrinsèque du médicament. Dans le
cas d’une comparaison avec un produit de référence, on ne peut que
comparer l’efficacité relative des deux produits.
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
Le choix du produit de référence est souvent beaucoup plus complexe
qu’il y paraît. Quand il s’agit d’un médicament que l’on souhaite faire
enregistrer pour une mise sur le marché, on n’a pas vraiment le choix.
En effet,pour que le dossier d’enregistrement soit analysé par la commission d’AMM (Autorisation de Mise sur le Marché), celle-ci exige que le
nouveau médicament soit comparé à un produit récent, reconnu
comme étant le plus efficace et le mieux toléré au sein de sa classe
thérapeutique.Or,les médicaments très récents sont rarement commercialisés simultanément dans tous les pays où l’on avait prévu de faire les
essais thérapeutiques, ce qui entraîne bien des complications.
20
Le deuxième problème est le choix de la posologie du produit de référence. On peut décider de l’administrer à une posologie relativement
faible. Dans ce cas, lors de la comparaison, on favorise le produit testé au
plan de l’efficacité, mais on risque de le défavoriser sur le plan de la tolérance. À l’inverse, si l’on administre le produit de référence à une posologie forte, on risque de pénaliser le produit testé sur le plan de
l’efficacité, même si sa tolérance apparaît meilleure que celle du
produit de référence. Ces choix qui engagent fortement l’avenir du
produit, sont souvent difficiles à faire.
L’usage d’un placebo n’est pas toujours possible.C’est notamment le cas
dans les pathologies qui présentent un risque vital à court terme,où cela
poserait des problèmes éthiques évidents. La comparaison à un placebo
est particulièrement intéressante chaque fois que l’on cherche à mettre
en évidence l’effet pharmacologique propre d’un produit, qui correspond à la différence entre l’effet observé et l’effet placebo. On néglige
trop souvent que cet effet placebo peut atteindre 50 % à 60 % dans
certains domaines thérapeutiques, notamment dans les traitements antimigraineux.Ne pas le prendre en compte pose donc de réels problèmes
Upsa Méthodo essais 2002
18/10/02
15:57
Page 21
d’interprétation.Par ailleurs,cet effet placebo peut varier en fonction du
centre d’essai,de l’investigateur,de la couleur de la gélule,etc.Il est donc
toujours souhaitable de pouvoir le quantifier.
◗ Quel plan expérimental ?
Ils peuvent être très nombreux et le choix dépend d’un ensemble
d’éléments tels que : les objectifs d’études, la durée du traitement,
l’évolution spontanée de la maladie, sa prévalence dans la population,
etc.
Ces essais ont été beaucoup utilisés pour rechercher les posologies qui
apportent le meilleur rapport efficacité/tolérance. Ils ne posent pas de
problèmes particuliers lorsqu’on les utilise pour évaluer l’effet d’un traitement administré à dose unique mais leur usage est beaucoup plus
périlleux lorsqu’ils s’appliquent à un traitement en prises répétées. Le
principe des essais de titration est fondé sur une augmentation individuelle des doses (à intervalles réguliers s’il s’agit d’un traitement prolongé) et selon des paliers prédéfinis. Si le sujet réagit comme attendu
au traitement, on le laisse poursuivre l’essai à la même posologie ; s’il ne
réagit pas suffisamment, on lui administre une posologie plus forte. On
répète la même procédure pour différents paliers de doses prédéfinis et,
à la fin de l’étude, on peut déterminer la ou les posologie(s) efficace(s)
à laquelle ou auxquelles le plus grand nombre de sujets a répondu au
traitement.
Ces plans ont été très largement utilisés dans les années soi, notamment
pour étudier l’efficacité des anti-hypertenseurs. À l’époque, on évaluait
l’efficacité des différentes posologies toutes les deux semaines.
L’application à large échelle de ces essais de titration a fait que la plupart
des anti-hypertenseurs qui ont été mis sur le marché dans les années
soixante-dix et au début des années quatre-vingt étaient surdosés.
L’explication de cette dérive est venue tardivement. Il a fallu en effet
de très nombreuses études pour que l’on découvre que lorsque l’on
institue un traitement anti-hypertenseur, il faut attendre en moyenne
entre six et huit semaines (et non quelques jours comme on le
pensait !) pour en obtenir le plein effet. On voit donc immédiatement le
biais que pouvaient présenter les évaluations sur deux semaines :
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
Les essais de “titration”
21
Upsa Méthodo essais 2002
18/10/02
15:57
Page 22
certains patients, loin d’avoir le plein effet de leur traitement au bout de
cette période, étaient, à tort, passés à une posologie plus forte ce qui
tirait artificiellement vers le haut les doses d’anti-hypertenseurs considérées comme efficaces. La difficulté de connaître, pour beaucoup de
traitements, la durée nécessaire pour obtenir le plein effet justifie
qu’aujourd’hui ces plans soient utilisés avec beaucoup de prudence.
Les plans expérimentaux en groupes parallèles
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
Ces plans expérimentaux sont certainement les plus utilisés actuellement. Leur principe est extrêmement simple. On commence par
prendre un échantillon représentatif de la population et on le divise en
autant de groupes que de traitements à comparer.Puis,par tirage au sort,
on affecte un traitement déterminé à chaque groupe, l’un d’entre eux
pouvant éventuellement recevoir un placebo. Au bout d’une période
définie, on évalue l’effet thérapeutique obtenu sur chacun de ces
groupes.
22
Au cours des études de ce type, on prévoit parfois une période dite de
“run-in” durant laquelle les patients reçoivent un placebo. Certains la
mettent à profit pour éliminer les “placebo-répondeurs”, en arguant du
fait que ces sujets génèrent un “bruit de fond” qui diminue la puissance
des comparaisons statistiques. Mais en éliminant ces patients, il faut
savoir que l’échantillon devient moins représentatif de la population
globale. Par conséquent, tout le monde n’adhère pas à cette solution.
Nous pensons qu’il faut arrêter le choix en fonction des objectifs de
chaque étude.
Au cours d’un essai en groupes parallèles, on peut comparer entre eux
plusieurs traitements, on peut aussi comparer les effets de différentes
posologies d’un même médicament avec un traitement de référence ou
un placebo.
Les plans expérimentaux en groupes parallèles présentent de nombreux
avantages. Si on les utilise beaucoup, c’est essentiellement parce qu’ils
sont simples à organiser ou à analyser et parce qu’ils présentent peu de
risques de biais. Ils ont aussi quelques inconvénients. Notamment,
compte tenu que chaque sujet ne reçoit qu’un seul type de traitement,
la mesure du critère d’évaluation est entachée de la variabilité interindividuelle. Si cette variabilité est forte, cela peut affaiblir considéra-
Upsa Méthodo essais 2002
18/10/02
15:57
Page 23
blement la puissance des tests statistiques, que l’on devra compenser
en augmentant le nombre de patients dans chaque groupe.Un risque de
biais peut venir de ce que les différents groupes ne sont pas comparables du point de vue de leurs caractéristiques physiologiques, physiopathologiques ou d’autres facteurs individuels pouvant interférer avec
l’effet du traitement étudié. Ce risque est en principe évité si l’on a pris
soin d’inclure les patients après tirage au sort et si l’on dispose d’un
échantillon suffisamment grand. Il n’en reste pas moins que, parfois,
le hasard fait mal les choses… et que cela ne se révèle malheureusement
qu’après le dépouillement des résultats.
Dans ces plans expérimentaux, les sujets sont leur propre témoin car ils
reçoivent, successivement et dans un ordre aléatoire, les différents traitements ou les différentes posologies qui sont à l’étude. Lorsque l’on
répète les comparaisons chez un même patient,on parle alors de “carrés
latins”, de “blocs incomplets” ou “d’essais croisés répétés intensifs”.
Comment se déroulent ces essais croisés ? Prenons un cas simple, dans
lequel on compare deux traitements. Le principe général est le même
que pour les plans en groupes parallèles. La différence est que 50 % des
sujets vont d’abord recevoir le traitement A, puis le traitement B, alors
que les 50 % restants vont d’abord recevoir le traitement B, puis le traitement A. Le fait que, dans ce type de plan expérimental, chaque sujet
soit son propre témoin élimine la variabilité inter-individuelle dont nous
avons parlé précédemment. Cette approche permet d’avoir la même
puissance de comparaison statistique avec, dans le meilleur des cas,
quatre fois moins de patients.
Mais les plans expérimentaux de ce type présentent également des
faiblesses. Ainsi, l’effet du premier traitement peut retentir sur les
effets du deuxième (c’est ce que l’on appelle la “rémanence de l’effet
thérapeutique”). On peut remédier partiellement à ce problème en
introduisant, entre les deux périodes de traitement, une “fenêtre thérapeutique” ou “période de wash-out” durant laquelle les sujets reçoivent un placebo. Le principe est simple, mais on est alors confronté
au même problème que dans les essais de titration : quelle doit être la
durée de la fenêtre thérapeutique pour être sûr que les sujets sont
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
Les plans expérimentaux croisés
ou par comparaisons intra-individuelles
23
Upsa Méthodo essais 2002
18/10/02
15:57
Page 24
effectivement revenus à leur niveau basal ? C’est une question à laquelle
il est malheureusement souvent difficile de répondre précisément, en
particulier lorsque l’on étudie des molécules vraiment nouvelles.
À l’extrême,on peut réaliser ce que l’on appelle un “essai intensif”avec
deux ou trois patients voire un seul, en répétant plusieurs fois et dans
un ordre aléatoire, les traitements étudiés. Le champ d’application de
ce type d’essais reste toutefois extrêmement limité. On le réserve habituellement aux pathologies rares pour lesquelles on ne peut recruter
que quelques sujets.
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
D’une manière générale, les études en permutation croisée présentent
un certain nombre d’avantages. Elles permettent de gommer la variabilité interindividuelle car chaque sujet est son propre témoin. Avec le
même effectif,on gagne donc beaucoup de puissance statistique pour la
comparaison. Cela peut s’avérer intéressant d’un point de vue éthique,
mais aussi au plan pratique, lorsque l’on a affaire à une pathologie pour
laquelle les malades sont particulièrement difficiles à recruter.
24
Mais les essais croisés présentent aussi quelques inconvénients :
• Leur organisation est plus complexe.
• Ils durent plus longtemps car chaque sujet reçoit successivement les
différents médicaments à tester. Dans ces conditions, les durées de
chacun des traitements et des fenêtres thérapeutiques s’additionnent
dans le temps.
• Le risque de biais est important et ils sont parfois difficiles à déceler.
• Ces essais ne peuvent pas s’appliquer aux pathologies spontanément
évolutives. Par exemple, les rhinites aiguës qui guérissent spontanément
en quatre jours.
• Ils ne peuvent pas s’appliquer aux traitements curatifs.
Les plans factoriels
Le plan factoriel est le plan expérimental de référence lorsque l’on
souhaite étudier l’effet de l’association de deux traitements, ou évaluer
l’influence du stade évolutif d’une maladie, d’une pathologie associée,
de caractéristiques physiologiques particulières… sur l’efficacité d’un
traitement.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 25
Les courbes de survie
L’utilisation des comparaisons basées sur les “courbes de survie”ne peut
s’adresser qu’à certaines pathologies pour lesquelles on peut caractériser de façon simple un événement précis. C’est le cas, par exemple,
pour la survenue d’un accident vasculaire cérébral, d’un infarctus, d’une
fracture du col du fémur… Souvent, mais il y a des exceptions, on utilise
cette méthode pour l’évaluation de traitements sur des périodes relativement longues, de plusieurs mois, voire plusieurs années. Le terme de
“courbes de survie” vient du fait que ces approches étaient initialement
destinées à étudier l’efficacité des traitements anti-néoplasiques en
suivant effectivement la survie des patients dans les différents
groupes traités et en comparant ces courbes à l’aide de tests statistiques appropriés. Leur usage s’est aujourd’hui étendu à bien d’autres
domaines de la thérapeutique.
Ces plans constituent une des avancées méthodologiques les plus intéressantes de ces dernières années. Il existe différentes méthodes pour
travailler en plans séquentiels, mais elles sont toutes basées sur le même
principe relativement simple. On fixe a priori des limites au-delà desquelles on peut conclure que l’un des traitements est supérieur à l’autre
et une zone dans laquelle on considère que l’on ne peut pas conclure à
une différence entre les traitements. Après chaque observation, ou
chaque paire d’observations, on en analyse soigneusement les résultats
et, selon que la réponse au traitement est considérée satisfaisante ou
non,le statisticien attaché à l’essai indique au clinicien la marche à suivre
pour les observations suivantes. Comme dans les autres types de plans
expérimentaux, le clinicien doit travailler en “aveugle” pour ce qui
concerne la nature ou la posologie du produit administré.
Cette approche a bien des avantages,notamment sur le plan éthique,car
elle permet d’inclure le minimum de patients requis pour comparer les
traitements. Contrairement aux autres plans expérimentaux que nous
avons vus précédemment,on ne définit plus a priori le nombre de sujets
à inclure, mais on inclut de nouveaux patients jusqu’au moment où l’on
peut apporter des conclusions statistiquement significatives.
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
Les plans séquentiels
25
Upsa Méthodo essais 2002
18/10/02
15:57
Page 26
Les plans séquentiels étant basés sur une analyse “en temps réel” des
résultats, ils ne peuvent raisonnablement s’appliquer qu’à l’étude de
traitements dont l’efficacité peut être jugée en quelques heures ou
quelques jours. Ils sont beaucoup utilisés en pédiatrie, notamment
pour évaluer des antibiotiques, car les délais de réponse à ces traitements sont courts.
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
◗ Quels critères de jugement ?
26
Les traitements sont avant tout destinés à améliorer la qualité de vie des
patients ou à prolonger leur durée de vie. Sur cette base, il serait logique
d’évaluer et de comparer tous les traitements en mesurant les bénéfices
qu’ils apportent en termes de morbidité et de mortalité. Dans la pratique, il est assez peu fréquent que l’efficacité d’un traitement soit
évaluée directement sur ces critères. Ceci tient à plusieurs facteurs :
• fort heureusement, toutes les pathologies ne mettent pas immédiatement en jeu la vie du patient ;
• les indices de morbidité sont souvent difficiles à quantifier ; même si
l’on fait aujourd’hui beaucoup d’efforts pour en synthétiser les multiples
facettes dans des scores de qualité de vie ;
• dans beaucoup de cas, la maladie constitue simplement un facteur
de risque pour la survenue de complications qui sont directement
responsables de la morbidité et de la mortalité.
Un exemple classique est l’hypertension artérielle (HTA). Lorsqu’elle
est légère à modérée, elle ne gène aucunement la personne qui est un
malade qui s’ignore. Grâce à des études épidémiologiques lourdes, on a
pourtant pu établir que l’HTA augmente significativement le risque de
mortalité par accidents vasculaires cérébraux. Cette affection est également à l’origine de nombreuses autres complications (qui sont autant de
causes directes de morbidité et de mortalité). Ce risque de complications est la seule justification de la normalisation d’une pression artérielle trop élevée. À partir de ce constat, la logique voudrait que l’on
évalue l’efficacité des traitements antihypertenseurs sur leur aptitude à
diminuer l’incidence de telle ou telle de ces complications ou sur le taux
de mortalité.Le problème est que la réalisation de telles études demande
d’inclure plusieurs dizaines de milliers de patients et de les suivre
pendant 5 ou 10 ans ! Pour des raisons de faisabilité, on doit se
rabattre sur ce que l’on appelle un critère de substitution. Le chiffre
de la pression artérielle est un critère de substitution très largement
Upsa Méthodo essais 2002
18/10/02
15:57
Page 27
utilisé. C’est même un des rares critères de substitution validé par la
démonstration d’une relation directe entre l’élévation de la pression
artérielle et le risque de survenue d’un accident vasculaire cérébral.
La première qualité requise pour un critère de jugement est d’être médicalement pertinent. Il revient aux experts de juger de cette pertinence
et les critères retenus font souvent l’objet d’un consensus international.
Il faut bien sûr s’assurer des qualités métrologiques du critère que l’on
utilise, que celui-ci repose sur des échelles d’évaluation, des questionnaires ou des mesures recueillies à partir d’appareils plus ou moins
sophistiqués. Cette standardisation des méthodes de mesures par la
définition de normes est indispensable pour que des résultats puissent être comparés d’un centre d’étude à l’autre. Naturellement, les
mesures doivent s’inscrire dans un calendrier extrêmement précis et
identique chez tous les patients, sous peine de ne pouvoir réaliser
aucune comparaison valable.
Enfin, il est indispensable de hiérarchiser les critères de jugement et, si
possible, de définir pour chaque protocole un critère d’évaluation principal qui reflète le plus fidèlement l’effet thérapeutique étudié et
présente les qualités métrologiques requises. C’est autour de ce critère
d’évaluation principal que l’on doit bâtir un protocole d’étude,choisir le
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
D’autres exemples nous rappellent les limites des critères de substitution.C’est le cas des antiarythmiques que l’on a longtemps évalués sur
leur aptitude à normaliser un tracé ECG, jusqu’au jour où l’on s’est
aperçu qu’il y avait plus de décès chez les patients traités que chez ceux
recevant un placebo ! Depuis cette étude, l’ECG n’est plus accepté
comme critère de substitution pour évaluer un antiarythmique et, dans
cette classe de médicaments, les agences d’enregistrement exigent des
essais comportant un suivi au long cours de la survie des patients. Face
à ces exigences, bien peu de laboratoires pharmaceutiques se sont
lancés dans le développement de nouveaux antiarythmiques. À côté de
ces deux exemples,l’un blanc,l’autre noir,combien de zones grisées qui
concernent des pathologies pour lesquelles on s’interroge sur la validité
des critères de substitution ! Ceci n’empêche pas qu’on les utilise quotidiennement dans les essais thérapeutiques mais, au minimum, il faut
essayer de n’avoir recours qu’à ceux qui sont acceptés (sinon validés)
par la communauté scientifique et médicale.
27
Upsa Méthodo essais 2002
18/10/02
15:57
Page 28
plan expérimental, calculer le nombre de sujets nécessaires… et que
l’on peut véritablement conclure sur l’efficacité du traitement étudié.
Ceci n’interdit pas d’observer les effets du nouveau médicament sur
d’autres critères, que l’on qualifie de secondaires.
■ CONCLUSION
PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX
La rigueur méthodologique est un élément essentiel pour donner du
crédit aux conclusions que l’on tire d’un essai thérapeutique.Toutefois,
une méthodologie irréprochable ne suffit pas à faire un bon essai
clinique. Pour atteindre cet objectif, il faut aussi garantir une parfaite
fiabilité des données recueillies et c’est là tout le domaine des Bonnes
Pratiques Cliniques.
28
Upsa Méthodo essais 2002
18/10/02
3. ÉVALUATION
15:57
Page 29
DE LA DOULEUR
Évaluation de la douleur provoquée
chez le volontaire sain
Les tests basés sur une douleur provoquée sont utilisés chez le volontaire sain dans deux contextes assez différents qui sont, d’une part, les
recherches fondamentales sur la physiologie de la douleur, d’autre
part, l’évaluation pharmacodynamique des médicaments antalgiques.
Les tests utilisables sont extrêmement nombreux, mais leur mise en
œuvre est souvent beaucoup plus délicate qu’il n’y paraît et peu ont
fait l’objet d’un travail de validation approfondi. Ce constat explique
que leur place en pharmacologie clinique reste encore largement
débattue et qu’à la différence d’autres domaines thérapeutiques, le
développement des antalgiques ne bénéficie pas aujourd’hui d’outils
d’évaluation aussi performants que nous le souhaiterions pour
étudier de nouvelles molécules dès les premiers essais chez l’homme
(études de phase I). À un moment où les connaissances fondamentales sur les mécanismes de la douleur ont fait des progrès considérables, ouvrant ainsi des perspectives nombreuses pour le
développement de molécules nouvelles, les difficultés rencontrées ne
doivent pas faire baisser les bras mais, au contraire, inciter chercheurs
et cliniciens à poursuivre un travail de validation minutieux pour
mieux définir les modalités optimales d’utilisation et améliorer leur
sensibilité.
ÉVALUATION DE LA DOULEUR
Claude Dubray
29
Upsa Méthodo essais 2002
18/10/02
15:57
Page 30
■ LES PRINCIPALES TECHNIQUES DE STIMULATIONS
NOCICEPTIVES APPLICABLES À L’HOMME
◗ Induction d’une douleur aiguë ou ponctuelle
Stimulus mécanique
Les méthodes utilisées consistent le plus souvent à exercer une pression
sur une surface cutanée, plus ou moins étendue, en regard de tissus
mous ou de crêtes osseuses. D’autres techniques permettent d’obtenir
un pincement des téguments ou une pression plus ponctuelle à type de
piqûre. Dans tous les cas, il est indispensable de disposer d’appareils qui
indiquent précisément la pression exercée, exprimée en newtons ou
kilopascals. Ces appareils doivent aussi permettre d’augmenter la pression d’une manière régulière et parfaitement calibrée, seul moyen de
déterminer précisément les seuils de douleur et de tolérance au stimulus mécanique. Ces tests sont habituellement assez faciles à mettre en
œuvre mais leur répétition rapprochée dans le temps peut poser
quelques problèmes, dans la mesure où ils peuvent entraîner des microtraumatismes cutanés provoquant une inflammation locale.
ÉVALUATION DE LA DOULEUR
Stimulus thermique
30
Les tests basés sur la stimulation thermique sont parmi les plus utilisés
dans le domaine de la douleur provoquée. Ils reposent essentiellement
sur l’utilisation de petites plaques dont on fait varier la température
(thermodes) lorsqu’elles sont appliquées sur la peau ou les muqueuses.
On peut élever la température de ces thermodes (stimulus chaud) ou,au
contraire, la faire baisser (stimulus froid). Les autres techniques sont
essentiellement basées sur la chaleur radiante (lampe au xénon) ou le
faisceau laser CO2.
Les stimulations à l’aide de thermodes sont certainement les plus utilisées,du fait de leur facilité de mise en œuvre.Ces thermodes fondées sur
le système Pelletier sont en effet très faciles à piloter à l’aide d’un ordinateur.L’ajustement thermique se fait au 10e de degré et elles permettent
d’obtenir pratiquement tous les schémas de stimulation que l’on
souhaite : pente régulièrement croissante ou décroissante, plateau thermique, pulses thermiques de forme pyramidale ou sinusoïde, etc. Ces
Upsa Méthodo essais 2002
18/10/02
15:57
Page 31
thermodes ont toutefois l’inconvénient d’une certaine inertie. Ce n’est
pas le cas du laser CO2 qui permet de délivrer un stimulus thermique
sur une zone très ponctuelle et surtout pendant des durées très brèves.
Beaucoup d’auteurs privilégient les stimulations thermiques dans le
domaine des douleurs provoquées, considérant qu’aux seuils nociceptifs, on stimule sélectivement les fibres C. Leur application en pharmacologie clinique pose toutefois un problème de sensibilité, car il est
difficile de faire varier significativement les seuils de douleur ou de tolérance à ces stimuli après administration de médicaments antalgiques.
Stimulus électrique
◗ Induction d’une douleur tonique ou soutenue
(de quelques minutes à quelques heures)
La plupart des méthodes reposent sur l’injection sous-cutanée ou intramusculaire d’une solution : soit acide, soit hypertonique, soit contenant
des substances qui activent les nocicepteurs, telles que la bradykinine,
la sérotonine… Elles permettent de provoquer une douleur qui persiste
pendant quelques minutes ou quelques heures. D’autres techniques
sont capables d’induire une douleur prolongée telles que le “tourniquet” qui consiste à créer une douleur ischémique au niveau d’un
membre, en appliquant un brassard tensionnel gonflé au-dessus de la
pression artérielle systolique. Dans le domaine des douleurs toniques,
il faut réserver une place à part aux modèles de douleur viscérale
expérimentale applicables à l’homme sain. Ces techniques reposent
ÉVALUATION DE LA DOULEUR
Les méthodes de douleur provoquée reposant sur ce type de stimulus
consistent essentiellement à appliquer des électrodes cutanées sur le
trajet d’un nerf périphérique et faire passer un courant de faible intensité. Une technique plus sophistiquée s’appuie sur une stimulation électrique de la pulpe dentaire. Ces stimulations électriques offrent
l’avantage d’être très facilement modulables et de délivrer un stimulus
de durée brève. Leur principal inconvénient est lié au fait qu’il s’agit
d’un stimulus “non naturel” qui provoque souvent plus une sensation
désagréable,voire anxiogène,qu’une véritable douleur.En conséquence,
il est particulièrement important de prévoir des séances d’entraînement
durant lesquelles le sujet se familiarisera progressivement avec ce type
de stimulus.
31
Upsa Méthodo essais 2002
18/10/02
15:57
Page 32
essentiellement sur des dilatations gastriques, coliques ou rectales à
l’aide de ballonnets gonflables, combinées éventuellement avec l’instillation locale de substances irritantes pour les muqueuses digestives.
◗ Induction d’une hyperalgésie ou d’une allodynie
transitoire
ÉVALUATION DE LA DOULEUR
La technique la plus utilisée pour induire une hyperalgésie ou/et une
allodynie transitoire est l’application cutanée de capsaïcine. Cette
substance irritante (extraite du paprika) est facile à utiliser mais son
action est relativement brève (2 à 3 heures). Ceci présente un inconvénient majeur lorsque l’on veut étudier des médicaments dont la durée
d’action dépasse celle de l’hyperalgésie induite par la capsaïcine. C’est
une des principales raisons pour lesquelles on a de plus en plus recours
à des stimulations thermiques (chaudes ou froides) ou à une exposition
à des U.V. pour provoquer une brûlure du premier degré. On observe
alors une inflammation locale qui s’accompagne d’une libération locale
de médiateurs pro-nociceptifs qui induisent une hyperalgésie et/ou une
allodynie transitoire. L’avantage ici est que cette hyperalgésie ou allodynie induite va persister pendant plusieurs jours, ce qui permet de
tester plusieurs antalgiques ou différentes doses d’un produit chez un
même sujet qui devient ainsi son propre témoin.
32
D’un point de vue pratique, nous avons une préférence pour la stimulation par le froid qui nous semble beaucoup plus confortable pour
les volontaires que la stimulation par le chaud. En effet, il est moins
désagréable de se voir appliquer sur le bras une petite barre de cuivre
à –28 °C pendant 8 secondes que de supporter pendant 8 à 10 minutes
une thermode chauffée à 47 °C ! Quelle que soit la méthode,on observe
dans les heures qui suivent l’exposition au chaud ou au froid, une
rougeur cutanée dans la zone d’application et une hyperalgésie qui
déborde largement cette zone. L’hyperalgésie reste stable dans la zone
“lésionnelle”, pendant plusieurs jours, mais la zone d’hyperalgésie “périlésionnelle” tend à se rétrécir progressivement. Peu de travaux publiés
utilisent cette technique pour évaluer l’effet antalgique des médicaments, mais l’expérience récente que nous en avons semble indiquer
que cette approche est nettement plus sensible que les tests psychophysiques sur peau saine pour mettre en évidence un effet antalgique
chez le sujet sain.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 33
◗ Modalités d’utilisation de ces techniques
de stimulation nociceptive
Les différentes techniques de stimulation nociceptive que nous venons
de voir peuvent être utilisées de manière isolée ou combinée. Dans le
cadre de l’évaluation des médicaments analgésiques, de nombreuses
équipes ont donné leur préférence à l’utilisation de batteries de tests
relativement lourdes. Cette approche est motivée par deux principales
raisons. Premièrement, il n’existe pas de relation évidente entre les
réponses obtenues avec les différents types de stimuli. Deuxièmement,
on a observé que certains antalgiques modifient préférentiellement les
seuils de douleur en réponse à tel type de stimulus plutôt qu’à tel autre.
Dans ces conditions, surtout lorsque l’on doit tester un nouvel antalgique, beaucoup ont estimé que seules des batteries de tests combinant
plusieurs types de stimulation nociceptive permettent d’analyser correctement le profil de la nouvelle molécule.
Cette approche a cependant ses limites dans la mesure où la répétition
de nombreux tests exige un effort de concentration considérable de la
part des volontaires. Dans ces conditions, on risque de privilégier la
quantité d’information au détriment de la qualité. Sur la base de notre
propre expérience, nous avons tendance actuellement à réduire le
nombre de tests.
En 1985, Gracely a défini les critères auxquels devrait répondre un tel
stimulus nociceptif :
• déclenchement et fin rapides ;
• caractère naturel (ce qui n’est pas le cas du stimulus électrique) ;
• aptitude à se renouveler avec un effet temps négligeable afin de
pouvoir répéter les tests de manière rapprochée, sans hyposensibilité
ou hypersensibilité des réponses ;
• caractère “objectif”, ce qui implique que les réponses au stimulus
soient similaires chez l’ensemble des sujets participant aux tests ;
• mise en jeu d’un nombre restreint de neurones afférents primaires.
ÉVALUATION DE LA DOULEUR
◗ Existe-t-il un stimulus idéal
pour induire une douleur expérimentale ?
33
Upsa Méthodo essais 2002
18/10/02
15:57
Page 34
Aucune des techniques de stimulation nociceptive aujourd’hui disponibles et applicables aux sujets sains ou aux patients ne répond à
l’ensemble de ces critères. Nous pensons, comme beaucoup de cliniciens ou chercheurs qui travaillent dans ce domaine, que les tests
utilisés sont trop nombreux. Cette variété a un intérêt incontestable
dans les recherches fondamentales portant sur les mécanismes de la
nociception.En revanche,pour ce qui concerne leur utilisation en pharmacologie clinique, un travail de standardisation serait nécessaire pour
sélectionner les méthodes les plus pertinentes en termes de sensibilité
et de spécificité.Il faut aussi noter que beaucoup de ces techniques,délicates à mettre en œuvre, exposent à des biais méthodologiques importants et il est regrettable que peu d’entre elles aient fait l’objet d’un
véritable travail de validation. En définitive, on est obligé de constater
que nous ne disposons aujourd’hui d’aucun type de stimulus qui puisse
être pris comme référence pour évaluer les antalgiques.
■ MÉTHODES D’ÉVALUATION DE LA DOULEUR
PROVOQUÉE
ÉVALUATION DE LA DOULEUR
◗ Les tests subjectifs basés
sur l’approche psycho-physique
34
La psycho-physique consiste à étudier les relations entre une sensation
consciente et les caractéristiques d’un stimulus. A priori, cette approche
semble particulièrement bien adaptée pour étudier, chez l’homme, la
sensation douloureuse en réponse à des stimuli nociceptifs précalibrés.
La plupart des travaux fondamentaux conduits dans le domaine de la
psycho-physique ont été appliqués aux domaines de l’audition, de la
vision, voire du goût mais, malheureusement, assez peu concernent la
nociception.
L’application des méthodes psycho-physiques dans le domaine de la
nociception répond à trois objectifs :
• l’identification des seuils de détection, de douleur et de tolérance
à un stimulus spécifique représente l’approche liminaire ;
• la discrimination entre deux stimuli d’intensité différente ;
• la quantification des sensations pour des stimulations supra-liminaires
(c’est-à-dire dans le domaine qui nous intéresse, des stimulations
supérieures au seuil d’apparition d’une sensation douloureuse).
Upsa Méthodo essais 2002
18/10/02
15:57
Page 35
Pour chaque type de stimulus, les mesures liminaires visent à déterminer, pour un individu, son seuil de douleur (correspondant à un
niveau d’intensité du stimulus qui devient désagréable) et son seuil de
tolérance (qui correspond à un niveau où l’intensité du stimulus
devient intolérable).
Prenons l’exemple d’une stimulation réalisée à l’aide d’une thermode,
dont la température s’élève progressivement,qui est appliquée sur l’éminence thénar de la main. Pour les mesures liminaires, on demande au
sujet de bloquer la montée de température en appuyant sur un bouton
dès que la chaleur de la thermode devient désagréable. Il fixe ainsi son
seuil de douleur. On procède de la même façon pour déterminer son
seuil de tolérance. L’intervalle de température se situant entre ces deux
seuils constitue une plage thermique sur lequel nous pourrons appliquer des stimuli supra-liminaires (c’est-à-dire au dessus du seuil de
douleur). Dans cette gamme de températures, on demande au sujet de
coter l’intensité de la sensation douloureuse qu’il ressent à l’aide d’une
échelle visuelle analogique, en réponse à un stimulus thermique d’amplitude variable se trouvant dans l’intervalle prédéfini. Une autre
approche un peu différente consiste à fixer la température de la thermode à 1 degré ou à 1/2 degré en dessous du seuil de tolérance et
d’enregistrer le temps pendant lequel le sujet peut maintenir la main
sur la thermode à cette température. Au cours d’une expérimentation
de ce type, on peut même demander au sujet d’évaluer en continu la
sensation douloureuse qu’il ressent à l’aide d’une échelle visuelle
analogique électronique.
L’utilisation de ces stimuli thermiques supra-liminaires permet d’obtenir
une très bonne corrélation entre l’intensité du stimulus appliqué et la
sensation douloureuse ressentie par le sujet. Sous l’influence des médicaments antalgiques, on pourrait s’attendre à observer un aplatissement
de la droite de régression ou son décalage vers la droite. En fait, cette
approche s’avère décevante car très peu sensible à l’action des médicaments antalgiques.
Les stimuli supra-liminaires sont également facilement utilisables
avec un stimulus laser ou avec un stimulus électrique. Leurs mises en
œuvre avec les stimuli mécaniques sont beaucoup plus délicates.
ÉVALUATION DE LA DOULEUR
Les mesures liminaires et supra-liminaires
35
Upsa Méthodo essais 2002
18/10/02
15:57
Page 36
Importance de l’entraînement aux tests
Dans le domaine des tests psycho-physiques, on observe chez un sujet
naïf une grande variabilité dans les réponses qui correspond à une phase
d’adaptation aux tests, d’apprentissage. Ceci justifie plusieurs séances
d’entraînement lorsque l’on veut les utiliser dans le domaine de la pharmacologie clinique. Avec les stimuli nociceptifs, il est naturel que, lors
des premières expositions, les sujets aient tendance à réagir à des
niveaux assez bas. Puis, lorsque l’on répète les tests, les réponses deviennent plus stables. Si on n’effectuait pas ces séances d’entraînement, ce
phénomène d’adaptation interférerait avec l’effet propre des médicaments que l’on voudrait étudier et ceci apporterait un biais majeur dans
l’interprétation des résultats.
Dans le domaine des tests psycho-physiques nociceptifs, en dépit
d’un entraînement bien suivi, les seuils de douleur présentent une
grande variabilité inter-individuelle (d’un sujet à l’autre) et même
intra-individuelle (d’un jour à l’autre chez un même sujet). Cette
variabilité dans les seuils de douleur et de tolérance constitue indéniablement un handicap pour évaluer l’effet des médicaments antalgiques. Les statisticiens savent bien, en effet, que cette variabilité
génère un “bruit de fond” qui a pour conséquence de nécessiter plus
de sujets pour mettre en évidence l’effet pharmacologique du produit
que l’on étudie.
ÉVALUATION DE LA DOULEUR
La nécessité d’un groupe placebo
36
Des études, peu nombreuses mais assez convaincantes, ont montré
que les seuils de sensibilité à la douleur ne sont pas stables au cours
du nycthémère. Ce constat a deux conséquences. D’une part, lorsque
l’on veut faire des comparaisons chez un même sujet, il est important
que les tests soient réalisés à la même heure de la journée s’ils doivent
être réalisés à des jours différents. D’autre part, lorsque l’on suit l’évolution d’un seuil de douleur ou un seuil de tolérance sur une période
relativement longue, il est indispensable d’avoir un groupe placebo
qui reflète les variations circadiennes afin de les prendre en compte
pour évaluer l’effet propre d’un médicament antalgique sur ces seuils.
Un autre facteur à prendre en compte est le rôle de l’imprégnation
hormonale œstro-progestative, et donc du cycle menstruel chez la
Upsa Méthodo essais 2002
18/10/02
15:57
Page 37
femme qui modifie les seuils de sensibilité à la douleur.Cette donnée fait
que l’on évite d’inclure des personnes de sexe féminin dans des études
au cours desquelles on va devoir répéter les tests psycho-physiques à
quelques jours d’intervalle.
La place des tests psycho-physiques dans l’étude
des médicaments antalgiques chez le sujet sain
La plupart des tests psycho-physiques sont relativement faciles à mettre
en œuvre, d’où leur utilisation assez large en pharmacologie clinique.
Derrière leur apparente facilité de réalisation, il faut savoir que de
nombreux facteurs autres que le médicament (ce que l’on appelle les
facteurs confondants) peuvent interférer sur les réponses observées.
De plus, ces tests sont essentiellement pénalisés par leur grande variabilité. Cette variabilité peut être atténuée en étant très attentif à l’environnement dans lequel se déroulent ces tests, au conditionnement
psychologique des sujets, à leur effort de concentration et à la sélection d’une population aussi homogène que possible pour ses seuils de
réponse à un type de stimulus particulier. Cette dernière condition
n’est toutefois pas réalisable lorsque l’on utilise une batterie de tests
combinant plusieurs types de tests.
Dans la pratique, on applique au volontaire sain une série de stimuli
douloureux d’amplitude variable et on mesure l’intensité de la douleur
ressentie, à l’aide d’une mesure de l’EVA qui est relevée après chaque
stimulus.Une autre approche consiste à augmenter de manière continue
le stimulus jusqu’à un palier, puis à enregistrer le temps pendant lequel
le sujet tolère ce stimulus. On peut également demander au sujet de
coter en continu sur une EVA la sensation douloureuse provoquée par
un stimulus d’intensité croissante. L’utilisation d’échelles visuelles électroniques facilite grandement l’évaluation dans ce contexte expérimental.
Lors de l’application de stimuli douloureux d’intensité variable au
moyen d’une thermode (par exemple entre 43 °C et 51 °C), on observe
une très bonne corrélation entre l’intensité de la température et celle
ÉVALUATION DE LA DOULEUR
La cotation de la sensation douloureuse en réponse
à des stimuli dont l’intensité se situe entre le seuil de douleur
et le seuil de tolérance
37
Upsa Méthodo essais 2002
18/10/02
15:57
Page 38
de la douleur. A priori, ce type d’évaluation constitue donc une
méthode intéressante pour mesurer l’effet d’un antalgique. Mais les
résultats sont très décevants puisque les réponses ne varient pas de
manière significative après l’administration de morphine.
Des résultats intéressants et pertinents ont pu être obtenus avec une
autre approche qui consiste à pratiquer, à plusieurs reprises, trois
niveaux de stimulation (haut/intermédiaire/bas) de manière individualisée en fonction des seuils de tolérance de chaque sujet. Cette
méthode permet de moyenner la cotation.
10
8
Avant-bras
6
4
2
Masseter
0
43
45
47
49
51°C
Log Intensité de la douleur (EVA)
Intensité de la douleur (EVA)
Relation entre l’intensité de la stimulation
thermique et la sensation douloureuse
2,5
2,0
1,5
1,0
0
Stimulus thermique
43
45
47
49
51°C
Stimulus thermique
ÉVALUATION DE LA DOULEUR
D’après Price et al, Clin. J. Pain, 1987 : 3,1-8
38
Certains auteurs ont montré que la répétition des stimulations thermiques pouvait induire une désensibilisation assez nette vis-à-vis de la
première douleur (douleur aiguë). En revanche, on observe le phénomène inverse pour la deuxième (douleur lancinante qui apparaît
1,5 seconde après la première douleur).
Lorsque l’on pratique des stimulations répétées dans un faible intervalle de temps, il n’est pas possible de demander au sujet de distinguer
la première douleur de la deuxième douleur. Par conséquent, le sujet
donne une cotation globale intégrant probablement les deux douleurs.
En pratique, nous avons constaté que les stimulations répétées à des
intervalles de moins de 10 secondes n’entraînaient pas de sensibilisation importante.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 39
Conclusion sur les études subjectives
Les études subjectives présentent l’avantage d’être faciles à mettre en
œuvre.En revanche,elles ne permettent pas vraiment de dissocier,d’une
part, la douleur primaire et la douleur secondaire, et, d’autre part, l’effet
nociceptif et l’effet désagréable ou anxiogène (ce dernier étant particulièrement important pour les stimuli électriques). Enfin, les études
subjectives sont fortement pénalisées par les phénomènes de variabilité
interindividuelle et intra-individuelle.
◗ Les tests objectifs
Les mesures électrophysiologiques
Les réponses neurovégétatives
Elles constituent un moyen indirect de mesurer la réponse d’un individu
à une stimulation nociceptive supra-liminaire, en enregistrant les variations de la fréquence cardiaque, de la pression artérielle, du diamètre
pupillaire et de la conductance cutanée.
Le réflexe nociceptif de flexion
Le principe consiste à appliquer une stimulation électrique de faible
intensité (moins de 30 mA) sur le trajet d’un nerf périphérique. Pour
le membre inférieur, on stimule habituellement le nerf sural, au niveau
de son trajet rétro malléolaire externe. Cette stimulation déclenche
ÉVALUATION DE LA DOULEUR
Les techniques utilisées pour explorer les réponses à des stimuli douloureux sont pour la plupart fondées, soit sur le réflexe nociceptif de
flexion (RIII), soit sur des potentiels évoqués somesthésiques. Dans les
deux cas, elles permettent d’opérer une distinction entre un antalgique
à effet central et un antalgique périphérique. Les techniques d’imagerie
cérébrale,qui ont fait l’objet d’un grand nombre de publications ces dernières années, sont très intéressantes pour comprendre les mécanismes
de la douleur. Pour l’instant, leur complexité de mise en œuvre et leur
coût font qu’elles ont été réservées à des recherches fondamentales (en
particulier sur les zones corticales impliquées dans la sensation douloureuse) plutôt qu’à l’étude de médicaments antalgiques.
39
Upsa Méthodo essais 2002
18/10/02
15:57
Page 40
un arc réflexe qui passe par la moelle épinière pour déclencher un
mouvement de flexion ipsilatéral. Avec les courants de faible intensité
que nous utilisons, ce réflexe ne déclenche pas de flexion visible
cliniquement, mais il peut être enregistré à l’aide d’un électromyogramme. La technique du réflexe nociceptif de flexion a fait
l’objet de plusieurs travaux de validations qui ont montré l’existence
d’une relation étroite entre l’amplitude du réflexe RIII et la cotation
de douleur (par EVA) ressentie à la suite de la stimulation électrique.
Plusieurs études réalisées avec cette technique ont permis d’objectiver l’effet de différents antalgiques administrés par voie IV.
Les méthodes “objectives” permettent généralement, mais pas systématiquement, d’établir une relation entre le paramètre mesuré et la
sensation douloureuse. Lorsque cette relation n’est pas établie, la
technique choisie peut être remise en cause. Les études objectives
présentent l’inconvénient d’être lourdes à mettre en œuvre et d’être
difficiles à répéter à court terme.
ÉVALUATION DE LA DOULEUR
◗ Les techniques de stimulation nociceptives
fondées sur l’hyperalgésie et l’allodynie induites
40
Après avoir induit une allodynie ou une hyperalgésie, on les quantifie,
soit à l’aide de stimulations thermiques, soit avec le filament de
Von Frey (classique ou électronique). En cas d’hyperalgésie induite,
on peut mettre en évidence l’effet de substances antalgiques de
palier I telles que le paracétamol ou l’ibuprofène dans la zone
d’hyper-algésie alors qu’aucun effet n’est objectivable, lorsqu’on
applique les mêmes stimuli sur une zone cutanée saine.
■ LES APPLICATIONS MÉDICAMENTEUSES
L’évaluation de la douleur chez le sujet sain permet de standardiser
les conditions expérimentales et d’évaluer l’effet des antalgiques dès
la phase I. Le fait de recourir à des sujets sains plutôt qu’à des patients
facilite grandement la répétition des mesures, ce qui est nécessaire
pour obtenir des données pharmacocinétiques et pharmacodynamiques.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 41
■ LES LIMITES
Tout d’abord,les douleurs provoquées,même lorsqu’il s’agit de douleurs
toniques, se situent dans un cadre différent selon que l’on se place sur
un plan psycho-affectif ou sur un plan nociceptif pur. Ensuite, la
sensibilité des volontaires sains à l’action des antalgiques est souvent
insuffisante. Enfin, la mise en œuvre des techniques d’évaluation de
la douleur provoquée est souvent délicate.
L’évaluation de la douleur provoquée chez le sujet sain représente
un outil d’exploration parfaitement adapté à certaines recherches
fondamentales sur la physiologie de la douleur. De ce point de vue,
des travaux récents ont d’ailleurs montré que la douleur provoquée,
le plus souvent fondée sur une stimulation aiguë, met en jeu des
mécanismes qui sont pour partie différents de ceux impliqués dans
les douleurs spontanées, surtout si elles ont un caractère chronique
ou subchronique. Ces considérations purement physiologiques ou
physiopathologiques, ainsi que les problèmes de variabilité et de
sensibilité parfois insuffisante à l’action des médicaments antalgiques,
font que l’on doit s’interroger sur la place de cette approche pour
l’évaluation des médicaments antalgiques. Mieux connaître les limites
de ces tests, leurs modalités optimales d’utilisation, leurs critères de
validation, devrait permettre de mieux les utiliser dans le développement de nouvelles molécules. Les difficultés que nous avons énumérées ne doivent pas nous faire renoncer à ces approches mais nous
inciter à travailler activement sur ces tests de douleur provoquée
pour que le développement des antalgiques puisse, comme d’autres
domaines thérapeutiques, bénéficier de tests pharmacodynamiques
applicables dès les premières étapes du développement chez
l’homme.
Nous n’avons pas abordé dans cette présentation l’utilisation des tests
de douleur provoquée chez le malade. Il s’agit là d’un domaine insuffisamment exploré mais certainement très porteur, dans la mesure
où ils permettraient probablement de mieux caractériser les
processus physiopathologiques sous-jacents aux phénomènes
douloureux chroniques, en particulier ceux liés à une neuropathie.
ÉVALUATION DE LA DOULEUR
■ CONCLUSION
41
ÉVALUATION DE LA DOULEUR
Upsa Méthodo essais 2002
42
18/10/02
15:57
Page 42
Upsa Méthodo essais 2002
18/10/02
15:57
Page 43
Évaluation de la douleur clinique
chez l’adulte
François Boureau
■ INTRODUCTION
Cet article porte sur l’évaluation de la douleur dans le cadre de la
réalisation d’un essai clinique et ne concerne donc pas la pratique
quotidienne de son évaluation et de son traitement. Les spécialistes
de la douleur qui gèrent des cas difficiles, rebelles, sont en général très
réceptifs à toute information concernant une nouvelle stratégie thérapeutique. Il est essentiel de souligner la nécessité d’appuyer toute
acquisition nouvelle sur des essais cliniques répondant à des critères
de qualité. Ceux-ci constituent une étape incontournable dans le
développement de nouveaux antalgiques.
La valeur d’un résultat dépend du choix des instruments de mesure mais
aussi, et surtout, de la méthodologie de l’ensemble de l’essai.
Les principes généraux d’un essai clinique tels que randomisation,
double aveugle, définitions de critères d’inclusion et d’exclusion, calcul
des effectifs, etc. sont considérés comme acquis et nous nous focaliserons sur les paramètres d’évaluation de la douleur.Concernant la méthodologie des essais cliniques dans ce domaine, il est souhaitable de se
référer à des recommandations qui font l’objet d’un consensus par les
spécialistes du domaine.Citons,par exemple,les recommandations de la
FDA :“Guidelines for the clinical evaluation of analgesics drugs”.
Lorsqu’un résultat est acquis avec une méthodologie quelque peu inhabituelle, on doit s’interroger sur les biais possibles introduits. Ceci incite
à la standardisation des méthodes d’évaluation utilisées. Cette standardisation est d’autant plus nécessaire que les résultats des études portant
sur une même problématique peuvent être repris dans des métaanalyses. Il devient délicat de faire des revues lorsque les variables
étudiées ne sont pas homogènes.
ÉVALUATION DE LA DOULEUR
■ QUALITÉ DE L’ESSAI CLINIQUE
43
Upsa Méthodo essais 2002
18/10/02
15:57
Page 44
Pour chaque modèle d’évaluation de la douleur, nous disposons d’une
littérature spécifique qu’il est important de consulter. Par exemple,
l’International Headache Society a proposé une liste de critères
à respecter dans les études sur les migraines et sur les céphalées de
tension. Des ouvrages généraux comme “Design of analgesics trials”
(Max, 1991) ou “An evidence base resource for pain relief” (Mc Quay,
1998) peuvent également être utilement consultés.
■ LES PROBLÈMES POSÉS
ÉVALUATION DE LA DOULEUR
La douleur est, par définition, un vécu. Malgré la nature subjective de la
douleur, sa mesure reste possible. Le problème posé consiste à standardiser au mieux les conditions de recueil de l’évaluation de ce phénomène subjectif. D’une certaine manière, les spécialistes sont confrontés
aux mêmes difficultés que les psychiatres ou psychologues lorsque
ceux-ci doivent mesurer la dépression ou l’anxiété.L’objectif est alors de
disposer d’outils validés permettant de standardiser, c’est-à-dire d’objectiver, une information par nature subjective. On comprend dès lors que
les échelles d’évaluation de la douleur rejoignent celles utilisées en
psychométrie.
44
La méthode envisagée pour évaluer la douleur dépend en partie de la
définition ou de la délimitation qu’on lui donne. À côté de l’aspect
sensation proprement dit, on peut être amené à considérer la dimension affectivo-émotionnelle qui est intégrée à la perception, à s’intéresser au retentissement sur les capacités fonctionnelles… Dans le cas
des lombalgies, par exemple, il paraît important de documenter les
capacités fonctionnelles. Le retentissement sur le sommeil et plus
généralement sur la qualité de vie est un autre niveau à considérer
pour décrire la symptomatologie des pathologies douloureuses.
L’appréciation des mécanismes générateurs d’une douleur est un autre
objectif possible. Des outils permettant de préciser, par exemple, sa
composante neuropathique seraient très utiles pour la réalisation
d’une étude dans ce domaine.
Lors d’un essai clinique, il faut définir un critère principal permettant
d’évaluer l’efficacité de la substance antalgique testée. Pour évaluer un
phénomène multidimensionnel, on peut être amené à chercher à
Upsa Méthodo essais 2002
18/10/02
15:57
Page 45
multiplier les critères.Toutefois, on doit alors connaître le risque d’introduire un biais dû à la chance de faire apparaître une différence
significative.
Modèle multidimensionnel de la douleur
MÉCANISMES
GÉNÉRATEURS
P
A
T
H
O
L
O
G
I
E
➨
DOULEUR
PERCEPTION
COMPORTEMENT
➨
ENVIRONNEMENT
NOCICEPTIF
SENSATION
➨
NEUROGÈNE
PSYCHOGÈNE
➨
IDIOPATHIQUE
DÉFICIENCE
COGNITION
FAMILIAL
MOTEUR
➨
➨
VERBAL
ÉMOTION
PROFESSIONNEL
SOCIAL
➨
INCAPACITÉ
➨
DÉSAVANTAGE
Aujourd’hui, la validation d’un outil d’évaluation de la douleur suppose
une réflexion appréciant l’ensemble des caractéristiques métrologiques
de cet outil.Le terme de validité rassemble en fait plusieurs types de validité : la validité de contenu (l’outil mesure-t-il véritablement ce qu’il est
censé mesurer ?), d’apparence (comment l’outil est-il perçu par le
patient ?), de construit (l’outil peut-il prendre en compte l’ensemble des
dimensions ?) et la validité concourante (l’outil proposé est-il cohérent
avec le “Gold Standard”éventuel ?).La validation d’un outil suppose aussi
de s’assurer de sa fidélité (test/retest/cohérence interne) et de sa sensibilité au changement.
Aujourd’hui, force est de reconnaître que peu d’outils d’évaluation de la
douleur clinique ont fait l’objet de publications réexaminant l’ensemble
de leurs caractéristiques métrologiques.
ÉVALUATION DE LA DOULEUR
■ LA VALIDATION DES OUTILS D’ÉVALUATION
DE LA DOULEUR
45
Upsa Méthodo essais 2002
18/10/02
15:57
Page 46
■ LE DÉROULEMENT DE L’ESSAI CLINIQUE
◗ Quelques questions fréquentes
•Faut-il éliminer les placebo-répondeurs ?
La réponse à cette question souvent posée est simple : les placeborépondeurs ne doivent pas être éliminés. Il ne faut, en effet, pas
confondre les notions de placebo-répondeur et de placebo-discriminateur. Un patient qui répond au placebo peut malgré tout faire la
différence avec le verum.
•Le placebo est-il éthique ?
ÉVALUATION DE LA DOULEUR
Il n’est pas facile de répondre à cette question. On peut décider de faire
l’économie d’un placebo en basant l’étude sur une molécule de référence, ce qui suppose souvent de faire l’hypothèse que la molécule
étudiée sera plus efficace que la molécule de référence.Cependant,pour
des raisons méthodologiques, il est rarement satisfaisant de se passer
d’un placebo. C’est pourquoi, il est souvent nécessaire de faire un
compromis entre ce qui est acceptable sur un plan scientifique et ce qui
est acceptable sur un plan éthique. Une autre question importante est
celle de l’information du patient sur le placebo. Il ne semble pas que les
bonnes pratiques, avec notamment l’information et le consentement,
aient modifié la survenue de l’effet placebo.
46
◗ La comparabilité des groupes
Lorsque l’on procède à des études sur des groupes parallèles, il est
essentiel de s’assurer que les groupes sont comparables. Dans cette
perspective, on retient bien évidemment les critères diagnostiques
habituels. Mais il faut aussi prendre en compte les variables de la
douleur susceptibles de créer une hétérogénéité comme l’ancienneté
de la douleur, son intensité ou le degré de handicap. Par exemple, il ne
serait pas logique d’inclure dans la même étude des patients au stade
aigu et chronique d’un zona.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 47
◗ La sélection des malades sur l’aptitude à s’évaluer
Si une grande rigueur est souvent observée en termes de critères
d’inclusion et d’exclusion, on peut regretter qu’il ne soit pas toujours
vérifié que les sujets participant aux essais sachent utiliser correctement un outil d’évaluation. Il faut savoir que dans une population
non-sélectionnée, environ 18 % à 25 % des sujets ne savent pas
utiliser une échelle visuelle analogique (EVA). Une mauvaise appréhension de l’aptitude des patients à s’auto-évaluer se traduit donc
par un manque de fiabilité des réponses qui se répercute directement sur la pertinence de l’étude. Pour remédier à ce type de
problème, il faut donc sélectionner les patients sur leur aptitude à
répondre, intégrer dans les critères d’inclusion des tests permettant
de contrôler cette aptitude et standardiser les explications. Il est
certain que ce type de raisonnement peut conduire à écarter, par
exemple, les enfants et les personnes très âgées des essais cliniques, ce
qui pose des problèmes pour documenter les possibilités thérapeutiques pour cette catégorie de malades.
Si les essais cliniques sont souvent très rigoureux en termes d’échelle,
on s’aperçoit que la définition claire de la douleur à évaluer n’est pas
suffisamment explicite dans la question posée. Par exemple, la question
de l’intensité de la douleur ne précise pas toujours s’il s’agit de la douleur ressentie au moment présent, depuis une heure ou depuis une
journée. Les douleurs provoquées par l’activité peuvent être difficiles
à évaluer. En effet, il faut que le patient accepte de réaliser une performance qui le fasse souffrir. Le plus souvent, le patient forme son jugement par anticipation du niveau possible de douleur. Pour des raisons
méthodologiques, les essais cliniques se basent donc plus souvent sur
les douleurs spontanées que sur les douleurs provoquées par une activité qu’il faudrait standardiser. Enfin, la douleur à l’inclusion doit avoir
un niveau suffisant pour permettre la mise en évidence des variations
des scores sous l’effet du traitement.
ÉVALUATION DE LA DOULEUR
◗ Définir la douleur à étudier
47
Upsa Méthodo essais 2002
18/10/02
15:57
Page 48
■ LES ÉCHELLES
◗ L’échelle verbale simple (EVS)
L’échelle verbale simple est une échelle ordinale qui fonctionne par catégorie (douleur absente/faible/modérée/intense) et à laquelle un score
est imputé (0, 1, 2 ou 3). Dans les essais internationaux, cette échelle
pose des problèmes sémantiques car il n’est pas facile de traduire des
termes comme “severe pain”.
L’échelle verbale simple présente l’avantage d’être facile à comprendre,
de permettre une réponse rapide et de pouvoir se prévaloir d’une certaine validité descriptive. En revanche, le nombre limité de catégories
peut être responsable de choix forcés. En effet, supposons qu’un patient
qui souffrait d’une douleur intense se sente un peu mieux, il n’aura
d’autre choix que de qualifier sa douleur de modérée. Or, il aurait peutêtre traduit l’évolution de sa douleur d’une manière moins radicale s’il
avait disposé d’une échelle de type visuelle analogique ou numérique.
En définitive, le faible nombre de catégories de l’échelle verbale simple
pénalise cet instrument qui a, par ailleurs, l’avantage d’être facilement
compris.
ÉVALUATION DE LA DOULEUR
◗ L’échelle numérique (EN)
48
Le patient indique sur une échelle de 0 (pas de douleur) à 10 (douleur
maximale) le niveau de sa douleur au moment présent ou le niveau de
la douleur ressentie de manière générale au cours des dernières
24 heures. L’échelle numérique, qui est un bon instrument pour la
routine clinique, a été peu utilisée pour les essais contrôlés.
◗ L’échelle visuelle analogique (EVA)
Cet instrument est aujourd’hui devenu un standard dans les essais
cliniques portant sur la perception de la douleur.L’échelle visuelle analogique est une échelle ordinale bien que certains auteurs, comme Price,
la désignent comme une échelle de rapport en raison de sa capacité
descriptive.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 49
Aujourd’hui, il n’existe pas de réel consensus sur la définition de l’extrémité supérieure de l’échelle visuelle analogique.Selon les réglettes,cette
extrémité sera désignée comme une “douleur extrême”, une “douleur
insupportable”.“Douleur maximale imaginable” est toutefois la terminologie la plus fréquente qu’il faut recommander. Évaluer une douleur,
entre l’absence de douleur et la douleur insupportable,place les patients
dans le registre de la tolérance,c’est-à-dire dans une dimension affective.
Par conséquent, il faut garder à l’esprit que l’échelle visuelle analogique intègre un ensemble de composantes de la douleur : affective et
sensorielle.
Le traitement des données issues des échelles visuelles analogiques
s’effectue en termes de moyennes et de médianes. Ces échelles sont
simples à utiliser et présentent une bonne sensibilité. Néanmoins, il
convient d’accepter que certains patients ne sont pas aptes à les
utiliser, et ce malgré les explications fournies. Enfin, il faut se rappeler
que l’utilisation de l’échelle visuelle analogique réclame une coordination motrice qui n’est pas toujours évidente à obtenir en période
post-opératoire.
La littérature ne permet pas de préciser à partir de quelle ampleur
une variation sur l’échelle est pertinente sur le plan clinique. Souvent,
on estime que la variation est pertinente à partir de 10 millimètres.
Échelles globales : forces et faiblesses
• Validité . . . . . . . . . . . . . . . . . . . . . . . . . .EVA=EVS=EN
• Sensibilité . . . . . . . . . . . . . . . . . . . . . . . . .EVA>EVS, EN ?
• Facilité de compréhension . . . . . . . . . . . . . .EVA<EN<EVS
• Facilité de passation . . . . . . . . . . . . . . . . .EVA=EVS=EN
• Adhésion du malade . . . . . . . . . . . . . . . . .EVA<EN<EVS
• Risque d'erreur de score . . . . . . . . . . . . . . .EVA>EVS=EN
D’après Jensen, 1992
ÉVALUATION DE LA DOULEUR
◗ Les forces et les faiblesses des échelles globales
49
Upsa Méthodo essais 2002
18/10/02
15:57
Page 50
L’EVA possède une sensibilité supérieure à l’EVS. Elle présente également un avantage certain en termes de risques d’erreurs de score. Pour
limiter ces risques, il est préférable que l’EVA soit remplie directement
dans le cahier d’observation. Lorsque ce cahier est photocopié, il est
important de s’assurer que l’échelle est respectée sur la copie.En termes
de validité et de facilité d’utilisation,les trois échelles sont réputées équivalentes. Enfin, l’EVS permet d’obtenir de meilleurs résultats en ce qui
concerne la facilité de compréhension et l’adhésion du malade.
◗ Les relations entre l’EVA et l’EVS
Nous savons qu’il existe une bonne corrélation entre les résultats obtenus avec l’EVA et l’EVS. Des travaux réalisés par Collins en 1997 ont
montré que les patients souffrant d’une douleur modérée plaçaient en
moyenne cette douleur à 49 mm sur une EVA et que 90 % d’entre eux
la plaçaient à plus de 26 mm. Ces auteurs ont également montré que les
patients souffrant d’une douleur intense plaçaient en moyenne cette
douleur à 75 mm sur une EVA et que 90 % d’entre eux la plaçaient à plus
de 49 mm.
Il n’est pas certain que ces relations soient identiques dans des
modèles de douleur chronique. Parfois un douloureux chronique se
dit moins gêné par l’intensité de sa douleur que par son caractère
continu, quotidien depuis de nombreuses années.
ÉVALUATION DE LA DOULEUR
◗ Mesure d’intensité et de soulagement
50
L’EVA, l’EVS et l’EN peuvent être utilisées pour mesurer l’intensité de la
douleur mais aussi pour mesurer l’ampleur du soulagement. Lorsqu’il
évalue son soulagement, le patient doit faire référence à une douleur
antérieure, ce qui peut introduire un biais dû à la mémoire de la douleur
initiale. Mais nous ne savons pas en fait si ce biais conduit à surestimer
ou à sous-estimer la douleur.
Les échelles d’intensité permettent très rapidement de s’assurer que les
groupes testés sont homogènes à l’inclusion, ce qui n’est pas le cas des
échelles de soulagement. En effet, il faut savoir que la description en critère principal des différences d’intensité douloureuse peut masquer une
hétérogénéité initiale, ce qui est un facteur de biais.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 51
Pour mesurer le critère principal de la douleur, il est préférable d’avoir
recours à l’EVA. Une EVS ou une échelle numérique de soulagement
peuvent être utilisées pour mesurer le critère secondaire.
Dans les études sur la douleur chronique, il faut associer l’analyse de la
perception de la douleur à celles des capacités fonctionnelles et de la
qualité de vie.
◗ Refléter la dynamique de l’effet
La dynamique de l’effet est d’autant plus simple à dégager que les études
portent sur un temps court. Des indices tels que SPID (Sum of Pain
Intensity Differences) ou TOTPAR (Total Pain Relief) nous aident à résumer cette dynamique.
◗ Critère de succès
◗ La nécessité d’une évaluation globale
En fin d’essai, il est intéressant de conduire une évaluation globale
intégrant les paramètres d’efficacité du traitement ainsi que les effets
indésirables. L’une des échelles globales couramment utilisées est
l’échelle CGI (Clinical Global Impression).
Les descriptions synthétiques de l’effet d’une substance qui permettent
de résumer,avec un seul marqueur,l’ensemble des résultats d’une étude
sur six heures (SPID,TOTPAR) sont très intéressantes, notamment pour
réaliser des comparaisons.
ÉVALUATION DE LA DOULEUR
Souvent, nous sommes amenés à choisir un critère de succès en complément d’un critère sensible mais insuffisamment descriptif. En 1957,
Beecher a introduit un critère très significatif sur le plan clinique en
demandant aux patients s’ils se sentaient, ou non, soulagés de 50 %.
Mc Quay a repris cet indice dans ses méta-analyses.
Un critère comparable a été défini pour les migraines : la disparition
de la douleur à deux heures. Ce type de critère est très parlant pour
le praticien. Il est aussi exigeant, ce qui a conduit à le modifier en
admettant une douleur absente et/ou faible au bout de deux heures.
51
Upsa Méthodo essais 2002
18/10/02
15:57
Page 52
◗ La dimension sensorielle et la dimension affective
Les équipes de Price et Gracely ont travaillé sur la discrimination de la
dimension sensorielle et de la dimension affective. Dans cette perspective, ils ont demandé aux patients d’évaluer sur des échelles (EVA ou
EVS),l’intensité de leur sensation,d’une part,et le caractère désagréable
de la sensation, d’autre part. Avant de conduire une telle étude, il est
important d’expliquer au patient que, comme en musique, l’intensité
ne présente pas nécessairement de lien avec son caractère agréable ou
désagréable. En situation clinique, il semble que le questionnaire de
Mc Gill soit le plus approprié pour opérer une distinction entre la
dimension sensorielle et la dimension affective de la douleur. Certains
résultats observés avec le fentanyl sont intéressants. Ils montrent une
diminution de l’intensité de la douleur mais pas son caractère désagréable. Cette absence d’effet observé sur la composante affective
s’explique peut-être par les effets secondaires associés dans cette
étude (nausées notamment).
■ LES QUESTIONNAIRES DE VOCABULAIRE
ÉVALUATION DE LA DOULEUR
La littérature considère que le questionnaire de Mc Gill est validé.
Toutefois, ce questionnaire relativement long puisqu’il comporte
82 items, gagnerait à faire l’objet d’une simplification et d’une révision
de sa structure factorielle.
52
À notre avis, le questionnaire de Mc Gill présente deux potentialités
irremplaçables : premièrement, il permet d’isoler la description neurogène de la douleur ; deuxièmement, il permet d’évaluer la dimension
affective de la douleur, qui est différente de la dimension anxieuse ou
dépressive.
Les malades désignés comme non-communicants sont principalement les jeunes enfants et les personnes âgées pour lesquelles des
échelles d’évaluation sont en cours de validation. Ils ne peuvent pas,
bien entendu, être évalués par ce type d’instruments, ni par les
échelles globales (EVA, EVS, EN).
Upsa Méthodo essais 2002
18/10/02
15:57
Page 53
■ RETENTISSEMENT ET QUALITÉ DE VIE
Pour les cliniciens, il est important de pouvoir s’appuyer sur des outils
valides permettant de décrire la symptomatologie douloureuse chronique. De nombreux questionnaires existent. Il paraît important de citer
le questionnaire MPI (Multidimensional Pain Inventory) qui existe en
plusieurs langues. La première partie de ce questionnaire comporte
28 items et 5 sous-échelles permettant d’analyser l’intensité de la douleur, l’interférence, le niveau de contrôle de la personne sur son état, la
détresse affective et le retentissement sur l’environnement. Bien que
le MPI soit plutôt destiné à un travail exploratoire sur la douleur, il
présente une valeur descriptive intéressante.
La qualité de vie s’évalue au travers de la perception du patient de son
état de santé dans quatre domaines : le fonctionnement physique, l’état
psychologique, les interactions sociales et les sensations physiques.
Aujourd’hui, il apparaît clairement que l’évaluation de la douleur chronique doit prendre en compte ce concept pluridimensionnel.
Travail
Loisirs
Émotion
Affect
Vie à la maison
Sommeil
Repos
Alimentation
Déambulation
Mobilité
Communication
Interaction sociale
Énergie
NHP (36 items)
SF-36 (36 items)
Douleur
Douleur
Émotion
Émotion
Santé mentale
Sommeil
Mobilité physique
Isolement social
Énergie
Prob. physiques
Fonct. physique
Fonct. social
Santé en général
ÉVALUATION DE LA DOULEUR
SIP (136 items)
53
Upsa Méthodo essais 2002
18/10/02
15:57
Page 54
Pour évaluer la qualité de vie, nous avons à notre disposition des
échelles génériques, c’est-à-dire des échelles utilisables pour toutes les
catégories de patients, et des échelles spécifiques, c’est-à-dire des
échelles adaptées à une population donnée (par exemple, les malades
souffrant de lombalgies).
Les questionnaires les plus utilisés pour évaluer la qualité de vie sont le
SIP (Sickness Impact Profile) qui comporte 136 items, ce qui requiert
une forte adhésion de la part des patients, le NHP (Nottingham Health
Profile) et le SF 36 qui comportent tous deux 36 items (voir tableau
page 53). Mais, quel que soit le questionnaire utilisé, l’essentiel pour le
praticien est surtout de savoir définir les dimensions de la douleur qu’il
cherche à évaluer.
■ CONCLUSION
ÉVALUATION DE LA DOULEUR
Les essais cliniques exigent qualité et rigueur dans leur mise en œuvre.
Si nous voulons parvenir à faire évoluer les conceptions dans le
domaine de la douleur, il nous faut adopter les mêmes exigences. Ceci
laisse une place limitée aux rapports anecdotiques sur quelques cas.
Il est sans doute déterminant que les experts motivés qui travaillent
sur la douleur puissent échanger leur savoir-faire dans un groupe
d’intérêt qu’il est important de mettre en place.
54
Upsa Méthodo essais 2002
18/10/02
15:57
Page 55
Évaluation de la douleur clinique
chez l’enfant
Annie Gauvain-Piquard
■ LA NOTION DE CONSTRUIT
◗ Définition
Lorsque l’on observe de fortes corrélations entre des données, on peut
émettre l’hypothèse qu’elles correspondent à un seul phénomène que
l’on appellera le construit. Par définition, la douleur est un construit
puisqu’elle correspond à des phénomènes divers observés en clinique
qui peuvent être regroupés sous cette notion. Il faut bien prendre
conscience que c’est initialement une théorie (aujourd’hui confortée
par la physio-pathologie) qui a amené à supposer que des phénomènes
qui affectent des parties du corps humain aussi différentes que la
colonne vertébrale ou une dent relevaient d’une même notion.
Pour relier les phénomènes observés au construit lui-même, les cliniciens établissent des mesures qui jouent le rôle d’intermédiaires entre
la théorie formulée et les observations. Il faut, d’une part, vérifier que
les mesures mises en œuvre sont fiables, et, d’autre part, s’assurer que
l’objet des mesures correspond véritablement à un construit.
ÉVALUATION DE LA DOULEUR
En France, les recherches sur la douleur ne se sont pas suffisamment
placées dans le registre des variables subjectives. Pourtant, ces
variables ont fait l’objet de recherches importantes, notamment dans
les années cinquante et soixante. En particulier, l’American Psychology
Association a édité des recommandations sur la validation des échelles
qui sont malheureusement peu connues en France. Ces recommandations reposent essentiellement sur la notion de construit (d’après le
terme anglais “construct”), une notion couramment utilisée dans la
littérature américaine relevant de la psychométrie.
55
Upsa Méthodo essais 2002
18/10/02
15:57
Page 56
◗ La validation
La validation du construit
Pour valider un construit, il faut respecter les étapes suivantes :
• spécifier le domaine des observables : il s’agit de dresser la liste des
variables utilisables pour évaluer le construit.
• évaluer la cohérence interne des observations : il s’agit d’étudier le
degré de corrélation entre les différents outils disponibles. Cela
permet de déterminer si le construit sur lequel repose la théorie est
indivisible ou s’il doit, au contraire, être subdivisé en plusieurs
construits. La douleur chez l’adulte peut être scindée en au moins
deux sous-construits : l’auto-évaluation et l’évaluation comportementale. En effet, on obtient de très fortes corrélations entre les différents
outils qui permettent d’auto-évaluer la douleur chez l’adulte, mais, en
revanche, la corrélation entre l’auto-évaluation et l’évaluation
comportementale est relativement faible (1).
ÉVALUATION DE LA DOULEUR
La validation des échelles
56
La validation d’une échelle ne consiste pas à énumérer un certain
nombre de qualités mais à respecter un processus.Tout d’abord, il faut
s’assurer de la validité de contenu, ce qui suppose de vérifier que l’on
n’a pas omis certaines composantes. Ensuite, il convient de savoir si l’on
se trouve ou non dans une situation où il existe un “Gold Standard”.
Lorsque c’est le cas, comme pour le construit de la douleur chez
l’adulte, on peut se contenter d’utiliser l’échelle à valider conjointement
au “Gold Standard” (ici l’EVA). Lorsque ce n’est pas le cas, comme pour
le construit de la douleur chez l’enfant, il est nécessaire de vérifier que
ce que l’on évalue correspond bien à la théorie qui sous-tend les
recherches (validité du construit). Par exemple, on peut émettre l’hypothèse qu’un enfant opéré pour une hernie inguinale n’aura pas mal
le jour de l’hospitalisation, aura mal après l’intervention et que cette
douleur ira en décroissant. Si l’échelle à valider fournit des données
confirmant l’hypothèse, un argument de validité de construit est
apporté.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 57
■ L’AUTO-ÉVALUATION DE LA DOULEUR
◗ L’Échelle Visuelle Analogique
L’EVA reste l’outil standard de l’auto-évaluation de la douleur chez l’enfant de plus de six ans. En pédiatrie, cet outil est utilisé de manière
verticale car le jeune enfant possède un sens de la verticalité développé. Le sens de l’horizontalité viendra plus tard, avec la maîtrise de
l’écriture. L’expérience montre que la forme de l’EVA ne joue pas un
rôle fondamental. En effet, des études qui se sont fondées sur plusieurs
formes d’EVA présentent de très forts taux de corrélations (2). Par
conséquent, il ne semble pas nécessaire de poursuivre les recherches
sur l’adaptation des EVA à l’enfant. L’essentiel est de savoir développer
une échelle d’évaluation adaptée à l’enfant sur un plan cognitif et
d’éviter un certain nombre d'erreurs. Nous savons notamment que les
gradients de couleur (du bleu au rouge) peuvent fausser les résultats.
C’est, par exemple, le cas si les petites filles choisissent la couleur rose
tout simplement parce qu’elles aiment intrinsèquement cette
couleur.
◗ Les outils basés sur l’expression faciale de la douleur
L’expression faciale universelle de la douleur
Ces outils reposent sur le principe que l’on peut décrire chez l’être
humain une expression faciale universelle de la douleur se caractérisant
notamment par l’accentuation du sillon naso-labial et par le froncement
des sourcils. Reste alors à savoir si le jeune enfant est en mesure d’identifier un niveau de douleur à partir d’expressions faciales.
Nous savons que dès l’âge de trois mois un nouveau-né dispose d’une
certaine aptitude à distinguer plusieurs expressions faciales. En
revanche, nous ne savons pas à partir de quel âge l’enfant est apte à
reconnaître l’expression faciale de la douleur. En outre, chez l’adulte,
ÉVALUATION DE LA DOULEUR
Une étude, financée notamment par l’Institut Upsa de la Douleur,
a permis de tester un outil dérivé des échelles analogiques : l’algocube.
Nous savons d’ores et déjà que cet outil présente, au-delà de six ans, un
très fort taux de corrélation avec les autres outils d’auto-évaluation de
la douleur.
57
Upsa Méthodo essais 2002
18/10/02
15:57
Page 58
cette aptitude est assez inconstante et hétérogène. Par ailleurs, il est
connu qu’un enfant de moins de cinq ans n’est pas capable d’effectuer
un choix parmi plus de cinq options.
Les visages dessinés
Par le passé, nous avons observé une très mauvaise corrélation entre
certains outils d’expression faciale de la douleur et les EVA. Mais il faut
préciser que ces outils présentaient des défauts majeurs. Premièrement,
ils associaient l’absence de douleur à un visage souriant en se basant sur
une théorie psychologique inexacte supposant que la douleur s’opposait au plaisir. Or, des études postérieures ont montré que l’être humain
n’associe pas l’absence de douleur à un visage qui sourit mais plutôt à
un visage neutre. Deuxièmement, ces outils commettaient l’erreur
d’associer la douleur intense aux larmes, ce qui peut entraîner un biais
dans les réponses des petits garçons à qui l’on défend de pleurer sous
prétexte qu’ils sont des hommes. Si l’on décidait de travailler sérieusement sur des échelles de visages dessinés, il serait préférable de concevoir de nouveaux outils sur la base des connaissances dont nous
disposons désormais.
ÉVALUATION DE LA DOULEUR
Les visages photographiés
58
Des infirmières ont développé une échelle de visages photographiés,
connue sous le nom d’échelle Oucher. La première photographie est
celle d’un visage neutre et les suivantes font apparaître de manière
progressive l’expression faciale de la douleur. Une nouvelle version de
l’échelle Oucher, actuellement en cours d’élaboration, a été présentée
lors du congrès sur la douleur de l’enfant qui s’est tenu en l’an 2000 au
Royaume-Uni. Précisons que l’échelle Oucher présente une bonne
validité ainsi qu’une très forte corrélation avec l’EVA. Notons aussi
que cette échelle a été adaptée à différentes populations ethniques.
◗ Autres outils
Pour l’instant, les échelles verbales n’ont pas été étudiées chez l’enfant
et nous sommes d’ailleurs incapables de savoir à partir de quel âge elles
pourront être utilisées.En tout état de cause,il n’existe aucun consensus
sur l’idée que peut se faire un enfant d’une douleur faible, modérée ou
Upsa Méthodo essais 2002
18/10/02
15:57
Page 59
intense. En revanche, la localisation de la douleur sur un schéma
présente une fiabilité assez bonne chez l’enfant.
◗ Corrélations
Il existe, dans la littérature, au moins 48 comparaisons entre deux autoévaluations qui font apparaître une corrélation systématiquement supérieure à 0,60 dans les études d’auto-évaluation de la douleur chez les
enfants de plus de six ans. Pour cette population, nous disposons donc
d’un construit d’auto-évaluation solide et homogène.
Les études d’auto-évaluation réalisées chez les enfants de plus de 6 ans
ont permis de constater que les 6/11 ans et les 12/17 ans n’évaluaient
pas leur douleur de la même manière. Une étude sur la douleur liée à la
polyarthrite juvénile a ainsi montré que le groupe le plus jeune donnait
des scores plus étalés que les plus âgés et que son score moyen était plus
bas. Pour expliquer ce phénomène, qui a été observé pour plusieurs
pathologies chroniques, nous avons avancé l’hypothèse que les jeunes
enfants avaient des difficultés à exprimer une plainte vis-à-vis de douleurs permanentes ou chroniques d’origine interne et à se situer par rapport à la normalité. En fait, pour un enfant de six à huit ans qui souffre
en permanence,la normalité ne correspond probablement plus à un état
sans douleur. En revanche, le phénomène inverse se produit pour les
douleurs aiguës qui seront évaluées avec des scores plus élevés par le
groupe des 6/11 ans que par le groupe des 12/17 ans. Une étude (qui
demande encore à être confirmée) a indiqué que cet écart se manifestait principalement dans la composante sensorielle de la douleur.
■ L’HÉTÉRO-ÉVALUATION
Actuellement, environ neuf échelles permettent de procéder à une
hétéro-évaluation de la douleur chez l’enfant et huit échelles permettent
de procéder à une hétéro-évaluation de la douleur chez le nouveau-né et
le prématuré. Elles reposent sur :
ÉVALUATION DE LA DOULEUR
◗ L’influence de l’âge
59
Upsa Méthodo essais 2002
18/10/02
15:57
Page 60
◗ Les réactions à la douleur
Un consensus s’est établi sur le fait que la douleur provoque deux types
de réactions :
• une réaction immédiate : elle est à la fois comportementale (agitation/cris) et physiologique (stress).
• une réaction d’adaptation et d’évitement : cette réaction conduit à des
positions antalgiques de plus en plus nettes et à une inertie psychomotrice. Concrètement, elle pousse l’enfant à devenir immobile.
ÉVALUATION DE LA DOULEUR
◗ Les comportements
60
Trois grandes catégories de comportements ont été recensées :
• les comportements émotionnels : les chercheurs américains les décrivent comme une réaction à la douleur aiguë, à laquelle s’associent des
phénomènes physiologiques tels que tachycardie ou élévation de la tension artérielle. L’accent est aujourd’hui porté sur l’expression faciale de
la douleur aiguë, d’autant plus que nous disposons d’un corpus de données nous permettant de nous assurer de la validité de cet outil.
L’accentuation du sillon naso-labial et du froncement des sourcils sont
désormais considérés comme des signes flagrants de l’expression de la
douleur chez l’enfant comme chez le nouveau-né.
• l’adaptation défensive du corps : cette adaptation, qui se traduit par
des positions antalgiques et des contractures, apparaît en phase de
douleur aiguë et se poursuit en cas de douleur prolongée.
• l’inertie psychomotrice :elle apparaît en quelques heures et conduit au
tableau d’un enfant immobile et indifférent, dont les activités de base
sont perturbées (boire, manger, jouer, dormir…).
◗ Les échelles comportementales
Aujourd’hui, nous nous retrouvons face à une pléthore d’outils, ce qui
peut entraîner une certaine confusion.Le moment est venu de prendre
du recul et de revoir la question du construit du comportement face
à la douleur. Pour l’instant, les corrélations entre les différents outils
d’hétéro-évaluation restent très mauvaises.
Une revue de la littérature a fait apparaître seulement cinq corrélations
entre les outils d’hétéro-évaluation et les outils d’auto-évaluation utilisés
en hétéro-évaluation. Pour les parents, ces corrélations sont toutes
Upsa Méthodo essais 2002
18/10/02
15:57
Page 61
inférieures à 0,5. Pour les trois corrélations observées lorsque l’outil est
utilisé par une infirmière, les corrélations sont meilleures puisqu’elles
sont supérieures à 0,75. Par ailleurs, l’étude de la corrélation entre un
outil utilisé par un parent et un outil utilisé par une infirmière fait
apparaître une grande dispersion de score (5 données).
Contrairement à ce que certains espéraient, l’hétéro-évaluation par les
parents ne résout pas le problème de l’évaluation de la douleur chez
l’enfant.
■ L’ABSENCE DE VÉRITABLES CORRÉLATIONS
ENTRE AUTO ET HÉTÉRO-ÉVALUATION
La revue de la littérature fait apparaître 22 corrélations entre les outils
d’auto-évaluation et les échelles de comportement dont 14 sont inférieures à 0,60. Jusqu’à présent, nous n’avons pas été en mesure de
trouver par quelles lois ces corrélations étaient régies. Précisons que sur
les 22 corrélations recensées dans la littérature,18 portent sur la douleur
aiguë et seulement 3 sur la douleur chronique. Sur quatre études utilisant l’échelle Chéops en post-opératoire, seule une peut se prévaloir
d’une bonne corrélation avec les outils d’auto-évaluation.
De manière générale, il semble que nous progressons peu dans
l’évaluation des plus jeunes.
ÉVALUATION DE LA DOULEUR
Lorsque l’on étudie la corrélation entre les outils d’auto-évaluation
utilisés en auto-évaluation par les enfants et en hétéro-évaluation par les
parents (9 comparaisons),les corrélations sont faibles (6 sont inférieures
à 0,60) et présentent une grande dispersion. Lorsque cette corrélation
est pratiquée avec des infirmières (11 corrélations), la corrélation n’est
pas non plus satisfaisante (9 sont inférieures à 0,60). Les corrélations
entre l’hétéro-évaluation par un adulte et l’auto-évaluation par un enfant
sur le même outil sont meilleures pour les enfants de plus de huit ou
dix ans.
61
Upsa Méthodo essais 2002
18/10/02
15:57
Page 62
ÉVALUATION DE LA DOULEUR
■ CONCLUSION
62
Les échelles existantes sont satisfaisantes en termes psychométriques.
En revanche, des progrès doivent être réalisés sur la validation du
construit.Ils devraient nous permettre de mieux comprendre ce que ces
échelles évaluent véritablement. Précisons que si ces études ont été
largement développées au Royaume-Uni et aux États-Unis, cela n’a pas
encore été le cas en France.
Pour évaluer la validité du construit, plusieurs types d’études sont
possibles :
• l’étude de la structure factorielle ;
• l’étude de la validité de trait grâce à des échelles permettant d’évaluer
des phénomènes connexes comme le stress ou l’anxiété. Il faudra alors
émettre des hypothèses sur le degré de corrélation entre la douleur et le
stress ou entre la douleur et l’anxiété ;
• la validité nomologique dont l’évaluation repose notamment sur le
design des groupes extrêmes.Ce design consiste à séparer deux groupes
de patients très distincts sur la base d’un critère extérieur à la douleur
en prenant l’hypothèse qu’un groupe ressent une douleur quasi
inexistante alors que l’autre ressent une douleur importante. Par
exemple, une étude française a porté sur l’évaluation de la douleur
prolongée chez cent nouveau-nés en maternité (3). Sur la base du dossier
obstétrical, ces nouveau-nés ont été classés en deux catégories : les
nouveau-nés qui avaient eu une naissance facile et les nouveau-nés qui
avaient eu une naissance plus difficile. Cette étude a permis de montrer
que les scores de douleur étaient beaucoup plus bas pour les bébés qui
avaient bénéficié d’une naissance facile. L’essai thérapeutique donne
également des arguments de validité nomologique qui méritent d’être
étudiés pour évaluer la validité de construit.
De manière générale, il faut savoir faire preuve de créativité pour
avancer dans l’évaluation de la douleur chez l’enfant.
Bibliographie
1. Jensen M.P. : Validity of self-report and observation measures - In : proceedings of the
8th world congress on pain, progress in pain research and management vol 8, Ed :
T.S. Jensen, J.A Turner, IASP Press, 1997.
2. Mc Grath : a new analogue scale fot assessing children’s pain : an initial validation study
- Pain 64 (1996) 435-443.
3. Lassauge F., Gauvain-Piquard A., Paris I : validité de construit de l’Échelle de Douleur et
d’Inconfort du Nouveau-né (EDIN) - Douleur et analgésie, 1998, 4, 173-177.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 63
Le soulagement : indice de la douleur
ou de la qualité de la vie ?
Jocelyne Feine
Pour évaluer le succès d’un traitement donné, il faut d’abord savoir quel
est l’objectif visé. Pour la douleur, il convient de distinguer entre pathologie aiguë et pathologie chronique. Dans le premier cas, il est possible
de soulager la douleur rapidement tandis que dans le deuxième, le
nombre de thérapeutiques envisageables est plus large. Le soulagement
de la douleur aiguë peut être mesuré selon des rapports sur la
douleur ou des rapports sur le soulagement. Il peut également être
estimé en fonction de la réponse du malade à une stimulation ou à un
médicament. Les mêmes indices peuvent être utilisés lorsqu’il s’agit de
douleur chronique, mais il faut y ajouter la capacité d’accomplir des
tâches de la vie quotidienne, le désir de recevoir des soins supplémentaires et la qualité de vie.
L’évaluation du soulagement suppose que le malade se souvienne précisément de la douleur avant la mise en place du traitement et puisse la
comparer à celle après le traitement. Nous proposons l’équation
suivante : soulagement perçu = douleur avant traitement – douleur
actuelle. Ne disposant pas de données sur la douleur aiguë, nous nous
sommes appuyés sur les études de McQuay et al.Le rapport négatif entre
le changement chez le patient et l’indice de soulagement indique que
cette équation peut s’appliquer à la douleur aiguë (voir figure p 64).
Quant au soulagement de la douleur chronique, nous avons mené une
étude pour connaître l’efficacité d’un appareil dentaire type gouttière
sur la douleur myofasciale des muscles manducateurs. Le groupe expérimental a porté l’appareil 24 heures par jour. Le premier Groupe de
contrôle a porté un appareil placebo 24 heures par jour tandis que le
deuxième Groupe de contrôle n’a porté l’appareil placebo que lors des
ÉVALUATION DE LA DOULEUR
■ COMMENT MESURER LA DOULEUR ?
63
Upsa Méthodo essais 2002
18/10/02
15:57
Page 64
Évaluation du soulagement dans la douleur aiguë
Somme de la différence
de l’intensité de la douleur
(VAS-SPID)
200
100
0
100
200
300
Soulagement total (VAS-TOTPAR)
ÉVALUATION DE LA DOULEUR
D’après McQuay et al, 1985, 1987, 1990
64
visites. Parallèlement à l’évaluation de la douleur, nous nous sommes
intéressés à la mémoire de la douleur chez les malades ainsi qu’à leur
perception du soulagement. L'intensité de la douleur et l'inconfort ont
diminué avec le temps pour chacun des trois groupes. Néanmoins, il n'y
a pas eu de différences entre eux. Malgré tout, le groupe qui portait l'appareil pendant les visites a présenté significativement moins de soulagement que les deux autres groupes, qui portaient l'appareil 24 heures sur
24. De plus, tous les patients ont rapporté un soulagement, même quand
la douleur a augmenté.Le soulagement perçu est donc significativement
plus élevé que le soulagement réel. Ceci suggère que d'autres facteurs
peuvent influencer la cotation des patients vis-à-vis du soulagement
qu'ils perçoivent après traitement.
Nous avons donc conclu que l’équation proposée n’était pas valable et
avons décidé d’étudier de plus près la mémoire des patients. D’autres
études s’étaient déjà intéressées à ce sujet et avaient abouti à la conclusion suivante : les patients ne conservent pas un souvenir précis de leur
douleur. Nous avons pu constater également que les malades dont la
douleur était moins intense (moins de 50 millimètres sur une échelle
visuelle analogique de 100 millimètres) avaient tendance à exagérer la
douleur initiale. À l’inverse, les patients dont la douleur était plus forte
avaient tendance à en diminuer l’intensité rétrospectivement. Les
erreurs de mémoire augmentent donc avec le temps.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 65
En utilisant l’ensemble des variables définies, nous avons tenté de créer
un modèle pour l’évaluation du soulagement. Le temps écoulé, le
souvenir de la douleur, la douleur actuelle et les différents traitements
ont fortement influé sur les indices finaux. Seul le soulagement réel
n’a pas joué un rôle important. La perception du soulagement est
particulièrement peu fiable comme indice de changement de la
douleur puisqu’elle est quasiment imprévisible.
McQuay affirme que les indices de soulagement sont plus sensibles aux
traitements que les indices d’intensité de la douleur, mais il n’explique
malheureusement pas son raisonnement. Nos études ayant démontré
que les indices de soulagement ne sont pas une représentation juste du
changement opéré, nous étions perplexes et avons décidé de nous
référer à McQuay une fois de plus. Il indique à ce sujet que « le soulagement renferme peut-être des éléments annexes que n’inclut pas la
notion d’intensité. En effet, tout effet secondaire, comme la nausée, peut
être pris en compte par le malade ».
Notre hypothèse est la suivante : l’indice de soulagement de la douleur
chronique présente une corrélation positive et significative avec l’indice
de qualité de vie.
La qualité de vie en matière de santé renferme l’effet d’une pathologie
et de la thérapeutique sur le patient,tel qu’il est perçu par ce patient.Les
études sur la qualité de vie portent sur quatre grands domaines : la
mobilité physique, l’état émotionnel, l’interaction sociale et la sensation
somatique et viscérale.
La qualité de vie sera d’autant plus importante au XXIe siècle que la
grande majorité des maladies seront chroniques et de longue durée. La
médecine propose peu de solutions à ces problèmes.Les malades,quant
à eux, souhaitent savoir comment leur maladie et le traitement proposé
les affecteront dans leur vie quotidienne. La biochimie les intéresse peu.
Si un nouveau traitement pouvait garantir une meilleure qualité de vie,
il serait préféré aux traitements existants.
En 1990, Fries et Spitz avaient déjà émis cette idée, indiquant que le
principe de l’évaluation du traitement représente un changement de
mentalité implicite : au lieu de se baser sur les données médicales, il
privilégie les éléments qui préoccupent les patients eux-mêmes.
ÉVALUATION DE LA DOULEUR
■ LA QUALITÉ DE VIE
65
Upsa Méthodo essais 2002
18/10/02
15:57
Page 66
ÉVALUATION DE LA DOULEUR
Il existe aujourd’hui plusieurs outils de mesure pour la qualité de vie,qui
sont soit génériques, soit spécifiques. Parmi les premiers, citons le
Nottingham Health Profile (Hunt et al, 1981) et le Sickness Impact
Profile (Bergner et al, 1981). Les outils spécifiques comprennent par
exemple l’EORTC QLQ-C30 (Aaronson et al, 1993),The Arthritis Impact
Measurement Scale (Meenan, 1984), l’Inflammatory Bowel Disease
Questionnaire (Guyatt et al, 1989) et le Chronic Heart Failure
Questionnaire (Guyatt et al, 1989).
Ceux portant sur des maladies spécifiques sont plus précis dans
certaines situations mais ne permettent pas de comparer les effets de
maladies différentes, comme le font les outils génériques. Ces
informations peuvent être très utiles pour les décideurs politiques qui
doivent répartir les fonds publics entre des pathologies différentes.
L’outil EORTC QLQ-C30 (European Organisation for Research on
Treatment of Cancer) fait relativement exception puisqu’il compare
différents types de cancer. Les outils spécifiques peuvent également
indiquer quels aspects de la qualité de vie sont altérés par la maladie ou
par le traitement. Une étude sur les douleurs dorsales a par exemple
révélé que la qualité de vie dépend essentiellement de la qualité du
matelas du malade. Enfin, ces outils peuvent mettre en évidence les
divergences entre les différentes expériences des malades.
66
Upsa Méthodo essais 2002
4. ESSAIS
18/10/02
15:57
Page 67
CLINIQUES DES ANTALGIQUES
Place de la pharmacocinétique
dans les essais cliniques des antalgiques
Jules Desmeules
■ INTRODUCTION
Dans les études pharmacocinétiques en phase I, on recherche une
concentration maximale, le temps maximal où cette concentration est
atteinte et une chronologie qui permettra de prédire celle des événements analgésiques. Ces études portent sur les paramètres suivants et
leur évolution : le volume de distribution, qui permet de déterminer la
dose de charge, la clairance, qui permet de savoir à quelle fréquence il
faut administrer les doses, la linéarité de l’élimination, en fonction de
la dose prévue en administration clinique et la biodisponibilité, en
fonction de la voie d’administration qui correspond à la fraction de la
dose administrée parvenant dans le volume sanguin.
En phase II, les études pharmacocinétiques viseront à mettre en
évidence une relation entre la concentration et l’action, d’une part,
et entre la concentration et les effets indésirables du médicament,
d’autre part.
Actuellement, pour les études de phase III, nous avons de plus en plus
recours à la pharmacocinétique dite de population afin d’étudier des
variables comme l’âge ou le sexe, l’insuffisance rénale ou hépatique.
ESSAIS CLINIQUES DES ANTALGIQUES
L’objet principal de la pharmacocinétique dans les essais cliniques des
antalgiques est d’évaluer la relation dose/effet dans l’optique de
proposer un régime thérapeutique optimal. La pharmacocinétique
permet de rationaliser le développement clinique des analgésiques. Les
instances réglementaires exigent l’étude d’un certain nombre de paramètres pharmacocinétiques pour toutes les molécules : paramètres liés
à l’absorption, au métabolisme, à la distribution et à l’élimination.
67
Upsa Méthodo essais 2002
18/10/02
15:57
Page 68
Pharmacocinétique des antalgiques
Phase I
Cmax - Tmax - Volume de distribution - Clairance
Linéarité de l'élimination en fonction de la dose
Biodisponibilité et modifications des paramètres PK
selon le mode d'application projeté
Phase II
Relation concentration - effet /effets secondaires
Phase III
Pharmacocinétique de population
Évaluation du rôle des co-variables sur la PK
(âge - sexe - fonctions rénale et hépatique)
■ L’IMPORTANCE DE LA PHARMACOCINÉTIQUE
DANS LE DÉVELOPPEMENT DES ANALGÉSIQUES
ESSAIS CLINIQUES DES ANTALGIQUES
◗ L’exemple du tramadol :
utilisation chez les populations à risques
68
Cet exemple est destiné à souligner l’importance des études de pharmacocinétique pour les populations à risque.
Le tramadol est considéré comme un analgésique de deuxième palier
qui agit aussi bien sur le système mono-aminergique que sur le système
opioénergique.Sa biodisponibilité après administration orale est de 50 %
à 60 % et il est éliminé par le foie et le rein.
Le rôle de l’âge, de l’insuffisance rénale
et de l’insuffisance hépatocellulaire
Une étude a comparé les effets de 100 milligrammes de tramadol par
voie orale dans deux groupes de volontaires sains :le premier regroupait
des personnes de plus de 75 ans alors que le second regroupait des
jeunes adultes. Elle a permis d’observer une augmentation très nette de
la demi-vie du tramadol chez le sujet âgé liée à une diminution de sa
capacité d’élimination. En clinique, il faut donc réduire les doses administrées aux patients âgés lors d’une administration répétée. En
revanche, la concentration maximale obtenue après prise d’une dose
unique est identique pour les deux groupes. Une étude portant sur la
Upsa Méthodo essais 2002
18/10/02
15:57
Page 69
pharmacocinétique du tramadol chez les patients souffrant d’une insuffisance rénale a permis d’aboutir à la même conclusion que pour les
patients âgés : il faut réduire la dose administrée en cas d’administration
répétée.
Une étude portant sur des patients atteints d’insuffisance hépatocellulaire (patients cirrhotiques) a montré que la demi-vie du tramadol,
ainsi que la concentration maximale après prise d’une dose unique,
étaient augmentées chez ces patients. Par conséquent, il faut à la fois
réduire la dose initiale et les doses répétées chez cette catégorie de
patients.
En résumé, il faut ajuster la posologie du tramadol chez les patients de
plus de 75 ans et lorsque la clairance est inférieure à 50 ml/mn. En
outre,il convient de diminuer la posologie initiale en cas d’insuffisance
hépatocellulaire et réduire la dose d’entretien.
Le tramadol est transformé au niveau hépatique en différents métabolites actifs. Si le degré d’affinité du tramadol pour les récepteurs
opioïdes est très faible, celui des métabolites actifs est beaucoup plus
important. Or, à ce jour, nous ne connaissons pas l’évolution pharmacocinétique de ce type de métabolite dans les conditions pathologiques
(insuffisance rénale, insuffisance hépatique). En outre, après une prise
unique, la demi-vie d’un métabolite actif du tramadol est deux fois plus
longue que celle de la substance mère. Compte tenu de ces résultats, on
peut s’attendre à ce qu’une administration répétée de tramadol soit
responsable d’une accumulation du métabolite actif et d’une augmentation de l’effet opioïde global.
◗ L’exemple du fentanyl : les problèmes de distribution
et les conséquences sur la durée d’action
La plupart des analgésiques n’agissent pas sur le compartiment plasmatique mais sur le système nerveux central.
La pharmacocinétique des molécules très lipophiles comme le fentanyl
est mieux modélisée par des modèles pluricompartimentaux. Le degré
d’élimination de ces molécules varie selon que l’on administre une
ESSAIS CLINIQUES DES ANTALGIQUES
Limites de ces études pharmacocinétiques liées
à l’étude de la substance mère - Les métabolites actifs
69
Upsa Méthodo essais 2002
18/10/02
15:57
Page 70
Variabilité pharmacocinétique en fonction
de la durée d’administration
Context- Sensitive Half-Time
(minutes)
300
250
Fentanyl
200
Thiopental
150
100
Midazolam
50
Alfentanil
Sufentanil
Propofol
0
1
2
3
4
5
6
7
8
9
Infusion duration (hours)
ESSAIS CLINIQUES DES ANTALGIQUES
D’après Hughes et al, Anesthesiology, 1992 : 76, 334
70
dose unique ou une dose répétée. En effet, la modélisation pharmacocinétique a très clairement montré que la demi-vie du fentanyl
augmente en fonction de la durée de perfusion.
Chez un groupe de dix patients cancéreux, il a été montré que la demivie apparente du fentanyl après une application transdermique s’élevait
à quelques jours, contre une à trois heures après une dose unique. Cette
augmentation très significative de la demi-vie apparente est responsable
de l’augmentation de la durée des effets. Ainsi, on peut s’attendre à des
modifications pharmacocinétiques considérables selon le mode d’administration (dose unique,répétée) en particulier pour les analgésiques qui
possèdent un grand volume de distribution.
◗ L’exemple du paracétamol : l’importance des modèles
pharmacocinétiques et pharmacodynamiques dans
le développement des analgésiques
Une étude réalisée en 1988 par Carisson montre très clairement que le
paracétamol agit au sein même du système nerveux central.Une relation
dose/effet a pu être démontrée après l’administration de 5, 10 et 25 mg
par kg chez l’animal.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 71
Nous avons utilisé le modèle du réflexe RIII afin de montrer l’effet
central du paracétamol chez l’être humain. Ce modèle donne la possibilité de contourner les récepteurs périphériques et permet d’évaluer
l’effet central des analgésiques.
Dans le modèle RIII, nous avons utilisé comme comparateur l’aspirine,
dont le coefficient de partage est très bas, et qui traverse mal la barrière
hémato-encéphalique. Nous pensons que cette substance n’a pas
d’action sur le système nerveux central, contrairement au paracétamol qui traverse bien la barrière hémato-encéphalique.
Une étude pharmacocinétique de population réalisée par Bannwarth
portant sur des sujets qui ont reçu du paracétamol par voie intraveineuse confirme que le pic de concentration de cette substance dans
le LCR est atteint entre deux et trois heures après l’administration.
Nous avons modélisé la vitesse d’absorption du paracétamol dans le
système nerveux central et les concentrations obtenues dans le plasma
pour une administration d’un gramme de paracétamol toutes les
6 heures, en les comparant à une administration de 4 grammes en
perfusion continue pendant 24 heures. Cette comparaison montre que
la distribution joue un rôle important. En effet, on obtient des concentrations beaucoup plus élevées dans le système nerveux central en
ayant recours à une administration répétée que par une administration
continue.
Une étude contre placebo réalisée en double aveugle chez des volontaires sains a confirmé l’impact de la vitesse de perfusion sur l’effet
analgésique du paracétamol. Il est apparu que si les doses répétées
présentent un effet analgésique chez le volontaire sain, ce n’est pas le
cas de la perfusion continue. Cette étude montre, par exemple, que le
développement d’une galénique retard n’aurait aucun sens en termes
d’efficacité.
ESSAIS CLINIQUES DES ANTALGIQUES
Une étude contre placebo réalisée en double-aveugle chez des volontaires sains a montré que l’effet analgésique du paracétamol se distingue
très nettement du placebo et de l’aspirine. Cet effet analgésique atteint
son maximum deux heures après l’administration intraveineuse.
L’analyse pharmacocinétique/pharmacodynamique fait apparaître une
hystérèse qui reflète le temps nécessaire au paracétamol pour atteindre
son organe cible : le système nerveux central.
71
Upsa Méthodo essais 2002
18/10/02
15:57
Page 72
ESSAIS CLINIQUES DES ANTALGIQUES
■ CONCLUSION
72
La pharmacocinétique des antalgiques constitue une étape indispensable dans le développement de ces substances car elle permet d’apprécier leur absorption, leur distribution, leur élimination dans les
conditions normales (chez l’enfant,l’adulte et la personne âgée) et dans
les conditions pathologiques. La pharmacocinétique des antalgiques
permet également d’établir un lien entre la dose et la concentration et
un lien entre la dose et l’effet dans l’optique de rationaliser les régimes
de prescription.
Les limites de la pharmacocinétique sont liées aux difficultés de
dosage, à la présence d’énantiomères et de métabolites actifs qui
compliquent sensiblement l’évaluation pharmacocinétique de médicaments comme le tramadol, l’ibuprofène ou la morphine. Par ailleurs,
on peut noter une grande variabilité des profils pharmacocinétiques
liée à la pharmacogénétique. Par exemple, il faut savoir que certaines
populations ne disposent pas des enzymes permettant d’activer l’efficacité analgésique de certains médicaments.
La modélisation pharmacocinétique et pharmacodynamique des
antalgiques autorise une description quantitative de la réponse à un
médicament, ce qui permet d’effectuer un certain nombre de simulations qui peuvent intervenir dans la stratégie de développement d’un
analgésique. Celles-ci devront bien évidemment être validées par des
essais cliniques. Pour les spécialistes de la pharmacocinétique et de la
pharmacodynamique, le principal enjeu sera d’utiliser un modèle
valide.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 73
Le développement clinique
des antalgiques
Hervé Ganry
■ INTRODUCTION
Le développement clinique d’un médicament ne constitue qu’une
partie de la vie de ce médicament. Il peut cependant se prolonger
pendant toute sa durée de vie.
• le développement d’une nouvelle molécule,qui peut à elle seule représenter une nouvelle classe thérapeutique ou appartenir à une classe
thérapeutique existante ;
• l’extension d’indication à une autre pathologie ou une autre
population ;
• la mise à disposition d’une nouvelle formulation galénique ;
• la mise à disposition d’une association ;
• la mise en évidence de propriétés spécifiques telles que la durée
d’action, le début d’activité, la définition de patients répondeurs…
■ LE DÉVELOPPEMENT D’UNE NOUVELLE ENTITÉ
CHIMIQUE
Aujourd’hui, sur 100 000 nouvelles molécules synthétisées par la
chimie, 1 000 font l’objet d’essais en pharmacologie animale, 50 à 100
arrivent au stade de la phase I, 10 à 15 arrivent au stade de la phase III
et 3 (dont 1 molécule innovante) sont mises sur le marché.
◗ La genèse d’un médicament
Elle comprend de nombreuses étapes.Tout d’abord, il faut définir un
cahier des charges et synthétiser les molécules semblant correspondre
ESSAIS CLINIQUES DES ANTALGIQUES
Différents types de développement clinique peuvent être distingués :
73
Upsa Méthodo essais 2002
18/10/02
15:57
Page 74
à son contenu.Viennent ensuite les tests de pharmacologie et de pharmacocinétique animales. Lorsque ces tests se révèlent concluants, le laboratoire peut passer à la formulation galénique qui est limitée par des
contraintes physico-chimiques. Ces contraintes peuvent empêcher la
réalisation de formes injectables, de solutions, de formes effervescentes, etc.
◗ Les pré requis en toxicologie pour passer
chez l’homme
ESSAIS CLINIQUES DES ANTALGIQUES
Avant de passer chez l’homme, il faut conduire des essais de toxicologie très spécifiques et procéder à des tests de mutagenèse.
Récemment, des recommandations ont permis d’harmoniser les
pré-requis de ces essais avant l’administration chez l’homme. Pour une
administration en prise unique, les essais préalables de toxicologie portent sur deux espèces animales et durent entre deux et quatre semaines
selon l’espèce concernée. Avant d’administrer pendant un mois un
médicament chez l’homme, la réglementation européenne exige trois
mois d’essais de toxicologie alors que les réglementations américaines
et japonaises ne réclament qu’une durée d’un mois.
74
■ LA PHASE I
La phase I correspond à la première administration d’une molécule
chez l’homme, en l’occurrence un volontaire sain. L’objet de cette
phase est de déterminer la dose maximale tolérée (DMT), d’obtenir
un profil pharmacocinétique (ADME : absorption/distribution/métabolisme/élimination) et de rechercher, lorsque cela est possible, une
relation pharmacodynamique et pharmacocinétique. Les résultats des
essais de la phase I permettent d’établir des comparaisons avec les
données obtenues chez l’animal et de vérifier la pertinence de leur
extrapolation à l’homme.
◗ La dose unique
Généralement, la dose de départ administrée à l’homme correspond à
1/50e de la première dose pharmacologiquement active dans l’espèce
animale la plus sensible. La dose maximale doit être inférieure à la
Upsa Méthodo essais 2002
18/10/02
15:57
Page 75
dernière dose sans effet qui a été obtenue pour l’espèce animale la
plus sensible au cours des quatre semaines d’essais de toxicologie.
◗ La progression des doses
Ainsi,par mesure de sécurité,la première dose est très faible.Pour passer
à la dose supérieure, deux conditions doivent être réunies : d’une part,
tous les volontaires prévus doivent avoir reçu la dose précédente (sauf
si des effets indésirables sont apparus et ont entraîné une interruption
des administrations) ; d’autre part, toutes les données cliniques et paracliniques de la dose précédente doivent avoir été analysées.
À l’issue de la phase I, le laboratoire définit une dose maximale tolérée.
Cette DMT dépend également du profil de tolérance souhaité par le
laboratoire. Par exemple, si le cahier des charges a prévu le développement d’un opioïde non sédatif, la DMT peut être diminuée et ramenée
à la dose entraînant une sédation. Il faut également définir la dose maximale tolérée rapportée à l’exposition réelle. En effet, si la dose maximale
tolérée est de 100 mg et que l’absorption de la molécule n’est que de
70 %,l’exposition réelle n’est que de 70 mg.Ainsi,70 mg est la DMT envisageable pour une forme injectable.
La démarche classique consiste à déterminer deux doses :une dose pour
laquelle la molécule présente une efficacité antalgique chez 50 % des
patients et une dose pour laquelle elle présente un effet indésirable chez
50 % des patients. À partir de ces doses, le laboratoire est en mesure de
calculer un ratio tolérance/efficacité qui doit être très élevé dans le cas
des antalgiques.
■ LA PHASE II
◗ Les contraintes liées aux essais de phase II
La sélection des patients
Les laboratoires qui développent des antalgiques s’intéressent à une
population cible la plus large possible. Cependant les essais cliniques
ESSAIS CLINIQUES DES ANTALGIQUES
◗ L’exploitation des résultats
75
Upsa Méthodo essais 2002
18/10/02
15:57
Page 76
sont fondés sur une population source que l’on trouve dans les centres
capables de réaliser ces essais, ce qui introduit une première sélection.
En effet, le patient qui fait le choix de l’automédication est différent du
patient qui consulte un médecin, lui-même différent du patient qui
s’adresse à un spécialiste ou qui est suivi dans un centre de la douleur.
Au sein de cette population source, les laboratoires imposeront une
deuxième sélection en isolant un échantillon de patients correspondant
aux critères d’exclusion et d’inclusion du protocole clinique.Au final, ne
seront retenus que les patients du protocole clinique qui auront suivi
avec exactitude le protocole imposé. L’objectif d’un développement
clinique vise à pouvoir extrapoler à la population cible les données
issues d’une population source très sélective.
Les caractéristiques modifiant la réponse aux antalgiques
ESSAIS CLINIQUES DES ANTALGIQUES
La définition de critères d’inclusion/exclusion rigoureux est liée au fait
que de nombreux paramètres peuvent modifier la réponse des patients
aux antalgiques. Ainsi, un essai qui a consisté à administrer des doses de
8 mg et de 16 mg de morphine à des populations très différentes a montré que l’efficacité antalgique de la morphine variait considérablement
selon l’âge, la race et les caractéristiques de la douleur traitée (localisation, ancienneté et intensité).
76
Le problème du recueil de l’information
La douleur étant un symptôme subjectif, le recueil de l’information est
biaisé par la propre subjectivité de l’investigateur. En effet, la perception
de la douleur et les réactions face à cette même douleur sont différentes
d’une équipe médicale à une autre. Ainsi, plus le nombre d’intervenants
sera important et plus la variabilité dans le recueil des données sera
forte. Or, le nombre d’intervenants est fonction du nombre de centres
mais également de la durée du suivi des patients. Ainsi, l’efficacité d’une
prise unique peut être évaluée par un seul investigateur pendant
quelques heures alors que l’évaluation de prises répétées sur plusieurs
jours nécessitera l’intervention de plusieurs investigateurs pour un
même patient. L’expression de la douleur étant différente selon les
cultures, il est souvent difficile mais parfois nécessaire de procéder à
des essais multicentriques et multi-états. Par ailleurs, les informations
obtenues seront différentes selon que l’on recueille l’intensité doulou-
Upsa Méthodo essais 2002
18/10/02
15:57
Page 77
reuse du patient (photographie à un temps donné) ou son soulagement
(nécessitant le souvenir de l’intensité douloureuse initiale avant
traitement).
Généralement, les essais classiques utilisent le mode des groupes
parallèles. Mais on peut également recourir aux techniques du “cross
over” et du carré latin qui permettent de diminuer le nombre de
patients inclus ainsi que la variabilité interindividuelle, chaque
patient étant son propre témoin. Cependant, ces deux techniques
sont rarement mises en œuvre pour plusieurs raisons. Premièrement,
elles exigent une stabilité des critères d’inclusion et d’exclusion difficile à obtenir dans le domaine de la douleur. Deuxièmement, elles
requièrent des essais plus longs, ce qui augmente le risque de “perdu
de vue”. Par exemple, pour une étude en carré latin chez des femmes
souffrant de dysménorrhée, il est nécessaire d’effectuer un suivi sur
plusieurs cycles.Troisièmement, les techniques du “cross over” et du
carré latin peuvent être biaisées par des phénomènes de “carry
over”. Si un opioïde agoniste-antagoniste est administré à un patient
avant un traitement à base de morphine, son effet rémanent peut
réduire l’effet thérapeutique de la morphine à moins que l’on ne
mette en place un “wash out” (période sans traitement) d’une durée
suffisante, méthodologiquement nécessaire mais souvent éthiquement irréalisable.
La démonstration
L’objet d’un essai est de montrer que l’efficacité du produit à l’essai est
supérieure à celle d’un placebo et/ou à celle d’un produit de référence.
Pour effectuer cette démonstration, on définit un critère principal qui
est par exemple le TOTPAR, qui correspond à la qualité de soulagement
sur une période de temps donnée.
Différents modèles d’essais peuvent alors être envisagés selon le type de
réponse attendue :
• comparaison du produit X avec un placebo : si le produit X, avec une
dose x, fournit une efficacité maximale, il n’est pas possible de déter-
ESSAIS CLINIQUES DES ANTALGIQUES
Le protocole de l’essai
77
Upsa Méthodo essais 2002
18/10/02
15:57
Page 78
miner s’il s’agit d’un effet plafond du produit ou d’un effet plafond du
modèle. En outre, un tel résultat ne permet pas de savoir si le même
résultat aurait pu être atteint avec une dose x/2. Si, au contraire, le
produit X, avec une dose x, se révèle totalement inefficace par
rapport au placebo, deux options sont possibles : soit le produit n’a
pas d’action, soit une erreur sur le modèle a été commise (par
exemple,expérimentation d’un futur antimigraineux sur un modèle
de douleur post-opératoire).
ESSAIS CLINIQUES DES ANTALGIQUES
• comparaison du produit X avec un placebo et un produit de référence R :
le produit de référence R est destiné à valider le modèle. Si le produit R
utilisé à une dose thérapeutique plus efficace n’est pas meilleur que le
placebo, il y a erreur méthodologique. Si le produit X, avec une dose x,
et le produit R,avec une dose r,atteignent tous deux une efficacité maximale, on ne peut ni isoler le produit le plus efficace ni savoir si la même
efficacité aurait pu être atteinte avec la dose x/2. À l’inverse, si le
produit R, avec une dose r, est plus efficace que le produit X, avec une
dose x, lui-même plus efficace que le placebo, il n’est pas possible
d’anticiper l’efficacité d’une dose 2x.
78
• l’émergence de modèles plus sophistiqués :les limites décrites avec les
modèles précédents incitent à utiliser des modèles plus sophistiqués.
Ces modèles consistent,par exemple,à comparer l’efficacité du placebo,
celle d’un produit de référence (aux doses r et 2r) et celle du produit X
(aux doses x et 2 x). Supposons que l’efficacité de la dose 2r soit maximale et qu’elle soit largement supérieure à l’efficacité de la dose r, ellemême supérieure à l’efficacité du placebo. Dans ce cas, si le produit X
fait apparaître pour la dose x une efficacité similaire au produit R pour
la dose r et que son efficacité n’est pas améliorée par l’administration
d’une dose 2x, on peut identifier un effet seuil propre au produit X,
qui n’est pas dû au modèle.
Ces différents exemples rappellent qu’il est indispensable de garder en
permanence à l’esprit l’objectif recherché lorsque l’on met en œuvre un
essai clinique.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 79
Contraintes liées aux études chez le patient
Choix des groupes de traitement
12_
6_
6_
4_
4_
Soulagement (TOTPAR)
12_
placebo
X
2X
R
placebo
X
2X
R
2R
X : produit étudié
R : produit de référence
Les modèles précédents mettent en jeu des essais comparatifs puisqu’ils ont pour objet de valider l’hypothèse selon laquelle le produit X
est plus efficace que le placebo et, éventuellement, le produit de référence. Dans les exemples précédents, si les produits X et R font apparaître une efficacité similaire, on ne peut pas pour autant conclure à
une équivalence entre ces deux produits puisque l’essai était construit
pour mettre en évidence une différence. Lorsque l’on cherche à
démontrer une équivalence entre deux produits, il est nécessaire de
procéder à des essais d’équivalence. Il s’agira alors de valider l’hypothèse selon laquelle le produit X est ni plus efficace, ni moins efficace
que le produit Y. On peut également conduire des essais de non-infériorité destinés à montrer que le produit X n’est pas moins efficace
que le produit Y.
Dans les essais d’équivalence ou de non-infériorité, il faut décider, avant
de commencer l’essai, la perte d’efficacité acceptable en deçà de
laquelle on peut considérer que l’équivalence ou la non-infériorité existent. Bien évidemment, cette perte concédée devra rester relativement
ESSAIS CLINIQUES DES ANTALGIQUES
Le choix du type d’étude
79
Upsa Méthodo essais 2002
18/10/02
15:57
Page 80
faible et demeurer en deçà de la pertinence clinique. Mais, pour que les
essais d’équivalence et de non-infériorité soient pertinents, il faut également s’assurer qu’ils portent sur un grand nombre de patients et que les
critères d’inclusion et d’exclusion retenus soient très sélectifs, d’où une
grande difficulté de réalisation.
Le modèle de douleur
ESSAIS CLINIQUES DES ANTALGIQUES
• Les critères : pour qu’un modèle de douleur soit pertinent, il faut tout
d’abord qu’il corresponde au futur positionnement du produit et qu’il
permette de démontrer l’efficacité antalgique de la molécule testée.
Ensuite, il faut s’assurer que le modèle est simple, reproductible et
qu’il autorise un recrutement facile. Le modèle de douleur retenu doit
également posséder une bonne sensibilité afin de pouvoir différencier les traitements. Enfin, il doit permettre de définir un effet seuil
différent d’un effet modèle et de mettre en évidence un début et une
durée d’action.
80
• Les modèles de douleur :
- douleur aiguë : aujourd’hui, le modèle le plus utilisé en douleur postopératoire est celui de la chirurgie dentaire après extraction de la
3e molaire. Les autres modèles couramment utilisés sont ceux des
migraines/céphalées, des dysménorrhées, de l’épisiotomie et du postpartum, de la chirurgie orthopédique et viscérale, de la reconstruction
mammaire et de la traumatologie.
- douleur chronique : les modèles utilisés sont ceux des douleurs cancéreuses et rhumatologiques.
En conclusion, les meilleurs essais de développement clinique des antalgiques en phase II sont les essais monocentriques mis en œuvre par une
équipe dévolue à cet effet.
◗ Les différents types de phase II
La phase II a
La phase IIa impose des critères d’inclusion et d’exclusion extrêmement stricts. Les essais réalisés au cours de cette phase sont des essais
pilotes contre placebo dont le but est de cerner la zone d’efficacité
Upsa Méthodo essais 2002
18/10/02
15:57
Page 81
thérapeutique. Dans cette perspective, on administre aux patients une
dose proche de la dose maximum tolérée, une dose intermédiaire et
une dose faible.
En parallèle, on poursuit les essais de phase I avec des prises répétées
(sur 7 ou 10 jours) en essayant de respecter le rythme des administrations. Il faut alors définir une dose maximale tolérée, qui peut être très
différente de celle obtenue pour la prise unique, étudier la cinétique
des événements indésirables (apparition, disparition), définir l’état
d’équilibre des taux plasmatiques, rechercher l’accumulation des
métabolites, l’apparition de nouveaux métabolites et l’induction enzymatique. Puis, lorsque les résultats d’efficacité sont disponibles, essayer
d’établir une relation pharmacocinétique/pharmacodynamique.
La phase II b, qui impose également de prendre des critères d’inclusion
et d’exclusion stricts, a pour objet de définir la dose minimum efficace
(DME) grâce à des essais contre placebo mettant en jeu plusieurs doses
et des produits de référence.
Le choix du modèle en prises répétées dépend du futur profil du traitement, mais également de l’évolution naturelle de la douleur. En effet, la
douleur n’évolue pas de la même manière selon les affections. Par
exemple,la douleur du post-partum diminue beaucoup plus rapidement
que la douleur due à la chirurgie dentaire qui, elle-même, diminue
beaucoup plus rapidement que la douleur causée par la chirurgie orthopédique.
À la fin de la phase II b, la dose minimum efficace et la durée d’activité
antalgique de la molécule doivent être connues, ce qui permet de
déterminer la fréquence des prises sur 24 heures.On doit pouvoir également situer le début d’activité du médicament,repérer un éventuel effet
plafond, déterminer son profil de tolérance et le positionner parmi
d’autres antalgiques en termes d’efficacité ou de tolérance.
■ LA PHASE III
L’objet de la phase III consiste à élargir les résultats de la phase II à des
patients plus représentatifs (sujets âgés, sujets à risques) et d’étudier
ESSAIS CLINIQUES DES ANTALGIQUES
La phase II b
81
Upsa Méthodo essais 2002
18/10/02
15:57
Page 82
les interactions médicamenteuses avec d’autres antalgiques et avec les
médicaments spécifiques des pathologies douloureuses devant être
traitées. Pour des antalgiques utilisés en douleur post-opératoire, on
étudie, par exemple, les interactions entre les nouveaux médicaments
antalgiques et les anticoagulants.C’est également en début de phase III
que l’on détermine la formulation galénique définitive.
La phase III permet de confirmer les résultats d’efficacité de la
phase II sur de plus grands échantillons de patients et d’augmenter le
nombre de patients recevant le traitement étudié. Les doses utilisées
dans cette phase seront celles retenues pour l’enregistrement du
nouveau médicament.
ESSAIS CLINIQUES DES ANTALGIQUES
La phase III fait appel à différents modèles de douleur, autorise les traitements associés, sélectionne les traitements de référence en vue d’un
positionnement futur parmi les autres antalgiques. Enfin, la phase III est
l’occasion de commencer les essais au long cours (300 à 600 patients
traités pendant six mois et 100 à 300 patients traités pendant un an). Si
elle est concluante, la phase III donne lieu à un dépôt de dossier en vue
d’obtenir une AMM.
82
■ LES AUTRES TYPES DE DÉVELOPPEMENT
Après la phase III, on peut procéder à des essais de phase IV et V
(pharmaco-épidémiologie) ou mettre en œuvre des essais d’extension
d’indication concernant des sous-populations spécifiques. Ces derniers
essais sont généralement difficiles à réaliser en raison d’un manque
d’outils d’évaluation adaptés à ces sous-populations et du caractère rare
de certaines pathologies concernées.
◗ Nouvelle formulation galénique
Travailler sur une nouvelle formule galénique suppose de s’assurer
qu’il existe une bioéquivalence (paramètres de pharmacocinétique
compris entre – 20 % et + 25 % par rapport à ceux de la molécule principale). À cet égard, il est important de souligner que, dans le domaine
de l’antalgie, il y a nécessairement des différences d’efficacité et/ou de
tolérance entre les génériques dont les paramètres de pharmaco-
Upsa Méthodo essais 2002
18/10/02
15:57
Page 83
cinétique se situent à – 20 % et ceux dont les paramètres de pharmacocinétique sont de + 25 %. Si on constate une absence de bioéquivalence, il faudra redémontrer l’efficacité et définir une dose minimum
efficace, d’une part, et réévaluer la tolérance, d’autre part (par
exemple, une forme IV par rapport à une forme orale).
◗ Association à visée antalgique
Ce type d’association présente de nombreux intérêts théoriques :
• augmenter l’efficacité antalgique ;
• réduire les effets indésirables (si deux produits présentent des effets
indésirables à une dose d’1 gramme, on peut choisir de les associer avec
une dose de 500 milligrammes chacun) ;
• associer un antalgique à des modificateurs de l’humeur (stimulants ou
sédatifs) ;
• créer une association revendiquant des indications spécifiques ;
• modifier l’absorption ou l’élimination des traitements avec des
excipients spécifiques ;
• réduire le risque d’utilisation détournée par les toxicomanes.
On peut étudier des propriétés spécifiques qui n’ont pas été évaluées au
cours du développement pré-AMM :début d’activité,profil de tolérance,
sous-groupe de patients répondeurs, positionnement par rapport à
d’autres produits.
■ CONCLUSION
Le développement d’un nouveau médicament fait intervenir tous les
secteurs d’un laboratoire et nécessite une coordination parfaite des
différents intervenants. Le développement clinique des antalgiques doit
prendre en compte le positionnement futur du produit que l’on
souhaite développer. Il faut garder à l’esprit qu’il est nécessaire de
pouvoir extrapoler les données obtenues lors des essais spécifiques à un
grand nombre de pathologies douloureuses.
Les modèles de douleur retenus pour les essais devront être discriminants, pertinents, sensibles, validés, réalistes, reproductibles et
ESSAIS CLINIQUES DES ANTALGIQUES
◗ Après l’AMM
83
Upsa Méthodo essais 2002
18/10/02
15:57
Page 84
ESSAIS CLINIQUES DES ANTALGIQUES
standardisables. Sachant que la douleur n’est pas directement accessible à autrui, le recueil des données devra être rigoureux, standardisé
et réalisé à partir d’outils validés. Ce recueil devra faire appel à un
minimum d’intervenants afin de réduire au maximum l’hétérogénéité
et de fait la variabilité.
Finalement, il faut comprendre que, si la plus belle molécule ne peut
donner que ce qu’elle a, il faut savoir l’aider à exprimer toutes ses
potentialités.
84
Upsa Méthodo essais 2002
18/10/02
15:57
Page 85
Les paramètres de quantification
de l’efficacité clinique des antalgiques
Paul Desjardins
■ INTRODUCTION
L’objectif des essais thérapeutiques est de répondre à une question
fondamentale : la substance étudiée a-t-elle une action analgésique chez
l’homme ? Il s’agit de démontrer qu’une substance dont l’effet analgésique a été étudié dans les modèles animaux, dont les propriétés pharmacologiques sont patentes et dont la durée d’action est suffisante, est
efficace pour traiter les pathologies douloureuses chez l’homme. Bien
évidemment, il faut aussi démontrer la non-toxicité de la substance.
En 1977, le Journal of the American Dental Association a publié une
communication publicitaire qui ne serait plus autorisée aujourd’hui.
Cette communication affirmait que, d’après une étude ouverte portant
sur cent patients souffrant de douleurs dentaires post-opératoires,
91 % d’entre eux voyaient leur douleur disparaître après une prise de
fiorinal. Cette étude comportait deux biais. Le premier était lié au
protocole de l’étude. En effet, il faut savoir que le protocole d’une
étude ouverte s’oppose en tout point à celui d’une étude en “double
aveugle” : le praticien sait quel produit est administré à chaque
patient et le patient sait quel produit il consomme. Le deuxième biais
venait du fait qu’il n’était pas possible de distinguer l’action de la
substance active et celle d’un placebo.
Aujourd’hui, la FDA, les agences réglementaires européennes et
japonaises sont beaucoup plus sévères sur les protocoles des études
et exigent qu’un certain nombre de critères soient respectés pour
que l’utilisation d’une substance puisse être validée chez l’homme.
ESSAIS CLINIQUES DES ANTALGIQUES
■ LES PROGRÈS DANS LE PROTOCOLE DES ÉTUDES
85
Upsa Méthodo essais 2002
18/10/02
15:57
Page 86
• l’étude en “double aveugle”.
• la prescription randomisée de la substance étudiée : cela implique que
chaque patient du groupe participant aux essais ait la même chance de
se voir prescrire la substance étudiée que le placebo ou la substance de
référence. Par ailleurs, la prescription aléatoire suppose un nombre
équivalent d’hommes et de femmes dans le groupe testé.
• une présentation similaire des comprimés : une étude comparant les
effets d’un médicament présenté sous la forme d’un gros comprimé à
ceux d’un médicament présenté sous la forme d’un petit comprimé fera
généralement apparaître une meilleure efficacité pour le premier
médicament.
ESSAIS CLINIQUES DES ANTALGIQUES
• un échantillon de patients d’une taille suffisante : pour montrer
qu’un analgésique calme les douleurs subies à la suite d’une chirurgie
dentaire et présente une efficacité supérieure de 20 % à celle d’un
autre analgésique, il faut entre 40 et 50 patients par groupe.
86
• la présence d’une douleur continue et d’intensité suffisante : les
études mesurant les effets des antalgiques chez les migraineux sont
particulièrement complexes dans la mesure où un certain nombre de
migraineux voient leur douleur disparaître naturellement en deux
ou trois heures alors que d’autres ne seront pas soulagés après de
longues heures. Compte tenu de ces différences, les études sur les
effets des antalgiques chez les migraineux doivent porter sur un
grand nombre de patients.
• un échantillon composé d’une population homogène et ne présentant
pas de pathologie majeure associée.
■ LA MÉTHODOLOGIE
Avant de lancer une étude, il faut établir un protocole qui définit la
manière dont cette étude sera conduite. En général, ce protocole
précise que l’étude est conduite en “double aveugle”, qu’elle fait l’objet
d’une randomisation et qu’elle teste des groupes parallèles. Pour les
patients souffrant d’une douleur forte ou modérée, l’analgésique sera
Upsa Méthodo essais 2002
18/10/02
15:57
Page 87
donné directement au patient par une infirmière. Les infirmières qui
ont accumulé un certain nombre d’années d’expérience savent à quel
rythme il faut donner un analgésique aux patients souffrant d’une
douleur post-opératoire.
Pour les extractions sans chirurgie osseuse, la réponse au placebo est
excellente et 30 à 50 % des patients ne ressentent pas de douleur. Pour
les chirurgies osseuses, la réponse au placebo est faible et seulement
5 % des patients ne ressentent pas de douleur. Dans les études sur la
douleur après extraction simple, il est par conséquent très difficile
d’établir une différence entre le placebo et le produit actif. Dans
les études sur la douleur après une chirurgie osseuse, la réponse est
nettement meilleure.
■ L’ANALOGIE ENTRE LE SAUT À LA PERCHE
ET LES ESSAIS CLINIQUES
Comme les athlètes lors d’une compétition, les nouvelles molécules
soumises aux essais cliniques doivent toutes parcourir le même
chemin afin de réussir ou d’échouer. Supposons que quatre athlètes
ESSAIS CLINIQUES DES ANTALGIQUES
Le critère du “double aveugle” pose parfois des problèmes de mise en
œuvre. Dans une étude en double aveugle comparant les effets d’une
prescription par voie orale, par voie intraveineuse et par voie intramusculaire, chaque patient recevait une dose active par l’une de ces trois
voies et deux placebos par les deux autres voies. L’étude sur 24 heures
suppose la rédaction de rapports réguliers sur les caractéristiques de la
douleur 15 minutes et 30 minutes après la prise du médicament et
toutes les heures pendant six heures. Elle porte sur des patients opérés
d’une à quatre dents de sagesse.
Peter Black de l’Université de Rochester a développé l’utilisation des
chronomètres dans les essais cliniques sur la douleur. Les patients
doivent appuyer sur le chronomètre lorsqu’ils prennent le médicament,
lorsqu’ils ressentent un premier soulagement et lorsqu’ils ressentent un
soulagement significatif. La FDA a approuvé cette technique. Dans les
études sur les analgésiques, il faut surtout éviter de demander toutes
les cinq minutes aux patients comment ils se sentent car cela biaise
fortement les résultats.
87
Upsa Méthodo essais 2002
18/10/02
15:57
Page 88
dont les capacités sont très différentes participent à une compétition
de saut à la perche. Si la barre est placée à un mètre du sol, tous les
athlètes la franchiront, ce qui ne permettra pas de les différencier. La
seule manière de repérer le meilleur sauteur sera d’élever la barre.
Dans les essais cliniques sur la douleur, l’enjeu est le même que dans
le saut à la perche. Si la barre est placée trop haut, c’est-à-dire si les
patients sélectionnés sont extrêmement difficiles à traiter (par
exemple, les patients souffrant de fortes migraines accompagnées de
vomissements), aucun traitement analgésique ne se distinguera par
son efficacité. Inversement, si la barre est placée trop bas, c’est-à-dire
si les patients sélectionnés ont un simple mal de tête dû à la tension
nerveuse, des placebos pourront sembler aussi actifs que des traitements réputés efficaces.
ESSAIS CLINIQUES DES ANTALGIQUES
■ LES MODÈLES DE LA DOULEUR
88
Jusqu’à présent, les modèles de douleur les plus utilisés sont les
modèles de douleur aiguë. Les premières études sur ces modèles sont
apparues dans la littérature vers les années trente. Harry Beecher,
médecin anesthésiste à l’Université de Harvard, a révolutionné les
études sur la douleur en avançant pour la première fois l’idée que les
essais cliniques sur les analgésiques devraient impliquer des groupes
témoins. Auparavant, la plupart des évaluations s’effectuaient dans le
cadre d’études ouvertes.
À partir des années trente, les modèles de douleur post-opératoire
sont apparus comme les modèles de douleur aiguë les plus adaptés
pour faire apparaître une relation dose effet. Mais au cours des vingt
dernières années, la pratique hospitalière a beaucoup changé : la
chirurgie ambulatoire et la chirurgie peu invasive se sont beaucoup
développées. Aujourd’hui, 24 heures après avoir subi une arthroscopie, la grande majorité des patients sont capables d’aller nager, ce
qui était loin d’être le cas il y a vingt ans.
Le modèle de la dysménorrhée a été largement utilisé pour l’évaluation des AINS et des inhibiteurs de la cyclo-oxygénase 2 et continuera
de l’être. Les études utilisant ce modèle de douleur s’effectuent généralement en cross-over. Les femmes participant à ces études sont
mobilisées pendant plusieurs mois et peuvent jouer à la fois le rôle de
patient et de témoin.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 89
Dans la plupart des modèles de douleur, les patients doivent évaluer
l’intensité de leur douleur en la désignant comme inexistante, faible,
modérée ou forte. Puis, les patients doivent évaluer le soulagement que
leur a procuré le traitement en le désignant comme inexistant, faible,
fort ou complet. D’autres études préfèrent demander si la douleur a pu
ou non être divisée de moitié. Les sujets participant aux essais pourront
également être amenés à classer l’efficacité du traitement reçu
(mauvaise/correcte/bonne/très bonne/excellente).
Après l’évaluation de la douleur initiale, il peut être intéressant de
demander aux patients de s’exprimer sur l’évolution de leur douleur.
Supposons que la douleur initiale soit forte (degré 3) : le score différentiel sera de 1 si elle passe à un état modéré (degré 2) et sera de 3 si
la douleur est totalement soulagée (degré 0). Inversement, le score
peut être négatif si la douleur s’aggrave.
Avant d’autoriser la mise sur le marché d’un nouveau médicament, les
agences réglementaires cherchent tout d’abord à s’assurer que cette
substance ne présente aucun danger. C’est d’ailleurs, ce qui justifie
toutes les études de toxicité conduites en phase I.Puis,les agences réglementaires cherchent à évaluer l’effet analgésique d’ensemble.Enfin,elles
s’attachent à déterminer l’effet maximal et l’évolution de l’effet avec
le temps. Notons que pour l’ensemble des analgésiques, les patients
affirment ressentir le premier soulagement 30 minutes après avoir
pris un traitement. Le problème est que 60 % des patients qui prennent un placebo ressentent également un premier soulagement après
30 minutes.
Pour différencier les traitements, la méthode la plus efficace semble
donc d’évaluer à quel moment a lieu le véritable soulagement.
Aujourd’hui, le modèle de douleur dentaire post-opératoire est le
plus utilisé. Plusieurs raisons justifient ce phénomène : il se distingue
par une bonne reproductibilité des résultats, il est très sensible et ne
pose pas de problèmes de recrutement.
Les autres essais cliniques post-opératoires se heurtent souvent à des
difficultés de recrutement. En effet, il est très rare que les anesthésistes
puissent s’appuyer sur la population d’un seul centre médical pour
ESSAIS CLINIQUES DES ANTALGIQUES
■ LES EXIGENCES DES AGENCES RÉGLEMENTAIRES
89
Upsa Méthodo essais 2002
18/10/02
15:57
Page 90
réaliser un essai statistiquement significatif. Or, les résultats des études
impliquant plusieurs centres ont l’inconvénient d’être hétérogènes.
Hormis les modèles dentaires, les modèles post-opératoires fréquemment utilisés sont ceux de la chirurgie du genou et de la hanche.
Les agences réglementaires n’autorisent pas la mise sur le marché d’un
médicament analgésique au vu des résultats d’une seule étude contre
placebo. Avant de s’engager, elles exigent que les laboratoires puissent
se prévaloir de résultats reproductibles dans au moins deux études
faisant appel à des modèles de douleur différents. Elles exigent des laboratoires de montrer que le médicament qu’ils souhaitent commercialiser
a un effet sur les douleurs d’origine pathologique.
Enfin, avant d’autoriser une association fixe (par exemple, produit A
+ produit B), la plupart des agences réglementaires exigent, à l’instar de
la FDA, que les laboratoires démontrent que le produit A est efficace,
que le produit B est efficace et que leur combinaison est plus efficace
que les produits A et B pris isolément. Dans les années cinquante, les
laboratoires n’avaient pas à effectuer de telles démonstrations.
ESSAIS CLINIQUES DES ANTALGIQUES
■ CONCLUSION
90
Pour analyser les effets d’une substance médicamenteuse chez
l’homme, les cliniciens repèrent un certain nombre d’événements
clés : le soulagement maximum, le premier soulagement perceptible,
le premier soulagement significatif et le temps mis par le patient
avant de prendre un autre médicament. De telles mesures permettent
la plupart du temps d’optimiser la posologie.
Repérer l’effet seuil d’une substance constitue également une étape
importante des essais cliniques.
Dans les modèles de douleur post-opératoire, les résultats les plus
significatifs sont obtenus juste après le réveil, lorsque la douleur est à
son maximum. Mais il faut tenir compte du fait que la douleur décroît
régulièrement dans les jours qui suivent l’opération,même en l’absence
de traitement analgésique.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 91
Les standards de quantification
de l’efficacité clinique des antalgiques
Claude Dubray
■ LES INSTRUMENTS DE MESURE
◗ L’évaluation de la douleur
L’échelle visuelle analogique (EVA), qui apparaît comme le “Gold
Standard”dans l’évaluation de la douleur,est apparemment simple d’utilisation. Il s’agit de positionner un curseur entre deux extrêmes.
Cependant, les différents modèles, surtout lorsqu’ils sont utilisés par la
même équipe, peuvent créer une confusion chez le patient. Certains
graphiques plus élaborés ou certaines indications en milieu d’échelle
peuvent introduire des biais. Par ailleurs, il faut bien veiller à prendre
une quantification en millimètre pour éviter la discontinuité. L’échelle
peut être utilisée horizontalement ou verticalement (“thermomètre”)
pour l’enfant. Ainsi, quelques problèmes techniques peuvent se poser.
Des infirmières, dans certains services, bloquent l’échelle à 45. Il faut
également veiller à ce que l’élément coulissant ne tombe pas trop bas
pour les échelles verticales. Ces détails peuvent parfois apporter des
erreurs considérables dans les évaluations, notamment lorsqu’il s’agit
d’évaluer l’efficacité des médicaments. Les systèmes plus sophistiqués
ont pour principal avantage de pouvoir être utilisés à domicile par les
patients, ce qui permet d’assurer un suivi. Par exemple, des systèmes
électroniques peuvent enregistrer les valeurs sur un ordinateur, ce qui
est très commode pour les essais thérapeutiques. Mais il faut veiller à
leur bonne utilisation.
L’échelle verbale
Pour l’échelle verbale, il est demandé au patient de situer sa douleur par
un qualificatif : aucune, légère, moyenne, intense. L’idéal est que les
échelles soient les mêmes. Malheureusement, ce n’est pas toujours le
ESSAIS CLINIQUES DES ANTALGIQUES
L’échelle visuelle analogique
91
Upsa Méthodo essais 2002
18/10/02
15:57
Page 92
cas. Parfois, le patient a du mal à choisir entre “moyenne” et “intense”. Il
faut donc essayer de situer sa douleur à partir de ces informations. Mais
il n’est pas forcément mauvais de lui demander de faire un choix. Les
études montrent une très bonne corrélation entre les résultats donnés
par les deux échelles, lorsque les mêmes patients les utilisent. Il ne faut
donc pas rejeter a priori l’une ou l’autre.
L’échelle numérique
L’échelle numérique, qui se rapproche de l’échelle analogique, peut
aussi être utilisée. Elle est discontinue et il est demandé aux patients de
coter la douleur de 0 à 10 de manière croissante.
ESSAIS CLINIQUES DES ANTALGIQUES
■ L’ÉVALUATION DU SOULAGEMENT
92
Les échelles pour évaluer le soulagement obéissent aux mêmes principes, sachant qu’elles ne sont pas utilisées au même moment et que
les qualificatifs sont différents. Il faut aussi éviter les biais dus à la
conception de l’échelle. Pour autant, il semble qu’un consensus se soit
dégagé concernant les échelles verbales et leurs cinq degrés. Comme
pour l’évaluation de la douleur, les études montrent une bonne corrélation entre les résultats des EVA et ceux des échelles verbales. La
distribution des réponses des patients à qui il était demandé de coter
leur douleur avec l’EVA et l’échelle verbale le montre avec une zone
de chevauchement qui paraît logique.
■ L’UTILISATION DE CES ÉCHELLES
Toutes ces échelles peuvent être utilisées dans divers cas. Il peut s’agir,
par exemple, de mesurer le soulagement après une prise médicamenteuse et de suivre son évolution au cours du temps. Il est également
possible de mesurer une sensation douloureuse au cours d’une période
donnée, pendant six heures, après une opération. Il peut être demandé
l’intensité de la douleur moyenne au cours des dernières 24 heures,
sachant que l’appel à la mémoire peut biaiser quelque peu l’analyse.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 93
◗ La relation avec l’intensité
Il faut se méfier de certaines réponses qui sont le résultat d’une gymnastique intellectuelle un peu compliquée. Par exemple, l’évaluation
par le patient du niveau maximum et minimum de douleur au cours
des dernières 24 heures conduit souvent à des résultats curieux. Dans
ce type d’analyse, il convient de passer du temps auprès du patient
pour lui expliquer. La question de l’amélioration de l’évaluation de la
douleur et du soulagement est une question importante. Dans ce
domaine, il faut éviter d’avoir recours aux deux types d’évaluation en
même temps. Les patients ont tendance à confondre les deux.
Ces échelles visuelles ou numériques ont une fausse apparence de
simplicité. Outre les problèmes techniques évoqués ci-dessus, il
semble qu’elles sont inadaptées à l’état des patients. Selon les études,
18 à 25 % des patients utilisent mal l’EVA, ce qui provoque un biais
considérable dans les essais. Il est donc nécessaire d’être sûr que le
patient a bien compris. Récemment encore, nous avons pu faire
l’expérience de patients qui répondent à tort et à travers concernant
les niveaux de grille.
En période post-opératoire, il faut déconseiller d’utiliser les EVA. Les
échelles verbales sont plus faciles d’accès. En particulier, les sujets
âgés éprouvent des difficultés à utiliser la règle de l’EVA, sans parler
des outils électroniques. Les patients qui ont un handicap moteur
(Parkinson, pathologies rhumatismales) ne positionnent pas nécessairement le curseur au bon endroit.
■ L’INTÉGRATION DES VALEURS
◗ Les différentes méthodes
Pour surmonter le problème de variabilité considérable de la douleur,
les séries de mesures peuvent être intégrées à plusieurs moments de la
journée. Un certain nombre de critères sont étudiés dans la littérature :
SUMVAS, PRIX, PID & SPID, PAR & TOTPAR.
Le SUMVAS consiste à faire la somme des scores d’intensité d’une
ESSAIS CLINIQUES DES ANTALGIQUES
◗ Les défauts
93
ESSAIS CLINIQUES DES ANTALGIQUES
Upsa Méthodo essais 2002
94
18/10/02
15:57
Page 94
douleur recueillis sur un intervalle de temps donné. Il est demandé au
patient de coter, à différents intervalles de temps, l’intensité de sa
douleur. Ces différentes cotations sont additionnées, sachant qu’il est
possible de faire la moyenne des cotations de plusieurs sujets traités.
Le produit est d’autant plus efficace que la somme des cotations est
basse.
Le PID qui est plus largement utilisé conduit à un calcul sur des
données primaires (intensité de la douleur à un instant T). Le différentiel de l’intensité de la douleur à l’instant T, par rapport à celle
identifiée au moment où le produit a été administré, doit être calculé.
Ensuite, il est nécessaire de calculer l’aire sous la courbe de ce PID
avec la méthode des trapèzes sur un intervalle de temps donné.
L’antalgique est d’autant plus efficace que le SPID moyen est élevé.
Le PRIX dont la formule est un peu compliquée n’apporte pas grandchose par rapport au PID.
Une étude montre l’évolution des scores mesurés en EVA pendant huit
heures du paracétamol, d’une part, et du paracétamol + codéine,
d’autre part. Le calcul du SPID ou de la SUMVAS montre l’efficacité
comparée de chaque produit avec un avantage en faveur de la combinaison paracétamol + codéine.
L’analyse des scores basés sur le soulagement en PAR obéit aux mêmes
principes que le PID avec un calcul du différentiel entre le niveau de
soulagement à un moment T et celui au départ.
Le TOTPAR consiste à intégrer ces variables en mesurant l’aire sous la
courbe par la méthode des trapèzes. Ce critère va permettre d’avoir une
vision globale du soulagement de la personne et, partant, de l’efficacité
du produit.
◗ Les limites
Il n’est pas possible de faire reposer l’analyse uniquement sur ces
valeurs intégrées. En effet, ces dernières ne tiennent pas compte du
délai d’action ou de l’amplitude de la réponse, ce qui est un peu
dommage. Il est également difficile de comparer entre eux les résultats calculés à partir de plusieurs TOTPAR compte tenu des différences en termes de temps de mesure ou de nombre de mesures. Le
passage au qualitatif est, dans ce cas, nécessaire en distinguant les
patients répondeurs et non-répondeurs.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 95
■ LE PASSAGE AUX CRITÈRES QUALITATIFS
◗ La notion de répondeur
La notion de répondeur permet de s’affranchir des temps de mesure.Un
patient est considéré par la littérature comme répondeur lorsque sa
réponse est supérieure de 50 % au maximum TOTPAR. Le pourcentage
maximum TOTPAR est calculé en faisant le rapport de deux surfaces
représentant le score du patient et le score d’efficacité maximale.
Les avantages de la distinction entre répondeurs et non-répondeurs sont
de pouvoir comparer des séries d’essais et de les intégrer.
◗ Le diagramme de l’Abbe
Le diagramme de l’Abbe permet de visualiser facilement l’efficacité d’un
produit comme le paracétamol avec la mesure de l’effet placebo. Il est
possible de faire des graphiques correspondant à différentes doses de
paracétamol. Une autre approche consiste à classer les patients répondeurs et non-répondeurs par rapport aux traitements actifs et aux effets
placebos.
Il est également possible d’avoir recours au calcul du bénéfice relatif
(équivalent du risque relatif). Généralement, les études prises individuellement se situent dans des intervalles acceptables. Par ailleurs,
compte tenu de ce critère qualitatif commun, il est possible de toutes
les fusionner et d’en tirer des enseignements intéressants. Étant donné
la variabilité de la douleur, il est cependant illusoire de compter sur des
résultats statistiquement significatifs avec moins de 500 patients, ce qui
est fréquent pour une étude isolée.
◗ Le NNT
L’Odds ratio peut également être employé pour intégrer un certain
nombre de données. L’évaluation des antalgiques par le NNT (nombre
de patients nécessaires à traiter), très utilisé, peut s’effectuer sur la base
de données brutes. Mais il est aussi possible de transformer les valeurs
de bénéfice relatif et de l’Odds ratio en NNT. Ainsi, toutes les données
ESSAIS CLINIQUES DES ANTALGIQUES
◗ Le bénéfice relatif
95
Upsa Méthodo essais 2002
18/10/02
15:57
Page 96
fusionnées donnent un paramètre général. Lorsque le NNT s’élève à 1,
cela signifie que le produit est efficace à 100 %.Un NNT à 5 signifie qu’il
faut faire appel à au moins cinq patients pour être sûr d’avoir un patient
qui réponde.
■ CONCLUSION
ESSAIS CLINIQUES DES ANTALGIQUES
Sans instruments de mesures fiables, les critères ne servent plus à
rien. C’est pourquoi il faut souligner la simplicité trompeuse des
instruments. Le principal problème de la douleur étant la variabilité,
il convient de l’atténuer le plus possible. Les paramètres intégrés
permettent de tenir compte de ce facteur. Il faut aussi compter sur
l’effet placebo qui est considérable. L’évaluation de la douleur n’étant
pas normale, il est nécessaire d’utiliser des tests paramétriques autres
comme la médiane et il est utile d’intégrer les résultats de plusieurs
études pour avoir une image claire de ce qui se passe.
96
Upsa Méthodo essais 2002
18/10/02
15:57
Page 97
L'antalgique de secours
dans les essais cliniques
Éric Boccard
Les raisons de se pencher spécifiquement, dans le cadre de la méthodologie des essais cliniques, sur l’antalgique de secours sont multiples.
L’une d’entre elles est une modification des attitudes thérapeutiques
dans le cadre de la douleur. En effet, en particulier dans le traitement de
la douleur post-opératoire, il est maintenant courant d’employer des
techniques conjointes dites “d’analgésie multimodale”,afin de tirer profit
des sites et mécanismes d’action complémentaires de plusieurs antalgiques. Il est ainsi courant de voir associer un morphinique avec un
non-morphinique. De même, en douleur chronique d’origine rhumatologique, on peut voir associer un AINS avec un antalgique pur.
Cette tendance se retrouve dans les essais cliniques menés dans un but
pragmatique. Mais, on peut parfois négliger le fait qu’une démonstration
au sein d’un essai clinique diffère souvent, d’une façon ou d’une autre,
de la pratique quotidienne.
Une autre raison d’aborder ce thème est l’amalgame retrouvé dans
certains essais entre différents critères de jugement, dont les scores de
douleurs et le recours à un antalgique de secours.
Dans la littérature et la terminologie anglo-saxonne, le distinguo n’est
pas fait clairement entre les deux concepts que nous allons développer
plus loin. Le seul terme constamment employé est le “rescue analgesic”,
que l’on peut traduire par antalgique de secours.
Et pourtant la prise d’un antalgique différent de celui à l’essai et qui
ESSAIS CLINIQUES DES ANTALGIQUES
Les dernières recommandations officielles de la FDA quant aux essais
cliniques d’antalgiques n’ont pas été actualisées depuis 1992 (1) et
comportent essentiellement trois types de critères de jugement : les
critères classiques basés sur l’évolution des scores de douleur (PID, pain
intensity differences) ou de soulagement (PR, pain relief), la durée de
l’analgésie et le délai d’apparition de l’analgésie. En revanche, il n’est
aucunement fait mention de façon explicite de l’antalgique de secours
que ce soit dans son choix ou dans les rôles qu’il peut jouer.
97
Upsa Méthodo essais 2002
18/10/02
15:57
Page 98
vient signer l’échec de celui-ci diffère quelque peu de l’antalgique qui
vient compléter, sur tout ou partie de l’essai, le produit étudié.
Nous allons donc distinguer l’antalgique de recours et l’antalgique de
complément.
ESSAIS CLINIQUES DES ANTALGIQUES
■ L’ANTALGIQUE DE RECOURS
98
L’antalgique de recours, c’est l’antalgique qu’il est prévu d’administrer
dans le protocole, en cas de soulagement insuffisant. Ce soulagement
insuffisant, qui doit répondre à des critères précis, signe l’échec thérapeutique et également le temps de la sortie d’essai. Cet antalgique de
recours répond donc à la nécessité éthique de prévoir dans un protocole une solution alternative pour les patients. Sa nature n’a a priori
aucune relation avec les résultats, il doit simplement offrir un soulagement potentiellement plus important que le ou les produits à l’essai et
ne pas risquer de produire des interactions médicamenteuses avec
ceux-ci.
Lors de cette sortie d’essai, le critère qui compte est le temps d’administration de l’antalgique de recours qui va déterminer un délai après la
prise initiale ou délai écoulé depuis le début du traitement (T0).
Il est courant de définir un délai minimal de recours possible (une heure
en douleur aiguë post-opératoire, ou 2/3 jours en chronique). Ce délai
minimal correspond à la durée pendant laquelle on considère qu’un
patient est “protégé” par l’effet placebo d’une part, au délai raisonnable
d’apparition d’un soulagement net d’autre part. Il est bien entendu à
adapter aux conditions de l’essai, à l’indication et à la sévérité attendue
de la douleur.
Dans cette définition d’un antalgique de recours, on voit que le problème d’interaction médicamenteuse ne se pose pas alors qu’il en va tout
autrement pour un antalgique de complément. En effet, la période pendant laquelle le traitement à l’essai et l’antalgique de recours sont pris
simultanément est postérieure à la période retenue dans l’analyse.
La méthode d’analyse statistique à appliquer dans ce cas s’appuie sur le
fait que seul le temps de recours à cet antalgique compte, et elle doit
être prédéfinie dans l’analyse statistique.La méthode de la courbe de survie (analyse dite de Kaplan-Meyer) est la plus recommandable étant
donné que l’on a à faire à un événement bien identifiable, à une seule
variable, le temps.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 99
Pourcentage de patients
Durée d’action des produits étudiés
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
Propacetamol
Paracetamol
Placebo
Durée en minutes
0
30
60
90
120 150 180
210 240 270
300
330
360
On peut aussi analyser sous l’angle du temps médian de recours. Il
s’agit plutôt d’une méthode complémentaire qui donnera une information sur la durée d’action du produit étudié dans chaque groupe
(figure ci-dessus). Il est en tout cas indispensable, quant à l’analyse
classique de l’évolution des scores de douleurs, de tenir compte de
ces événements intercurrents. La méthode la plus consensuelle, pour
ne pas introduire un biais et tenir compte de l’échec thérapeutique
avéré, est le report du score tel qu’il a été enregistré au moment de la
sortie, à chaque temps ultérieur jusqu’à la fin de l’essai. Le nombre de
données analysables reste ainsi constant, même aux temps tardifs de
l’essai, mais on se met dans la situation la pire du point de vue des
résultats et donc dans la situation la moins critiquable du point de vue
de la rigueur méthodologique. Dans l’hypothèse où des scores
auraient été enregistrés à la suite de la prise de l’antalgique de
recours, ceux-ci sont, bien entendu, sans valeur. Si la durée d’action est
le critère essentiel recherché, il existe une méthode plus fine et spécifique (méthode des trois chronomètres).
En définitive, ce concept est essentiellement applicable à la douleur
aiguë car il offre un cadre d’analyse relativement simple à systématiser,
ce qui est indispensable.
ESSAIS CLINIQUES DES ANTALGIQUES
3 groupes parallèles de 108 patients, après chirurgie d’hallux valgus
sous anesthésie locale, propacetamol vs paracetamol vs placebo.
D’après Jarde et al (2)
99
Upsa Méthodo essais 2002
18/10/02
15:57
Page 100
ESSAIS CLINIQUES DES ANTALGIQUES
En revanche, en matière de douleur chronique, les critères qui vont
mener à la définition d’un échec thérapeutique sont moins simples et
dès lors,ne se font pas la plupart du temps sous le contrôle direct de l’investigateur, mais grâce à des instructions remises au patient. Il plane
toujours un doute sur les conditions exactes de survenue d’une sortie
d’essai pour échec thérapeutique. Comment interpréter, par exemple, le
cas du patient qui juge nécessaire de prendre à une ou plusieurs
reprises, mais pas de façon constante et répétée, l’antalgique de recours
autorisé, mais sans vouloir interrompre le traitement étudié ? À quel
moment situer l’échec ? Est-il valide de le fixer dès la première prise d’un
autre antalgique que celui étudié ? Et que décider si le patient a
présenté,en cours d’étude,soit momentanément une douleur différente
et supplémentaire, soit une poussée de la pathologie sous-jacente (ex. :
céphalées ou poussée inflammatoire chez un patient arthrosique).
100
Du point de vue de l’analyse des données,la situation diffère également.
Autant en aiguë, chaque heure comptant, l’analyse en courbe de survie
a du sens, autant en chronique, l’événement à analyser étant moins
précisément identifiable, des critères tels que la durée moyenne de
participation à l’essai ou le pourcentage de patients interrompant
l’essai pour échec pourraient être préférés. Cependant, s’il s’agit de
patients hospitalisés, pour lesquels le recueil de données est plus fiable,
on peut envisager de faire appel à une analyse de covariance, à condition d’être capable de fixer précisément la nature et la quantité d’antalgique de secours. En définitive, en douleur chronique, le maître mot
devrait être de rester pragmatique et d’adapter la méthode d’analyse de
l’échec thérapeutique à chaque cas.
■ L’ANTALGIQUE DE COMPLÉMENT
L’antalgique de complément est l’antalgique,connu,qui vient compléter
tout au long de l’essai, si nécessaire, l’effet antalgique du ou des
produits testés. Les modalités de son administration sont clairement et
précisément définies dans le protocole (nature, posologie [fixe ou
poso/poids] et critères d’emploi) afin d’assurer une comparabilité
inter-groupe et inter-patient, il peut être réclamé et/ou utilisé par le
patient sans que cela ne signe un échec thérapeutique. Il peut-être
ainsi être analysé de façon fiable et reproductible. Ce peut être un
Upsa Méthodo essais 2002
18/10/02
15:57
Page 101
critère de jugement principal de l’efficacité antalgique lors de la
comparaison de deux produits actifs ou versus placebo.
Bien sûr, un tel antalgique de complément n’est exploitable que si les
critères de recours sont parfaitement définis, et définissables
à l’avance. Il peut arriver que ce pré requis ne soit pas réalisable.
Pour que cet usage d’un antalgique de complément soit fiable et donc
analysable, il faut en particulier que les conditions de recours soient
identiques. Pour cela, il faut un nombre minimal d’étapes et d’intermédiaires, d’une part, et une fiabilité du critère de recours, d’autre part.
Or, dès que cette administration fait appel à un personnel soignant
comme intermédiaire, on introduit plusieurs variables difficiles à
maîtriser et à homogénéiser dans le temps d’un patient à l’autre et
d’un centre à l’autre. On peut faire intervenir le jugement de ce
soignant quant au bien-fondé de la demande du patient (à moins
qu’un score de douleur seuil ait été déterminé à l’avance) et, dans
tous les cas, on ajoute les délais variables de réponse à l’appel du
patient et d’administration de l’antalgique.
On voit bien là la différence qui se dessine entre les méthodes passant
par l’hétéro-administration, de celles passant par l’auto-évaluation et
l’auto-administration.Les premières entraînent ipso facto une cascade de
sources de variabilité qui compromettent son utilisation rationnelle
comme critère de jugement d’efficacité. Au contraire les secondes
limitent, sans totalement les supprimer, ces facteurs de variabilité.
Dans les premières, on peut regrouper les méthodes d’administration
d’un antalgique à la demande du patient, y compris sous forme
injectable.
Dans les secondes, on peut regrouper les méthodes utilisant la PCA ou
la PCEA comme méthode d’administration d’une antalgie complémentaire et celles mettant à disposition du patient un antalgique sous
forme orale avec des consignes de prise. Cependant, il existe une différence importante entre ces techniques. Lors de l’usage de la PCA, où
l’analgésique employé est délivré en micro-bolus (à volume fixe, et
donc à dose fixe) à intervalles réguliers (avec une période réfractaire
minimale, de l’ordre de la dizaine de minutes), on peut s’attendre à un
effet rapide sur la douleur et donc à une adaptation relativement fine
dans le temps entre les besoins du patient et la dose employée.
ESSAIS CLINIQUES DES ANTALGIQUES
◗ L’antalgique de complément dans la douleur aiguë
101
Upsa Méthodo essais 2002
18/10/02
15:57
Page 102
ESSAIS CLINIQUES DES ANTALGIQUES
L’efficacité de l’administration répétée de faibles doses de morphine a
été démontrée (3).Au contraire, lors de l’usage d’un antalgique oral, on
emploie en général la dose optimale, qui est nettement plus longue à
agir qu’un micro-bolus intraveineux ou intra-épidural a fortiori, et qui
ne peut être répétée qu’après plusieurs heures, quelle que soit la molécule. Dans ce dernier cas, on ne peut pas considérer que la consommation de cet antalgique de complément reflète l’évolution et les
fluctuations de la douleur, car on obtient un résultat en tout ou rien.
En définitive, on voit donc que la seule technique qui permet de réellement utiliser l’antalgique de complément de façon satisfaisante sur le
plan méthodologique,comme critère de jugement principal d’efficacité,
est une technique permettant une incrémentation la plus fine possible
de la dose d’antalgique de complément, c’est-à-dire la PCA ou la PCEA.
Mais, même cette technique d’administration possède des limites et
impose des choix corollaires.
102
La PCA a pour intérêt de répondre au problème de la variabilité interindividuelle de la sensation douloureuse et de la sensibilité aux morphiniques, mais présente néanmoins des taux de variabilité encore
importants. Il faut donc tenir compte de cette variabilité de la
consommation de morphine en fonction de l’indication, en général
dans la littérature, et plus particulièrement dans le ou les centres
concernés, afin de calculer le nombre minimal nécessaire de patients.
La caractéristique la plus intéressante de la PCA, dans le cadre de notre
réflexion, est que le patient peut déclencher l’administration dès qu’il
ressent une douleur, rentrant dans un système de boucle de rétrocontrôle. Le patient va donc s’administrer l’antalgique jusqu’à obtenir un
effet qu’il juge satisfaisant sur l’intensité de la douleur. La plupart des
études publiées, lorsqu’elles fournissent les données de scores de
douleur, montrent que les patients se stabilisent aux environs de 30 mm
sur une échelle EVA de 100 mm, c’est-à-dire qu’ils ne recherchent pas le
zéro douleur. En revanche on peut faire l’assertion que, quelle que soit
l’efficacité intrinsèque du traitement étudié et de l’antalgique de
complément, il n’y a aucune raison pour que d’un groupe à l’autre les
patients (et aussi, dans un même centre, d’une étude à l’autre, mais la
rigueur méthodologique interdit les comparaisons historiques) ne cherchent pas en moyenne un soulagement équivalent et donc à ramener
leur score de douleur dans des plages comparables. Ce constat prend
toute son importance quant aux conclusions que l’on est en droit de
Upsa Méthodo essais 2002
18/10/02
15:57
Page 103
tirer d’un essai où le critère de jugement principal est la consommation
de morphine. En effet, un pré requis indispensable au moment de l’analyse des résultats est que les scores de douleurs dans les groupes étudiés
doivent être comparables, c’est-à-dire non différents significativement.
Dans le cas contraire une différence signerait un biais dans l’étude.
Prenons, à titre d’exemples, plusieurs essais utilisant la PCA avec
morphine dans des comparaisons entre le propacetamol et un
placebo ou le ketorolac, en post-opératoire.
Essai 1
mg 50
Propacetamol
Placebo
p= 0,03
40
30
20
10
0
1
2
3
4
6
8
10 12 14 16 18 20 22 24 heures
cm
8
Propacetamol
Placebo
7
6
5
4
3
2
0
1
2
3
4
6
8
10 12 14 16 18 20 22 24
heures
SCORES DE DOULEUR SUR EVA
2 groupes parallèles de 30 patients, après ligamentoplastie du genou,
propacetamol vs placebo. D’après Delbos et al (4)
Bolus = 1 mg, flux continu 0,5 mg/h, période réfractaire 15 minutes.
Déviation standard consommation de morphine = 14 mg sur 24 heures
ESSAIS CLINIQUES DES ANTALGIQUES
CONSOMMATION CUMULÉE DE MORPHINE
103
Upsa Méthodo essais 2002
18/10/02
15:57
Page 104
Essai 2
mg 20
Propacetamol
Placebo
p< 0,001
15
10
5
0
1
2
3
4
6
8
10 12 14 16 18 20 22 24 heures
CONSOMMATION CUMULÉE DE MORPHINE
cm 6
Propacetamol
Placebo
5
4
3
2
1
0
0
1
2
3
4
6
8
10 12 14 16 18 20 22 24 heures
ESSAIS CLINIQUES DES ANTALGIQUES
SCORES DE DOULEUR SUR EVA
104
18
16
14
12
10
8
6
4
2
0
Propacetamol (n=39)
Placebo (n=43)
p= 0,01
Nulle
Faible
Modérée
Bonne
Très bonne
SCORES DE SATISFACTION GLOBALE DES PATIENTS
2 groupes parallèles de 47 patients, après chirurgie orthopédique,
propacetamol vs placebo. D’après Peduto et al (5).
Bolus = 0,015 mg/kg, période réfractaire 15 min. Déviation standard
de consommation de morphine sur 24 heures = 10 mg.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 105
Essai 3
mg 12
Propacetamol
Ketorolac
10
8
6
4
2
0
1
2
3
4
6
8
10
12
heures
CONSOMMATION CUMULÉE DE MORPHINE
cm 10
Propacetamol
Ketorolac
8
6
4
0
1
2
3
4
6
8
10
12
heures
SCORES DE DOULEUR SUR EVA
2 groupes parallèles de 100 patientes, après chirurgie gynécologique,
propacetamol vs ketorolac. D’après Varassi et al (6).
Bolus = 0,02 mg/kg, période réfractaire 5 min, limite de 0,1 mg/kg
les 4 premières heures.
Déviation standard consommation de morphine sur 12 heures = 4.6 mg.
On voit, dans les résultats de ces trois essais menés sur des indications
différentes, que les scores de douleurs sont à chaque fois comparables,
que ce soit entre un traitement actif et un placebo ou entre deux traitements actifs. Dans le même temps, les consommations de morphine
évoluent de manières visiblement différentes (et significativement)
entre l’actif et le placebo, et tout à fait superposables entre les deux
actifs dans l’essai 3.
ESSAIS CLINIQUES DES ANTALGIQUES
2
105
Upsa Méthodo essais 2002
18/10/02
15:57
Page 106
ESSAIS CLINIQUES DES ANTALGIQUES
Il est donc antinomique de vouloir rechercher dans la même étude une
différence significative sur la consommation de morphine et sur les
scores de douleurs.D’une manière générale,cela reflète aussi le principe
selon lequel il est préférable de s’en tenir à un seul critère de jugement
principal.
106
En théorie, la seule exception à cette règle serait un antalgique tellement efficace qu’il réduirait le besoin de compléter l’antalgie par la
morphine, avec une consommation quasiment nulle. Mais, dans le cas
d’un tel antalgique, le bon sens ferait rechercher d’autres méthodes
d’évaluation de son efficacité antalgique en monothérapie.
Si l’on considère des critères de jugement accessoires tels que la satisfaction du patient, il est en revanche possible de constater des différences significatives, comme on peut le voir dans l’essai n°2, car on fait
intervenir là des facteurs multiples et associés. En particulier, le profil
d’effets indésirables des morphiniques étant dose dépendant, on peut
faire l’hypothèse qu’une consommation moindre de morphine retentit
sur le confort du patient et donc, au final, sur sa satisfaction globale
quant à sa prise en charge. Cependant, Homs et collègues ont
démontré dans une large enquête sur l’utilisation de la PCA en
France (7), que la satisfaction du patient semblait ne pas être liée avec
le soulagement de sa douleur. On entre là dans le sujet de la qualité de
vie comme critère de jugement de l’intérêt d’une méthode ou d’une
technique et qui nécessite d’employer d’autres critères de jugements
bien spécifiques.
Lorsqu’on emploie cette technique de l’antalgie de complément, il ne
faut pas perdre de vue que l’on étudie en fait une association. Et c’est
donc l’efficacité et la tolérance de cette association qui est observée.
Sur le plan efficacité antalgique, l’effet de cette association peut être
synergique (simplement additif, voire potentialisateur) ou même antagoniste. L’observation de la consommation de morphine ne permettra
pas de distinguer entre effet additif et synergique, ni de préciser le
meilleur ratio de doses. Seules les études associant cette fois des doses
fixes permettent de répondre à cette question, comme il en a été fait
de nombreuses au sujet de l’association paracetamol-codéine. (8,9)
Sur le plan des effets indésirables, c’est l’imputabilité des effets indésirables à l’une ou l’autre molécule que l’on complique.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 107
Le principe de l’antalgie de complément via la PCA n’est guère applicable qu’à la douleur aiguë post-opératoire. Si l’on accepte le principe
de contrôler au mieux les différents facteurs de variabilité, on peut
concevoir qu’il est illusoire de considérer l’antalgie de complément,
dans le cadre de la douleur chronique, comme un critère de jugement
qui puisse refléter de façon fine l’effet antalgique d’un produit, ou
une différence d’effet entre deux produits ou versus placebo. Au
mieux ce peut-être un critère secondaire dans une analyse de type
pragmatique.
En effet, même si le protocole a défini précisément les critères de
recours à cet antalgique, il est difficile de pouvoir s’assurer qu’ils
ont été respectés en tout par les patients, et en particulier la prise
du traitement étudié, par opposition avec une perfusion intraveineuse. Une des différences avec la méthode PCA en douleur aiguë
est le recueil des scores de douleurs. Avec celle-ci, il est fait très
régulièrement, et au moins aussi souvent que le recueil des consommations cumulées de morphine, soit toutes les heures ou toutes les
deux heures. En revanche, en chronique, il n’est pas pensable de
demander au patient plus d’un à deux scores par jour. De plus, la
douleur chronique oscille dans la journée et d’un jour à l’autre,
contrairement à la douleur post-opératoire que l’on peut, en
première intention, considérer comme évoluant de manière assez
régulière (que ce soit dans le sens de l’augmentation ou de la diminution). Il devient donc impossible de repérer une discordance
entre la prise de l’antalgique et le score de douleur.
■ CONCLUSION
L’antalgie de secours est souvent envisagée pour des raisons éthiques
et il s’agit alors d’antalgie de recours, sa mise en œuvre n’est pas difficile, elle impose juste de prendre des précautions dans l’analyse des
données subséquentes à l’intervention de cet antalgique de recours.
Son utilisation préméditée comme critère de jugement, il s’agit alors
d’antalgie de complément, est plus difficile sur le plan pratique. De
nombreux biais méthodologiques sont à éviter, son emploi doit donc
être très encadré ce qui le rend peu praticable en douleur chronique.
ESSAIS CLINIQUES DES ANTALGIQUES
◗ L’antalgie de complément en douleur chronique
107
Upsa Méthodo essais 2002
18/10/02
15:57
Page 108
Enfin, il faut se rappeler qu’on étudie dans ce cas une association de
deux principes actifs, mais qu’une seule étude ne pourra pas
répondre à plusieurs objectifs, comme par exemple l’effet d’épargne
et la nature de l’effet obtenu : additif ou potentialisateur.
ESSAIS CLINIQUES DES ANTALGIQUES
Bibliographie
108
1. Guideline for the clinical evaluation of analgesic drugs- FDA- 1992- docket
91D-0425
2. O. Jarde and E. Boccard Parenteral versus oral route increases paracetamol
efficacy. Clinical Drug Investigation, 1997 ; 14 (6) : 474-481
3. Ballantyne JC, Carr DB, Chalmers TC et al.,Post-operative patient-controlled
analgesia-meta-analyses of initial randomized controlled trials J Clin Anesth,
1 993, 5,182-193
4. Delbos A., Boccard E. The morphine-sparing effect of propacetamol in
orthopedic postoperative pain. Journal of Pain and Symptom Management,
1995 ; 10 (4) : 279-286
5. Peduto V.A., Ballabio M. and Stefanini S. Efficacy of propacetamol in the treatment of postoperative pain - Morphine-sparing effect in orthopedic surgery
Asta Anaesthesiol. Scand. 1998 ; 42 : 293-298
6.Varassi G, Marinangelli F,Agro F et al,A double-blinded evaluation of propacetamol versus ketorolac in combination with patient-controlled analgesia
morphine : analgesic efficacy and tolerability after gynecologic
surgery,Anest anlg 1999, 88,611-616
7. Homs JB, Loriferne JF, Bonnet F,ARAR Evaluation of patient satisfaction and
pain relief with intravenous PCA, Br J Anaesth, 74, S1, 133,A436
8. Bentley KC, Head TW The additive analgesic efficacy of acetaminophen,
1 000 mg, and codeine, 60 mg, in dental pain. Clin Pharmacol Ther., 1987 ;
42 (6) : 634-640
9. Quiding H, Persson G, AhlstromU et al Paracetamol Plus Supplementary
Doses of Codeine : An Analgesic Study of Repeated Doses. Eur. J. Clin.
Parmacol., 1982 ; 23 : 315-319
Upsa Méthodo essais 2002
18/10/02
15:57
Page 109
Les contraintes des essais cliniques
en pédiatrie
Jacques Wrobel
Les contraintes imposées aux promoteurs et aux investigateurs dans
le cadre des essais cliniques propres au développement des nouveaux
produits antalgiques en pédiatrie doivent être dissociées de celles
imposées à l'adulte. Ainsi, dès les années soixante, le Dr Harry Shirkey
estimait que les enfants sont des “orphelins thérapeutiques” (1,2).
■ LES CONTRAINTES D'ORDRE PRATIQUE
Les contraintes liées aux essais cliniques comportent à la fois des aspects
réglementaires, éthiques et techniques.
Le développement des médicaments passe obligatoirement, après la
phase de recherche, par la mise en place d'essais cliniques sur l'humain, afin de mesurer leur efficacité et leur tolérance dans les conditions les plus proches possibles de leur utilisation à venir. La
déclaration d'Helsinki indique que le progrès de la médecine est
fondé sur la recherche, qui doit elle-même s'appuyer sur les expérimentations. Ces essais cliniques, désignés par le terme “recherche
biomédicale”, sont aujourd'hui relativement bien codifiés en France
par des dispositions réglementaires du Code de santé publique (3)
ayant pour objet de protéger au mieux les personnes, bien portantes
ou malades, qui vont s'y soumettre (articles L 1121.1/10).
Le non-respect de ces dispositions peut entraîner des amendes et des
peines de prison pour le promoteur (le laboratoire) ainsi que pour
l'investigateur, qui risque également d'être suspendu provisoirement
de son droit d'exercer la médecine (articles L 1126.1/ 7). Chacun se
doit de respecter ces contraintes réglementaires.Voici les principaux
articles de loi les concernant.
ESSAIS CLINIQUES DES ANTALGIQUES
◗ Au plan réglementaire
109
Upsa Méthodo essais 2002
18/10/02
15:57
Page 110
ESSAIS CLINIQUES DES ANTALGIQUES
• L'article L 1122.2 du Code de santé publique donne des précisions sur
le “consentement éclairé” qui doit être notifié par écrit par celui qui va
faire l'objet d'un essai clinique. Il indique que « le consentement éclairé
est donné par les titulaires de l'autorité parentale pour des mineurs nonémancipés, ou pour des majeurs qui sont protégés par la loi, mais le
consentement du mineur doit également être recherché lorsqu'il est
apte à exprimer sa volonté et il ne peut être passé outre son refus ou la
révocation de son consentement ». Le moment à partir duquel on peut
demander son avis au mineur est donc laissé à l'appréciation de chacun.
Plus important est de préciser que l'avis favorable doit être émis par les
deux parents qui sont “les titulaires de l'exercice de l'autorité parentale”.
Il peut être toutefois compliqué d'obtenir ces deux avis, dans une
situation d'urgence, ou lorsque les parents vivent séparés.
110
• L'article L 1124.1 porte sur la notion de “bénéfice individuel direct”. Il
précise qu'il doit y avoir une absence de “risque prévisible sérieux pour
la santé des personnes qui se prêtent à la recherche” et qu'elle doit être
utile pour d'autres personnes d'un âge identique. Il est donc nécessaire
de respecter le bénéfice direct de l'enfant,tout en ne perdant pas de vue
que la législation française impose de ne pas commercialiser un nouveau
médicament,destiné à l'enfant ou à l'adulte,sans apporter les preuves de
son efficacité et de sa tolérance. La recherche de ces preuves est particulièrement complexe chez l'enfant car il est en maturation constante.
Des organes comme le foie ou les reins voient leur taille et leur fonction
se modifier en relation avec la croissance de l'enfant, ce qui rend plus
délicate l’analyse des paramètres biologiques. Concevoir un protocole
d’essai clinique chez l’enfant impose donc de prendre en compte ce
facteur croissance en instituant des groupes d’individus d’âge et de
poids évolutifs.Tout ceci alourdit notablement les effectifs nécessaires et
les essais doivent donc être menés à différents âges, ce qui en multiplie
le nombre.
• L'article L 1124.2 précise qu'une “indemnité peut être versée en
contrepartie des contraintes subies, sauf pour un mineur ou un majeur
protégé”. Ceci veut dire qu'en aucun cas des parents ou des tuteurs ne
peuvent entraîner des enfants à faire l'objet d'essais thérapeutiques pour
des intérêts financiers.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 111
◗ Au plan éthique
Chaque protocole doit faire l'objet d'un examen approfondi par un
Comité Consultatif de Protection des Personnes pour les Recherches
Biomédicales (CCPPRB), qui juge de son bien-fondé scientifique et
méthodologique et dont l'accord officiel est obligatoire en préalable à la
mise en place de l'essai (articles L 1123.1/11).Les essais cliniques menés
chez l'enfant posent souvent un problème dès cette étape de mise en
place, à cause tout simplement de la jeunesse des sujets concernés.
On note souvent des réticences du personnel soignant (le personnel
paramédical et les médecins) vis-à-vis de l'expérimentation. Les
soignants sont souvent très sensibles à la réalisation d'essais chez
l'enfant. Ainsi, les essais comparatifs avec un placebo sont mal
accueillis. En effet, comment imaginer que dans un protocole, un
enfant sur deux ne recevra pas un produit actif alors qu’il présente
une pathologie douloureuse réelle.
Par ailleurs, l'essai clinique est un facteur de travail supplémentaire,
compte tenu des contraintes liées au protocole qu'il induit. Citons le
cas des prélèvements sanguins, pour lesquels le nombre de prélèvements et la quantité de sang à recueillir sont plus problématiques
chez un enfant en bas âge que chez un adulte.
Souvent, une relation affective se crée entre le soignant et l'enfant et
peut entraîner une incitation à soustraire celui-ci de l'essai clinique,
même lorsque le risque est limité.
La famille est aussi facteur de réticence. L'enfant hospitalisé et sa famille
sont à la recherche de certitudes et non de motifs d'inquiétude et l'essai
d'un médicament ou d'un nouveau dosage n'est pas le bienvenu. Les
parents d'un enfant hospitalisé vivent le plus souvent une situation
angoissante. Ils ne sont alors pas dans les meilleures dispositions pour
comprendre ce que l'on attend d'eux dans le contexte très particulier,
tant administratif que clinique, d'un essai thérapeutique. L'enfant est
inquiet lui aussi et peut poser la question “pourquoi moi ?” alors que
son accord est nécessaire.
ESSAIS CLINIQUES DES ANTALGIQUES
◗ Au plan technique
111
Upsa Méthodo essais 2002
18/10/02
15:57
Page 112
■ LES CONTRAINTES D'ORDRE ÉCONOMIQUE
Des contraintes d’ordre économique existent également. Ainsi, les
essais cliniques, base du développement médical des produits, sont
longs et coûteux, ainsi que toutes les études pharmacologiques préalables, indispensables et complexes. Le laboratoire pharmaceutique a
pour contrainte supplémentaire de mettre à disposition des enfants
malades des dosages et des présentations différentes. Cette spécificité,
propre à la pédiatrie, multiplie également le nombre d’essais cliniques
à réaliser.
Parallèlement, le marché des produits antalgiques en pédiatrie est
restreint en volume et en chiffre d’affaires, si on le compare à celui de
l’adulte. En effet, le prix de vente proposé par les autorités de tutelle
est calculé, en toute logique, au prorata du principe actif. Ceci
diminue d’autant la rentabilité de chaque produit dans ses différentes
formes. Un impact négatif sur le potentiel de mise en place des essais
cliniques en pédiatrie est alors inévitable.
ESSAIS CLINIQUES DES ANTALGIQUES
■ LES PERSPECTIVES D'AVENIR
112
D'un point de vue réglementaire, il est souhaitable de pouvoir autoriser
le démarrage d'un essai clinique avec l'autorisation d'un seul parent, le
deuxième signant plus tard. La présence d'un expert pédiatre dans
chaque Comité d'Éthique devrait également favoriser l'évaluation des
protocoles. La réduction du caractère agressif de certains prélèvements
ou examens bénéficie dorénavant de l'existence de micro-méthodes de
dosage et du recours systématique aux crèmes antalgiques.
D'un point de vue scientifique, des nouveaux concepts se développent
actuellement dans chaque domaine thérapeutique. La sensibilisation des
pédiatres aux problèmes de l'antalgie chez l'enfant constitue un atout
supplémentaire. La mise en place de réseaux de pédiatres pourrait favoriser l'organisation des essais cliniques. Enfin,“mieux prendre en charge
la douleur de l'enfant” est une des trois priorités du deuxième
programme de lutte contre la douleur 2002-2005 du Ministère de la
Santé. Les pouvoirs publics et les laboratoires, stimulés par ces évolutions, semblent mieux s’impliquer pour que soient mises à disposition
du corps médical des solutions thérapeutiques nouvelles et adaptées.
D'un point de vue sociologique, les familles doivent faire de plus en plus
Upsa Méthodo essais 2002
18/10/02
15:57
Page 113
l'objet d'une information détaillée. Leur rôle est central dans la mesure
où ce sont elles qui connaissent le mieux leur enfant et qu'elles en ont
la responsabilité (4). L’avenir est donc porteur d’optimisme.
■ CONCLUSION
L'amélioration de la formation du corps médical et de l'information
du grand public à la prise en charge de la douleur de l'enfant est
fondamentale.Tous les moyens publics et privés doivent y contribuer.
De cette évolution dépend une meilleure compréhension des
contraintes liées aux essais thérapeutiques chez l'enfant, afin de
pouvoir favoriser leur réalisation dans les meilleures conditions de
confiance et de sécurité.
Les contraintes réglementaires qui s’appliquent aux recherches
biomédicales chez l’adulte peuvent, à l’instar des textes précédents
concernant l’enfant, être consultées dans le même chapitre du Code
de santé publique (articles L 1121.1 / L 1126.7).
1.“Why FDA is encouraging drug testing in children”, FDA Consumer, july/august 1991.
2. Shirkey H.,Therapeutic orphans, J. Pediatr, 1968 : 72, 1, 119-20.
3. Code de santé publique, Édition 2001, 6-15, Dalloz.
4. Cook J.,Tursz A., L'enfant et la douleur, familles et soignants, 1998, Ed Syros
ESSAIS CLINIQUES DES ANTALGIQUES
Bibliographie
113
Upsa Méthodo essais 2002
114
18/10/02
15:57
Page 114
Upsa Méthodo essais 2002
18/10/02
15:57
Page 115
5. ESSAIS
CLINIQUES DANS
LES PATHOLOGIES DOULOUREUSES
Évaluation de la douleur
post-opératoire
Dominique Fletcher
Le nombre de patients constitue un premier point important dans le
cadre de l’évaluation de la douleur post-opératoire compte tenu de la
variabilité des phénomènes de douleur. Les consommations de
morphine, par exemple, pour des douleurs post-opératoires, vont de
un à cinq selon les patients. Pour réduire cette variabilité, il convient
de se rapprocher le plus possible des situations de puissance intrinsèque. Pour ce faire, le risque alpha et le risque bêta doivent être
déterminés, le risque alpha révélant à tort une différence et le risque
bêta ne révélant pas une différence qui existe.
Il paraît possible d’effectuer des recherches cliniques avec moins de
500 patients. Mais l’une des limites est la pertinence clinique de la
différence statistique. L’analyse de technique analgésique en postopératoire revient à interroger la thérapeutique habituelle. C’est pourquoi il est important de combiner la pertinence statistique de l’étude
et l’objectif clinique quant à la différence à mettre en évidence.
Le calcul prédictif du nombre des patients est aussi un élément important. Il dépend de la variabilité du critère utilisé, de la différence à
mettre en évidence et des critères statistiques concernant le risque.
Rétrospectivement, il faut aussi savoir si l’étude a la sensibilité intrinsèque est suffisante pour mettre en évidence une différence. Une différence entre un traitement A et le placebo peut révéler une puissance
suffisante de l’essai. Ce faisant, si la comparaison entre deux traitements
A et B, potentiellement efficaces, ne fait apparaître aucune différence,
c’est que la différence n’est pas importante.
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
■ LE NOMBRE DE PATIENTS
115
Upsa Méthodo essais 2002
18/10/02
15:57
Page 116
Les calculs du nombre de patients sont parfois une limite à la pratique
de la recherche clinique, sachant que l’information n’est pas toujours
disponible quant aux critères analysés. Il faut engager des études
ouvertes d’analyse de critère.Par ailleurs,les études multicentriques sont
difficiles à gérer. Mais ces études, même si elles portent sur un nombre
de patients réduit, peuvent présenter un intérêt à partir du moment où
la différence à mettre en évidence est définie précisément.
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
■ LES CRITÈRES DE QUALITÉ MÉTHODOLOGIQUE
116
La randomisation et le double aveugle permettent de “verrouiller” la
majorité des biais. Sans la randomisation, l’effet analysé est surestimé.
Cela étant, il convient de le définir de manière appropriée sur la base
de critères qui essaient de limiter la connaissance de l’ordre de randomisation. La sélection peut être centralisée avec des listes préalablement établies.
Le “double-aveugle” nécessaire pour éviter les biais peut être affiné,
notamment en cas d’effets secondaires fréquents des produits à analyser.
En particulier, l’utilisation d’un placebo actif limite le risque de perception par le patient et par l’équipe soignante du type de traitement qui
a été administré. Le “double-dummy” correspond à une double administration de différents produits réalisée sur un patient placebo.
Pourquoi continuer à analyser les patients exclus ? De fait, des études
positives, en dépit de leur moindre qualité méthodologique, ont
tendance à être davantage publiées que les études négatives. Cela a été
l’une des critiques adressées aux études portant sur l’analyse postopératoire utilisant des techniques d’administration périphérique
d’analgésie. La majorité des études positives avaient un niveau méthodologique faible, contrairement aux études négatives. Ce biais de
publication doit être anticipé.
■ TYPE DE CHIRURGIE
Il faut garder à l’esprit les facteurs de variabilité dans le cadre de l’analyse en post-opératoire. Dans le contexte de la nociception, les douleurs
neurogènes et viscérales doivent être prises en compte. L’intensité de la
douleur selon le type de chirurgie est également variable.L’évolution est
Upsa Méthodo essais 2002
18/10/02
15:57
Page 117
aussi différente quant à la durée et aux facteurs déclenchants. En améliorant l’homogénéité, l’étude gagne en puissance et permet de mieux
mettre en évidence la différence que l’on souhaite. Il faut donc absolument se restreindre à des populations bien ciblées en termes de type
chirurgical. Les opérations doivent être également aussi standardisées
que possible. Les études mêlant des patients aux origines chirurgicales
variées sont fatalement moins puissantes.
Les scores globaux de douleur figurent parmi les premiers critères
d’évaluation. Les seuils douloureux sont sans doute plus pertinents
pour raisonner en termes de mécanismes.Il est aussi possible d’adopter
comme critère la consommation d’analgésiques.
◗ Les scores de douleur
Sauf en post-opératoire immédiat,il ne faut pas se fonder sur une hétéroévaluation. L’auto-évaluation par échelle visuelle analogique (EVA),
échelle verbale ou numérique reste la référence. L’EVA a l’avantage
d’être continue et d’avoir été validée. Elle a une corrélation précise et
une linéarité dans sa réponse par rapport au type de stimulation et à
la douleur perçue par le patient.
Des expériences standardisées de stimulation thermique montrent une
bonne linéarité de la réponse du patient et de la description de la
douleur. Cela étant, les résultats des échelles d’évaluation peu utilisées,
comme l’échelle numérique ou l’échelle verbale, sont bien corrélés
avec les scores d’EVA. Il est donc possible de réaliser des essais
cliniques avec ces scores comme critère principal.
L’EVA peut être sensibilisée au mouvement. Les techniques d’évaluation
en post-opératoire ont récemment dérivé vers une évaluation de la
douleur dans des conditions de mouvements standardisés, l’objectif
étant d’évaluer les patients dans le cadre d’une réhabilitation,c’est-à-dire
d’une reprise de l’activité précoce en post-opératoire.
La notion de mouvement permet de quantifier la douleur provoquée
(différente de la douleur spontanée) pour sensibiliser la mesure et en
tirer des conséquences cliniques en termes de capacités de mobilisation.
Mais, les techniques d’évaluation rétrospectives ont peu d’avantages.
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
■ LES CRITÈRES D’ÉVALUATION
117
Upsa Méthodo essais 2002
18/10/02
15:57
Page 118
L’intervalle de confiance est aussi une notion importante. La comparaison d’études avec un contrôle à quatre heures et à vingt-quatre heures
avec un niveau d’efficacité défini à 3 sur une EVA montre que la
moyenne à quatre heures est proche du seuil d’efficacité. En revanche,
la dispersion des valeurs ne permet pas de penser que le traitement est
vraiment fiable.
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
◗ Les seuils douloureux
118
Il n’a pas encore été démontré que les seuils douloureux sont vraiment
utiles en termes d’analyse post-opératoire.Il s’agit plus d’un transfert de
techniques réservées à la recherche animale ou humaine non clinique.
L’objectif est de raisonner, non plus sur la douleur spontanée, mais sur
la douleur provoquée dans un contexte clinique. Les cas susceptibles
de réactiver les stimulus mécaniques doivent permettre de définir le
seuil de douleur. L’allodynie mécanique sera diagnostiquée si le niveau
douloureux est réduit par rapport à une situation de contrôle.Au-delà,
l’hyperalgésie sera diagnostiquée.
Les études utilisent des stimulations de large surface avec une pression
sur la cicatrice ou avec des fils qui permettent de déterminer, de
manière plus limitée dans l’espace, un seuil. Des stimulations thermiques et électriques ont aussi été testées, mais elles sont peu applicables dans le cadre post-opératoire. La détermination de ces seuils a
pour objectif de raisonner sur des notions d’hyperalgésie renvoyant à
l’allodynie primaire au niveau du site de la lésion et secondaire autour
de la lésion. On s’intéresse à la réduction des seuils après la stimulation
mécanique pour ce qui est de l’hyperalgésie secondaire. Il s’agit du
seul phénomène détectable.
Les stimulations statiques et dynamiques donnent des éléments différents de physiopathologie. Ainsi, la réalisation d’une inflammation par
injection de capsaïcine, par pression, par fil ou au toucher peut être
responsable d’une allodynie. En cas d’infiltration, seul le phénomène
d’allodynie statique est interrompu, alors que l’allodynie dynamique
ne franchit pas la barre d’infiltration. Il est donc possible, sur un
registre expérimental, de raisonner de manière intéressante sur des
physiopathologies différentes d’allodynies. Le transfert de ce type
d’analyse sur un plan clinique peut aussi avoir des conséquences
intéressantes en termes de mécanismes d’actions des analgésiques.
18/10/02
15:57
Page 119
L’étude de la prévention par la morphine de certains phénomènes
douloureux peut être citée comme exemple.Les patients ayant subi une
chirurgie gynécologique recevaient des morphiniques à différents
temps de l’intervention dans le cadre d’un protocole d’analyse. Le
premier groupe recevait 10 mg de morphine en pré-induction, le
deuxième en intra-musculaire au début de l’induction et le troisième en
fin d’intervention. Une augmentation de la différence de seuil entre une
zone péri-cicatricielle et une zone contrôle a permis d’identifier une
allodynie. En l’occurrence, seul le deuxième groupe connaissait ce
phénomène de limitation de l’allodynie mécanique. Ainsi, il a été
possible de mieux dissocier les effets à différents moments de l’administration de l’analgésique.
Une expérience a aussi été menée concernant des patients ayant subi
une chirurgie abdominale et chez qui une pression au niveau de la cicatrice a été exercée. Un groupe a reçu un traitement contrôle et l’autre
groupe un traitement par de la kétamine en per-opératoire, l’évaluation
de la réponse à la pression se faisant à distance de l’intervention. Ainsi,
le seuil nociceptif à la pression augmentait dans le groupe ayant reçu
de la kétamine, correspondant à une limitation de l’allodynie mécanique. Par ailleurs, la douleur décrite par le patient après une pression
supra-liminaire était plus faible dans ce groupe.Autrement dit, l’hyperalgésie mécanique diminuait.
■ LES CONSOMMATIONS D’ANALGÉSIE
Le standard dans le domaine des consommations d’analgésie renvoie
aux consommations auto-contrôlées. C’est le meilleur moyen d’administrer aux patients de la morphine sans autre facteur que son bon vouloir.
Dans ce cadre, il est possible de revoir les doses cumulées ou horaires,
ce qui permet d’avoir une vision globale ou une vision des variations.
Cependant, il faut savoir qu’aucune relation fine n’existe entre les
concentrations de morphine trouvées dans le sang et le niveau d’efficacité analgésique observé chez chacun des patients. En outre, les
critères de consommation du patient ne sont pas uniquement liés à la
douleur.
Néanmoins, c’est le meilleur moyen de permettre au patient de s’administrer un antalgique de façon standardisée et sans facteurs de confusion. L’analgésique à la demande est un pis-aller. Il peut être utilisé en
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
Upsa Méthodo essais 2002
119
Upsa Méthodo essais 2002
18/10/02
15:57
Page 120
traitement de secours uniquement sur des critères stricts. Dans une
étude où il n’est pas possible d’utiliser l’analgésie auto-contrôlée, on
peut utiliser un traitement intermittent par antalgique. Mais le critère
d’administration doit être aussi standardisé que possible avec le traitement connu. Il est aussi possible d’accroître les délais de demande.
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
■ LES LIMITES
120
L’étude de la relation entre la concentration de l’analgésique dans le sang
et le niveau de douleur montre une concentration maximale inefficace
et minimale efficace. Pour une même chirurgie, les concentrations
varient beaucoup selon les patients. Cette relation n’est pas mécanique.
L’analyse auto-contrôlée permet seulement de s’adapter à la variabilité
des patients qui peuvent fluctuer leur consommation de morphine aussi
librement que possible.
L’EVA, grâce au caractère continu de ses scores, permet un traitement
statistique.Ainsi,une étude à partir de scores d’EVA a été réalisée auprès
de femmes venant d’accoucher et à qui différents traitements avaient
été administrés. Les auteurs ont tout d’abord cherché si la distribution
était normale. Ensuite, ils ont procédé à une analyse de la puissance et
de la fiabilité des tests effectués, qu’ils soient paramétriques ou non.
La capacité à détecter les faux positifs était bonne pour tous les tests.
Néanmoins, la puissance était supérieure pour les tests paramétriques.
Des problèmes se sont également posés pour les EVA proches des
valeurs extrêmes. Les auteurs en ont donc conclu que les bons tests
concernant les scores de douleurs, même en l’absence de distribution
normale, restaient les tests paramétriques (notamment Anova).
■ CONCLUSION
Une technique de recherche bien menée est fondée sur la sélection
optimale des types de chirurgie. Il n’est pas possible de réaliser des
études très larges. Ainsi, il faut avoir des objectifs raisonnables de
pertinence clinique. Il convient également de définir ses paramètres
et utiliser une analyse statistique adaptée.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 121
Exigences méthodologiques
pour les essais thérapeutiques
dans les douleurs neuropathiques
Ce n’est que depuis cinq ans environ que les grands groupes pharmaceutiques s’intéressent à la douleur neuropathique. Jusqu’à présent, les
cliniciens étaient habitués à des essais méthodologiques portant sur des
effectifs extrêmement réduits (15 à 20 patients), ce qui en diminuait
d’autant la qualité. Cependant, l’évaluation des douleurs neuropathiques
a beaucoup progressé. Le problème de la randomisation et des statistiques se pose moins aujourd’hui que celui de l’évaluation de la douleur.
■ ÉTAT DES LIEUX
◗ Historique
Depuis quelques années, des laboratoires ont réalisé des essais à la
méthodologie beaucoup plus avancée qu’auparavant avec des effectifs
plus importants. Citons notamment un essai sur la gabapentine, un
autre sur le tramadol et un dernier aux États-Unis sur l’oxycodone
concernant les neuropathies douloureuses du diabète et les algies
post-zostériennes. Ces essais ont une méthodologie très proche des
essais initiaux.
Le plus souvent, les patients sont classés selon l’étiologie de leur
douleur. La plupart des essais thérapeutiques considèrent deux
grandes étiologies comme étant des modèles d’études : les neuropathies du diabète et les algies post-zostériennes. Les lésions nerveuses
traumatiques ou les douleurs centrales sont moins considérées.
◗ La méthode d’évaluation
La douleur est considérée de façon assez globale. Généralement,
les études utilisent des échelles visuelles analogiques (EVA). En
consultation, il est demandé au patient de noter un score de
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
Nadine Attal
121
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
Upsa Méthodo essais 2002
122
18/10/02
15:57
Page 122
douleur. À domicile, le patient remplit un carnet d’auto-évaluation le
soir et note son score de douleur sur une échelle numérique allant de
0 à 10. Cette évaluation porte sur l’ensemble de la douleur de la
journée. Les échelles catégorielles peuvent aussi être utilisées en plus
des échelles visuelles. Un certain nombre d’études ont également
utilisé la version abrégée du questionnaire de Mac Gill.
Les études considèrent souvent la qualité de vie avec l’échelle SF 36
(voir p. 53). Mais celle-ci n’est peut-être pas la plus adéquate à la
mesure du retentissement de la douleur neuropathique. Elle paraît un
peu trop globale.
Parmi les critères utilisés, les méta-analyses de Mc Kay indiquent que
le critère le plus pertinent dans les essais classiques est une diminution
de l’EVA d’au moins 50 %. Dans l’étude sur la gabapentine qui a porté
sur un effectif important, les scores de douleurs spontanées étaient
cotés à 6 sur 10 sur une EVA pour passer à 4 pour le placebo et à 3
pour la gabapentine.Très exactement, la différence entre le placebo et
la gabapentine était de 1,5 point sur l’EVA.
Cependant,la question de la pertinence clinique du score de l’EVA reste
posée. C’est pourquoi certains auteurs proposent de se fonder sur le
pourcentage de diminution du score de l’EVA. La plupart des études
récentes n’ont pas considéré ce critère. Mais il a été largement utilisé à
l’occasion d’études portant notamment sur les antidépresseurs avec des
méta-analyses.
◗ Les limites de la méthodologie
L’une des principales limites est peut-être que l’évaluation clinique n’est
pas suffisamment adaptée aux spécificités des douleurs neuropathiques.
Aucune des échelles ne traduit la richesse sémiologique de ces douleurs
et permettrait d’affiner les critères d’évaluation d’un traitement.
■ LES ENJEUX
◗ Mise en perspective
Une douleur neuropathique (liée à une lésion du système nerveux) est
un syndrome douloureux qui peut être dû à de nombreuses étiologies,
comme le diabète ou le zona, et qui associe un cortège de symptômes
Upsa Méthodo essais 2002
18/10/02
15:57
Page 123
positifs ou négatifs comme la perte de la sensibilité, l’hypoesthésie ou
l’hypoalgésie. Il peut y avoir d’autres symptômes : déficit moteur,
troubles de la température cutanée, phénomènes vasomoteurs, etc.
◗ Comment évaluer globalement la douleur
neuropathique ?
L’interrogatoire
L’évaluation passe par un interrogatoire concernant l’existence de la
douleur au repos ou l’existence d’une douleur évoquée. Les caractéristiques de ces douleurs seront précisées par des échelles appropriées. La localisation de la douleur, l’évolution temporelle et
l’intensité de douleur sont aussi des éléments importants. L’EVA ou
l’échelle numérique est la plupart du temps utilisée pour mesurer l’intensité de la douleur.
Concernant la douleur évoquée, on peut demander quelle est la
douleur à l’effort, sachant que certains patients la ressentent fortement
(allodynie du mouvement). Les douleurs au frottement sont également
évoquées, sachant que les patients s’en plaignent spontanément,
notamment ceux qui ont un zona. Cette douleur peut être cotée sur
une EVA. Enfin, il est demandé au patient s’il est gêné par le froid.
Les instruments de mesure
Plusieurs échelles peuvent permettre de déterminer les caractéristiques de la douleur. Le questionnaire de Mc Gill traduit et validé par
François Boureau a été largement utilisé en France, notamment pour
les douleurs neuropathiques. En 1990, François Boureau a indiqué
que certaines des variables utilisées dans le questionnaire étaient
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
Le problème est que la mesure globale de la douleur ne traduit pas
finement l’ensemble des phénomènes neuropathiques comme l’allodynie hyperalgésique ou les phénomènes de post-sensation, d’adaptation et d’habituation anormale. L’intérêt clinique de cette évaluation
est évident. Certains patients atteints de zona sont bien plus gênés par
leur allodynie au frottement que par leur douleur spontanée. Sans
évaluation du traitement de cette composante, l’effet peut être minimisé, voire inexistant.
123
Upsa Méthodo essais 2002
18/10/02
15:57
Page 124
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
discriminantes des douleurs neuropathiques par rapport à des
douleurs chroniques d’autres étiologies comme l’arthrose.
Parmi les variables discriminantes, on retrouve les caractéristiques de la
douleur neuropathique : brûlures, décharges électriques, démangeaisons, fourmillements, picotements, crampes et impressions de froid. Ce
questionnaire a une pertinence au cours de l’interrogatoire concernant
l’estimation des différents types de douleur puisqu’il est possible de
quantifier ces variables.
124
Plus récemment, Galer et Jensen ont proposé d’utiliser un questionnaire incluant dix variables qui se veut plus spécifique de la neuropathie
appelé “Neuropathic Pain Scale”. Ce questionnaire n’a pas, jusqu’à
présent, été traduit. Il n’est pas disponible et n’a pas été utilisé dans les
essais cliniques en France, même pour tenter de comparer plusieurs
catégories de patients.
Il a seulement fait l’objet d’une validation interne par ses auteurs qui ont
montré que des variables pouvaient discriminer certains types de
douleurs neuropathiques par rapport à d’autres, par exemple la
névralgie post-zostérienne où l’impression de brûlure et de froid était
davantage observée par rapport à des douleurs postraumatiques ou à
des douleurs centrales.
L’examen clinique
L’examen clinique d’une douleur neuropathique doit s’intéresser aux
symptômes négatifs d’hypoesthésie. Il est important de mesurer une
hypoesthésie au chaud et au froid par exemple, sachant qu’elle peut
traduire l’existence ou l’atteinte des petites fibres. L’examen va aussi
s’intéresser à la recherche d’une allodynie et d’une hyperalgésie.
Cet examen clinique standardisé est nécessaire. Par exemple, la
mesure d’une allodynie dynamique au frottement (allodynie dynamique mécanique) peut être effectuée au moyen d’un pinceau ou
d’une brosse à dents électrique. Il ne s’agit donc pas véritablement
d’une évaluation quantitative. En revanche, il est possible de
demander au sujet de rapporter l’intensité de l’allodynie sur une EVA
ou une échelle numérique.
Depuis quelques années, des techniques d’évaluation quantitative des
troubles de la sensibilité ont également été introduites dans la recherche
Upsa Méthodo essais 2002
18/10/02
15:57
Page 125
L’évaluation thermique, très utilisée actuellement, autorise la mesure
concernant les fibres de petits calibres qui ne sont pas explorées par
l’électrophysiologie conventionnelle.Ainsi, on peut obtenir des résultats des seuils de détection et de douleur au chaud et au froid ainsi
que mesurer la douleur évoquée par l’application de stimulations
supraliminaires. L’appareil utilisé (thermotest) comprend une thermode
posée sur la peau du sujet à une température initialement neutre. Il est
demandé au sujet d’appuyer sur un bouton pour renverser la stimulation
au chaud ou au froid,le même principe s’appliquant pour définir le seuil
de douleur.Grâce à la méthode des limites,l’appareil fait la moyenne des
stimulations successives, ce score étant reporté sur un graphique
montrant les seuils de perception au chaud et au froid. Des stimulations
mécaniques telles les poêles de Bollfrey peuvent compléter l’analyse.
Au cours de ces tests, il est nécessaire de contrôler un certain nombre
de facteurs de variabilité comme l’âge du sujet, la taille de la thermode,
la rapidité d’élévation de la température, la température cutanée et les
paramètres liés au sujet lui-même, puisqu’il s’agit de méthodes semiobjectives. En effet, la réponse dépend de la subjectivité du sujet et du
temps de réaction. Les patients soumis à des fortes doses de psychotropes auront des temps de réaction plus élevés.Ces paramètres doivent
être gardés à l’esprit dans le cadre d’études multicentriques avec des
effectifs plus importants.
◗ Applications
Ces méthodes permettent de mieux mesurer les phénomènes négatifs
comme l’hypoesthésie, l’hypoalgésie et les phénomènes de douleurs
évoquées comme l’allodynie ou l’hyperalgésie. Dans cette perspective,
l’allodynie correspond à une diminution des seuils de douleurs, alors
que l’hyperalgésie peut être mise en évidence lorsqu’on compare les
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
clinique. Le but est de fournir des informations sur les seuils de détection ou de douleurs somesthésiques en réponse à des stimulations dites
supra-liminaires.
Les tests sont effectués en zone de douleur maximale. Les résultats
obtenus sont comparés à une zone homologue saine ou à des sujets de
contrôle. Différentes modalités somesthésiques (thermique, mécanique
et vibratoire) sont testées. Ces mesures peuvent permettre une utilisation reproductible et relativement fiable.
125
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
Upsa Méthodo essais 2002
126
18/10/02
15:57
Page 126
réponses obtenues lors de l’application de stimuli supra-liminaires en
zone saine et en zone lésée. Le sujet malade aura une augmentation
de la pente stimulus-sensation.
Une deuxième application est une meilleure évaluation des traitements
de la douleur neuropathique. Plusieurs équipes ont développé une
certaine habitude de ces techniques pour évaluer les traitements, y
compris en double aveugle versus placebo.Il s’avère que ces techniques
sont particulièrement sensibles pour mettre en évidence les effets de
traitement sur l’allodynie au frottement, l’allodynie au chaud et au froid
et l’hyperalgésie.
Depuis plusieurs années, de nombreuses études ont porté sur l’application de ces méthodes à l’évaluation de substances comme la betamine
qui a un effet anti-NMDA. L’approche quantifiée a ainsi été utilisée pour
les anti-épileptiques, les anesthésiques locaux, les antagonistes des
récepteurs NMDA et les blocs sympathiques. Pour ces derniers versus
placebo, une efficacité préférentielle des sympatholytiques sur une
hyperalgésie ou une allodynie au froid a été mise en évidence.
Une étude avec de la gabapentine concernant des patients victimes de
lésions nerveuses périphériques ou centrales a aussi été réalisée. L’effet
sur la douleur spontanée continue a été très modéré, alors qu’il a été
plus significatif pour les paroxysmes douloureux et l’allodynie au frottement,ce qui montre l’intérêt de dissocier ces différents composants lors
d’une étude contrôlée. L’Emla (anesthésique) et les gels de lidocaïne ont
entraîné une efficacité globale sur la douleur de l’algie post-zostérienne.
L’Emla était peu efficace sur la douleur spontanée, mais très efficace sur
l’hyperalgésie mécanique.
Par ailleurs, nous avons montré que la lidocaïne pour les douleurs
centrales en intra-veineuse versus placebo avait une efficacité très significative sur l’allodynie et l’hyperalgésie mécanique,tandis que la douleur
spontanée était peu améliorée.
■ POUR UNE NOUVELLE APPROCHE
Ces études permettent de discriminer les différents types de douleurs
(spontanées et évoquées) et l’effet des composants.Le problème est que
les symptômes ne sont pas toujours équivalents aux mécanismes. Ainsi,
nous nous sommes davantage attachés à essayer d’évaluer les mécanismes des douleurs neuropathiques.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 127
Récemment, Fields, Rowbotham et Baron ont entrepris une série
d’études pour mettre en évidence chez des patients présentant tous une
névralgie post-zostérienne une certaine hétérogénéité. En particulier, les
patients présentaient une forte allodynie au frottement, mais pas au
chaud avec une réponse très importante aux blocs anesthésiques et une
augmentation de la douleur initiale à l’application de capsaïcine qui
active les fibres C.
Un autre groupe de patients ne présentait aucune allodynie au frottement, mais une sensibilité au chaud extrêmement prononcée. Par
ailleurs, ils ne répondaient pas aux blocs anesthésiques et à la capsaïcine.Un troisième groupe présentait à la fois une allodynie au frottement
et un important signe de déficit au chaud, ce qui suppose une atteinte
des fibres de gros calibres. Ainsi, aucune réponse aux blocs anesthésiques et à la capsaïcine n’était enregistrée.
◗ Vers un nouveau classement
Ces études nous conduisent à penser que les douleurs neuropathiques
pourraient être classées autrement que selon des critères étiologiques. Il
serait intéressant d’examiner les symptômes douloureux et les mécanismes des douleurs neuropathiques afin d’avoir une approche encore
plus patho-physiologique.
En cas d’algie post-zostérienne, on peut penser que les patients qui ont
une allodynie classée dans le groupe des nocicepteurs irritables avec
peu ou pas d’effets thermiques vont répondre à des médicaments qui
agissent plus spécifiquement sur des phénomènes de sensibilisation
périphérique comme les topics locaux. Au contraire, les patients
présentant des signes de désafférentation importante (déficit thermique) pourraient répondre davantage à des produits d’action
centrale, sachant que ceci n’a jamais été validé.
◗ Les limites
L’une des limites inhérentes à l’évaluation tient à la coopération du
sujet et à une certaine variabilité des tests, ce qui nécessite d’uniformiser les paramètres de stimulation. Nous ne connaissons pas non plus
le mécanisme des douleurs neuropathiques et l’action des traitements.
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
◗ Bilan des études
127
Upsa Méthodo essais 2002
18/10/02
15:57
Page 128
Ainsi, il est difficile de faire une adéquation entre les opiacés ou la
gabapentine et le zona ou les phénomènes de désafférentation.
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
◗ Application à la méthodologie des essais cliniques
128
Cette méthodologie doit permettre de mieux évaluer la douleur spontanée et de dissocier les deux types de douleur,comme s’y attachent des
études récentes. L’efficacité des anti-épileptiques sur les douleurs
paroxystiques a pu être montrée grâce à ce type d’études. Il est également possible d’évaluer la douleur maximale sur 24 heures et la douleur
d’efforts grâce à un interrogatoire.
Concernant la douleur évoquée, les techniques disponibles ont des
limites, sachant qu’elle peut être quantifiée lors de l’interrogatoire.
L’étude tramadol a essayé de mesurer les paramètres de la douleur au
frottement. Cet interrogatoire peut avoir une certaine validité par
rapport à d’autres mesures et peut permettre d’être un peu plus
discriminant.
Lors de l’examen clinique, une allodynie au frottement peut être
recherchée. Dans ce contexte, le stimulus doit être contrôlé. Pour
réaliser une étude multicentrique, tous les investigateurs doivent
utiliser la même méthode et être formés à l’examen, même si ce
dernier n’a rien de contraignant.
Par ailleurs, on peut d’ores et déjà envisager d’utiliser ces tests quantifiés dans les essais thérapeutiques à grande échelle. Les laboratoires
commencent à se poser la question. Ils ont compris l’intérêt d’avoir
une approche un peu plus “mécanistique”. Une évaluation standardisée avec les mêmes paramètres de stimulation, des expérimentateurs
formés et des patients préalablement entraînés, peut être menée à une
plus grande échelle avec des thermotests notamment.
Upsa Méthodo essais 2002
18/10/02
15:57
Page 129
Méthodes de développement clinique
des anti-migraineux
La méthode d’évaluation dans le domaine des migraines et des céphalées repose sur des bases assez solides du fait du consensus existant
grâce à l’International Headache Society (IHS). Historiquement,
la méthodologie du traitement de crise s’est nourrie du développement des triptans, notamment du sumatriptan. Les critères IHS et
Glaxo pour évaluer l’efficacité des anti-migraineux ont eu tendance
à se concurrencer, sachant que les critères Glaxo, avec leurs qualités
et leurs inconvénients, sont encore largement utilisés.
■ LES PATIENTS
◗ Les critères diagnostiques IHS
La distinction entre migraine sans aura et avec aura est exigée pour
pouvoir inclure un patient dans un essai thérapeutique.
La migraine sans aura
La migraine sans aura (ou migraine commune) correspond à au moins
cinq crises. Un patient n’est pas considéré comme migraineux s’il a eu
seulement une crise ; de plus, il doit avoir des céphalées durant 4 à
72 heures.Par ailleurs,la migraine doit revêtir au moins deux des caractéristiques suivantes : unilatéralité, pulsatilité, intensité modérée ou
sévère, aggravation par les activités physiques (par exemple, la montée
des escaliers). Enfin, la migraine doit être associée à au moins l’un des
signes suivants : nausées et/ou vomissements (composante digestive)
et photophobie et phonophobie (hyperesthésie sensorielle).
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
Michel Lanteri-Minet
129
Upsa Méthodo essais 2002
18/10/02
15:57
Page 130
La migraine avec aura
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
Actuellement, nous butons sur le problème de la prise en charge de
la migraine avec aura, sachant que la tendance aujourd’hui est de
regrouper cette population avec celle de la migraine sans aura pour
les études, ce qui est dommage. Mais il faut savoir que la migraine avec
aura (ou migraine classique) est beaucoup moins fréquente (10 à 20 %
des crises).
Les critères IHS font référence et sont assez faciles à utiliser, contrairement à ce qui est dit. Ils permettent, de surcroît, une bonne homogénéité des patients et une bonne correspondance avec la réalité
clinique. La correspondance des critères IHS avec la réalité clinique
du praticien atteint près de 95 %.
130
◗ Les autres critères
Le problème des céphalées intercalaires
Un certain nombre de critères reviennent systématiquement dans les
essais migraineux. Tout d’abord, les céphalées intercalaires. qui
concernent les patients qui allèguent des céphalées entre deux crises
de migraine, ces céphalées étant prolongées et moins paroxystiques
que les crises de migraine.
Il est possible d’inclure des patients ayant des céphalées intercalaires,
à condition qu’ils puissent les individualiser par rapport à la migraine.
Ils ne doivent pas prendre l’anti-migraineux au moment de la
céphalée intercalaire afin de ne pas biaiser l’étude. Mais, la question
de la différence entre la céphalée intercalaire et la migraine d’un
point de vue physiopathologique reste posée.
Par ailleurs, ces céphalées intercalaires ne doivent pas être présentes
plus de six jours par mois. Au-delà, il s’agit de patients sujets à des
céphalées quotidiennes chroniques. Ces sujets, qui ont tendance à
l’abus médicamenteux, ne sont pas les mieux placés pour faire partie
des essais.
Le nombre de crises
Les migraineux ne doivent pas avoir plus de six crises par mois. Sinon,
les patients sont considérés comme pouvant présenter des céphalées
Upsa Méthodo essais 2002
18/10/02
15:57
Page 131
quotidiennes chroniques, avec un risque d’abus médicamenteux. Les
patients ayant moins d’une crise par mois ne sont pas non plus considérés comme pouvant être inclus pour des raisons d’efficience de
l’essai.
L’ancienneté
L’âge
L’âge de début de crise ne doit pas excéder 50 ans. En effet, la fréquence
des migraines dites “symptomatiques”est importante après 50 ans,ce qui
constitue un biais de recrutement. Par ailleurs, le patient doit être âgé
entre 18 et 65 ans. Ceci pose un problème du point de vue de l’utilisation pratique des triptans.La réglementation interdit l’utilisation des triptans avant 18 ans. Ainsi, actuellement, aucune donnée fiable n’est
disponible concernant l’utilisation des triptans parmi cette population.
Or, la prévalence de la migraine dans cette population peut être estimée
à 3-5 %, ce qui n’est pas négligeable.
Les migraineux sont généralement des sujets plutôt jeunes. Mais il arrive
que des migraineux sévères aient cette maladie tout au long de leur vie.
Ainsi, un patient âgé de 65 ans peut très bien demander s’il peut avoir
recours au triptan. Aujourd’hui, le critère d’âge 18-65 ans est davantage
utilisé par habitude que de manière justifiée. Il faut donc s’en méfier.
L’adaptation de la méthodologie peut parfois s’avérer nécessaire.
■ LE CRITÈRE D’EFFICACITÉ
◗ Les critères IHS
Le critère de l’IHS a l’avantage de la clarté :“headache free”.Autrement
dit, un anti-migraineux efficace fait totalement disparaître la céphalée
deux heures après la prise du traitement.
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
Il est toujours exigé une ancienneté supérieure à un an. Les migraines
qui viennent de se déclarer ont souvent un caractère très capricieux. Il
est difficile de connaître leur évolution tant en termes de fréquence que
de nature de crise. Une amélioration de l’état du patient peut très bien
résulter de l’évolution spontanée de la migraine.
131
Upsa Méthodo essais 2002
18/10/02
15:57
Page 132
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
◗ Les critères Glaxo
132
La majorité des essais utilisent le critère Glaxo de soulagement de la
céphalée à la deuxième heure. La crise de migraine est classée selon l’intensité avec l’échelle verbale suivante :“absente”,“minime”,“modéré” et
“sévère”. Le soulagement correspond au passage d’une crise “sévère”
cotée à 3 à une crise “minime”cotée à 1 ou “absente”cotée 0 ou bien au
passage d’une crise “modérée” cotée à 2 à une crise “minime” ou
“absente”.
L’utilisation de ce critère est allée de pair avec le développement du
sumatriptan en recherche clinique.Cette tendance s’est poursuivie et les
autres laboratoires ont reproduit ce critère d’efficacité en le considérant
comme une référence.L’avantage de ce critère est d’enregistrer des taux
de succès plus élevés. Au-delà du caractère “flatteur” du résultat, la sensibilité plus élevée de ce critère peut aussi présenter un intérêt du point
de vue méthodologique.
Le principal problème est la pertinence clinique du passage d’un
niveau 2 à un niveau 1, 75 % des patients passant d’une crise modérée
à une crise minime jugeant ce passage non pertinent sur le plan thérapeutique. Il faut aussi savoir qu’il est impossible de traiter tôt avec ce
critère. Le traitement démarre à partir d’une crise de niveau 2, ce qui
ne reflète pas vraiment la réalité clinique. Hormis les cas d’abus médicamenteux, les praticiens conseillent souvent aux patients de se traiter
le plus tôt possible.
◗ L’évaluation à quatre heures
L’une des critiques méthodologiques de certains essais est l’évaluation à
quatre heures. En effet, il faut se méfier de l’effet du traitement de
secours, la majorité des essais sur les traitements anti-migraineux autorisant ce type de traitement à la deuxième heure. L’évaluation à quatre
heures conduit ainsi à associer un groupe de patients constitués de
ceux qui n’ont pas pris le traitement de secours et ceux qui l’ont pris.
Pour ces derniers, il est difficile de savoir quel traitement a agi.
L’analyse en sous-groupes rendrait l’essai ingérable sur le plan pratique
et financier, compte tenu de l’importance des effectifs nécessaires. Dans
certaines études, le promoteur demande aux patients d’attendre quatre
heures avant de pouvoir utiliser le traitement de secours. Mais c’est très
Upsa Méthodo essais 2002
18/10/02
15:57
Page 133
difficile en pratique, le patient ayant l’habitude de prendre son traitement au bout de deux heures.
Avec le développement du sumatriptan, le problème de la récurrence
est apparu. La récurrence est le fait qu’un patient voit réapparaître ou se
réaggraver sa crise dans les 24 heures après une disparition ou une nette
amélioration initiale.
Les taux de récurrence des triptans s’élèvent à 30 %, ce qui n’est pas
négligeable. Actuellement, les laboratoires se livrent bataille pour présenter des taux de récurrence différents. Cependant, la comparaison de
deux molécules en termes de taux de récurrence n’a aucun sens en l’absence de taux de succès initiaux. Il est évident que le taux de récurrence augmente avec le taux de succès d’une drogue. Une réflexion à l’IHS
vise à mettre au point un score de succès total : “headache free” à la
deuxième heure et non-réapparition de la douleur dans les 24 heures.
Ce critère ne paraît pas suffisant par rapport à la réalité clinique.En effet,
il conduit à se concentrer sur les 24 premières heures,alors que la durée
de la migraine est de 4 à 72 heures. La perte d’information est importante. Les essais cliniques n’ont, par exemple, pas du tout appréhendé le
problème de la récurrence multiple.Certains patients qui reprennent du
produit entre la 24e et la 48e heure estiment que le produit n’est pas efficace pour cette raison.
L’IHS va peut-être tenir compte de cet aspect, mais il ne faudrait pas que
des critères trop sévères entravent la sortie de nouveaux médicaments.
Pour chaque étude, il faudra bien mesurer les avantages et les limites de
ces choix.
◗ Le gain thérapeutique
L’effet placebo est encore plus important dans la migraine que dans
la douleur, la migraine étant auto-limitée dans des délais très variables
selon les patients. Les crises cessent au bout de quatre heures pour
certains patients. Ce délai est sans doute encore plus faible pour les
enfants.
Il est possible de comparer les taux de réponse en termes de soulagement selon les critères Glaxo, les taux de succès en termes
d’absence de céphalées à deux heures, mais aussi le taux de succès
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
◗ La récurrence
133
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
Upsa Méthodo essais 2002
134
18/10/02
15:57
Page 134
en termes de gain thérapeutique (c’est-à-dire la différence entre le
taux de succès du produit étudié et le placebo).
Il faut savoir que la comparaison de deux molécules évaluées au cours
de deux essais différents est dénuée de sens sans les taux de réponse au
placebo. Un taux d’efficacité de 70 % avec un bras placebo de 40 % et
de 10 % n’a pas la même signification. L’effet placebo ne doit pas non
plus être systématiquement critiqué. Il est important pour les cliniciens
que nous sommes au quotidien. Il faut se méfier du discours de type
“jusqu’au-boutiste” de la méthodologie clinique. Cette distance par
rapport à la réalité peut être une source de déception.
Un médicament avec un gain thérapeutique de 20 à 30 % est considéré
comme ayant une efficacité modérée. Entre 30 et 40 %, le médicament
est considéré comme efficace et, au-delà de 50 %, comme très efficace.
Le gain thérapeutique facilite la comparaison d’études réalisées dans
des conditions très différentes. Souvent, l’industrie pharmaceutique
a tendance à présenter des résultats isolés, ce qui n’est pas justifié.
◗ Les autres critères d’évaluation
D’autres critères peuvent être utilisés comme objectifs secondaires. Ils
concernent l’évaluation sur les nausées-vomissements et sur la photophobie-phonophobie. La gêne fonctionnelle est liée à ces composantes
sémiologiques qui sont obligatoirement présentes chez les migraineux.
Un autre critère est l’effet sur l’impact fonctionnel qu’il serait possible
d’élargir à la qualité de vie. Mais on a du mal à appréhender la notion de
qualité de vie chez les migraineux. Il paraît douteux de mesurer la
qualité de vie à partir d’un anti-migraineux de crise. Il ne s’agit pas de
la même échelle de temps. Ainsi, l’influence nord-américaine conduit
de plus en plus à mesurer la rentabilité et les conséquences en termes
de remboursement des produits.Il faut se méfier de cette pensée économique qui ne doit pas occulter les aspects médicaux.
Un critère important est la reproductibilité de l’effet. Les patients
souhaitent fortement que le médicament garde son efficacité.
Généralement, un médicament qui calme la douleur migraineuse
deux fois sur trois est considéré comme bon, d’où l’apparition
d’études évaluant sur trois crises.
Enfin, le dernier critère qui va peut-être devenir important est la rapidité de l’effet. Selon des enquêtes, cette attente est faite chez les
patients souffrant de migraines avec celle de l’accessibilité en termes
Upsa Méthodo essais 2002
18/10/02
15:57
Page 135
de galénique. Ce critère mériterait de faire l’objet d’essais spécifiques,
sachant que les études ont, jusqu’à présent, évalué ce critère en
seconde analyse.
■ GRANDS ESSAIS OUVERTS
ESSAIS CLINIQUES DANS LES PATHOLOGIES DOULOUREUSES
Il faut mettre en garde contre les grands essais en ouvert, destinés à
déterminer des indices de satisfaction. Il vaudrait mieux faire des essais
trouvant une résonance dans la pratique réelle. Les taux de satisfaction
de 90 ou 95 % sont dénués de sens dans la mesure où ils n’intègrent pas
ceux sortis de l’essai. Il est donc nécessaire de connaître le nombre de
patients sortis de l’étude et les raisons de leurs sorties.
135
Upsa Méthodo essais 2002
136
18/10/02
15:57
Page 136
17/10/02
16:12
Page 1
MÉTHODOLOGIE DES ESSAIS CLINIQUES DANS LE DOMAINE DE LA DOULEUR
UPSA couv Méthodologie
MÉTHODOLOGIE
DES ESSAIS CLINIQUES
DANS LE DOMAINE
DE LA DOULEUR