Télécharger l`article au format PDF
Transcription
Télécharger l`article au format PDF
L’Encéphale (2008) Supplément 6, S190–S193 j o u r n a l h o m e p a g e : w w w. e m - c o n s u l t e . c o m / p r o d u i t / e n c e p L’analyse des données : jusqu’où ? J.D. Guelfi Université Paris Descartes ; Hôpital Sainte-Anne, Service du Pr F. Rouillon, CMME, 100 rue de la santé, 75674 Paris cedex 14 Introduction : l’efficacité des traitements au long cours Lors de la réalisation d’un essai contrôlé randomisé, il est nécessaire de se poser plusieurs questions : • quelles données analyser pour répondre à quelle question ? • quelles analyses statistiques choisir ? • quels risques de se tromper dans l’interprétation des résultats ? Les essais contrôlés randomisés portant sur les antipsychotiques reposent sur différentes méthodologies : • l’une classique comprenant les essais versus placebo, les principales limites étant liées au choix du critère principal et à la sélection de l’échantillon ; • l’autre comprenant les essais d’efficience, de non infériorité et les méta-analyses. Les critères habituels de jugement d’efficacité sont des critères symptomatiques mesurés par des échelles comme la Brief Psychiatric Rating Scale (BPRS), la Positive And Negative Syndrome Scale (PANSS) ou la Clinical Global Impression (CGI) qui évaluent soit la gravité soit l’amélioration d’un tableau clinique. Il peut exister une différence entre la significativité statistique et la signification clinique des résultats. La diminution du score à une échelle est donc un critère insuffisant pour conclure à l’efficacité d’un traitement. En effet, la différence de score n’a pas la même signification en fonction de l’intensité des symptômes initiaux. Par ailleurs, l’interprétation clinique d’un score est complexe. Il est admis qu’un traitement est efficace si on obtient une réduction de 50 % du score à la PANSS dans les formes positives, de 25 % dans les formes déficitaires de schizophrénie. On pourrait s’aider de l’évolution comparée des notes factorielles de sous-groupes homogènes de patients. Cependant, la structure factorielle de la PANSS n’est pas stable. Le changement de 10-15 points de la BPRS/PANSS correspond environ à un changement d’un point à la CGI. [4] Ce résultat repose, sur l’analyse de plusieurs bases de données dans lesquelles ont été étudiées les relations entre les valeurs absolues des notes de la BPRS, de la PANSS et le changement sur la CGI (CGI amélioration (Fig. 1) ; CGI sévérité (Fig. 2)). On accorde de plus en plus d’importance aux critères fonctionnels tels que la qualité de vie, le fonctionnement et l’adaptation sociale, l’autonomie, l’impact de la maladie (sur l’entourage, la société, les coûts), la satisfaction du patient (efficacité symptomatique et effets secondaires plus ou moins gênants) et l’efficience. Mais ces critères sont plus difficilement objectivables. Au long cours, il faut distinguer la stabilité du résultat obtenu à court terme et la rémission de la pathologie. On peut citer comme outil d’évaluation le GOALS (Global Outcome Assessment of Life in Schizophrenia) qui distingue 4 domaines côtés de 1 à 7 * Auteur correspondant. E-mail : [email protected] L’auteur a déclaré, pour le laboratoire Lilly, en qualité d’investigateur principal, coordonnateur ou expérimentateur principal ; intervenir ponctuellement en conseil. © L’Encéphale, Paris, 2008. Tous droits réservés. L’analyse des données : jusqu’où ? S191 Linking the PANSS, BPRS, and CGI : Clinical Implications. 5 a Week 1 n = 1629 Week 2 n = 1717 Week 4 n = 1511 4 3 2 1 – 30 CGI-Improvement score b – 20 – 10 0 10 20 30 BPRS: absolute change from baseline 7 40 6 5 Week Week Week Week 1 2 4 6 n n n n = = = = 1231 1175 1038 93 4 3 2 1 – 40 – 30 – 20 – 10 0 10 20 30 40 50 PANSS: absolute change from baseline 60 70 Figure 1 (a) Linking of BPRS absolute change with CGI-improvement score. (b) Linking of PANSS absolute change with CGI-improvement score. In [4] Leucht S et al. Diapositive université Paris Descartes, obligeamment prêtée par Llorca PM. Avec mes remerciements. (symptômes, impact des traitements, impact de la maladie, santé et bien-être) et le IAQ (Investigator’s Assessment Questionnaire) [7] [9]. L’étude CATIE a fait l’objet de nombreuses publications. Le critère principal de jugement de l’efficacité était la durée du traitement. Sur 18 mois, 5 molécules étaient comparées sur un échantillon de 1 493 patients après randomisation : olanzapine, quétiapine, rispéridone, ziprazidone et perphenazine. Lorsque les traitements étaient suspendus pour diverses raisons, il y avait une seconde randomisation. Lors d’une interruption thérapeutique pour inefficacité, le patient pouvait être inclus dans un bras clozapine ou dans un bras « autre APA ». Lors d’un arrêt pour intolérance, le patient était inclus dans un bras ziprazidone ou dans un bras « autre APA ». Cette étude nous renseigne sur les taux de premier et second échec, et sur la durée de traitement. Le temps de prise de traitement est de 9,2 mois pour l’olanzapine versus 3,5 à 5,6 mois pour les autres traitements antipsychotiques. Lors de la seconde phase de randomisation, 44 % des patients recevant la clozapine poursuivent leur traitement à 18 mois contre 18 % des patients recevant un autre antipsychotique [5]. Lorsque les traitements avaient été interrompus pour intolérance, le taux d’arrêt ensuite était similaire quelle que soit la molé- CGI-severity score absolue change from baseline 6 –30 b CGI-severity score absolue change from baseline 7 Le changement de 10-15 points de la BPRS/PANSS correspond à un changement de 1 point à la CGI. a CGI-Improvement score Autre étude portant sur les deux bases de données précédentes (n = 1905, n = 4065). Étude de la relation entre changement du score en valeur absolue et changement à la CGI. 5 4 3 Week 1 n = 1832 Week 2 n = 1717 Week 4 n = 1511 2 1 – 20 – 10 0 0 10 20 30 40 50 60 –1 –2 BPRS: absolute change from baseline 5 4 3 Week Week Week Week 2 1 0 –30 – 20 – 10 0 –1 1 2 4 6 n n n n = = = = 3698 3698 3349 2654 10 20 30 40 50 60 70 80 90 100 110 –2 PANSS: absolute change from baseline Figure 2 (a) Linking of BPRS absolute change with CGIseverity score absolute change. (b) Linking of PANSS absolute change with CGI-severity score absolute change. In [4] Leucht S et al. Diapositive université Paris Descartes, obligeamment prêtée par Llorca PM. Avec mes remerciements. cule mais le délai avant l’arrêt était plus long chez les patients recevant de la rispéridone [8]. Les critères secondaires pris en compte dans cette étude sont nombreux : les symptômes, l’utilisation et le coût des services, les cognitions, la compliance, les pathologies associées, la qualité de vie, l’utilisation de substances, et les comportements violents. L’intérêt des méta-analyses Les résultats des études contrôlées randomisées peuvent être présentés dans une méta-analyse. Dans ce type d’étude, l’analyse statistique repose sur une méta-régression. L’équipe de Kemmler et coll. s’est posée 3 questions auxquelles une seule étude ne pouvait répondre [3] : • est-ce que les interruptions de traitement dans les groupes placebo au cours des essais contrôlés sont plus nombreuses que dans les groupes des comparateurs actifs ? • est-ce que les taux d’interruption varient selon les études dans les groupes placebo et les groupes de traitement actif ? • y a-t-il une différence des taux d’interruption entre antipsychotiques classiques et produits de 2e génération ? S192 Les auteurs ont donc regroupé, à partir de PubMed et Medline, tous les essais contrôlés comparatifs ayant inclus au moins 40 patients schizophrènes ou schizoaffectifs, durant quatre à douze semaines, dont le critère principal était la réduction symptomatique aux échelles BPRS ou PANSS. Les études avaient toutes été publiées avant octobre 2004. Un total de 31 études a été sélectionné, dont 11 versus placebo et 20 versus comparateur actif (12 versus halopéridol), totalisant 10 058 sujets. Les taux d’interruptions prématurées sont 2,34 fois (IC 95 % = 1,58 – 3,47) plus importants dans les groupes placebo que dans les groupes traités par antipsychotiques de 2e génération (48,1 % vs 28,3 %). Ils sont également plus importants (OR = 2,10 ; IC 95 % = 1,29 – 3,40) dans les groupes placebo que dans les groupes traités par antipsychotiques classiques (55,4 % vs 37,2 %). Lorsque les essais comprennent conjointement un antipsychotique classique et de 2e génération, les interruptions prématurées sont significativement plus nombreuses dans les groupes des antipsychotiques classiques. Le critère de rémission La définition de la rémission est complexe. En 1972, Strauss et Carpenter avaient été les premiers à s’intéresser à des critères de rémission plus larges que J.D. Guelfi des critères symptomatiques en définissant 4 domaines d’intérêt : absence d’hospitalisation, qualité des contacts sociaux, emploi, réduction significative des symptômes [in 2]. En 1990, Brenner et coll. avaient défini deux niveaux de rémission : complète et partielle grâce aux échelles BPRS et CGI [in 2]. Enfin Andreasen et coll., en 2005, ont défini la rémission par une note de sévérité à l’échelle PANSS inférieure ou égale à 3 pour 8 items prédéfinis durant une durée minimale de six mois. Ces items sont : les idées délirantes (P1), le contenu inhabituel de la pensée (G9), l’activité hallucinatoire (P3), la désorganisation conceptuelle (P2), le maniérisme et les troubles de la posture (G5), l’émoussement de l’expression des émotions (N1), le repli social passif/apathique (N4), l’absence de spontanéité et de fluidité dans la conversation (N6). La note de 1 à 3 (sur 7 degrés possibles) correspond à une symptomatologie absente, minime ou légère. Il s’agit d’une amélioration suffisamment importante et persistante des symptômes clés qui n’interfèrent plus durablement et significativement avec le fonctionnement [2]. Kane, Leucht et coll. ont par la suite proposé une définition moins stricte que celle établie par le consensus de 2005 : présence de 8 symptômes positifs ou négatifs d’intensité au maximum moyenne pendant six mois (communication orale). Tableau 1a Échelle GAF ou EGF (in 1) 100 - 91 Niveau supérieur de fonctionnement, dans une grande variété d’activités. N’est jamais débordé par les problèmes rencontrés. Est recherché par autrui en raison de ses nombreuses qualités. Absence de symptômes 90 - 81 Symptômes absents ou minimes (ex. anxiété légère avant un examen), fonctionnement satisfaisant dans tous les domaines, intéressé et impliqué dans une grande variété d’activités, socialement efficace, en général satisfait de la vie, pas plus de problèmes ou de préoccupations que les soucis de tous les jours (ex. conflit occasionnel avec des membres de la famille) 80 - 71 Si des symptômes sont présents, ils sont transitoires et il s’agit de réactions prévisibles à des facteurs de stress (ex. des difficultés de concentration après une dispute familiale) ; pas plus qu’un handicap léger du fonctionnement social, professionnel ou scolaire (ex. fléchissement temporaire du travail scolaire) 70 - 61 Quelques symptômes légers (ex. humeur dépressive et insomnie légère) OU une certaine difficulté dans le fonctionnement social, professionnel ou scolaire (ex. école buissonnière épisodique ou vol en famille) mais fonctionne assez bien de façon générale et entretient plusieurs relations interpersonnelles positives. 60 - 51 Symptômes d’intensité moyenne (exemple : émoussement affectif, prolixité circonlocutoire, attaques de panique épisodiques) OU difficultés d’intensité moyenne dans le fonctionnement social, professionnel ou scolaire (ex. peu d’amis, conflits avec les collègues de travail). 50 - 41 Symptômes importants (ex. idéation suicidaire, rituels obsessionnels sévères, vols répétés dans les grands magasins) OU handicap important dans le fonctionnement social, professionnel ou scolaire (ex. absence d’amis, incapacité à garder un emploi 40 - 31 Existence d’une certaine altération du sens de la réalité ou de la communication (exemple : discours par moments illogique, obscur ou inadapté) OU handicap majeur dans plusieurs domaines (ex. le travail, l’école, les relations familiales, le jugement, la pensée ou l’humeur (ex : .un homme déprimé évite ses amis, néglige sa famille et est incapable de travailler ; un enfant bat fréquemment des enfants plus jeunes que lui, se montre provoquant à la maison et échoue à l’école). 30 - 21 Le comportement est notablement influencé par des idées délirantes ou des hallucinations OU trouble grave de la communication ou du jugement (exemple : parfois incohérent, actes grossièrement inadaptés, préoccupation suicidaire) OU incapable de fonctionner dans tous les domaines (exemple : reste au lit toute la journée, absence de travail, de foyer ou d’amis) 20 - 11 Existence d’un certain danger d’auto ou d’hétéro-agression (exemple : tentative de suicide sans attente précise de la mort, violence fréquente, excitation maniaque) OU incapacité temporaire à maintenir une hygiène corporelle minimum (ex. se barbouille d’excréments) OU altération massive de la communication (exemple : incohérence indiscutable ou mutisme) 10 - 1 Danger persistant d’hétéro-agression grave (exemple : accès répétés de violence) OU incapacité durable à maintenir une hygiène corporelle minime OU geste suicidaire avec attente précise de la mort. L’analyse des données : jusqu’où ? S193 Tableau 1b Échelle PSP (in 6) 100-91 Excellent fonctionnement dans chacun des 4 domaines. Il/elle est bien reconnu(e) pour ses qualités, fait face de manière adéquate aux problèmes de la vie quotidienne, est impliqué(e) dans une large palette d’activités et de centres d’intérêts. 90-81 Bon fonctionnement dans chacun des 4 domaines, en dehors de quelques problèmes ou difficultés ordinaires. 80-71 Difficultés légères dans un ou plus des domaines a-c* 70-61 Difficultés manifestes mais non marquées dans un ou plus des domaines a-c, ou difficultés légères en d. 60-51 Difficultés marquées dans un des domaines a-c, ou difficultés manifestes en d*. 50-41 Difficultés marquées dans 2 ou plus des domaines a-c, ou graves difficultés dans un des domaines a-c, avec ou sans difficultés manifestes en d. 40-31 Graves difficultés dans un des domaines a-c, et difficultés marquées dans au moins un des domaines a-c, ou difficultés marquées en d. 30-21 Graves difficultés dans 2 des domaines a-c, ou graves difficultés en d avec ou sans déficience dans les domaines a-c 20-11 Graves difficultés dans tous les domaines a-d ou très graves difficultés en d avec ou sans déficience dans les domaines ac. Si la personne réagit à des provocations extérieures, le score suggéré est de 20-16 ; sinon le score suggéré est 15-11. 10-1 Manque d’autonomie dans le fonctionnement de base avec comportements extrêmes, sans risque vital (score 6-10) ; ou avec risque vital, par exemple risque de décès pour malnutrition, déshydratation, infections, incapacité à identifier un danger manifeste (score 5-1). * a = activités sociales utiles, y compris travail et études ; b = relations privées et sociales ; c = soin que l’on se porte ; d = comportement perturbant et agressif. Pour chaque domaine les perturbations peuvent être considérées comme : légères, manifestes, marquées, graves ou très graves. Actuellement, de plus en plus d’outils se développent afin d’évaluer les conséquences fonctionnelles liées aux troubles : • SKILLS portant sur fonctionnement social, activités quotidiennes et performances/talents ; • l’échelle GAF ou EGF associant des symptômes et des éléments fonctionnels [1] (Tableau 1a) ; • l’échelle PSP explorant 4 domaines de fonctionnement : activités sociales utiles (dont école et travail), relations privées et sociales, soin que l’on se porte, comportement perturbant et agressif [6] (Tableau 1b). Conclusion Ces quelques exemples montrent l’importance de l’évolution actuelle des essais contrôlés qui porte surtout sur l’intérêt porté à de nouvelles variables comme la rémission symptomatique, les conséquences fonctionnelles des troubles, la signification clinique des résultats obtenus et les durées de traitement. Par ailleurs, dans le domaine des statistiques, les méta-analyses, les essais d’efficience ou de non-infériorité se sont multipliés, renouvelant la méthodologie classique des essais thérapeutiques. Références [1] American Psychiatric Association DSM-IV-TR manuel diagnostique et statistique des troubles mentaux, 4e édition, texte révisé (Washington DC, 2000) Trad. française par JD Guelfi et al. Elsevier-Masson, Paris, 2003 1120 p. [2] Andreasen NC, Carpenter WT Jr, Kane JM et al. Remission in schizophrenia : proposed criteria and rationale for consensus. Am J Psychiatry. 2005 Mar ; 162 (3) : 441-9. [3] Kemmler G, Hummer M, Widschwendter C et al. Dropout rates in placebo-controlled and active-control clinical trials of antipsychotic drugs : a meta-analysis. Arch Gen Psychiatry. 2005 Dec ; 62 (12) : 1305-12. [4] Leucht S, Kane JM, Etschel E et al. Linking the PANSS, BPRS, and CGI : clinical implications Neuropsychopharmacology. 2006 Oct ; 31 (10) : 2318-25. Epub 2006 Jul 5. [5] McEvoy JP, Lieberman JA, Stroup TS et al. Effectiveness of clozapine versus olanzapine, quetiapine and resperidone in patients with chronic schizophrenia who did not respond to prior atypical antipsychotic treatment. Am J Psychiatry 2006 Apr ; 163 (4) : 600-10. [6] Morosini PL, Magliano L, Brambilla L et al. Personal and Social Performance (PSP) Scale. In : Development, reliability and acceptability of a new version of the DSM-IV Social and Occupational Functioning Assessment Scale (SOFAS) to assess routine social functioning. Acta Psychiatr Scand 2000 Apr ; 101 (4) : 232-9. [7] Nasrallah HA, Targum SD, Tandon R et al. Defining and measuring clinical effectiveness in the treatment of schizophrenia. Psychiatr Serv. 2005 Mar ; 56 (3) : 273-82. [8] Stroup TS, Lieberman JA, McEvoy JP et al. Effectiveness of olanzapine quetiapine, risperidone and ziprazidone in patients with chronic schizophrenia following des continuation of a previous atypical antipsychotic. Am J Psychiatry 2006 Apr ; 163 ( 4) : 611-22. [9] Tandon R, Devellis RF, Han J et al. IAQ Validation Study Group. Validation of the Investigator’s Assessment Questionnaire, a new clinical tool for relative assessment of response to antipsychotics in patients with schizophrenia and schizoaffective disorder. Psychiatry Res. 2005 Sep 15 ; 136 (2-3) : 211-21.