8. Les bases bibliographiques informatisées
Transcription
8. Les bases bibliographiques informatisées
8. Les bases bibliographiques informatisées De par leur puissance, les bases informatiques sont devenues, depuis plusieurs années, le principal outil de recherche bibliographique. En effet, seul le traitement informatique permet la gestion du volume toujours croissant d’informations que génèrent les publications scientifiques. 8.1. Généralités Toutes les bases bibliographiques informatisées suivent le même principe général. Chaque base enregistre les références bibliographiques d’articles en provenance d’un certain nombre de revues (revues indexées). Ces enregistrements contiennent trois grands types d’informations : la référence bibliographique proprement dite (titres, auteurs, revue, année, volume, numéro et pages), un résumé (abstract) et une série de mots-clés (ou descripteurs) attribués par l’organisme gérant la base. Ces mots clés sont choisis parmi ceux d’un thésaurus. Les moyens disponibles pour consulter ces bases sont divers. Le support papier est actuellement en voie de disparition, remplacé par la consultation informatisée, soit à distance par l’intermédiaire d’un moyen télématique (terminal, Minitel, Internet), soit en local à partir de CD-ROM. A) Type de recherche Les bases bibliographiques informatisées autorisent deux types de recherche : la recherche par mots clés et la recherche en texte libre. La recherche par mots clés utilise les items du vocabulaire standardisé représenté par le thesaurus. Par contre, la recherche en texte libre recherche des mots quelconques dans le titre ou dans le texte de l’abstract. Chacune de ces recherches présente des points forts et des limitations [94]. Recherche par mots clés L’intérêt de l’utilisation d’un thesaurus réside dans la standardisation des termes utilisés pour désigner un concept. De plus, il présente une structure hiérarchique autorisant à partir d’un terme global à rechercher tous les sous-domaines. 58 Les bases bibliographiques informatisées Cependant, cette approche implique une indexation préalable de l’article, c’est à dire l’attribution d’un nombre limité de mots clés qui décrivent le mieux la teneur de la publication. Ce travail est très difficile et souvent il est impossible d’indexer l’ensemble des aspects d’un travail, ce qui débouche sur la possibilité de faux négatifs. Une autre limitation de cette approche est représentée par le délai d’intégration des nouveaux concepts ou termes au thésaurus. Recherche en texte libre La recherche en texte libre présente une certaine souplesse : il n’est pas nécessaire de chercher le terme retenu par le thesaurus. Elle permet aussi de s’affranchir de la codification préalable nécessaire à l’attribution des mots-clés à un article. Si, lors de cette codification, un aspect de la publication a été omis, la recherche en texte libre peut permettre de « récupérer » cet oubli. Les inconvénients résident dans l’absence de gestion des synonymes. Une recherche menée avec un terme particulier ne retrouvera pas les articles qui n’emploient pas ce terme, mais des synonymes. Pour pallier ce problème, il est nécessaire de multiplier les termes de recherche en utilisant le plus possible de synonymes du thème recherché. Dans certaines situations, il peut être fastidieux de couvrir l’ensemble des termes synonymes possibles pour un concept donné. Par contre, ce type de recherche permet de s’adapter rapidement à l’émergence d’une nouvelle terminologie, qui n’apparaîtra qu’avec retard dans le thesaurus. Stratégie de recherche Il est rare qu’un seul terme de recherche suffis à définir le domaine recherché. Les articles escomptés se définissent le plus souvent par le croisement de plusieurs concepts. Par exemple, les essais cliniques randomisés de l’interféron dans les maladies auto-immunes se définissent par l’intersection de trois critères : essais cliniques randomisés, interféron et maladies auto-immunes. Les articles recherchés devront porter à la fois sur ces trois concepts. Dans cette situation, la recherche fait appel à une stratégie qui consiste à identifier tous les articles se rapportant aux maladies auto-immunes, tous ceux traitant de l’interféron, et tous les articles qui sont des comptes rendus d’essais cliniques randomisés. Les articles recherchés se trouveront à l’intersection de ces trois groupes : elle s’obtient en ne retenant que les articles présents dans le premier groupe ET dans le deuxième ET dans le troisième. Ainsi, les stratégies consistent en des combinaisons de recherche sur différents concepts par des opérateurs logiques. Les opérateurs les plus courants sont le ET, le OU, le NON. – A ET B permet d’obtenir les articles qui traitent à la fois du sujet A et du sujet B. Par exemple Infarctus du myocarde ET Angioplastie sélectionne les articles au sujet de l’angioplastie dans l’infarctus du myocarde. 59 Généralités – A OU B trouve des articles qui traitent soit de A soit de B (séparément ou ensemble). Infarctus du myocarde OU Angioplastie ramène entre autres des articles concernant par exemple l’angioplastie fémorale. Par contre, si l’on souhaite retrouver les articles concernant l’angioplastie coronaire dans l’angor ou dans l’infarctus du myocarde la sélection appropriée est Angioplastie ET (Infarctus du myocarde OU Angor). – A NON B sélectionne les publications qui traitent le sujet A et qui ne traitent pas du sujet B. Dans la plupart des recherches, il s’avère nécessaire d’utiliser à plusieurs reprises ces opérateurs. B) Sensibilité et spécificité Deux indices décrivent la qualité d’une recherche bibliographique : la sensibilité et la spécificité. La sensibilité (« Recall » en anglais) se définit comme la proportion d’articles retrouvés par rapport au nombre total d’articles présents dans la base qui concernent le sujet recherché et qui auraient donc du être repérés. Pour reprendre la terminologie des tests diagnostiques il s’agit du complément à l’unité du taux de faux négatifs. Sensibilité = Nombre de références pertinentes trouvées Nombre de références pertinentes dans la base La spécificité (’Precision’) quantifie la pollution de la recherche par des références qui ne se rapportent pas au sujet recherché. En d’autres termes, il s’agit du complément à l’unité du taux de faux positifs. Spécificité = Nombre de références pertinentes trouvées Nombre total de références trouvées D’une manière générale, lorsque l’on cherche à augmenter la sensibilité d’une recherche (afin de ne pas oublier des articles intéressants) la spécificité diminue. En effet, nous sommes amenés à utiliser des termes de plus en plus généraux et le nombre de références hors sujet augmente. A l’opposé, une recherche très spécifique s’avère souvent peu sensible. Exemple 8.1 Dans une recherche des essais concernant le traitement de l’accident vasculaire cérébral, Counsell rapporte que la stratégie la plus sensible (qui ne détecte pourtant que 87% des essais) possède une spécificité de seulement 10% [95]. Cette stratégie qui combine 13 termes du thesaurus fournit une liste de 10 000 titres pour une période de 6 ans, qui doivent être ensuite sélectionnés de façon manuelle. 60 Les bases bibliographiques informatisées C) Validation de la recherche informatique La validation d’une stratégie de recherche est un travail difficile mais indispensable. Cette validation a pour but de s’assurer dans les faits que la stratégie élaborée permet bien de retrouver le plus grand nombre d’essais thérapeutiques du domaine d’intérêt. Une façon de la réaliser consiste à effectuer tout d’abord une recherche manuelle systématique portant sur deux ou trois revues du domaine et limitée à un certain nombre d’années (entre 5 et 10 ans). Le résultat de cette recherche est ensuite comparé à celui de la recherche informatique. La stratégie est alors modifiée de façon itérative jusqu’à l’obtention d’une bonne concordance portant principalement sur la sensibilité (et non sur la spécificité). Après cette phase, la stratégie ainsi validée pourra être appliquée à l’ensemble de la base informatisée. D) Recherche des essais thérapeutiques La procédure de recherche des essais thérapeutiques avec une base bibliographique informatisée peut se résumer ainsi. – réalisation d’une stratégie de recherche assez large pour augmenter la sensibilité (l’exhaustivité), – cette stratégie se décompose en deux sous-recherches : l’une portant sur le domaine d’intérêt de la méta-analyse, l’autre recherchant les essais thérapeutiques. Le résultat final sera le croisement de ces deux sous-recherches, – la stratégie de recherche des essais doit être la plus large possible afin d’identifier de véritables essais thérapeutiques qui n’auraient cependant pas été indexés comme tels. Une recherche n’utilisant que le mot clé du thésaurus désignant un essai thérapeutique ou un essai randomisé est insuffisante. – une phase de nettoyage du fichier est ensuite nécessaire, pour éliminer les vrais faux positifs (références sélectionnées mais qui n’ont rien à voir avec le domaine d’intérêt ou qui ne sont pas des comptes rendus d’essais cliniques). L’élimination de références devra être prudente et le bénéfice du doute sera systématiquement accordé dans les cas limites ou peu clairs. A cette étape du travail, il est hors de question de faire une sélection fine, en particulier sur les critères méthodologiques. Il s’agit seulement d’épurer le fichier des références « parasites » qui peuvent être nombreuses en cas de recherche très large. La sélection finale des essais (en particulier sur des critères méthodologiques) aura lieu ultérieurement. 61 MEDLINE 8.2. MEDLINE MEDLINE est certainement la base de données bibliographiques la plus populaire dans le domaine biomédical. MEDLINE, dont le nom est la contraction de MEDlars onLINE, désigne le système de distribution qui permet d’accéder à MEDLARS (MEDical Literature Analysis and Retrieval System), MEDLARS étant le véritable nom de la base de données qui est l’implémentation informatique de l’ancien Index Medicus . Elle est gérée par un organisme fédéral des USA : la National Library of Medicine (NLM). A) Présentation générale MEDLINE donne accès à toutes les références de l’Index medicus, et à celles de « l’International Nursing Index » et de « l’Index to Dental Literature ». Les articles en provenance d’environ 3 600 périodiques biomédicaux sont référencés. Ces références contiennent le résumé en anglais publié dans la revue dans 70% des cas. Le fichier central est mis à jour toutes les semaines, de janvier à octobre, puis mensuellement pour novembre et décembre. Chaque mois, la base s’enrichit d’environ 31 000 nouvelles citations. En janvier 1993, elle contenait plus de 7,2 millions enregistrements. B) Description d’un enregistrement MEDLINE Les différentes informations enregistrées dans MEDLINE apparaissent dans différents champs, qui peuvent ne pas être tous présents pour certaines références [96, 97]. – Le premier champ affiche le numéro unique d’identification de la référence. – Le titre en anglais suit. Si l’article n’est pas écrit en anglais, une traduction anglaise du titre apparaît entre crochet suivi du titre dans la langue originelle. – La liste des auteurs avec leur nom suivi de leurs initiales. – L’adresse de l’auteur responsable de la correspondance – La référence bibliographique proprement dite, composée d’une abréviation standard du nom de la revue, suivie entre parenthèse de sa localisation géographique. Apparaît ensuite la date du numéro, le numéro du tome suivi entre parenthèse du numéro dans le volume puis de la première et dernière page de l’article. Un numéro d’ISSN (numéro international d’identification des revues) 62 Les bases bibliographiques informatisées Tableau 8.1. — Liste des types de documents Bibliography Clinical conference Clinical trial - phase I Clinical trial - phase III Comment Concensus development conference - NIH Corrected and republished article Dictionary Duplicate publication English abstract Guideline Historical biography Journal article Letter Meta-analysis News Periodical index Published erratum Retraction of publication Review - literature Review - academic Review - tutorial Technical report Classical article Clinical trial Clinical trial - phase II Clinical trial - phase IV Concensus development conference Controlled clinical trial Current biog-obit Directory Editorial Festschrift Historical article Interview Legal brief Meeting report Multicenter study Overall Practice guideline Randomized controlled trial Review Review of reported cases Review - multicase Scientific integrety review Twin study – Eventuellement un champ « Note » permettant de mentionner des errata (« Erratum in ») publiés dans d’autres numéros ou des lettres à l’éditeur se rapportant à cet article (« Comment in ») – La langue d’écriture de l’article – Le champ « Summary Language » précise la langue du résumé originel – Le champ « Document Type », appelé aussi « Publication type » (PT) se réfère à la forme de la publication et non pas à son contenu. Environ 40 types différents sont possibles (voir le tableau 8.1) et certains d’entres eux sont particulièrement importants en méta-analyse, tel que : ¢ « Clinical trial »,« Clinical trial - phase II », « Clinical trial-phase IV », « Controlled clinical trial ». ¢ « Randomized clinical trial » qui désigne le compte rendu d’un essai thérapeutique randomisé. Ce champ véhicule une information très importante dans le cadre de la méta-analyse. ¢ « Review » : Revue générale. ¢ « Meta-analysis » : Compte rendu d’une méta-analyse. Ce champ a été créé en 1993. 63 MEDLINE – Eventuellement sur la même ligne est mentionnée l’existence d’un résumé en anglais pour les publications écrites dans une autre langue. – « Journal announcement » correspond à la date (année suivi du mois) à laquelle les éditeurs de la revue ont transmis à la NLM ces données. – « Subfile » identifie les sous fichiers auxquels appartient l’article (AIM, Index Medicus, etc.). – L’abstract tel qu’il apparaît dans la publication, tronqué éventuellement à 250 mots (« truncated at 250 words »). – Le champ « Check Tags » donne des grands marqueurs dont la liste est donnée dans le tableau 8.2 : Tableau 8.2. — ’Check Tags’ Animal Comparative study Human Male Support, U.S. Gov’t, non-P.H.S. Case report Female In vitro Support, non-U.S. Gov’t Support, U.S. Gov’t, P.H.S. – Les « Descriptors » ou mots-clés. Il s’agit de termes issus du thesaurus de MEDLINE (nommé « MeSH ») attribués à l’article par les indexeurs de la NLM (la structure du thesaurus MeSH est décrite plus loin). Les descripteurs du thème central de la référence apparaissent suivis par un astérisque. – « CAS (Chemical Abstract Service) Registry No. » et « Enzyme Commision No. » permettent d’identifier avec un code standardisé les médicaments et les enzymes éventuellement mentionnés dans l’article. C) Exemple de sortie MEDLINE 92226361 Confronting the issues of patient safety and investigator conflict of interest in an international clinical trial of myocardial reperfusion. Global Utilization of Streptokinase and Tissue Plasminogen Activator for Occluded Coronary Arteries (GUSTO) Steering Committee. Topol EJ; Armstrong P; Van de Werf F; Kleiman N; Lee K; Morris D; Simoons M; Barbash G; White H; Califf RM Department of Cardiology, Cleveland Clinic Foundation, Ohio 44195. J Am Coll Cardiol (UNITED STATES) May 1992 19 (6) p1123-8 ISSN: 0735-1097 Language: ENGLISH Document Type: CLINICAL TRIAL; JOURNAL ARTICLE; MULTICENTER STUDY 64 Les bases bibliographiques informatisées Journal Announcement: 9207 Subfile: AIM; INDEX MEDICUS The Global Utilization of Streptokinase and Tissue Plasminogen Activator for Occluded Coronary Arteries (GUSTO) trial is a large scale international trial of new myocardial reperfusion strategies. The primary hypothesis is .... Incorporation of these approaches may facilitate the design of future large scale randomized trials in cardiovascular medicine. Tags: Human Descriptors: *Alteplase--Adverse Effects--AE; *Conflict of Interest; *Coronary Disease--Drug Therapy--DT; *International Cooperation; *Myocardial Reperfusion--Adverse Effects--AE; *Streptokinase--Adverse Effects--AE; Coronary Disease--Epidemiology--EP; Drug Industry; Drug Therapy, Combination; Heparin--Adverse Effects--AE; Interprofessional Relations; Myocardial Reperfusion--Methods--MT; Myocardial Reperfusion--Statistical and Numerical Data--SN; Observer Variation; Physician-Patient Relations; Recombinant Proteins--Adverse Effects--AE; Research Design; Safety; United States CAS Registry No.: 0 (Recombinant Proteins); 9005-49-6 (Heparin) Enzyme No.: EC 3.4.- (Streptokinase); EC 3.4.21.- (Alteplase) D) Le thesaurus Chaque enregistrement MEDLINE comporte une série de descripteurs (mots-clés) qui décrivent le contenu de l’article référencé. Ces mot clés ne sont pas choisis au hasard, mais issus d’un thesaurus nommé MeSH (Medical Subjet Headings) qui comprend environ 17000 termes. Ce thesaurus regroupe de façon hiérarchique les descripteurs [98]. Les descripteurs les moins précis (par exemple, maladies cardiaques) regroupent des termes plus précis (comme maladies cardiaques ischémiques, insuffisance cardiaque, maladie valvulaire cardiaque, arythmies). Cette structure aboutit à une arborescence où les termes les plus généraux représentent les grosses branches et les termes moins précis qui leur sont reliés les petites branches et les feuilles. Cette structure est matérialisée par la numérotation des termes du MeSH : D26.74.75 D26.74.75.150 D26.74.75.150.175 D26.74.75.150.175.150 D26.74.75.150.350 D26.74.75.150.700 Anti-inflammatory agents, non-steroidal Anti-inflammatory agents, gold Aurothioglucose Auranofin Gold thiomalate Sodium gold thiosulfate Un autre intérêt du thesaurus réside dans la possibilité d’étendre automatiquement, à partir d’un terme relativement précis, la recherche à tous les autres termes qui lui sont reliés. Par exemple, imaginons que l’on souhaite chercher les articles traitant des sels d’or utilisés en rhumatologie. Le terme MeSH qui semble le mieux correspondre à notre demande est D26.74.75.150 Anti-inflammatory agent, gold. Cependant il se peut que des articles aient été uniquement indexés avec des termes plus précis du type D26.74.75.150.175.150 Auranofin. 65 MEDLINE Tableau 8.3. — Topical subheading Abnormalities Analogs & Derivatives Antagonists & inhibitors Blood supply Chemically induced Complications Cytology Diagnostic use Drug therapy Embryology Ethnology Growth & developpment Injuries Isolation & purification Metabolism Mortality Parasitology Pharmacokinetics Physiopathology Psychology Radionucleide Imaging Secondary Statistical & Numerical data Therapeutic use Transmission Ultrasonography Utilization Administration & dosage Analysis Biosynthesis Cerebrospinal fluid Chemistry Congenital Deficiency Diet therapy Economics Enzymology Etiology History Innervation Legislation & jurisprudence Methods Nursing Pathogenicity Pharmacology Poisoning Radiation Effects Radiotherapy Secretion Supply & Distribution Therapy Transplantation Ultrastructure Veterinary Adverse effects Anatomy & histology Blood Chemical synthesis Classification Contreindications Diagnosis Drug effects Education Epidemiology Genetics Immunology Instrumentation Manpower Microbiology Organization & Administration Pathology Physiology Prevention & Control Radiography Rehabilitation Standards Surgery Toxicity Trends Urine Le thesaurus permet à partir du niveau général Anti-inflammatory agent, gold d’effectuer aussi automatiquement la recherche avec les termes dépendant de niveau inférieur (fonction « Explode »). Des sous-thèmes (Topical SubHeading) complètent les descripteurs en le précisant (leur liste est donnée dans le tableau 8.3). Par exemple, le terme désignant une maladie peut être complété pour ne plus désigner que l’aspect thérapeutique de la maladie, ou son diagnostic, etc... myocardial myocardial myocardial myocardial myocardial infarction--drug therapy infarction--diet therapy infarction--epidemiology infarction--physiopathology infarction--radionuclide imaging En France, il existe une traduction française du MeSH qui est proposée dans l’interrogation par Questel ou Minitel. Dans les références, certains mots-clés apparaissent suivis d’un astérisque qui identifie les thèmes centraux (« Major concept ») de la publication. Les autres motsclés correspondent à des thèmes abordés par la publication mais de façon accessoire, qui ne sont pas le principal sujet de l’article. La recherche peut être effectuée uni- 66 Les bases bibliographiques informatisées quement sur ces ’major concept’, ce qui permet une recherche plus spécifique mais qui fait aussi courir le risque de la rendre moins sensible. Le principal problème pratique qui se pose avec le MeSH est de trouver retenu pour désigner un concept. Pour faciliter cette recherche, des synonymes ont été introduits dans le thesaurus. Ces termes (« Entry terms ») n’appartiennent pas directement à la structure hiérarchique, mais servent de renvoi au bon terme MeSH. Ainsi, parmi plusieurs synonymes possibles pour désigner un concept, un seul a été retenu, mais des termes synonymes sont quand même présents dans le vocabulaire afin de renvoyer au terme choisi. Néanmoins, il n’est pas toujours aisé de trouver le bon terme. Le choix peut être aidé en regardant les mots clés qui sont attachés à une ou plusieurs publications déjà connues, la récupération de ces références s’effectuant par le nom des auteurs, de la revue, etc. Un problème survient lorsque l’on s’intéresse à un concept assez général, comme par exemple les cancers intestinaux. Les articles sont codés avec le terme le plus précis existant dans le thesaurus, et par exemple, un article traitant du cancer du colon sera codé avec ce terme et les mots-clés plus généraux n’apparaîtront pas. Pourtant cet article est pertinent pour la recherche sur les cancers intestinaux. La solution à ce problème réside dans la possibilité de sélectionner automatiquement tous les termes qui dépendent d’un concept général (fonction « Explode »). Ainsi, pour retrouver les cancers intestinaux, la recherche utilisera ce terme et tous les termes qui en découlent. 8.3. Recherche des essais cliniques avec MEDLINE A) Les difficultés Une recherche bibliographique limitée uniquement à une recherche dans une base informatique comme MEDLINE ne permet pas d’obtenir l’exhaustivité nécessaire à une méta-analyse. Plusieurs travaux ont comparé, pour un domaine donné, la liste des essais randomisés retrouvés à partir de MEDLINE avec une liste de références quasi exhaustive. Cette référence était obtenue en combinant plusieurs sources d’information (autres bases bibliographiques, listes des références d’articles connus, etc.) et une recherche manuelle systématique dans certaines revues. Même si cette liste de références ne peut prétendre regrouper l’ensemble des essais randomisés publiés dans un domaine, elle représente en général une liste assez complète des essais réalisés dans un domaine. Une revue de 15 travaux de ce type a été publiée par Kay Dickersin et son équipe de l’université de Baltimore [99]. Globalement, sur l’ensemble de ces travaux, la Recherche des essais cliniques avec MEDLINE 67 recherche MEDLINE ne permettait de retrouver que 51% de tous les essais randomisés connus. Même en ne retenant dans la liste de référence que les essais publiés dans une revue indexée par MEDLINE, la sensibilité n’était que de 77%. Ainsi, en utilisant MEDLINE, il n’est pas possible d’identifier tous les essais randomisés publiés dans les revues indexées par MEDLINE . Les raisons possibles de ce manque de sensibilité sont multiples : nombre limité de revues couvertes par MEDLINE, inadéquation des techniques de recherches, problème d’indexation (thésaurus limité ou non adapté, performance des indexeurs) ou description insuffisante de la méthodologie par les auteurs [100, 101]. Nous avons vu dans la description de MEDLINE, que ce système ne couvre qu’une faible partie de tout ce qui est publié à travers le monde dans le domaine biomédical. MEDLINE ne s’intéresse qu’à 3 700 journaux alors que l’on estime qu’il existe environ 16 000 périodiques biomédicaux actifs à travers le monde. La réalisation de recherche de qualité (précise et sensible) nécessite une bonne connaissance de la structure de MEDLINE, de son thesaurus et des règles d’indexation. Un utilisateur inexpérimenté n’a que peu de chance de retrouver une forte proportion des essais [102]. De plus, si l’on cherche à augmenter la sensibilité de la recherche, sa spécificité diminue et elle ramène un nombre inacceptable de références non pertinentes [103]. L’indexation des articles ne portait que peu d’attention aux critères méthodologiques jusqu’à une date récente. La première introduction d’un mot-clé ayant trait à la méthode des essais randomisés a eu lieu en 1978 avec « Random allocation ». Le mot clé « Randomized controlled trials » n’est utilisé que depuis 1990. Depuis 1992, un essai randomisé n’est plus identifié avec ce mot clé mais avec le type de publication « Randomized controlled trial » 12 . En l’absence de mots clé spécifique des essais randomisés les recherches ne peuvent être que très aléatoires. De plus, même si les mots-clés adaptés existent, ils peuvent ne pas avoir été appliqués de façon uniforme par les personnes réalisant l’indexation pour la NLM (PL Schuyler et al., second international congress on peer review 1993; C Lefebvre, An evidence-based health care system: the case for clinical trial registries, National Institutes of Health, 1993, cités dans la réf. [104]. ). Enfin, les auteurs des publications peuvent ne pas décrire la méthode utilisée de façon suffisamment précise : il s’avère impossible de savoir si leur travail est ou n’est pas un essai clinique randomisé. Toutes ces constatations amènent à conclure qu’il est, à l’heure actuelle, impossible de se contenter d’une seule recherche MEDLINE, pour trouver les données nécessaires à une méta-analyse. Les différentes limitations que nous venons de voir conduiraient à un manque important d’information. Il est donc nécessaire d’envisager des procédures et des stratégies complexes de recherche des essais randomisés. 12 Ce point a des implications pratiques dans la façon de formuler les requêtes MEDLINE. 68 Les bases bibliographiques informatisées Head ry entry entry Tableau 8.4. — Recherche des essais avec Medline Recherche des essais cliniques avec MEDLINE 69 B) Les solutions La recherche des essais thérapeutiques randomisés avec MEDLINE se décompose en fait en deux parties : la description du domaine d’intérêt et la recherche des essais [105]. Nous allons voir maintenant quelques « recettes » permettant de rendre aussi efficaces que possible les recherches MEDLINE [106, 107]. Type de publication Un premier point auquel il est important de prêter attention dans les recherches d’essais thérapeutiques randomisés avec MEDLINE concerne la codification des essais au niveau du champ « type de publication ». Depuis 1992, les rapports d’essais randomisés ne sont plus identifiés par le motclé « Randomized Clinical Trials » mais uniquement dans le champ type de publication par « Randomized Clinical Trial ». Il devient donc impératif d’inclure une recherche sur le champ Type de publication dans la stratégie de recherche. En effet si celle ci se limite à une recherche par les mots-clés tous les essais indexés après 1992 ne seront pas retrouvés. Par exemple l’essai GUSTO est un essai récent de cardiologie dont le compte rendu a été publié dans le New England Journal of Medicine [108]. Le retrouver ne devrait pas à priori poser beaucoup de problèmes. Intuitivement les mots clés « Gusto » et « Randomized Clinical Trials » sont les premiers envisagés. Contre toute attente cette recherche ramène uniquement des éditoriaux ou des articles discutant GUSTO, et passe sous silence le compte-rendu de l’essai. Cette publication est par contre retrouvée spécifiquement avec le mot clé GUSTO combiné au type de publication « Randomized Clinical Trial ». Stratégie Pour obtenir une sensibilité maximale, il convient de combiner des termes plus ou moins proches du concept d’essais randomisés, mais qui peuvent éventuellement être utilisés au sujet d’un essai randomisé non reconnu en tant que tel. Le tableau 8.5 présente une stratégie de recherche mise au point dans le cadre de la Collaboration Cochrane par Carole Lefebvre [104]. Cette stratégie est divisée en trois grandes parties (partie I de l’étape 1 à l’étape 8, partie II de 9 à 24 et partie III de 25 à 34) 13 . L’étape I n’utilise que des termes très précis tandis que l’étape III utilise des termes très larges. Dans les instructions de recherche, les termes en majuscule se réfèrent à des mots du thesaurus. Les mots en minuscule à du texte libre. Les instructions du langage de sélection apparaissent aussi en minuscule (« in », « explode », « near », etc.). 13 Cette stratégie est décrite en utilisant la syntaxe du logiciel d’interrogation SilverPlatter version 3.10. 70 Les bases bibliographiques informatisées Tableau 8.5. — Stratégie de recherche des essais cliniques randomisés avec MEDLINE (d’après réf. [104]) Etape 1 2 3 4 5 6 7 8 Phase I Instructions de recherche RANDOMIZED-CONTROLLED-TRIAL in PT RANDOMIZED-CONTROLLED-TRIALS RANDOM-ALLOCATION DOUBLE-BLIND-METHOD SINGLE-BLIND-METHOD 1 or 2 or 3 or 4 or 5 TG=ANIMAL not (TG=HUMAN and TG=ANIMAL) 6 not 7 Etape 9 10 11 12 13 14 15 16 17 18 19 20 21 24 25 26 Phase II Instructions de recherche CLINICAL-TRIAL in PT explode CLINICAL-TRIALS (clin* near trial*) in TI (clin* near trial*) in AB (singl* or doubl* or trebl* or tripl*) near (blind* or mask*) (13 in TI) or (13 in AB) PLACEBOS placebo* in TI placebo* in AB random* in TI random* in AB RESEARCH-DESIGN 9 or 10 or 11 or 12 or 14 or 15 or 16 or 17 or 18 or 19 or 20 TG=ANIMAL not (TG=HUMAN and TG=ANIMAL) 21 not 22 23 not 8 Etape 25 26 27 28 29 30 31 32 33 34 Phase III Instructions de recherche TG=COMPARATIVE-STUDY explode EVALUATION-STUDIES FOLLOW-UP-STUDIES PROSPECTIVE-STUDIES control* or prospectiv* or volunteer* (29 in TI) or (29 in AB) 25 or 26 or 27 or 28 or 30 TG=ANIMAL not (TG=HUMAN and TG=ANIMAL) 31 not 32 33 not (8 or 24) Recherche des essais cliniques avec MEDLINE 71 Dans la première partie, l’étape 1 recherche les essais randomisés à partir du champ type de publication (PT, « Publication type » ) pour les articles indexés depuis 1992. L’étape 2 recherche par les mots clés (codification des essais randomisés entre 1978 et 1992). Les étapes 3,4 et 5 sont là pour rechercher les publications anciennes, indexées quand aucun descripteur n’existait pour l’entité essai clinique randomisé. L’étape 6 permet de trouver l’ensemble des références qui correspondent à au moins l’un des critères de sélection précédents. Les étapes 7 et 8 permettent d’exclure les références portant exclusivement sur des travaux sur l’animal (les travaux portant à la fois sur l’animal et l’humain sont conservés). La deuxième partie effectue une sélection plus large, débutant par la recherche des essais cliniques sans se restreindre aux essais randomisés. L’étape 11 nécessite quelques explications. L’étoile figurant par exemple dans clin* signifie que tous mots commençant par clin seront sélectionnés. L’étoile permet de remplacer une séquence quelconque de caractères. Par exemple ici clin* permettra de retrouver aussi bien clinical que clinique ou clinics. L’opérateur « near », que l’on rencontre dans cette étape 11, permet de sélectionner les enregistrements dans lesquels deux mots se trouvent l’un à coté de l’autre. L’instruction « clinical near trial » recherche l’expression « clinical trial ». Cette instruction permet donc la recherche d’une séquence de mots. Dans cette partie seront aussi sélectionnés les enregistrements qui comportent des termes comme placebo, double ou simple aveugle, randomisation. Il est évident que cette façon de procéder permet de récupérer des publications de véritables essais randomisés qui n’emploieraient pas ce terme mais dont le résumé comporterait la description du plan d’expérience. Il est aussi vrai que cette recherche large ramène de nombreuses références sans rapport avec des essais randomisés. Ces références non pertinentes devront être éliminées manuellement par une lecture une à une. Il apparaît ici que l’élargissement des critères de recherche dans le but de ne récupérer que quelques références mal indexées se traduit par un travail de nettoyage du fichier issu de la recherche informatique. Enfin, la troisième et dernière partie correspond à une recherche très large qui, après combinaison aux précédentes, assure un haut niveau de sensibilité mais s’accompagne, suivant les domaines, de très nombreux faux positifs. Par exemple, si le domaine est riche en études épidémiologiques il est probable que celles-ci seront récupérées par cette dernière partie de la recherche. Cela peut conduire à ne pas l’employer pour éviter une explosion du nombre de références non pertinentes ramenées par la recherche informatisée. Sélection du domaine d’intérêt Le choix des termes pour conduire la recherche du domaine d’intérêt est aussi primordial et nécessite une solide expérience de MEDLINE. Il est important ici aussi 72 Les bases bibliographiques informatisées que les termes employés soient suffisamment larges pour que la stratégie soit suffisamment sensible [95]. Le manque de spécificité sera ensuite corrigé lors du nettoyage manuel du fichier. C) Interaction MEDLINE - Collaboration Cochrane La NLM a collaboré très tôt à la Collaboration Cochrane 14 . En interaction avec le centre Cochrane de Baltimore, il a été décidé que MEDLINE intégrerait plusieurs travaux conduits par cette collaboration : – la codification avec un type de publication PT = « randomized clinical trial » de tous les rapport d’essais thérapeutiques randomisés retrouvés dans le cadre des « Groupes de Revue Systématique » (« Systematic review group »). Si l’essai appartient à un journal qui n’est pas normalement indexé dans MEDLINE, la référence sera créée. – la recodification du champ « publication type » pour tous les essais randomisés anciens (depuis 1948) qui auront été identifiés par une stratégie de recherche complexe et pas recherche manuelle. D) Les moyens d’accès MEDLINE est accessible par différents moyens. Le système informatique de la NLM peut être interrogé directement avec le logiciel d’interrogation Grateful Med à travers une connexion informatique dédiée ou à travers Internet. De nombreux prestataires de services offrent un accès à MEDLINE dont certains se font par l’intermédiaire d’Internet. En France, le prestataire de service QUESTEL se charge de cette connexion. Un service Minitel (08 36 29 00 36) est aussi disponible en France, sans abonnement mais il s’avère très onéreux à l’usage. De plus, la lenteur du Minitel rend impossible les recherches importantes. La diffusion de cette base sur support CD-ROM est en pleine expansion et se fait par l’intermédiaire de plusieurs sociétés indépendantes de la NLM. E) Adresse MEDLARS management section National Library of Medicine 8600 Rockville Pike Bethesda, MD 20894 http: //igm.nlm.nih.gov 14 La Collaboration Cochrane est décrite dans le chapitre 33. 73 Les autres bases 8.4. Les autres bases Même si MEDLINE s’avère être la base bibliographique la plus populaire dans le domaine biomédical, elle n’est pas unique. Trois autres bases de données généralistes EMBASE, BIOSIS et PASCAL existent, tandis que plusieurs autres couvrent des domaines plus spécifiques (AIDSLINE). D’autres encore concernent des domaines voisins comme la psychologie (ERIC, Psybase). A) EMBASE EMBASE est la version informatisée de la base Excerpta Medica. Elle est gérée par l’éditeur néerlandais Elsevier. EMBASE contient plus de 6 millions de références issues de plus de 3 500 journaux publiés dans 110 pays. Elle offre une bonne couverture de la littérature européenne : parmi les 313 journaux biomédicaux publiés en France, EMBASE en indexe 137 soit 44%, contre seulement 87 (28%) pour BIOSIS, 82 (26%) pour MEDLINE, 28 (9%) pour Science Citation Index et 19 (6%) dans les Current Contents Life Science. Le délai d’intégration des références est parmi les plus rapides, inférieur à 1 mois. De plus un fichier express, « EMBASE Alert » récapitule les références dès réception et avant toute indexation. Sa consultation régulière offre un moyen de veille de la littérature, à la manière des « Current Contents ». Le taux de recouvrement avec MEDLINE est estimé à seulement 35-40%. Ce taux relativement faible est un argument de plus en faveur de la nécessité d’utiliser plusieurs bases de données bibliographiques pour la recherche des essais et non pas de se limiter à MEDLINE. Thesaurus EMTREE est le vocabulaire standardisé (thesaurus) d’EMBASE qui contient environ 38 500 termes de deux types : des termes médicaux et des dénominations de médicaments. Les médicaments sont indexés dans ce thesaurus sous leur dénomination standard retenue par l’OMS (World Health Organization’s International Nonproprietary Nomenclature), mais peuvent aussi être retrouvés par un jeu de synonymes à partir de leur nom commercial, code de développement, ou nom du composé chimique. Dans les enregistrements les mots-clés médicaux apparaissent dans le champ DE et les mentions de médicaments dans le champ DR. Le mot-clé « Randomized Controlled Trial » a été introduit en 1994 pour indexer les essais cliniques randomisés. 74 Les bases bibliographiques informatisées Tableau 8.6. — "Link terms" appliqués aux termes du thesaurus EMTREE « Link terms » s’appliquant aux termes médicaux médicaments Complication Adverse drug reaction Congenital disorder Clinical trial Diagnosis Drug administration Drug therapy Drug analysis Epidemiology Drug combination Etiology Drug comparison Prevention Drug concentration Radiotherapy Drug development Rehabilitation Drug dose Side effect Drug interaction Surgery Drug therapy Therapy Drug toxicity Endogenous compound Pharmaceutics Pharmacokinetics Pharmacology Les termes du thesaurus sont complétés depuis 1988, à la façon des Subheading de MEDLINE, par des « Link terms » qui sont différents suivant qu’ils qualifient les termes médicaux ou les dénominations de médicaments (tableau 8.6). Le terme « Clinical trial » est particulièrement utile en méta-analyse, il permet de cibler la recherche sur les essais d’une molécule, par exemple : « streptokinase-Clinical Trial ». Un autre thesaurus, EMCLAS a été remplacé par EMTREE en 1988. Cependant les termes les plus généraux sont encore utilisés pour classer les références par disciplines (comme Physiology ou Surgery, etc.). Cette classification apparaît dans le champ EC. Cet ancien thesaurus persiste aussi dans le champ EL qui code numériquement les médicaments. Un troisième thesaurus existe, EMTAGS qui identifie des sujets très larges et fréquemment recherchés comme le type de l’article, les méthodes expérimentales ou de laboratoire, les catégories d’âge, les aspects éthiopathogéniques, le type d’étude, la nature des sujets de l’expérimentation, les organes ou les zones géographiques. Ces identifiants apparaissent dans le champ EM et sous forme d’un code numérique dans le champ TG. Recherche des essais thérapeutiques Dans EMBASE, les essais thérapeutiques peuvent être recherchés par plusieurs voies : – en utilisant les mots-clés du thesaurus EMTREE qui sont, du plus précis au plus large : randomized-controlled-trial, clinical-trial, Les autres bases 75 controlled-study, major-clinical-study, double-blindprocedure, multicenter-study, phase-3-clinical-trial, single-blind-procedure, crossover-procedure, – en complétant une dénomination de médicaments par le « link term » « -clinical-trial », – en utilisant les termes « controlled-study », « major-clinical-study » du thesaurus EMTAG. Accès EMBASE est disponible en ligne par télématique auprès des principaux serveurs télématiques (OVID online, DIALOG, STN international, DataStar, DIMDI, etc.). Des versions CD-ROM sont également disponibles. Description des enregistrements TI: Diabetic nephropathy: Etiologic and therapeutic considerations AU: DeFronzo-RA AD: Diabetes Clinical Research Center, Univ. Texas Health Science Center, Audie L. Murphy VA Hospital, San Antonio, TX 78284-7886, United States SO: DIABETES-REV. 3/3 (510-564) 1995 CO: DBRVE IS: 1066-9442 PY: 1995 CP: United-States LA: English LS: English AB: Diabetic nephropathy is the commonest cause of renal failure in the U.S., accounting for one of every three patients entering chronic dialysis programs. Over the last decade the .... Treatment with intensified glycemic control and antihypertensive agents, especially the angiotensin-converting enzyme inhibitors, has been shown to halt the progression or cause regression of microalbuminuria, indicating the effectiveness of these therapeutic interventions as primary prevention for diabetic nephropathy. DE: *diabetic-nephropathy-complication; *diabetic-nephropathy-drug-therapy; *diabetic-nephropathy-etiology; *diabetic-nephropathy-prevention; *diabetic-nephropathy-surgery; *diabetic-nephropathy-therapy; genetic-susceptibility; glucose-blood-level; glucose-homeostasis; kidney-failure; diabetes-mellitus-drug-therapy; diabetes-mellitus-therapy; non-insulin-dependent-diabetes-mellitus-drug-therapy; non-insulindependent-diabetes-mellitus-therapy;hypertension-drug-therapy; risk-factor; microalbuminuria-drug-therapy;microalbuminuria-prevention; proteinuria-; chemoprophylaxis-; diabetic-retinopathy-complication; diabetic-neuropathycomplication; cardiovascular-disease-complication; proton-sodium-exchange; insulin-resistance; kidney-blood-flow; kidney-hypertrophy; metabolicregulation; insulin-treatment; kidney-graft; pancreas-transplantation; 76 Les bases bibliographiques informatisées antihypertensive-therapy; lipid-blood-level; glucose-tolerance-test; protein-restriction; diet-therapy; human-; nonhuman-; clinical-trial; priority-journal;review-DR:glucose-endogenous-compound; antihypertensiveagent-drug-therapy; dipeptidyl-carboxypeptidase-inhibitor-clinical-trial; dipeptidyl-carboxypeptidase-inhibitor-drug-combination; dipeptidylcarboxypeptidase-inhibitor-drug-therapy; albumin-endogenous-compound; ... aminoguanidine-pharmacology; antilipemic-agent-drug-development; antilipemic-agent-drug-therapy; hydroxymethylglutaryl-coenzyme-areductase-inhibitor-drug-therapy; probucol-drug-development; clofibratedrug-development; colestyramine-drug-development; camostat-mesilate-drugtherapy; camostat-mesilate-pharmacology; glycosaminoglycan-drug-development EC: Endocrinology- (3); Urology-and-nephrology (28); Clinicalbiochemistry (29) EL: 03700000000 RN: 50-99-7; 84778-64-3; 17341-25-2; 12408-02-5; 12586-59-3; 9004-10-8; ... 11041-12-6; 58391-37-0; 59721-29-8 EM: therapy- (160); etiology- (135); prevention- (165); heredity- (137); diagnosis- (140); mammal- (738); human- (888); nonhuman- (777); priority-journal (7); review- (1); enzyme- (990) TG: 160; 135; 165; 137; 140; 738; 888; 777; 7; 1; 990 PT: J (Journal-Article) AN: 95343272 Adresses Elsevier Science Secondary Publishing Div. 655 Avenue of the Americas New York, NY 10010 Tel : +1 212 633 3980, Fax : +1 212 633 3975 http: //www.elsevier.nl, Email : [email protected] Elsevier Science B.V. Secondary Publishing Div. Molenwerf 1 1014 AG Amsterdam The Netherlands Tel : + 31 20 580 3507, Fax : +31 20 5803222 Email : [email protected] B) BIOSIS BIOSIS est une association sans but lucratif créée en 1926 et qui maintient une base de données bibliographiques dans le domaine de la médecine et des sciences de la Les autres bases 77 vie. Les disciplines couvertes englobent les disciplines traditionnelles de la biologie (botanique, zoologie, écologie), des domaines interdisciplinaires (biochimie, médecine clinique et pharmacologie) ainsi que des disciplines annexes (méthodologie, instrumentation). La base de données enregistre des références d’articles de revues, de livres ou de monographies, ainsi que des comptes rendus de congrès. Chaque année, environ 540 000 nouvelles références sont ajoutées et fin 1994 la base contenait 10,5 millions de citations. Plusieurs productions sont issues de cette base. – Biological Abstract qui contient des références d’articles contenant le résumé des auteurs issus de 6 500 revues périodiques – Biological Abstract/RRM (Reports, Reviews, Meeting) qui contient entre autres des références de communications à des congrès (130 000 durant l’année 1993). – Zoological Record. Ces produits sont disponibles sous forme papier ou CD-ROM. Un accès télématique est aussi possible avec les produits suivants : BIOSIS Previews, BioBusiness, Zoological Record Online et Toxline. Organisation de la base et format des références Les références sont classées suivant un « major concept heading » et un « subheading » ce qui permet une consultation par grand type de sujet. Une recherche des références peut aussi s’effectuer par : – nom d’auteur – catégorie taxinomique (phylum, classe, ordre, famille) (« biosystematics index ») – organisme décrit par le genre et l’espèce (« generic index ») – sujet (« subject indexes ») Description des enregistrements TI: Controlled trial of fish oil for regression of human coronary atherosclerosis. AU: Sacks-F-M; Stone-P-H; Gibson-C-M; Silverman-D-I; Rosener-B; Pasternak-R-C CS: Dep. Nutr., Harvard Sch. Public Health, 665 Huntington Ave., Boston, MA 02115, USA SO: Journal of the American College of Cardiology 25(7): 1492-1498 PY: 1995 78 Les bases bibliographiques informatisées IS: 0735-1097 LA: English AB: Objectives: This randomized clinical trial tested whether fish oil supplements can improve human coronary atherosclerosis. Background: Epidemiologic studies of populations .... Conclusions: Fish oil treatment for 2 years does not promote major favorable changes in the diameter of atherosclerotic coronary arteries. DE: RESEARCH ARTICLE; HUMAN; EICOSAPENTAENOIC ACID; PLASMA TRIGLYCERIDE; PLASMA CHOLESTEROL; EPIDEMIOLOGY; THERAPEUTIC DIET MJCC: CC13006 (Metabolism-Lipids); CC13008 (Metabolism-Sterols-and-Steroids); CC13218 (Nutrition-Prophylactic-and-Therapeutic-Diets); CC13222 (Nutrition-Lipids); CC14506 (Cardiovascular-System-Heart-Pathology); CC14508 (Cardiovascular-System-Blood-Vessel-Pathology); CC37056 (Public-Health:-Epidemiology-Miscellaneous) MNCC: CC10066 (Biochemical-Studies-Lipids); CC10067 (Biochemical-Studies-Sterols-and-Steroids) BC: BC86215 Hominidae ST: Animals; Chordates; Vertebrates; Mammals; Primates; Humans JA: Biological Abstracts Vol. 100, Iss. 3, Ref. 40817. UD: 9503 Recherche des essais thérapeutiques L’indexation des essais randomisés s’effectue avec le descripteur « Randomized trial ». Cependant, le processus d’indexation s’avère peu performant, ce qui rend impossible la limitation de la recherche à cet unique mot clé. D’une façon générale, l’indexation par mots clés de BIOSIS présente quelques faiblesses conduisant à privilégier fortement la recherche en texte libre. La recherche des essais thérapeutiques découlera donc de la stratégie standard présentée en fin de chapitre. Adresses BIOSIS, 2100 Arch Street Philadelphia, PA 19103-1399 Fax : +1 215 587 2016 eMail : [email protected] http: //www.biosis.org BIOSIS, U.K. 54 Micklegate York, North Yorkshire Y01 1LF, UK Fax : +44 (0) 1904 612 793 eMail : [email protected] http: //www.york.biosis.org Les autres bases 79 C) PASCAL La base de données PASCAL est maintenue par l’INIST (Institut National d’Information Scientifique et Technique) qui dépend du CNRS (voir p. 120). Cette base bibliographiques multidisciplinaire, multilangue couvre la littérature mondiale en science, technologie, médecine. Elle comprend plus de 11 millions de références, avec un accroissement de 700 000 durant l’année 1993. La médecine représente 33% des références, sans compter la biologie (25%). Dix pour cent des références concernent des références de publications en français, 6% en allemand, 8% en russe et 75% en anglais. PASCAL assure une bonne couverture des revues européennes (50%), supérieure à celle des bases d’origine américaine (seulement 40% des revues indexées sont publiées aux USA). La base comporte aussi 7,5% de littérature grise (c’est à dire non publiée de façon traditionnelle). La recherche par termes contrôlés (descripteurs) se fait à partir d’un thesaurus de 80 000 termes traduits en français, anglais et espagnol. Une recherche en texte libre est aussi possible. L’interrogation de cette base est possible à partir de moyens télématiques : par Minitel ou par des serveurs comme Questel ou Dialog. Le Minitel 08 36 29 36 01 permet d’interroger PASCAL sans mot de passe et de commander en ligne des copies des documents souhaités. La facture est effectuée par France Telecom (coût : 9,21 FF la minute). La base est aussi disponible sous CD-ROM chez divers distributeurs. Chaque article est indexé par des mots-clés traduits en trois langues : le français, l’anglais et l’espagnol. Les avantages de PASCAL sont la possibilité d’une interrogation en français et une bonne couverture des revues européennes. La consultation de cette base complète sans aucun doute une recherche MEDLINE et présente un réel intérêt en méta-analyse. Recherche des essais thérapeutiques Le thesaurus de PASCAL qui est non hiérarchique contient quelques termes en rapport avec les essais cliniques : clinical trial, double blind study, randomization, multicenter study. L’indexation des essais thérapeutiques s’avère peu performante et de nombreuses références se rapportant à de véritables essais cliniques randomisés ne sont indexées par aucun de ces mots clés. A partir de cette constatation, il convient de faire principalement une recherche en texte libre. L’utilisation de termes en français est obligatoire pour exploiter cette information présente dans les nombreux résumés écrits en français. Exemple d’enregistrement 11681593 PASCAL No: 94-0541000 The effect of intravesical thiotepa on tumour recurrence after endoscopic 80 Les bases bibliographiques informatisées treatment of newly diagnosed superficial bladder cancer. A further report with long-term follow-up of a Medical Research Council randomized trial Journal: British journal of urology 1994 v 73 n 6 pp 632-638 ISSN: 0007-1331 CODEN: BJURAN Availability: INIST-1050; 354000046434590070 No of Refs: 12 ref. Document Type: P- Serial; A- Analytic Country of Publication: United Kingdom Language: English Objective To determine the role, if any, of one and five instillations of intravesical thiotepa in the treatment of newly diagnosed superficial bladder cancer. Patients and method A multicentre randomized clinical trial was carried out involving 417 patients with newly diagnosed superficial bladder cancer. After transurethral resection the patients were randomized into one of three treatment arms: no thiotepa; one instillation of thiotepa at the time of resection; one instillation at time of resection and then at 3-monthly intervals for one year (giving a total of five instillations). In all treatment arms the dosage was 30 mg thiotepa in 50 ml saline Classification Codes: 002B02R02 English Descriptors: Alkylating agent; Antineoplastic agent; Transitional cell carcinoma; Urinary bladder; Early stage; Local administration; Intra vesical administration; Chemotherapy; Treatment; Human; Multicenter study; Randomization; Aziridine derivatives; Organic thioamidophosphate French Descriptors: Thiotepa; Agent alkylant; Anticancereux; Epithelioma paramalpighien; Vessie urinaire; Stade precoce; Voie locale; Voie intravesicale; Chimiotherapie; Traitement; Homme; Etude multicentrique; Randomisation; Aziridine derive; Thiophosphoramidate organique Spanish Descriptors: Agente alquilante; Anticanceroso; Carcinoma celula transicional; Vejiga; Estadio precoz; Via local; Via intravesical; Quimioterapia; Tratamiento; Hombre; Estudio multicentrico; Aleatorizacion; Tiofosforamidato organico Broad Descriptors: Bladder disease; Urinary system disease; Urinary tract disease; Malignant tumor; Vessie pathologie; Appareil urinaire pathologie; Voie urinaire pathologie; Tumeur maligne; Vejiga patologia; Aparato urinario patologia; Via urinaria patologia; Tumor maligno D) LILACS La base LILACS (LIterature Latino-Americana y del carib en Ciencias de la Salud) crée en 1982 s’intéresse principalement à la littérature médicale latino-américaine. Elle est gérée par un organisme localisé à Sao Paolo : BIREME (Latin American and Caribbean Center on Health Sciences Informations - Biblioteca Regional de Medicina). Cette base indexe des revues publiées en espagnol, portugais et d’autres langues. Elle complète ainsi les bases traditionnelles relativement pauvres en revues provenant de ces pays. L’accès à LILACS reste difficile bien qu’elle soit interro- Les autres bases 81 geable en ligne ou disponible sur CD-Rom. De plus amples renseignements sont disponibles sur le site Internet : http: //www.bireme.br. E) MEDIDOC Produit uniquement sous forme de CD-ROM par l’INIST et l’AUPELF/UREF (Association des Universités Partiellement ou Entièrement de Langue Française) cette base bibliographique recense la littérature scientifique publiée en français dans le domaine biomédical. MEDIDOC comprend plus de 40 000 références issues de plus de 500 titres de périodiques, d’actes de congrès ou de thèses de langue française appartenant non seulement au domaine médical (spécialités médicales et chirurgicales, pharmacologie, santé publique) mais aussi aux sciences biologiques (biochimie) et à la psychologie. Ce CD-ROM est disponible auprès de l’INIST (voir p. 120). F) SCISEARCH SCISEARCH (Science Citation Index) est une base d’un type différent. Elle enregistre pour un article donné, une liste des autres articles dans lesquels il est cité. Le plus souvent utilisé pour calculer la fréquence de citations des publications d’un auteur, et donc son mérite, cette base peut aussi permettre de récupérer des comptes rendus d’essais. En effet un essai cite les travaux antérieurs réalisés dans son domaine. Ce nouvel essai apparaîtra donc dans la liste rattachée à ces précédents travaux. A partir des essais déjà connus, il est donc possible de trouver un article qui les cite mais qui n’est pas enregistré par ailleurs. Dans certaines situations, cette recherche ascendante peut représenter un complément intéressant au moyen plus classique, et ceci peut être utile pour retrouver des publications dans des journaux non couverts par MEDLINE. G) Current Contents Le principe de la base Current Contents diffère de celui des bases bibliographiques vues précédemment. Le but de cette base est de diffuser très rapidement après leur parution les sommaires des revues. Que ce soit sous sa forme en ligne ou diffusée sous forme de disquette, seul un petit nombre d’années est accessible. Cette base n’est pas adaptée aux grandes recherches rétrospectives, mais offre un moyen efficace de surveiller la littérature de manière prospective, dans un but de mise à jour d’une méta-analyse existante. Les Current Contents présentent donc peu d’intérêt pour la recherche initiale d’une méta-analyse. 82 Les bases bibliographiques informatisées H) SIGLE SIGLE (System for Information on Grey Literature in Europe) est une base de données permettant d’accéder à la littérature grise (qualifiée aussi de non conventionnelle ou souterraine) produite en Europe. Le terme littérature grise désigne les documents qui ne sont pas publiés par les voies commerciales classiques de l’édition. Cette littérature grise comprend entre autres : – les rapports des domaines scientifiques, techniques, économiques issus du secteur public ou privé, – les thèses, – les communications à des conférences, – les recommandations ou réglementations techniques, – certains documents officiels, – la documentation technique publicitaire, – les articles imprimés dans certaines revues comme les revues de sociétés savantes non commercialisées ou à diffusion très restreinte. SIGLE a débuté en 1980 et couvre les sciences et techniques pures et appliquées, l’économie et les sciences humaines et sociales. La biologie et la médecine représentant environ 10% des références. En France, l’accès à SIGLE s’effectue par l’intermédiaire de l’INIST (voir page 120) qui gère la participation française à ce projet. I) Les autres bases de la National Library of Medicine La National Library of Medicine (NLM) maintient plusieurs autres bases de données bibliographiques spécialisées 15 . La description de ces bases se trouve sur Internet au niveau du serveur de la NLM accessible par Internet : http: //www.nlm.org. AIDSLINE (AIDS information onLINE) s’intéresse spécifiquement aux publications, quelle que soit la langue, concernant l’infection par le VIH. Elle couvre un large éventail de types de publications, allant des articles de périodiques aux monographies, actes de congrès, thèses, ouvrages. Comme MEDLINE, il s’agit d’une base de données de la NLM. BIOETHICSLINE (BIOETHICS on LINE) couvre les publications en anglais concernant l’éthique, la législation ou les réglementations du domaine de la santé et de la recherche biomédicale. Elle appartient aux bases de données de la NLM. 15 Ainsi que des bases de données factuelles qui ne sont pas mentionnées ici. 83 Les autres bases CANCERLIT (CANCER LITerature) est la base bibliographique de la NLM spécialisée en cancérologie. Elle couvre quelques revues non indexées par MEDLINE, mais la grande majorité de ses références apparaît aussi dans MEDLINE. Autres bases Tableau 8.7. — Liste des bases de la NLM autres que MEDLINE Nom de la base Domaine HEALTH (Health planning and administration) administration du service de santé HISTLINE (History of medecine onLINE) histoire de la médecine POPLINE (POPulation information onLINE) démographie et planning familial SDILINE (Selective Dissemination of Information onLINE) liste des nouvelles références ajoutées à MEDLINE chaque mois SERLINE (SERials onLINE) série du NLM TOXLINE (TOXicology information onLINE) toxicologie TOXLIT (TOXicology LITerature from special sources) toxicologie BIOTECHSEEK biotechnologue DART (Developmental And Reproductive Toxicology) tératologie EMICBACK (Environmental Mutagen Information Center BACKfile) agents mutagènes ETICBACK (Environmental Teratology Information Center BACKfile) tératologie. toxicologie de la reproduction J) Autres disciplines Des bases non médicales issues des domaines de la psychologie, des sciences sociales ou sciences de l’éducation peuvent être éventuellement utiles pour des métaanalyses réalisées sur des thèmes de santé publique ou de psychiatrie. Les plus importantes sont : – PsycINFO : psychologie – AGELINE : gérontologie – DRUGINFO/ Alcohol Use and Abuse : alcoologie – Mental Health Abstracts : psychiatrie 84 Les bases bibliographiques informatisées 8.5. Comparaison des grandes bases biomédicales Le tableau 8.8 compare les caractéristiques des quatre principales bases bibliographiques MEDLINE, EMBASE, PASCAL et BIOSIS. Lorsque l’on étudie le recouvrement des trois grandes bases biomédicales (MEDLINE, EMBASE et BIOSIS), les résultats suivants sont observés : – BIOSIS possède 867 titres non présents dans les deux autres bases, EMBASE 377 et MEDLINE 701, – MEDLINE possède 2 265 titres en commun avec EMBASE et 2 736 avec BIOSIS, – 1 941 titres sont présents dans les trois bases [109]. 8.6. Les moyens d’accès aux bases Ces bases bibliographiques informatisées sont en général accessibles de plusieurs façons. Leur interrogation nécessite de se rendre dans une bibliothèque universitaire ou dans un centre de documentation d’hôpitaux ou de recherche. Les accès télématiques par Minitel ou par Internet permettent maintenant de faire cette interrogation de son bureau. A) Support papier Le support papier est devenu presque anecdotique avec le développement de l’informatique. B) Les serveurs informatiques L’accès à ces bases de données peut s’effectuer en ligne grâce à des prestataires de service qui offrent la possibilité de connections informatiques sur des serveurs donnant accès à une ou plusieurs bases de données. Il s’agit, entre autres, de : Knowledge Finder (http: //www.ariessys.com), CDP-Online, Data-Star, Ovid Technologies (http: //www.ovid.com ), PaperChase (http: //www.paperchase.com ), Dialog, STN, Questel, National Library of Medicine (http: //igm.nlm.nih.gov ). Ces connections qui nécessitent un micro-ordinateur et un modem, peuvent aussi parfois s’effectuer par Minitel en France (Questel16 ) ou plus récemment via Internet ou d’autres réseaux informatiques « grand public ». 16 Le capitole. 55 av des Champs Pierreux. 92029 Nanterre cedex. Tél : +33 (0) 146 145 660. 85 Les moyens d’accès aux bases Tableau 8.8. — Comparaison des bases de données fichier .doc tableau vide 86 Les bases bibliographiques informatisées Des renseignements pratiques peuvent être obtenus sur le serveur Internet du centre documentaire de l’INSERM à Strasbourg à l’adresse : http: //www.inserm.ustrasbg.fr. Les avantages de la liaison directe sont l’accès en ligne à la totalité de l’information des années couvertes et la disponibilité d’une information à jour. Compuserve Knowledge Index, qui est accessible sur le réseau informatique COMPUSERVE, donne accès à 26 bases bibliographiques parmi lesquelles se trouvent : MEDLINE, EMBASE et d’autres bases spécialisées. La facturation des coûts s’effectue par Compuserve, ce qui dispense de contracter un abonnement spécifique auprès du gestionnaire du serveur. Cette souplesse représente le principal intérêt de ce système. Internet Plusieurs sites sur Internet permettent d’accéder à des bases bibliographiques informatisées. Il s’agit soit de sites nécessitant un abonnement préalable et où l’accès est contrôlé par un mot de passe, soit de sites financés par la publicité et offrant un accès gratuit seulement à Medline. Parfois seulement quelques années sont accessibles. Un accès gratuit à tout MEDLINE est possible par http: //www.healthgate.com. La NLM propose directement une interrogation de MEDLINE à l’adresse : http: //www.nlm.org. C) CD-ROM A l’heure actuelle, la plupart de ces bases sont distribuées sur support CD-ROM. Ces produits sont offerts par plusieurs sociétés parmi lesquelles SilverPlatter, Dialog, Knowledge finder, etc. Les avantages de ce support sont liés à la disponibilité locale des informations qui ne dépend pas d’un site central ni d’une connection télématique. Les inconvénients sont représentés par le délai dans la mise à jour qui se fait par envoi de nouveaux disques CD périodiquement, ces délais de distribution se rajoutant aux délais d’intégration des références dans les bases. 8.7. Stratégie « universelle » A) Principe Quelle que soit la base bibliographique consultée, la recherche des essais thérapeutiques randomisés s’appuie sur la même démarche. Plusieurs étapes sont successi- Stratégie « universelle » 87 vement réalisées allant d’une recherche très sélective (et donc très certainement peu exhaustive) à une recherche très large. Cette dernière recherche ramène beaucoup de références non pertinentes mais elle est nécessaire pour détecter de véritables essais randomisés n’utilisant pas les termes consacrés pour décrire leur méthode. Par exemple, la description suivante « les traitements ont été donnés au hasard sans que les patients et les médecins connaissent leur nature réelle » correspond sans ambiguïté à un essai randomisé en double aveugle, mais l’article correspondant ne sera pas détecté par les stratégies de recherche utilisant les termes classiques. Une recherche très large peut espérer détecter cet essai qui sera ensuite identifié par la lecture du résumé (abstract). Dans des domaines donnant lieu à de nombreuses publications, ce type de recherche large rapporte de très nombreuses références impliquant un travail important de lecture et de sélection non automatisée. B) Termes utilisables pour la recherche La liste suivante donne une série de termes en anglais, français, allemand, espagnol et portugais 17 utilisables pour rechercher les essais randomisés classés des plus sélectifs aux plus larges. Ces termes sont à utiliser dans une recherche en texte libre qui présente l’avantage de retrouver à la fois les références utilisant ces termes comme mots-clés mais aussi les références où figurent ces termes dans le texte du titre ou du résumé. – Mots clés retenus par le thésaurus pour désigner un « essai contrôlé randomisé », par exemple : randomized controlled trial*. – controlled study (controlled studies), controlled trial*, essai* contrôlé* – ensaio* controlado* aleatorio*, ensaio* controlado* aleatorio* – random*, aléatoire* – crossover – clinical trial*, essai* clinique*, essai* thérapeutique* – ensaio* clinico*, (clinico or controlado*) and (ensaio* or estudio* or experimento*) – comparative study, comparative studies, étude* comparative* – clin* near trial* – (singl* or doubl* or tripl* ) near (blind* or mask*) 17 ? et * désignent les caractères de substitution qui remplacent respectivement un ou plusieurs caractères. 88 Les registres d’essais cliniques – duplocegos, (duplo or doble or simples or simple or triplo or triple) and (cego or ciego) – doppelblind* – pla? ebo – vs or versus – verum – hasard* – random* near2 (assign* or allocate*) – prospective study, prospective studies – control*, prospectiv*, volunteer* – multicentri*