8. Les bases bibliographiques informatisées

Transcription

8. Les bases bibliographiques informatisées
8.
Les bases bibliographiques informatisées
De par leur puissance, les bases informatiques sont devenues, depuis plusieurs années,
le principal outil de recherche bibliographique. En effet, seul le traitement informatique permet la gestion du volume toujours croissant d’informations que génèrent
les publications scientifiques.
8.1. Généralités
Toutes les bases bibliographiques informatisées suivent le même principe général.
Chaque base enregistre les références bibliographiques d’articles en provenance
d’un certain nombre de revues (revues indexées). Ces enregistrements contiennent
trois grands types d’informations : la référence bibliographique proprement dite
(titres, auteurs, revue, année, volume, numéro et pages), un résumé (abstract) et une
série de mots-clés (ou descripteurs) attribués par l’organisme gérant la base. Ces
mots clés sont choisis parmi ceux d’un thésaurus.
Les moyens disponibles pour consulter ces bases sont divers. Le support papier
est actuellement en voie de disparition, remplacé par la consultation informatisée,
soit à distance par l’intermédiaire d’un moyen télématique (terminal, Minitel, Internet), soit en local à partir de CD-ROM.
A) Type de recherche
Les bases bibliographiques informatisées autorisent deux types de recherche : la
recherche par mots clés et la recherche en texte libre. La recherche par mots clés
utilise les items du vocabulaire standardisé représenté par le thesaurus. Par contre, la
recherche en texte libre recherche des mots quelconques dans le titre ou dans le texte
de l’abstract. Chacune de ces recherches présente des points forts et des limitations
[94].
Recherche par mots clés
L’intérêt de l’utilisation d’un thesaurus réside dans la standardisation des termes
utilisés pour désigner un concept. De plus, il présente une structure hiérarchique
autorisant à partir d’un terme global à rechercher tous les sous-domaines.
58
Les bases bibliographiques informatisées
Cependant, cette approche implique une indexation préalable de l’article, c’est
à dire l’attribution d’un nombre limité de mots clés qui décrivent le mieux la teneur
de la publication. Ce travail est très difficile et souvent il est impossible d’indexer
l’ensemble des aspects d’un travail, ce qui débouche sur la possibilité de faux négatifs. Une autre limitation de cette approche est représentée par le délai d’intégration
des nouveaux concepts ou termes au thésaurus.
Recherche en texte libre
La recherche en texte libre présente une certaine souplesse : il n’est pas nécessaire
de chercher le terme retenu par le thesaurus. Elle permet aussi de s’affranchir de la
codification préalable nécessaire à l’attribution des mots-clés à un article. Si, lors de
cette codification, un aspect de la publication a été omis, la recherche en texte libre
peut permettre de « récupérer » cet oubli.
Les inconvénients résident dans l’absence de gestion des synonymes. Une recherche menée avec un terme particulier ne retrouvera pas les articles qui n’emploient pas ce terme, mais des synonymes. Pour pallier ce problème, il est nécessaire
de multiplier les termes de recherche en utilisant le plus possible de synonymes du
thème recherché. Dans certaines situations, il peut être fastidieux de couvrir l’ensemble des termes synonymes possibles pour un concept donné.
Par contre, ce type de recherche permet de s’adapter rapidement à l’émergence
d’une nouvelle terminologie, qui n’apparaîtra qu’avec retard dans le thesaurus.
Stratégie de recherche
Il est rare qu’un seul terme de recherche suffis à définir le domaine recherché.
Les articles escomptés se définissent le plus souvent par le croisement de plusieurs
concepts. Par exemple, les essais cliniques randomisés de l’interféron dans les maladies auto-immunes se définissent par l’intersection de trois critères : essais cliniques
randomisés, interféron et maladies auto-immunes. Les articles recherchés devront
porter à la fois sur ces trois concepts. Dans cette situation, la recherche fait appel
à une stratégie qui consiste à identifier tous les articles se rapportant aux maladies
auto-immunes, tous ceux traitant de l’interféron, et tous les articles qui sont des
comptes rendus d’essais cliniques randomisés. Les articles recherchés se trouveront
à l’intersection de ces trois groupes : elle s’obtient en ne retenant que les articles
présents dans le premier groupe ET dans le deuxième ET dans le troisième.
Ainsi, les stratégies consistent en des combinaisons de recherche sur différents
concepts par des opérateurs logiques. Les opérateurs les plus courants sont le ET, le
OU, le NON.
– A ET B permet d’obtenir les articles qui traitent à la fois du sujet A et du sujet
B. Par exemple Infarctus du myocarde ET Angioplastie sélectionne
les articles au sujet de l’angioplastie dans l’infarctus du myocarde.
59
Généralités
– A OU B trouve des articles qui traitent soit de A soit de B (séparément ou
ensemble). Infarctus du myocarde OU Angioplastie ramène entre
autres des articles concernant par exemple l’angioplastie fémorale. Par contre,
si l’on souhaite retrouver les articles concernant l’angioplastie coronaire
dans l’angor ou dans l’infarctus du myocarde la sélection appropriée est
Angioplastie ET (Infarctus du myocarde OU Angor).
– A NON B sélectionne les publications qui traitent le sujet A et qui ne traitent
pas du sujet B.
Dans la plupart des recherches, il s’avère nécessaire d’utiliser à plusieurs reprises
ces opérateurs.
B) Sensibilité et spécificité
Deux indices décrivent la qualité d’une recherche bibliographique : la sensibilité et
la spécificité. La sensibilité (« Recall » en anglais) se définit comme la proportion
d’articles retrouvés par rapport au nombre total d’articles présents dans la base qui
concernent le sujet recherché et qui auraient donc du être repérés. Pour reprendre
la terminologie des tests diagnostiques il s’agit du complément à l’unité du taux de
faux négatifs.
Sensibilité =
Nombre de références pertinentes trouvées
Nombre de références pertinentes dans la base
La spécificité (’Precision’) quantifie la pollution de la recherche par des références qui ne se rapportent pas au sujet recherché. En d’autres termes, il s’agit du
complément à l’unité du taux de faux positifs.
Spécificité =
Nombre de références pertinentes trouvées
Nombre total de références trouvées
D’une manière générale, lorsque l’on cherche à augmenter la sensibilité d’une
recherche (afin de ne pas oublier des articles intéressants) la spécificité diminue.
En effet, nous sommes amenés à utiliser des termes de plus en plus généraux et le
nombre de références hors sujet augmente. A l’opposé, une recherche très spécifique
s’avère souvent peu sensible.
Exemple 8.1 Dans une recherche des essais concernant le traitement de l’accident
vasculaire cérébral, Counsell rapporte que la stratégie la plus sensible (qui ne détecte pourtant que 87% des essais) possède une spécificité de seulement 10% [95].
Cette stratégie qui combine 13 termes du thesaurus fournit une liste de 10 000 titres
pour une période de 6 ans, qui doivent être ensuite sélectionnés de façon manuelle.
60
Les bases bibliographiques informatisées
C) Validation de la recherche informatique
La validation d’une stratégie de recherche est un travail difficile mais indispensable.
Cette validation a pour but de s’assurer dans les faits que la stratégie élaborée permet
bien de retrouver le plus grand nombre d’essais thérapeutiques du domaine d’intérêt.
Une façon de la réaliser consiste à effectuer tout d’abord une recherche manuelle
systématique portant sur deux ou trois revues du domaine et limitée à un certain
nombre d’années (entre 5 et 10 ans). Le résultat de cette recherche est ensuite comparé à celui de la recherche informatique. La stratégie est alors modifiée de façon
itérative jusqu’à l’obtention d’une bonne concordance portant principalement sur
la sensibilité (et non sur la spécificité). Après cette phase, la stratégie ainsi validée
pourra être appliquée à l’ensemble de la base informatisée.
D) Recherche des essais thérapeutiques
La procédure de recherche des essais thérapeutiques avec une base bibliographique
informatisée peut se résumer ainsi.
– réalisation d’une stratégie de recherche assez large pour augmenter la sensibilité
(l’exhaustivité),
– cette stratégie se décompose en deux sous-recherches : l’une portant sur
le domaine d’intérêt de la méta-analyse, l’autre recherchant les essais
thérapeutiques. Le résultat final sera le croisement de ces deux sous-recherches,
– la stratégie de recherche des essais doit être la plus large possible afin d’identifier
de véritables essais thérapeutiques qui n’auraient cependant pas été indexés
comme tels. Une recherche n’utilisant que le mot clé du thésaurus désignant un
essai thérapeutique ou un essai randomisé est insuffisante.
– une phase de nettoyage du fichier est ensuite nécessaire, pour éliminer les
vrais faux positifs (références sélectionnées mais qui n’ont rien à voir avec le
domaine d’intérêt ou qui ne sont pas des comptes rendus d’essais cliniques).
L’élimination de références devra être prudente et le bénéfice du doute sera
systématiquement accordé dans les cas limites ou peu clairs. A cette étape du
travail, il est hors de question de faire une sélection fine, en particulier sur les
critères méthodologiques. Il s’agit seulement d’épurer le fichier des références
« parasites » qui peuvent être nombreuses en cas de recherche très large. La
sélection finale des essais (en particulier sur des critères méthodologiques) aura
lieu ultérieurement.
61
MEDLINE
8.2. MEDLINE
MEDLINE est certainement la base de données bibliographiques la plus populaire
dans le domaine biomédical. MEDLINE, dont le nom est la contraction de MEDlars onLINE, désigne le système de distribution qui permet d’accéder à MEDLARS
(MEDical Literature Analysis and Retrieval System), MEDLARS étant le véritable
nom de la base de données qui est l’implémentation informatique de l’ancien Index
Medicus . Elle est gérée par un organisme fédéral des USA : la National Library of
Medicine (NLM).
A) Présentation générale
MEDLINE donne accès à toutes les références de l’Index medicus, et à celles de
« l’International Nursing Index » et de « l’Index to Dental Literature ».
Les articles en provenance d’environ 3 600 périodiques biomédicaux sont référencés. Ces références contiennent le résumé en anglais publié dans la revue dans
70% des cas. Le fichier central est mis à jour toutes les semaines, de janvier à octobre, puis mensuellement pour novembre et décembre. Chaque mois, la base s’enrichit d’environ 31 000 nouvelles citations. En janvier 1993, elle contenait plus de
7,2 millions enregistrements.
B) Description d’un enregistrement MEDLINE
Les différentes informations enregistrées dans MEDLINE apparaissent dans différents champs, qui peuvent ne pas être tous présents pour certaines références [96,
97].
– Le premier champ affiche le numéro unique d’identification de la référence.
– Le titre en anglais suit. Si l’article n’est pas écrit en anglais, une traduction
anglaise du titre apparaît entre crochet suivi du titre dans la langue originelle.
– La liste des auteurs avec leur nom suivi de leurs initiales.
– L’adresse de l’auteur responsable de la correspondance
– La référence bibliographique proprement dite, composée d’une abréviation
standard du nom de la revue, suivie entre parenthèse de sa localisation
géographique. Apparaît ensuite la date du numéro, le numéro du tome suivi entre
parenthèse du numéro dans le volume puis de la première et dernière page de
l’article. Un numéro d’ISSN (numéro international d’identification des revues)
62
Les bases bibliographiques informatisées
Tableau 8.1. — Liste des types de documents
Bibliography
Clinical conference
Clinical trial - phase I
Clinical trial - phase III
Comment
Concensus development conference - NIH
Corrected and republished article
Dictionary
Duplicate publication
English abstract
Guideline
Historical biography
Journal article
Letter
Meta-analysis
News
Periodical index
Published erratum
Retraction of publication
Review - literature
Review - academic
Review - tutorial
Technical report
Classical article
Clinical trial
Clinical trial - phase II
Clinical trial - phase IV
Concensus development conference
Controlled clinical trial
Current biog-obit
Directory
Editorial
Festschrift
Historical article
Interview
Legal brief
Meeting report
Multicenter study
Overall
Practice guideline
Randomized controlled trial
Review
Review of reported cases
Review - multicase
Scientific integrety review
Twin study
– Eventuellement un champ « Note » permettant de mentionner des errata
(« Erratum in ») publiés dans d’autres numéros ou des lettres à l’éditeur se
rapportant à cet article (« Comment in »)
– La langue d’écriture de l’article
– Le champ « Summary Language » précise la langue du résumé originel
– Le champ « Document Type », appelé aussi « Publication type » (PT) se réfère à
la forme de la publication et non pas à son contenu. Environ 40 types différents
sont possibles (voir le tableau 8.1) et certains d’entres eux sont particulièrement
importants en méta-analyse, tel que :
¢ « Clinical trial »,« Clinical trial - phase II », « Clinical trial-phase IV »,
« Controlled clinical trial ».
¢ « Randomized clinical trial » qui désigne le compte rendu d’un essai
thérapeutique randomisé. Ce champ véhicule une information très
importante dans le cadre de la méta-analyse.
¢ « Review » : Revue générale.
¢ « Meta-analysis » : Compte rendu d’une méta-analyse. Ce champ a été créé
en 1993.
63
MEDLINE
– Eventuellement sur la même ligne est mentionnée l’existence d’un résumé en
anglais pour les publications écrites dans une autre langue.
– « Journal announcement » correspond à la date (année suivi du mois) à laquelle
les éditeurs de la revue ont transmis à la NLM ces données.
– « Subfile » identifie les sous fichiers auxquels appartient l’article (AIM, Index
Medicus, etc.).
– L’abstract tel qu’il apparaît dans la publication, tronqué éventuellement à 250
mots (« truncated at 250 words »).
– Le champ « Check Tags » donne des grands marqueurs dont la liste est donnée
dans le tableau 8.2 :
Tableau 8.2. — ’Check Tags’
Animal
Comparative study
Human
Male
Support, U.S. Gov’t, non-P.H.S.
Case report
Female
In vitro
Support, non-U.S. Gov’t
Support, U.S. Gov’t, P.H.S.
– Les « Descriptors » ou mots-clés. Il s’agit de termes issus du thesaurus de
MEDLINE (nommé « MeSH ») attribués à l’article par les indexeurs de la NLM
(la structure du thesaurus MeSH est décrite plus loin). Les descripteurs du thème
central de la référence apparaissent suivis par un astérisque.
– « CAS (Chemical Abstract Service) Registry No. » et « Enzyme Commision
No. » permettent d’identifier avec un code standardisé les médicaments et les
enzymes éventuellement mentionnés dans l’article.
C) Exemple de sortie MEDLINE
92226361
Confronting the issues of patient safety and investigator conflict of
interest in an international clinical trial of myocardial reperfusion. Global
Utilization of Streptokinase and Tissue Plasminogen Activator for Occluded
Coronary Arteries (GUSTO) Steering Committee.
Topol EJ; Armstrong P; Van de Werf F; Kleiman N; Lee K; Morris D; Simoons M;
Barbash G; White H; Califf RM
Department of Cardiology, Cleveland Clinic Foundation, Ohio 44195.
J Am Coll Cardiol (UNITED STATES) May 1992 19 (6) p1123-8 ISSN: 0735-1097
Language: ENGLISH
Document Type: CLINICAL TRIAL; JOURNAL ARTICLE; MULTICENTER STUDY
64
Les bases bibliographiques informatisées
Journal Announcement: 9207
Subfile: AIM; INDEX MEDICUS
The Global Utilization of Streptokinase and Tissue Plasminogen Activator for
Occluded Coronary Arteries (GUSTO) trial is a large scale international trial
of new myocardial reperfusion strategies. The primary hypothesis is
....
Incorporation of these approaches may facilitate the design of future large
scale randomized trials in cardiovascular medicine.
Tags: Human
Descriptors: *Alteplase--Adverse Effects--AE; *Conflict of Interest;
*Coronary Disease--Drug Therapy--DT; *International Cooperation; *Myocardial
Reperfusion--Adverse Effects--AE; *Streptokinase--Adverse Effects--AE;
Coronary Disease--Epidemiology--EP; Drug Industry; Drug Therapy, Combination;
Heparin--Adverse Effects--AE; Interprofessional Relations;
Myocardial Reperfusion--Methods--MT; Myocardial Reperfusion--Statistical and
Numerical Data--SN; Observer Variation; Physician-Patient Relations;
Recombinant Proteins--Adverse Effects--AE; Research Design;
Safety; United States
CAS Registry No.: 0 (Recombinant Proteins); 9005-49-6 (Heparin)
Enzyme No.: EC 3.4.- (Streptokinase); EC 3.4.21.- (Alteplase)
D) Le thesaurus
Chaque enregistrement MEDLINE comporte une série de descripteurs (mots-clés)
qui décrivent le contenu de l’article référencé. Ces mot clés ne sont pas choisis au hasard, mais issus d’un thesaurus nommé MeSH (Medical Subjet Headings) qui comprend environ 17000 termes. Ce thesaurus regroupe de façon hiérarchique les descripteurs [98]. Les descripteurs les moins précis (par exemple, maladies cardiaques)
regroupent des termes plus précis (comme maladies cardiaques ischémiques, insuffisance cardiaque, maladie valvulaire cardiaque, arythmies). Cette structure aboutit
à une arborescence où les termes les plus généraux représentent les grosses branches
et les termes moins précis qui leur sont reliés les petites branches et les feuilles. Cette
structure est matérialisée par la numérotation des termes du MeSH :
D26.74.75
D26.74.75.150
D26.74.75.150.175
D26.74.75.150.175.150
D26.74.75.150.350
D26.74.75.150.700
Anti-inflammatory agents, non-steroidal
Anti-inflammatory agents, gold
Aurothioglucose
Auranofin
Gold thiomalate
Sodium gold thiosulfate
Un autre intérêt du thesaurus réside dans la possibilité d’étendre automatiquement, à partir d’un terme relativement précis, la recherche à tous les autres termes
qui lui sont reliés. Par exemple, imaginons que l’on souhaite chercher les articles
traitant des sels d’or utilisés en rhumatologie. Le terme MeSH qui semble le mieux
correspondre à notre demande est D26.74.75.150 Anti-inflammatory
agent, gold. Cependant il se peut que des articles aient été uniquement indexés
avec des termes plus précis du type D26.74.75.150.175.150 Auranofin.
65
MEDLINE
Tableau 8.3. — Topical subheading
Abnormalities
Analogs & Derivatives
Antagonists & inhibitors
Blood supply
Chemically induced
Complications
Cytology
Diagnostic use
Drug therapy
Embryology
Ethnology
Growth & developpment
Injuries
Isolation & purification
Metabolism
Mortality
Parasitology
Pharmacokinetics
Physiopathology
Psychology
Radionucleide Imaging
Secondary
Statistical & Numerical data
Therapeutic use
Transmission
Ultrasonography
Utilization
Administration & dosage
Analysis
Biosynthesis
Cerebrospinal fluid
Chemistry
Congenital
Deficiency
Diet therapy
Economics
Enzymology
Etiology
History
Innervation
Legislation & jurisprudence
Methods
Nursing
Pathogenicity
Pharmacology
Poisoning
Radiation Effects
Radiotherapy
Secretion
Supply & Distribution
Therapy
Transplantation
Ultrastructure
Veterinary
Adverse effects
Anatomy & histology
Blood
Chemical synthesis
Classification
Contreindications
Diagnosis
Drug effects
Education
Epidemiology
Genetics
Immunology
Instrumentation
Manpower
Microbiology
Organization & Administration
Pathology
Physiology
Prevention & Control
Radiography
Rehabilitation
Standards
Surgery
Toxicity
Trends
Urine
Le thesaurus permet à partir du niveau général Anti-inflammatory agent,
gold d’effectuer aussi automatiquement la recherche avec les termes dépendant de
niveau inférieur (fonction « Explode »).
Des sous-thèmes (Topical SubHeading) complètent les descripteurs en le précisant (leur liste est donnée dans le tableau 8.3). Par exemple, le terme désignant une
maladie peut être complété pour ne plus désigner que l’aspect thérapeutique de la
maladie, ou son diagnostic, etc...
myocardial
myocardial
myocardial
myocardial
myocardial
infarction--drug therapy
infarction--diet therapy
infarction--epidemiology
infarction--physiopathology
infarction--radionuclide imaging
En France, il existe une traduction française du MeSH qui est proposée dans
l’interrogation par Questel ou Minitel.
Dans les références, certains mots-clés apparaissent suivis d’un astérisque qui
identifie les thèmes centraux (« Major concept ») de la publication. Les autres motsclés correspondent à des thèmes abordés par la publication mais de façon accessoire,
qui ne sont pas le principal sujet de l’article. La recherche peut être effectuée uni-
66
Les bases bibliographiques informatisées
quement sur ces ’major concept’, ce qui permet une recherche plus spécifique mais
qui fait aussi courir le risque de la rendre moins sensible.
Le principal problème pratique qui se pose avec le MeSH est de trouver retenu
pour désigner un concept. Pour faciliter cette recherche, des synonymes ont été introduits dans le thesaurus. Ces termes (« Entry terms ») n’appartiennent pas directement à la structure hiérarchique, mais servent de renvoi au bon terme MeSH. Ainsi,
parmi plusieurs synonymes possibles pour désigner un concept, un seul a été retenu,
mais des termes synonymes sont quand même présents dans le vocabulaire afin de
renvoyer au terme choisi.
Néanmoins, il n’est pas toujours aisé de trouver le bon terme. Le choix peut être
aidé en regardant les mots clés qui sont attachés à une ou plusieurs publications déjà
connues, la récupération de ces références s’effectuant par le nom des auteurs, de la
revue, etc.
Un problème survient lorsque l’on s’intéresse à un concept assez général, comme
par exemple les cancers intestinaux. Les articles sont codés avec le terme le plus
précis existant dans le thesaurus, et par exemple, un article traitant du cancer du
colon sera codé avec ce terme et les mots-clés plus généraux n’apparaîtront pas.
Pourtant cet article est pertinent pour la recherche sur les cancers intestinaux. La
solution à ce problème réside dans la possibilité de sélectionner automatiquement
tous les termes qui dépendent d’un concept général (fonction « Explode »). Ainsi,
pour retrouver les cancers intestinaux, la recherche utilisera ce terme et tous les
termes qui en découlent.
8.3. Recherche des essais cliniques avec MEDLINE
A) Les difficultés
Une recherche bibliographique limitée uniquement à une recherche dans une base
informatique comme MEDLINE ne permet pas d’obtenir l’exhaustivité nécessaire
à une méta-analyse. Plusieurs travaux ont comparé, pour un domaine donné, la liste
des essais randomisés retrouvés à partir de MEDLINE avec une liste de références
quasi exhaustive. Cette référence était obtenue en combinant plusieurs sources d’information (autres bases bibliographiques, listes des références d’articles connus,
etc.) et une recherche manuelle systématique dans certaines revues. Même si cette
liste de références ne peut prétendre regrouper l’ensemble des essais randomisés publiés dans un domaine, elle représente en général une liste assez complète des essais
réalisés dans un domaine.
Une revue de 15 travaux de ce type a été publiée par Kay Dickersin et son équipe
de l’université de Baltimore [99]. Globalement, sur l’ensemble de ces travaux, la
Recherche des essais cliniques avec MEDLINE
67
recherche MEDLINE ne permettait de retrouver que 51% de tous les essais randomisés connus. Même en ne retenant dans la liste de référence que les essais publiés
dans une revue indexée par MEDLINE, la sensibilité n’était que de 77%. Ainsi,
en utilisant MEDLINE, il n’est pas possible d’identifier tous les essais randomisés
publiés dans les revues indexées par MEDLINE .
Les raisons possibles de ce manque de sensibilité sont multiples : nombre limité
de revues couvertes par MEDLINE, inadéquation des techniques de recherches, problème d’indexation (thésaurus limité ou non adapté, performance des indexeurs) ou
description insuffisante de la méthodologie par les auteurs [100, 101].
Nous avons vu dans la description de MEDLINE, que ce système ne couvre
qu’une faible partie de tout ce qui est publié à travers le monde dans le domaine
biomédical. MEDLINE ne s’intéresse qu’à 3 700 journaux alors que l’on estime
qu’il existe environ 16 000 périodiques biomédicaux actifs à travers le monde.
La réalisation de recherche de qualité (précise et sensible) nécessite une bonne
connaissance de la structure de MEDLINE, de son thesaurus et des règles d’indexation. Un utilisateur inexpérimenté n’a que peu de chance de retrouver une forte proportion des essais [102]. De plus, si l’on cherche à augmenter la sensibilité de la
recherche, sa spécificité diminue et elle ramène un nombre inacceptable de références non pertinentes [103].
L’indexation des articles ne portait que peu d’attention aux critères méthodologiques jusqu’à une date récente. La première introduction d’un mot-clé ayant trait
à la méthode des essais randomisés a eu lieu en 1978 avec « Random allocation ». Le mot clé « Randomized controlled trials » n’est utilisé que
depuis 1990. Depuis 1992, un essai randomisé n’est plus identifié avec ce mot clé
mais avec le type de publication « Randomized controlled trial » 12 . En
l’absence de mots clé spécifique des essais randomisés les recherches ne peuvent
être que très aléatoires.
De plus, même si les mots-clés adaptés existent, ils peuvent ne pas avoir été
appliqués de façon uniforme par les personnes réalisant l’indexation pour la NLM
(PL Schuyler et al., second international congress on peer review 1993; C Lefebvre,
An evidence-based health care system: the case for clinical trial registries, National
Institutes of Health, 1993, cités dans la réf. [104]. ).
Enfin, les auteurs des publications peuvent ne pas décrire la méthode utilisée de
façon suffisamment précise : il s’avère impossible de savoir si leur travail est ou
n’est pas un essai clinique randomisé.
Toutes ces constatations amènent à conclure qu’il est, à l’heure actuelle, impossible de se contenter d’une seule recherche MEDLINE, pour trouver les données
nécessaires à une méta-analyse. Les différentes limitations que nous venons de voir
conduiraient à un manque important d’information. Il est donc nécessaire d’envisager des procédures et des stratégies complexes de recherche des essais randomisés.
12
Ce point a des implications pratiques dans la façon de formuler les requêtes MEDLINE.
68
Les bases bibliographiques informatisées
Head
ry
entry
entry
Tableau 8.4. — Recherche des essais avec Medline
Recherche des essais cliniques avec MEDLINE
69
B) Les solutions
La recherche des essais thérapeutiques randomisés avec MEDLINE se décompose
en fait en deux parties : la description du domaine d’intérêt et la recherche des essais
[105]. Nous allons voir maintenant quelques « recettes » permettant de rendre aussi
efficaces que possible les recherches MEDLINE [106, 107].
Type de publication
Un premier point auquel il est important de prêter attention dans les recherches d’essais thérapeutiques randomisés avec MEDLINE concerne la codification des essais
au niveau du champ « type de publication ».
Depuis 1992, les rapports d’essais randomisés ne sont plus identifiés par le motclé « Randomized Clinical Trials » mais uniquement dans le champ type
de publication par « Randomized Clinical Trial ». Il devient donc impératif
d’inclure une recherche sur le champ Type de publication dans la stratégie de recherche. En effet si celle ci se limite à une recherche par les mots-clés tous les essais
indexés après 1992 ne seront pas retrouvés. Par exemple l’essai GUSTO est un essai récent de cardiologie dont le compte rendu a été publié dans le New England
Journal of Medicine [108]. Le retrouver ne devrait pas à priori poser beaucoup de
problèmes. Intuitivement les mots clés « Gusto » et « Randomized Clinical
Trials » sont les premiers envisagés. Contre toute attente cette recherche ramène
uniquement des éditoriaux ou des articles discutant GUSTO, et passe sous silence le
compte-rendu de l’essai. Cette publication est par contre retrouvée spécifiquement
avec le mot clé GUSTO combiné au type de publication « Randomized Clinical
Trial ».
Stratégie
Pour obtenir une sensibilité maximale, il convient de combiner des termes plus ou
moins proches du concept d’essais randomisés, mais qui peuvent éventuellement
être utilisés au sujet d’un essai randomisé non reconnu en tant que tel.
Le tableau 8.5 présente une stratégie de recherche mise au point dans le cadre
de la Collaboration Cochrane par Carole Lefebvre [104]. Cette stratégie est divisée
en trois grandes parties (partie I de l’étape 1 à l’étape 8, partie II de 9 à 24 et partie
III de 25 à 34) 13 . L’étape I n’utilise que des termes très précis tandis que l’étape III
utilise des termes très larges.
Dans les instructions de recherche, les termes en majuscule se réfèrent à des mots
du thesaurus. Les mots en minuscule à du texte libre. Les instructions du langage de
sélection apparaissent aussi en minuscule (« in », « explode », « near », etc.).
13
Cette stratégie est décrite en utilisant la syntaxe du logiciel d’interrogation SilverPlatter version
3.10.
70
Les bases bibliographiques informatisées
Tableau 8.5. — Stratégie de recherche des essais cliniques randomisés avec MEDLINE (d’après réf. [104])
Etape
1
2
3
4
5
6
7
8
Phase I
Instructions de recherche
RANDOMIZED-CONTROLLED-TRIAL in PT
RANDOMIZED-CONTROLLED-TRIALS
RANDOM-ALLOCATION
DOUBLE-BLIND-METHOD
SINGLE-BLIND-METHOD
1 or 2 or 3 or 4 or 5
TG=ANIMAL not (TG=HUMAN and TG=ANIMAL)
6 not 7
Etape
9
10
11
12
13
14
15
16
17
18
19
20
21
24
25
26
Phase II
Instructions de recherche
CLINICAL-TRIAL in PT
explode CLINICAL-TRIALS
(clin* near trial*) in TI
(clin* near trial*) in AB
(singl* or doubl* or trebl* or tripl*) near (blind* or mask*)
(13 in TI) or (13 in AB)
PLACEBOS
placebo* in TI
placebo* in AB
random* in TI
random* in AB
RESEARCH-DESIGN
9 or 10 or 11 or 12 or 14 or 15 or 16 or 17 or 18 or 19 or 20
TG=ANIMAL not (TG=HUMAN and TG=ANIMAL)
21 not 22
23 not 8
Etape
25
26
27
28
29
30
31
32
33
34
Phase III
Instructions de recherche
TG=COMPARATIVE-STUDY
explode EVALUATION-STUDIES
FOLLOW-UP-STUDIES
PROSPECTIVE-STUDIES
control* or prospectiv* or volunteer*
(29 in TI) or (29 in AB)
25 or 26 or 27 or 28 or 30
TG=ANIMAL not (TG=HUMAN and TG=ANIMAL)
31 not 32
33 not (8 or 24)
Recherche des essais cliniques avec MEDLINE
71
Dans la première partie, l’étape 1 recherche les essais randomisés à partir du
champ type de publication (PT, « Publication type » ) pour les articles indexés depuis
1992. L’étape 2 recherche par les mots clés (codification des essais randomisés entre
1978 et 1992). Les étapes 3,4 et 5 sont là pour rechercher les publications anciennes,
indexées quand aucun descripteur n’existait pour l’entité essai clinique randomisé.
L’étape 6 permet de trouver l’ensemble des références qui correspondent à au moins
l’un des critères de sélection précédents.
Les étapes 7 et 8 permettent d’exclure les références portant exclusivement sur
des travaux sur l’animal (les travaux portant à la fois sur l’animal et l’humain sont
conservés).
La deuxième partie effectue une sélection plus large, débutant par la recherche
des essais cliniques sans se restreindre aux essais randomisés. L’étape 11 nécessite
quelques explications. L’étoile figurant par exemple dans clin* signifie que tous
mots commençant par clin seront sélectionnés. L’étoile permet de remplacer une
séquence quelconque de caractères. Par exemple ici clin* permettra de retrouver
aussi bien clinical que clinique ou clinics.
L’opérateur « near », que l’on rencontre dans cette étape 11, permet de sélectionner les enregistrements dans lesquels deux mots se trouvent l’un à coté de l’autre.
L’instruction « clinical near trial » recherche l’expression « clinical trial ». Cette
instruction permet donc la recherche d’une séquence de mots.
Dans cette partie seront aussi sélectionnés les enregistrements qui comportent
des termes comme placebo, double ou simple aveugle, randomisation. Il est évident
que cette façon de procéder permet de récupérer des publications de véritables essais
randomisés qui n’emploieraient pas ce terme mais dont le résumé comporterait la
description du plan d’expérience. Il est aussi vrai que cette recherche large ramène
de nombreuses références sans rapport avec des essais randomisés. Ces références
non pertinentes devront être éliminées manuellement par une lecture une à une. Il
apparaît ici que l’élargissement des critères de recherche dans le but de ne récupérer
que quelques références mal indexées se traduit par un travail de nettoyage du fichier
issu de la recherche informatique.
Enfin, la troisième et dernière partie correspond à une recherche très large qui,
après combinaison aux précédentes, assure un haut niveau de sensibilité mais s’accompagne, suivant les domaines, de très nombreux faux positifs. Par exemple, si
le domaine est riche en études épidémiologiques il est probable que celles-ci seront
récupérées par cette dernière partie de la recherche. Cela peut conduire à ne pas l’employer pour éviter une explosion du nombre de références non pertinentes ramenées
par la recherche informatisée.
Sélection du domaine d’intérêt
Le choix des termes pour conduire la recherche du domaine d’intérêt est aussi primordial et nécessite une solide expérience de MEDLINE. Il est important ici aussi
72
Les bases bibliographiques informatisées
que les termes employés soient suffisamment larges pour que la stratégie soit suffisamment sensible [95]. Le manque de spécificité sera ensuite corrigé lors du nettoyage manuel du fichier.
C) Interaction MEDLINE - Collaboration Cochrane
La NLM a collaboré très tôt à la Collaboration Cochrane 14 . En interaction avec le
centre Cochrane de Baltimore, il a été décidé que MEDLINE intégrerait plusieurs
travaux conduits par cette collaboration :
– la codification avec un type de publication PT = « randomized clinical
trial » de tous les rapport d’essais thérapeutiques randomisés retrouvés
dans le cadre des « Groupes de Revue Systématique » (« Systematic review
group »). Si l’essai appartient à un journal qui n’est pas normalement indexé
dans MEDLINE, la référence sera créée.
– la recodification du champ « publication type » pour tous les essais randomisés
anciens (depuis 1948) qui auront été identifiés par une stratégie de recherche
complexe et pas recherche manuelle.
D) Les moyens d’accès
MEDLINE est accessible par différents moyens. Le système informatique de la
NLM peut être interrogé directement avec le logiciel d’interrogation Grateful Med
à travers une connexion informatique dédiée ou à travers Internet. De nombreux
prestataires de services offrent un accès à MEDLINE dont certains se font par l’intermédiaire d’Internet. En France, le prestataire de service QUESTEL se charge de
cette connexion. Un service Minitel (08 36 29 00 36) est aussi disponible en France,
sans abonnement mais il s’avère très onéreux à l’usage. De plus, la lenteur du Minitel
rend impossible les recherches importantes.
La diffusion de cette base sur support CD-ROM est en pleine expansion et se fait
par l’intermédiaire de plusieurs sociétés indépendantes de la NLM.
E) Adresse
MEDLARS management section
National Library of Medicine
8600 Rockville Pike
Bethesda, MD 20894
http: //igm.nlm.nih.gov
14
La Collaboration Cochrane est décrite dans le chapitre 33.
73
Les autres bases
8.4. Les autres bases
Même si MEDLINE s’avère être la base bibliographique la plus populaire dans le
domaine biomédical, elle n’est pas unique. Trois autres bases de données généralistes
EMBASE, BIOSIS et PASCAL existent, tandis que plusieurs autres couvrent des
domaines plus spécifiques (AIDSLINE). D’autres encore concernent des domaines
voisins comme la psychologie (ERIC, Psybase).
A) EMBASE
EMBASE est la version informatisée de la base Excerpta Medica. Elle est gérée par
l’éditeur néerlandais Elsevier.
EMBASE contient plus de 6 millions de références issues de plus de 3 500 journaux publiés dans 110 pays. Elle offre une bonne couverture de la littérature européenne : parmi les 313 journaux biomédicaux publiés en France, EMBASE en
indexe 137 soit 44%, contre seulement 87 (28%) pour BIOSIS, 82 (26%) pour MEDLINE, 28 (9%) pour Science Citation Index et 19 (6%) dans les Current Contents Life Science.
Le délai d’intégration des références est parmi les plus rapides, inférieur à 1 mois.
De plus un fichier express, « EMBASE Alert » récapitule les références dès réception
et avant toute indexation. Sa consultation régulière offre un moyen de veille de la
littérature, à la manière des « Current Contents ».
Le taux de recouvrement avec MEDLINE est estimé à seulement 35-40%. Ce
taux relativement faible est un argument de plus en faveur de la nécessité d’utiliser
plusieurs bases de données bibliographiques pour la recherche des essais et non pas
de se limiter à MEDLINE.
Thesaurus
EMTREE est le vocabulaire standardisé (thesaurus) d’EMBASE qui contient environ 38 500 termes de deux types : des termes médicaux et des dénominations de médicaments. Les médicaments sont indexés dans ce thesaurus sous leur dénomination
standard retenue par l’OMS (World Health Organization’s International Nonproprietary Nomenclature), mais peuvent aussi être retrouvés par un jeu de synonymes à
partir de leur nom commercial, code de développement, ou nom du composé chimique. Dans les enregistrements les mots-clés médicaux apparaissent dans le champ
DE et les mentions de médicaments dans le champ DR. Le mot-clé « Randomized
Controlled Trial » a été introduit en 1994 pour indexer les essais cliniques
randomisés.
74
Les bases bibliographiques informatisées
Tableau 8.6. — "Link terms" appliqués aux termes du thesaurus EMTREE
« Link terms » s’appliquant aux
termes médicaux
médicaments
Complication
Adverse drug reaction
Congenital disorder
Clinical trial
Diagnosis
Drug administration
Drug therapy
Drug analysis
Epidemiology
Drug combination
Etiology
Drug comparison
Prevention
Drug concentration
Radiotherapy
Drug development
Rehabilitation
Drug dose
Side effect
Drug interaction
Surgery
Drug therapy
Therapy
Drug toxicity
Endogenous compound
Pharmaceutics
Pharmacokinetics
Pharmacology
Les termes du thesaurus sont complétés depuis 1988, à la façon des Subheading
de MEDLINE, par des « Link terms » qui sont différents suivant qu’ils qualifient
les termes médicaux ou les dénominations de médicaments (tableau 8.6).
Le terme « Clinical trial » est particulièrement utile en méta-analyse, il permet de cibler la recherche sur les essais d’une molécule, par exemple : « streptokinase-Clinical Trial ».
Un autre thesaurus, EMCLAS a été remplacé par EMTREE en 1988. Cependant les termes les plus généraux sont encore utilisés pour classer les références par
disciplines (comme Physiology ou Surgery, etc.). Cette classification apparaît dans
le champ EC. Cet ancien thesaurus persiste aussi dans le champ EL qui code numériquement les médicaments.
Un troisième thesaurus existe, EMTAGS qui identifie des sujets très larges et
fréquemment recherchés comme le type de l’article, les méthodes expérimentales ou
de laboratoire, les catégories d’âge, les aspects éthiopathogéniques, le type d’étude,
la nature des sujets de l’expérimentation, les organes ou les zones géographiques.
Ces identifiants apparaissent dans le champ EM et sous forme d’un code numérique
dans le champ TG.
Recherche des essais thérapeutiques
Dans EMBASE, les essais thérapeutiques peuvent être recherchés par plusieurs voies :
– en utilisant les mots-clés du thesaurus EMTREE qui sont, du plus précis
au plus large : randomized-controlled-trial, clinical-trial,
Les autres bases
75
controlled-study, major-clinical-study, double-blindprocedure, multicenter-study, phase-3-clinical-trial,
single-blind-procedure, crossover-procedure,
– en complétant une dénomination de médicaments par le « link term »
« -clinical-trial »,
– en utilisant les termes « controlled-study », « major-clinical-study »
du thesaurus EMTAG.
Accès
EMBASE est disponible en ligne par télématique auprès des principaux serveurs
télématiques (OVID online, DIALOG, STN international, DataStar, DIMDI, etc.).
Des versions CD-ROM sont également disponibles.
Description des enregistrements
TI: Diabetic nephropathy: Etiologic and therapeutic considerations
AU: DeFronzo-RA
AD: Diabetes Clinical Research Center, Univ. Texas Health Science Center,
Audie L. Murphy VA Hospital, San Antonio, TX 78284-7886, United States
SO: DIABETES-REV. 3/3 (510-564) 1995
CO: DBRVE
IS: 1066-9442
PY: 1995
CP: United-States
LA: English
LS: English
AB: Diabetic nephropathy is the commonest cause of renal failure in the U.S.,
accounting for one of every three patients entering chronic dialysis
programs. Over the last decade the
....
Treatment with intensified glycemic control and antihypertensive agents,
especially the angiotensin-converting enzyme inhibitors, has been shown to
halt the progression or cause regression of microalbuminuria, indicating the
effectiveness of these therapeutic interventions as primary prevention for
diabetic nephropathy.
DE: *diabetic-nephropathy-complication; *diabetic-nephropathy-drug-therapy;
*diabetic-nephropathy-etiology; *diabetic-nephropathy-prevention;
*diabetic-nephropathy-surgery; *diabetic-nephropathy-therapy;
genetic-susceptibility; glucose-blood-level; glucose-homeostasis;
kidney-failure; diabetes-mellitus-drug-therapy; diabetes-mellitus-therapy;
non-insulin-dependent-diabetes-mellitus-drug-therapy; non-insulindependent-diabetes-mellitus-therapy;hypertension-drug-therapy; risk-factor;
microalbuminuria-drug-therapy;microalbuminuria-prevention; proteinuria-;
chemoprophylaxis-; diabetic-retinopathy-complication; diabetic-neuropathycomplication; cardiovascular-disease-complication; proton-sodium-exchange;
insulin-resistance; kidney-blood-flow; kidney-hypertrophy; metabolicregulation; insulin-treatment; kidney-graft; pancreas-transplantation;
76
Les bases bibliographiques informatisées
antihypertensive-therapy; lipid-blood-level; glucose-tolerance-test;
protein-restriction; diet-therapy; human-; nonhuman-; clinical-trial;
priority-journal;review-DR:glucose-endogenous-compound; antihypertensiveagent-drug-therapy; dipeptidyl-carboxypeptidase-inhibitor-clinical-trial;
dipeptidyl-carboxypeptidase-inhibitor-drug-combination; dipeptidylcarboxypeptidase-inhibitor-drug-therapy; albumin-endogenous-compound;
...
aminoguanidine-pharmacology; antilipemic-agent-drug-development;
antilipemic-agent-drug-therapy; hydroxymethylglutaryl-coenzyme-areductase-inhibitor-drug-therapy; probucol-drug-development; clofibratedrug-development; colestyramine-drug-development; camostat-mesilate-drugtherapy; camostat-mesilate-pharmacology; glycosaminoglycan-drug-development
EC: Endocrinology- (3); Urology-and-nephrology (28); Clinicalbiochemistry (29)
EL: 03700000000
RN: 50-99-7; 84778-64-3; 17341-25-2; 12408-02-5; 12586-59-3; 9004-10-8;
...
11041-12-6; 58391-37-0; 59721-29-8
EM: therapy- (160); etiology- (135); prevention- (165); heredity- (137);
diagnosis- (140); mammal- (738); human- (888); nonhuman- (777);
priority-journal (7); review- (1); enzyme- (990)
TG: 160; 135; 165; 137; 140; 738; 888; 777; 7; 1; 990
PT: J (Journal-Article)
AN: 95343272
Adresses
Elsevier Science
Secondary Publishing Div.
655 Avenue of the Americas
New York, NY 10010
Tel : +1 212 633 3980, Fax : +1 212 633 3975
http: //www.elsevier.nl, Email : [email protected]
Elsevier Science B.V.
Secondary Publishing Div.
Molenwerf 1
1014 AG Amsterdam
The Netherlands
Tel : + 31 20 580 3507, Fax : +31 20 5803222
Email : [email protected]
B) BIOSIS
BIOSIS est une association sans but lucratif créée en 1926 et qui maintient une base
de données bibliographiques dans le domaine de la médecine et des sciences de la
Les autres bases
77
vie. Les disciplines couvertes englobent les disciplines traditionnelles de la biologie
(botanique, zoologie, écologie), des domaines interdisciplinaires (biochimie, médecine clinique et pharmacologie) ainsi que des disciplines annexes (méthodologie,
instrumentation).
La base de données enregistre des références d’articles de revues, de livres ou
de monographies, ainsi que des comptes rendus de congrès. Chaque année, environ
540 000 nouvelles références sont ajoutées et fin 1994 la base contenait 10,5 millions
de citations.
Plusieurs productions sont issues de cette base.
– Biological Abstract qui contient des références d’articles contenant le résumé
des auteurs issus de 6 500 revues périodiques
– Biological Abstract/RRM (Reports, Reviews, Meeting) qui contient entre
autres des références de communications à des congrès (130 000 durant l’année
1993).
– Zoological Record.
Ces produits sont disponibles sous forme papier ou CD-ROM. Un accès télématique est aussi possible avec les produits suivants : BIOSIS Previews, BioBusiness,
Zoological Record Online et Toxline.
Organisation de la base et format des références
Les références sont classées suivant un « major concept heading » et un « subheading » ce qui permet une consultation par grand type de sujet. Une recherche des
références peut aussi s’effectuer par :
– nom d’auteur
– catégorie taxinomique (phylum, classe, ordre, famille) (« biosystematics
index »)
– organisme décrit par le genre et l’espèce (« generic index »)
– sujet (« subject indexes »)
Description des enregistrements
TI: Controlled trial of fish oil for regression of human coronary
atherosclerosis.
AU: Sacks-F-M; Stone-P-H; Gibson-C-M; Silverman-D-I; Rosener-B;
Pasternak-R-C
CS: Dep. Nutr., Harvard Sch. Public Health, 665 Huntington Ave.,
Boston, MA 02115, USA
SO: Journal of the American College of Cardiology 25(7): 1492-1498
PY: 1995
78
Les bases bibliographiques informatisées
IS: 0735-1097
LA: English
AB: Objectives: This randomized clinical trial tested whether fish oil
supplements can improve human coronary atherosclerosis. Background:
Epidemiologic studies of populations
....
Conclusions: Fish oil treatment for 2 years does not promote major
favorable changes in the diameter of atherosclerotic coronary arteries.
DE: RESEARCH ARTICLE; HUMAN; EICOSAPENTAENOIC ACID; PLASMA TRIGLYCERIDE;
PLASMA CHOLESTEROL; EPIDEMIOLOGY; THERAPEUTIC DIET
MJCC: CC13006 (Metabolism-Lipids);
CC13008 (Metabolism-Sterols-and-Steroids);
CC13218 (Nutrition-Prophylactic-and-Therapeutic-Diets);
CC13222 (Nutrition-Lipids);
CC14506 (Cardiovascular-System-Heart-Pathology);
CC14508 (Cardiovascular-System-Blood-Vessel-Pathology);
CC37056 (Public-Health:-Epidemiology-Miscellaneous)
MNCC: CC10066 (Biochemical-Studies-Lipids);
CC10067 (Biochemical-Studies-Sterols-and-Steroids)
BC: BC86215 Hominidae
ST: Animals; Chordates; Vertebrates; Mammals; Primates; Humans
JA: Biological Abstracts Vol. 100, Iss. 3, Ref. 40817.
UD: 9503
Recherche des essais thérapeutiques
L’indexation des essais randomisés s’effectue avec le descripteur « Randomized
trial ». Cependant, le processus d’indexation s’avère peu performant, ce qui rend
impossible la limitation de la recherche à cet unique mot clé. D’une façon générale,
l’indexation par mots clés de BIOSIS présente quelques faiblesses conduisant à privilégier fortement la recherche en texte libre. La recherche des essais thérapeutiques
découlera donc de la stratégie standard présentée en fin de chapitre.
Adresses
BIOSIS, 2100 Arch Street
Philadelphia, PA 19103-1399
Fax : +1 215 587 2016
eMail : [email protected]
http: //www.biosis.org
BIOSIS, U.K.
54 Micklegate York, North Yorkshire
Y01 1LF, UK
Fax : +44 (0) 1904 612 793
eMail : [email protected]
http: //www.york.biosis.org
Les autres bases
79
C) PASCAL
La base de données PASCAL est maintenue par l’INIST (Institut National d’Information Scientifique et Technique) qui dépend du CNRS (voir p. 120). Cette base
bibliographiques multidisciplinaire, multilangue couvre la littérature mondiale en
science, technologie, médecine. Elle comprend plus de 11 millions de références,
avec un accroissement de 700 000 durant l’année 1993. La médecine représente
33% des références, sans compter la biologie (25%). Dix pour cent des références
concernent des références de publications en français, 6% en allemand, 8% en russe
et 75% en anglais. PASCAL assure une bonne couverture des revues européennes
(50%), supérieure à celle des bases d’origine américaine (seulement 40% des revues
indexées sont publiées aux USA). La base comporte aussi 7,5% de littérature grise
(c’est à dire non publiée de façon traditionnelle).
La recherche par termes contrôlés (descripteurs) se fait à partir d’un thesaurus
de 80 000 termes traduits en français, anglais et espagnol. Une recherche en texte
libre est aussi possible.
L’interrogation de cette base est possible à partir de moyens télématiques : par
Minitel ou par des serveurs comme Questel ou Dialog. Le Minitel 08 36 29 36 01
permet d’interroger PASCAL sans mot de passe et de commander en ligne des copies
des documents souhaités. La facture est effectuée par France Telecom (coût : 9,21
FF la minute). La base est aussi disponible sous CD-ROM chez divers distributeurs.
Chaque article est indexé par des mots-clés traduits en trois langues : le français,
l’anglais et l’espagnol. Les avantages de PASCAL sont la possibilité d’une interrogation en français et une bonne couverture des revues européennes. La consultation
de cette base complète sans aucun doute une recherche MEDLINE et présente un
réel intérêt en méta-analyse.
Recherche des essais thérapeutiques
Le thesaurus de PASCAL qui est non hiérarchique contient quelques termes en rapport avec les essais cliniques : clinical trial, double blind study, randomization, multicenter study.
L’indexation des essais thérapeutiques s’avère peu performante et de nombreuses
références se rapportant à de véritables essais cliniques randomisés ne sont indexées
par aucun de ces mots clés. A partir de cette constatation, il convient de faire principalement une recherche en texte libre. L’utilisation de termes en français est obligatoire pour exploiter cette information présente dans les nombreux résumés écrits
en français.
Exemple d’enregistrement
11681593 PASCAL No: 94-0541000
The effect of intravesical thiotepa on tumour recurrence after endoscopic
80
Les bases bibliographiques informatisées
treatment of newly diagnosed superficial bladder cancer. A further report with
long-term follow-up of a Medical Research Council randomized trial
Journal: British journal of urology 1994 v 73 n 6 pp 632-638
ISSN: 0007-1331 CODEN: BJURAN
Availability: INIST-1050; 354000046434590070
No of Refs: 12 ref.
Document Type: P- Serial; A- Analytic
Country of Publication: United Kingdom
Language: English
Objective To determine the role, if any, of one and five instillations of
intravesical thiotepa in the treatment of newly diagnosed superficial bladder
cancer. Patients and method A multicentre randomized clinical trial was carried
out involving 417 patients with newly diagnosed superficial bladder cancer.
After transurethral resection the patients were randomized into one of three
treatment arms: no thiotepa; one instillation of thiotepa at the time of
resection; one instillation at time of resection and then at 3-monthly intervals
for one year (giving a total of five instillations). In all treatment arms the
dosage was 30 mg thiotepa in 50 ml saline
Classification Codes: 002B02R02
English Descriptors: Alkylating agent; Antineoplastic agent; Transitional
cell carcinoma; Urinary bladder; Early stage; Local administration; Intra
vesical administration; Chemotherapy; Treatment; Human; Multicenter study;
Randomization; Aziridine derivatives; Organic thioamidophosphate
French Descriptors: Thiotepa; Agent alkylant; Anticancereux; Epithelioma
paramalpighien; Vessie urinaire; Stade precoce; Voie locale;
Voie intravesicale; Chimiotherapie; Traitement; Homme; Etude multicentrique;
Randomisation; Aziridine derive; Thiophosphoramidate organique
Spanish Descriptors: Agente alquilante; Anticanceroso; Carcinoma celula
transicional; Vejiga; Estadio precoz; Via local; Via intravesical;
Quimioterapia; Tratamiento; Hombre; Estudio multicentrico; Aleatorizacion;
Tiofosforamidato organico
Broad Descriptors: Bladder disease; Urinary system disease; Urinary tract
disease; Malignant tumor; Vessie pathologie; Appareil urinaire pathologie;
Voie urinaire pathologie; Tumeur maligne; Vejiga patologia; Aparato urinario
patologia; Via urinaria patologia; Tumor maligno
D) LILACS
La base LILACS (LIterature Latino-Americana y del carib en Ciencias de la Salud)
crée en 1982 s’intéresse principalement à la littérature médicale latino-américaine.
Elle est gérée par un organisme localisé à Sao Paolo : BIREME (Latin American
and Caribbean Center on Health Sciences Informations - Biblioteca Regional de
Medicina). Cette base indexe des revues publiées en espagnol, portugais et d’autres
langues. Elle complète ainsi les bases traditionnelles relativement pauvres en revues
provenant de ces pays. L’accès à LILACS reste difficile bien qu’elle soit interro-
Les autres bases
81
geable en ligne ou disponible sur CD-Rom. De plus amples renseignements sont
disponibles sur le site Internet : http: //www.bireme.br.
E) MEDIDOC
Produit uniquement sous forme de CD-ROM par l’INIST et l’AUPELF/UREF (Association des Universités Partiellement ou Entièrement de Langue Française) cette
base bibliographique recense la littérature scientifique publiée en français dans le
domaine biomédical. MEDIDOC comprend plus de 40 000 références issues de plus
de 500 titres de périodiques, d’actes de congrès ou de thèses de langue française appartenant non seulement au domaine médical (spécialités médicales et chirurgicales,
pharmacologie, santé publique) mais aussi aux sciences biologiques (biochimie) et
à la psychologie. Ce CD-ROM est disponible auprès de l’INIST (voir p. 120).
F) SCISEARCH
SCISEARCH (Science Citation Index) est une base d’un type différent. Elle enregistre pour un article donné, une liste des autres articles dans lesquels il est cité. Le
plus souvent utilisé pour calculer la fréquence de citations des publications d’un auteur, et donc son mérite, cette base peut aussi permettre de récupérer des comptes rendus d’essais. En effet un essai cite les travaux antérieurs réalisés dans son domaine.
Ce nouvel essai apparaîtra donc dans la liste rattachée à ces précédents travaux. A
partir des essais déjà connus, il est donc possible de trouver un article qui les cite
mais qui n’est pas enregistré par ailleurs. Dans certaines situations, cette recherche
ascendante peut représenter un complément intéressant au moyen plus classique, et
ceci peut être utile pour retrouver des publications dans des journaux non couverts
par MEDLINE.
G) Current Contents
Le principe de la base Current Contents diffère de celui des bases bibliographiques
vues précédemment. Le but de cette base est de diffuser très rapidement après leur
parution les sommaires des revues. Que ce soit sous sa forme en ligne ou diffusée
sous forme de disquette, seul un petit nombre d’années est accessible.
Cette base n’est pas adaptée aux grandes recherches rétrospectives, mais offre
un moyen efficace de surveiller la littérature de manière prospective, dans un but de
mise à jour d’une méta-analyse existante. Les Current Contents présentent donc peu
d’intérêt pour la recherche initiale d’une méta-analyse.
82
Les bases bibliographiques informatisées
H) SIGLE
SIGLE (System for Information on Grey Literature in Europe) est une base de données
permettant d’accéder à la littérature grise (qualifiée aussi de non conventionnelle ou
souterraine) produite en Europe. Le terme littérature grise désigne les documents
qui ne sont pas publiés par les voies commerciales classiques de l’édition. Cette
littérature grise comprend entre autres :
– les rapports des domaines scientifiques, techniques, économiques issus du
secteur public ou privé,
– les thèses,
– les communications à des conférences,
– les recommandations ou réglementations techniques,
– certains documents officiels,
– la documentation technique publicitaire,
– les articles imprimés dans certaines revues comme les revues de sociétés
savantes non commercialisées ou à diffusion très restreinte.
SIGLE a débuté en 1980 et couvre les sciences et techniques pures et appliquées, l’économie et les sciences humaines et sociales. La biologie et la médecine
représentant environ 10% des références. En France, l’accès à SIGLE s’effectue par
l’intermédiaire de l’INIST (voir page 120) qui gère la participation française à ce
projet.
I) Les autres bases de la National Library of Medicine
La National Library of Medicine (NLM) maintient plusieurs autres bases de données
bibliographiques spécialisées 15 . La description de ces bases se trouve sur Internet
au niveau du serveur de la NLM accessible par Internet : http: //www.nlm.org.
AIDSLINE (AIDS information onLINE) s’intéresse spécifiquement aux publications, quelle que soit la langue, concernant l’infection par le VIH. Elle couvre un
large éventail de types de publications, allant des articles de périodiques aux monographies, actes de congrès, thèses, ouvrages. Comme MEDLINE, il s’agit d’une
base de données de la NLM.
BIOETHICSLINE (BIOETHICS on LINE) couvre les publications en anglais
concernant l’éthique, la législation ou les réglementations du domaine de la santé et
de la recherche biomédicale. Elle appartient aux bases de données de la NLM.
15
Ainsi que des bases de données factuelles qui ne sont pas mentionnées ici.
83
Les autres bases
CANCERLIT (CANCER LITerature) est la base bibliographique de la NLM spécialisée en cancérologie. Elle couvre quelques revues non indexées par MEDLINE,
mais la grande majorité de ses références apparaît aussi dans MEDLINE.
Autres bases
Tableau 8.7. — Liste des bases de la NLM autres que MEDLINE
Nom de la base
Domaine
HEALTH (Health planning and
administration)
administration du service de santé
HISTLINE (History of medecine onLINE)
histoire de la médecine
POPLINE (POPulation information
onLINE)
démographie et planning familial
SDILINE (Selective Dissemination of
Information onLINE)
liste des nouvelles références ajoutées à
MEDLINE chaque mois
SERLINE (SERials onLINE)
série du NLM
TOXLINE (TOXicology information
onLINE)
toxicologie
TOXLIT (TOXicology LITerature from
special sources)
toxicologie
BIOTECHSEEK
biotechnologue
DART (Developmental And Reproductive
Toxicology)
tératologie
EMICBACK (Environmental Mutagen
Information Center BACKfile)
agents mutagènes
ETICBACK (Environmental Teratology
Information Center BACKfile)
tératologie. toxicologie de la reproduction
J) Autres disciplines
Des bases non médicales issues des domaines de la psychologie, des sciences sociales ou sciences de l’éducation peuvent être éventuellement utiles pour des métaanalyses réalisées sur des thèmes de santé publique ou de psychiatrie. Les plus importantes sont :
– PsycINFO : psychologie
– AGELINE : gérontologie
– DRUGINFO/ Alcohol Use and Abuse : alcoologie
– Mental Health Abstracts : psychiatrie
84
Les bases bibliographiques informatisées
8.5. Comparaison des grandes bases biomédicales
Le tableau 8.8 compare les caractéristiques des quatre principales bases bibliographiques MEDLINE, EMBASE, PASCAL et BIOSIS. Lorsque l’on étudie le recouvrement des trois grandes bases biomédicales (MEDLINE, EMBASE et BIOSIS),
les résultats suivants sont observés :
– BIOSIS possède 867 titres non présents dans les deux autres bases, EMBASE
377 et MEDLINE 701,
– MEDLINE possède 2 265 titres en commun avec EMBASE et 2 736 avec
BIOSIS,
– 1 941 titres sont présents dans les trois bases [109].
8.6. Les moyens d’accès aux bases
Ces bases bibliographiques informatisées sont en général accessibles de plusieurs
façons. Leur interrogation nécessite de se rendre dans une bibliothèque universitaire
ou dans un centre de documentation d’hôpitaux ou de recherche. Les accès télématiques par Minitel ou par Internet permettent maintenant de faire cette interrogation
de son bureau.
A) Support papier
Le support papier est devenu presque anecdotique avec le développement de l’informatique.
B) Les serveurs informatiques
L’accès à ces bases de données peut s’effectuer en ligne grâce à des prestataires de
service qui offrent la possibilité de connections informatiques sur des serveurs donnant accès à une ou plusieurs bases de données. Il s’agit, entre autres, de : Knowledge Finder (http: //www.ariessys.com), CDP-Online, Data-Star, Ovid Technologies
(http: //www.ovid.com ), PaperChase (http: //www.paperchase.com ), Dialog, STN,
Questel, National Library of Medicine (http: //igm.nlm.nih.gov ). Ces connections
qui nécessitent un micro-ordinateur et un modem, peuvent aussi parfois s’effectuer
par Minitel en France (Questel16 ) ou plus récemment via Internet ou d’autres réseaux
informatiques « grand public ».
16
Le capitole. 55 av des Champs Pierreux. 92029 Nanterre cedex. Tél : +33 (0) 146 145 660.
85
Les moyens d’accès aux bases
Tableau 8.8. — Comparaison des bases de données fichier .doc
tableau vide
86
Les bases bibliographiques informatisées
Des renseignements pratiques peuvent être obtenus sur le serveur Internet du
centre documentaire de l’INSERM à Strasbourg à l’adresse : http: //www.inserm.ustrasbg.fr.
Les avantages de la liaison directe sont l’accès en ligne à la totalité de l’information des années couvertes et la disponibilité d’une information à jour.
Compuserve
Knowledge Index, qui est accessible sur le réseau informatique COMPUSERVE,
donne accès à 26 bases bibliographiques parmi lesquelles se trouvent : MEDLINE,
EMBASE et d’autres bases spécialisées. La facturation des coûts s’effectue par
Compuserve, ce qui dispense de contracter un abonnement spécifique auprès du gestionnaire du serveur. Cette souplesse représente le principal intérêt de ce système.
Internet
Plusieurs sites sur Internet permettent d’accéder à des bases bibliographiques informatisées. Il s’agit soit de sites nécessitant un abonnement préalable et où l’accès est
contrôlé par un mot de passe, soit de sites financés par la publicité et offrant un accès
gratuit seulement à Medline. Parfois seulement quelques années sont accessibles.
Un accès gratuit à tout MEDLINE est possible par http: //www.healthgate.com.
La NLM propose directement une interrogation de MEDLINE à l’adresse : http:
//www.nlm.org.
C) CD-ROM
A l’heure actuelle, la plupart de ces bases sont distribuées sur support CD-ROM.
Ces produits sont offerts par plusieurs sociétés parmi lesquelles SilverPlatter, Dialog,
Knowledge finder, etc.
Les avantages de ce support sont liés à la disponibilité locale des informations
qui ne dépend pas d’un site central ni d’une connection télématique. Les inconvénients sont représentés par le délai dans la mise à jour qui se fait par envoi de nouveaux disques CD périodiquement, ces délais de distribution se rajoutant aux délais
d’intégration des références dans les bases.
8.7. Stratégie « universelle »
A) Principe
Quelle que soit la base bibliographique consultée, la recherche des essais thérapeutiques randomisés s’appuie sur la même démarche. Plusieurs étapes sont successi-
Stratégie « universelle »
87
vement réalisées allant d’une recherche très sélective (et donc très certainement peu
exhaustive) à une recherche très large. Cette dernière recherche ramène beaucoup
de références non pertinentes mais elle est nécessaire pour détecter de véritables
essais randomisés n’utilisant pas les termes consacrés pour décrire leur méthode.
Par exemple, la description suivante « les traitements ont été donnés au hasard sans
que les patients et les médecins connaissent leur nature réelle » correspond sans
ambiguïté à un essai randomisé en double aveugle, mais l’article correspondant ne
sera pas détecté par les stratégies de recherche utilisant les termes classiques. Une
recherche très large peut espérer détecter cet essai qui sera ensuite identifié par la
lecture du résumé (abstract). Dans des domaines donnant lieu à de nombreuses publications, ce type de recherche large rapporte de très nombreuses références impliquant un travail important de lecture et de sélection non automatisée.
B) Termes utilisables pour la recherche
La liste suivante donne une série de termes en anglais, français, allemand, espagnol
et portugais 17 utilisables pour rechercher les essais randomisés classés des plus sélectifs aux plus larges. Ces termes sont à utiliser dans une recherche en texte libre qui
présente l’avantage de retrouver à la fois les références utilisant ces termes comme
mots-clés mais aussi les références où figurent ces termes dans le texte du titre ou
du résumé.
– Mots clés retenus par le thésaurus pour désigner un « essai contrôlé randomisé »,
par exemple : randomized controlled trial*.
– controlled study (controlled studies), controlled trial*, essai* contrôlé*
– ensaio* controlado* aleatorio*, ensaio* controlado* aleatorio*
– random*, aléatoire*
– crossover
– clinical trial*, essai* clinique*, essai* thérapeutique*
– ensaio* clinico*, (clinico or controlado*) and (ensaio* or estudio* or
experimento*)
– comparative study, comparative studies, étude* comparative*
– clin* near trial*
– (singl* or doubl* or tripl* ) near (blind* or mask*)
17
? et * désignent les caractères de substitution qui remplacent respectivement un ou plusieurs
caractères.
88
Les registres d’essais cliniques
– duplocegos, (duplo or doble or simples or simple or triplo or triple) and (cego or
ciego)
– doppelblind*
– pla? ebo
– vs or versus
– verum
– hasard*
– random* near2 (assign* or allocate*)
– prospective study, prospective studies
– control*, prospectiv*, volunteer*
– multicentri*

Documents pareils