Recherche documentaire sur Internet Sommaire

Transcription

Recherche documentaire sur Internet Sommaire
Recherche documentaire sur Internet
Sommaire
Objectifs de ce cours .................................................................................................. 2
Les outils de recherche............................................................................................... 2
Les navigateurs ............................................................................................................................................. 2
Un moteur de recherche .............................................................................................................................. 2
Les Métamoteurs ......................................................................................................................................... 3
L’annuaire..................................................................................................................................................... 3
Un catalogue de bibliothèque ...................................................................................................................... 3
Un répertoire................................................................................................................................................ 4
Base de données ou banque de données bibliographiques ......................................................................... 4
Système de veille : ........................................................................................................................................ 5
Un agrégateur .............................................................................................................................................. 5
Les revues et la recherche documentaire en sciences infirmières .............................. 5
Evaluer des sites Internet ........................................................................................... 6
Déchiffrer une adresse Web ......................................................................................................................... 6
La « toile visible » et la « toile invisible ».................................................................... 7
Ces outils permettent d'obtenir des documents pertinents en évitant le bruit et le
silence. ....................................................................................................................... 8
Les opérateurs booléens .............................................................................................................................. 8
La troncature ................................................................................................................................................ 9
Les limitations .............................................................................................................................................. 9
Champs......................................................................................................................................................... 9
Bruit et Silence ............................................................................................................................................. 9
Le thésaurus ............................................................................................................................................... 10
ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia
Page 1
Objectifs de ce cours
L’étudiant devra à parti de ce cours :
•
Localiser un document à distance
•
Analyser une information médicale en ligne
•
Recherche des définitions fiables pour les sciences infirmières
•
Hiérarchiser du contenu à partir de site Internet de base de données
•
Utiliser des ressources institutionnelles pour ses travaux
•
Responsabiliser ses recherches en citant ses sources
Les outils de recherche
Une fois vous avez cerné votre sujet de recherche à partir de vos propres connaissances pour les
confronter avec d’autres sources (professionnelles et/ ou scientifiques), la construction d’une liste de mots
clés sera nécessaire pour effectuer des requêtes appropriées sur des moteurs de recherche 1.
Il est alors important de concevoir quelles sont les modalités pratiques pour :
• Connaitre les différents navigateurs, la différence entre un moteur de recherche généralisé, un
moteur de recherche spécialisé, un méta moteur, un annuaire, un répertoire, un catalogue et une
base de données
• effectuer une veille documentaire et
• repérer les lieux de recherche spécifiques (centres de documentation CNUDST ou organismes
spécialisés, Bibliothèques spécialisées, sites certifiés…).
Les navigateurs
Un navigateur web est un logiciel conçu pour consulter le World Wide Web (www).
Techniquement, en utilisant le protocole Hypertext Transfer Protocol (http). Il existe de nombreux
navigateurs web, pour toute sorte de matériels (ordinateur personnel, tablette tactile, téléphones mobiles,
etc.) et pour différents systèmes d'exploitation (Linux, Windows, Mac OS…). Les plus utilisés en 2012
sont : Google Chrome, Mozilla Firefox, Internet Explorer, Safari et Opera
Le terme navigateur Web est inspiré de Netscape Navigator. Le premier terme utilisé était browser, comme
en anglais. Au Québec, il est appelé fureteur.
Un moteur de recherche
C’est une application web permettant de retrouver des ressources (pages web, articles de
forums Usenet, images, vidéo, fichiers, etc.) associées à des mots quelconques. Certains sites
web offrent un moteur de recherche comme principale fonctionnalité ; on appelle alors moteur de
recherche le site lui-même (Google Video par exemple est un moteur de recherche vidéo). Le moteur de
recherche spécialisé dans le domaine de la santé est Google Scholar. http://scholar.google.fr/ . C'est par
abus de langage qu'on appelle également moteurs de recherche des sites web proposant des annuaires. Ce
sont des instruments de recherche élaborés par des personnes qualifiées , qui répertorient et classifient
1
Recherche documentaire http://sidoc.fr/node/570 visité le 01/09/2012
ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia
Page 2
des sites web jugés dignes d'intérêt, et non des robots d'indexation — on peut citer par
exemple Voilà et Yahoo! etc.
Les moteurs de recherche ne s'appliquent pas qu'à Internet : certains moteurs sont des logiciels installés
sur un ordinateur personnel (PC). Ce sont des moteurs dits desktop qui combinent la recherche parmi les
fichiers stockés sur le PC et la recherche parmi les sites Web — on peut citer par exemple Exalead
Desktop, Google Desktop et Copernic Desktop Search, etc.
Les Métamoteurs
On trouve également des métamoteurs, c'est-à-dire des sites web où une même recherche est
lancée simultanément sur plusieurs moteurs de recherche (les résultats étant ensuite fusionnés pour être
présentés à l'internaute) — on peut citer
Ixquick, https://www.ixquick.com/fra/
Mamma, http://www.mamma.com/
Kartoo, http://www.kartoo.com/
Seek.fr, http://www.seek.fr/
metacrawler etc. http://metacrawler.com
L’annuaire
Un annuaire web, répertoire web, annuaire Internet ou répertoire Internet est un site web proposant
une liste classée de sites Web. Contrairement aux moteurs de recherche, la classification dans les
annuaires est réalisée par des humains. Le classement se fait typiquement dans une arborescence de
catégories, censée couvrir tout ou partie des centres d'intérêt des visiteurs. Chaque catégorie contient :
•
•
des sous-catégories concernant des aspects plus pointus d'un sujet donné ;
des hyperliens vers les sites agrémentés d'une description.
L'Open Directory Project (ODP), plus connu sous le nom de dmoz est un répertoire de sites web créé
en 1998, sous licence Open Directory. C'était aussi le répertoire de Google. http://www.dmoz.org/ . Le
répertoire de yahoo est http://dir.yahoo.com/
Un catalogue de bibliothèque
Il sert à faciliter la recherche des livres qui se trouvent dans une bibliothèque, ou de plusieurs
bibliothèques dans le cas des catalogues collectifs et des catalogues virtuels. Leur version informatisée, le
plus souvent, se présente sous forme de base de données. Le catalogue est destiné à identifier les
documents (décrits dans des notices2) et à faciliter leur recherche ou leur localisation. Le catalogage
consiste à analyser le document en tant que support. Le catalogage fait partie des deux opérations
intellectuelles nécessaire à la constitution d'un catalogue : catalogage (Description physique)
& indexation (Description intellectuelle). Je cite par exemple Le catalogue du Système Universitaire
de Documentation http://www.sudoc.abes.fr/
2
Une notice bibliographique est une fiche qui décrit un objet (document) manipulé dans une bibliothèque, traditionnelle ou
numérique : livre, fascicule, article etc. Elle comporte un ensemble d'indications permettant de l'identifier, de le localiser ou de le décrire
sommairement
ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia
Page 3
Un répertoire
C‘est un outil de collecte de données, initialement d'adresses ou de noms de personnes. C'est
un instrument de recherche présentant des informations, quel qu'en soit le support, classées par ordre
alphabétique, numérique, chronologique ou systématique pour l'identification, la description ou la
localisation de personnes, de documents, d'organismes, de lieux, de ressources Web ou d'objets. Dans les
domaines des ressources humaines et de la formation, un Référentiel de compétences est un répertoire
de compétences nécessaires pour tenir un poste, une fonction ou un métier. Exemple le référentiel de
compétences des infirmiers.
Base de données ou banque de données bibliographiques
Les bases de données bibliographiques répertorient toute catégorie d'objets bibliographiques : livres,
collections, revues, articles de revues etc. Elles sont le fruit de l'informatisation des catalogues de
bibliothèque, et permettent des recherches à l'aide de mots-clefs (titre, auteur, etc.) ainsi que l'analyse des
données (bibliométrie, etc.). Exemples
•
•
•
•
•
•
•
•
•
•
WorldCat 3 http://worldcat.org./
un catalogue de bibliothèque : RERO http://opac.rero.ch/gateway
une bibliographie : Eric Education Ressource Information Center(version gratuite)
http://www.eric.ed.gov/
des périodiques : Des revues scientifiques et universitaires en texte intégral validées, accessibles
gratuitement, couvrant toutes les disciplines et de nombreuses langues Directory of Open Access
Journals http://www.doaj.org/doaj?func=home
une collection de documents : Google scholar http://scholar.google.com/
un ouvrage de référence : Grand Robert électronique http://gr.bvdep.com/
Pubmed est l’interface de la bibliothèque médicale Américaine. Il s’agit de résumé d’article
mais les textes intégrales e en langue française existent:
http://www.ncbi.nlm.nih.gov/pubmed
La Banque de données en santé publique (BDSP) est un réseau documentaire d'informations en
santé publique http://www.bdsp.ehesp.fr/
Portail de la santé publique française http://www.anasys.org/
La base Cochrane en langue française : http://cochrane.fr/
Comment
interroger
une
banque
de
données
?
Il n'est pas si facile d'y trouver une information complète et pertinente. Vous devrez vous
familiariser avec le système d'interrogation propre à chaque banque, mais surtout apprendre à
exploiter son contenu. Pour une bonne stratégie de recherche documentaire, vous devez :
•
•
•
3
bien délimiter votre sujet, en étudiant les concepts concernés de votre discipline.
choisir des mots-clés exprimant votre recherche et correspondant au vocabulaire d'indexation
de la banque. Les termes spécifiques et précis sont à essayer en priorité. dans certains cas,
apprendre à utiliser les opérateurs logiques (et, ou, sauf).
ne pas hésiter à modifier les termes de votre question si les réponses ne sont pas satisfaisantes
: utiliser des synonymes ou des termes plus généraux en cas de réponses insuffisantes, prévoir
des moyens de limiter la question (par date, par pays, par langues..) en cas de résultats trop
nombreux.
WorldCat est la base de données bibliographiques en ligne de l’OCLC (Online Computer Library Center)
ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia
Page 4
Chaque base de données a une interface de recherche 4 qu’il faut savoir interroger. Exemple Pubmed pour
Medline et Web of Knowledge pour Web of science etc…
Système de veille :
Afin d’être à jour sur votre sujet de recherche faite la veille documentaire.
•
•
•
La création d’Alerte sur Google en mettant votre mot-clé: http://www.google.com/alerts?hl=fr
La création d’alerte sur la plateforme des éditeurs à partir de votre sujet de recherche
L’abonnement au flux RSS 5. Un flux RSS est une ressource Web dont le contenu est produit
automatiquement en fonction des mises à jour d’un site Web. Vous avez besoin d’un agrégateur
sur votre navigateur pour les lire. Le navigateur Mozilla Firefox est doté d’un lecteur de Flux RSS
Un agrégateur
Il s’agit d’un logiciel permettant de suivre plusieurs fils de syndication6 en même temps. Il prévient
de la mise à jour d'un site web ou des actualités qu'il publie (par notification sonore, visuelle, etc.).
Également, il importe le contenu nouveau en question et il le fait pour un ensemble de sites.
Les revues et la recherche documentaire en sciences infirmières
Echantillon de Quelques périodiques :
•
APORIA (Canada) http://www.oa.uottawa.ca/journals/aporia/?lang=fr
•
•
•
•
KRANKENPFLEGE (suisse) est la revue spécialisée la plus lue en Suisse dans le domaine des soins http://www.sbk-asi.ch/
Recherche en soins infirmiers (RSI) éditée par ARSI http://www.asso-arsi.fr/
L’infirmière clinicienne (revue électronique canadienne) http://revue-infirmiereclinicienne.uqar.ca/
Savoirs et sciences infirmières (Elsevier Masson) http://www.emconsulte.com/article/221335/introduction-a-la-recherche-en-sciences-infirmiere
L’infirmière canadienne http://www.cna-aiic.ca/fr/formation-continue/linfirmiere-cliniciennespecialisee-et-linfirmiere-praticienne/
JALMALV (jusqu’à la mort, accompagnant la vie) http://www.jalmalv.fr/do.php?n=Home.Accueil
Objectif soins (édition Lamare-wolterskluwer) http://www.wolterskluwerfrance.fr/
Perspective infirmière (ordre des infirmiers du Quebec)
http://www.oiiq.org/publications/perspective-infirmiere
Perspective soignante (édition Seli Arslan) http://www.praqsi.org/praqsi-nos-publications.php
Laennec (édité par centre Laennec) http://www.jesuites.com/actu/2011/laennec.htm
•
•
•
•
•
•
4
Interface de recherche est un Système qui permet le dialogue entre un utilisateur et un ordinateur au moyen de menus,
formulaires, liens hypertexte, etc
5
RSS (sigle venant de l'anglais « Really Simple Syndication ») est une famille de formats de données basés sur XML et
utilisés pour la syndication de contenu Web.
6
La syndication de contenu Web est une forme de syndication dans laquelle une partie d'un site est accessible depuis d'autres sites. Cela est
possible en y ajoutant une licence accordée à ses utilisateurs
ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia
Page 5
•
•
Santé mentale (société Acte Presse) http://www.santementale.fr/
Pratique et organisation des soins : http://www.ameli.fr/l-assurance-maladie/statistiques-etpublications/la-revue-pratiques-et-organisation-des-soins/
Evaluer des sites Internet
Le premier indice vous sera fourni par la nature et la fiabilité du site d'accueil, élément important
d'appréciation sur la qualité des informations apportées. De prime abord, la lecture de l'adresse du site,
qu'il faut apprendre à déchiffrer, orientera votre jugement.
Déchiffrer une adresse Web
L'adresse d'une page sur un site web, souvent désignée par le sigle URL 7indique généralement: la
méthode d'accès (http 8, telnet9, ftp 10), le nom du serveur, le nom du domaine et sous-domaine,
éventuellement le répertoire et le nom du fichier correspondant au document. Exemples :
Abréviation
Interprétation
.tn,.fr, .ca, .de, .it
abréviation du nom du pays (Tunisie, France, Canada, Allemagne, Italie...)
.edu
université américaine - ex : <http://www.georgetown.edu/>
.com
site commercial
.gov
organisme gouvernemental
.univ- .... .fr
université française - ex: <http://www.mshs.univ-poitiers.fr>
.asso.fr
association française - ex: <http://www.societes-savantes-toulouse.asso.fr/>
Comparaison des ressources sélectionnées par trois robots de recherche "académiques"
Exemple : quels sont les résultats trouvés pour les mots- clés Soins palliatifs = Palliative care
Google Scholar = http://scholar.google.com/ - (456 000 résultats trouvés)
Oaister 11 = http://www.oclc.org/fr/fr/default.htm = (7 résultats trouvés)
Portail Sudoc = http://www.sudoc.abes.fr/ (855- résultats trouvés)
Pour chacun des moteurs de recherches, vous observez la première page de résultats
- Comparez ces résultats et dégagez les caractéristiques principales des réponses fournies par chaque
outil ?
- Quel est celui dont les résultats sont les plus intéressants pour votre recherche et pourquoi ?
Essayez de répondre à cet exercice.
7
8
9
URL = Uniform Resource Locator
http = hyper text laguage protocole. C’est le protocole de navigation
Telnet (TErminal NETwork ou TELecommunication NETwork, ou encore TELetype NETwork) est un protocole réseau utilisé sur tout réseau
prenant en charge le protocole TCP/IP ( Transfert Control Protocol/ Internet Protocole)
10
11
FTP= file transfert protocole
Oaister : Fondé en 1967, OCLC Online Computer Library Center est un organisme de recherche à but non lucratif qui offre des
services aux bibliothèques afin qu'elles puissent accroître leur accès à l'information mondiale tout en réduisant leurs coûts
ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia
Page 6
Voici quelques critères de validité à considérer 12 :
Contenu
*Le contenu du site montre-t-il un thème traité avec une profondeur suffisante?
*Le niveau est-il approprié à votre travail ? L'expression est-elle trop compliquée, trop spécialisée ou trop simple au
contraire?
*Est-ce que le site articule de l'information de type "recherche", "éducation", "savante ou scientifique" avec un
produit commercial ou un service de promotion -vente (publicité)?
*L'information n'est-elle pas, périmée, obsolète?
Sources
et date
*Le site est-il mis à jour ? la page datée et signée ? Vérifier aussi ces éléments dans la bibliographie citée. Y-a-t-il
suffisamment de références à d'autres travaux?
* S'agit-il d'une source stable, produite et mise à jour par un organisme reconnu, une université, une bibliothèque?
*Les auteurs du site sont-ils des chercheurs ou des spécialistes dans ce domaine? Appartiennent-ils à des sociétés
savantes, des institutions, des organismes reconnus? Peut-on vérifier leurs qualités et identifier leur établissement
de rattachement? Peut-on trouver certaines de leurs publications dans des livres, des périodiques ou d'autres
documents multimedia? Sont-ils cités dans des bibliographies spécialisées?
*Si la page est trouvée à l'aide d'un moteur (ou d'un robot) elle apparaît sortie de son contexte. Vérifier
soigneusement son contenu. Ne pas hésiter à remonter jusqu'à la page d'accueil du site pour bien vérifier
l'appartenance de la page. Consulter aussi le plan du site ou le sommaire. Ces outils permettent d'avoir une vue
d'ensemble du contenu.
Divers
*L'information est-elle gratuite ou payante?
*Vérifiez les qualités formelles de la page ou du site : la lisibilité, la qualité de l'expression et de l'orthographe.
*Dispose-t-on de fonctionnalités de recherche, sommaire, index ou plan de site?
*A-t-on besoin de télécharger des utilitaires pour lire et utiliser le site ou certaines pages?
Outils de
recherche:
répertoire
Répertoire de liens sur la qualité des services en ligne : http://www.temesis.com/
La « toile visible » et la « toile invisible »
On parle souvent de la toile visible et de la toile invisible sur le web, mais qu'est-ce que cela signifie ?
En fait une part importante des ressources Internet n'est pas explorée par les robots des moteurs (soit
parce les pages sont en accès réservé, soit parce qu'elles appartiennent aux banques de données).
Schématiquement:
•
la Toile visible peut être assimilée à celle explorée par les moteurs type Google.
•
La Toile invisible est donc la partie complémentaire non accessible aux moteurs classiques, donc les
pages appartenant aux banques de données ( Medline, Inist, Cismef...) et toutes les pages en accès
réservé ( pages à accès professionnel restreint, aux abonnés d'un journal, aux membres d'une
association…).
En pratique les robots ont fait des progrès et arrivent maintenant à lire les notices de Medline et autres
base de donnée, alors, Pourquoi cette distinction ? Tout simplement parce que pour explorer la toile
invisible on ne pourra pas passer par un moteur de recherche.
12
http://urfist.enc.sorbonne.fr/cerise/cerTDeco.htm Maj 17-01-06, visité le 02/09/2012
ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia
Page 7
Ces outils permettent d'obtenir des documents pertinents en
évitant le bruit et le silence.
La majorité des interfaces de recherche vous proposent les outils suivants 13 :
•
•
•
Les opérateurs booléens permettent la combinaison de termes ou de concepts en vue d'augmenter
ou de diminuer le nombre des résultats. (et, ou, sauf)
La troncature (truncation, wild card) permet d'exprimer en une seule fois toutes les formes d'un
terme : singulier, pluriel, terminaisons diverses, variations orthographiques internes. Elle élargit la
recherche (*, ?). Exemple inf*
Les limitations servent à préciser une recherche et à rétrécir ou élargir le nombre des résultats. On
trouve différents types de limitations : de champs, de dates, de types de documents, etc.
Les opérateurs booléens
Opérateurs
Effets de leur emploi
•
Additionne les termes
(synonymes ou quasisynonymes) exprimant un
même concept
•
Combine deux concepts
différents
Diminue le nombre de
résultats et les rend plus
précis
OU /
OR
ET /
AND
•
•
SAUF
/ NOT
/AND
NOT
13
•
•
Exclut un ensemble de
documents du sujet
recherché
Diminue le nombre de
résultats
Attention aux documents
pertinents qui risquent d'être
exclus dans l'opération !
Autoformation :http://www.unige.ch/biblio/ses/afbdd00.html
ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia
Page 8
La troncature
Il faut déterminer les signes de troncature spécifiques à l'interface : * ? + et déterminer
précisément la longueur du radical :
Longueur
Effets de leur emploi
Trop court
Provoquera du bruit
Trop long
Provoquera du silence
Exemples
cat* = catastrophe, catapulte, cathédrale....alors que
vous cherchiez "catholique"...
Juste
racism* = racisme, racismes, mais pas "racial"
réfugié* = réfugié-és-ée-ées
Les limitations
Types de limitations
Recherche sans limitations
Limitations de champs, dates,
langues, types de publications,
etc.
Effets de leur emploi
Exemples à cliquer
Risque de bruit
Augmente la pertinence
Diminue le nombre des
résultats
Champs
Nom donné aux différentes parties de la référence : champ auteur, champ titre, champ sujet
(descripteur), etc. Chaque champ est désigné par une étiquette : Auteur (AU), Titre (TI),
Descripteurs (DE), etc. Selon les interfaces, appelés aussi Field, Catégories, etc.
Bruit et Silence
Le Bruit : références hors sujet obtenues à la suite d'une interrogation trop large.
Le Silence : références pertinentes manquées à la suite d'une recherche trop étroite, alors qu'elles
existent dans la base.
ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia
Page 9
Le thésaurus
Le thésaurus est la liste des mots-sujets ou descripteurs attribués aux documents, organisés
hiérarchiquement. Chaque descripteur est accompagné des termes ayant une signification
commune (son environnement sémantique) :
relations hiérarchiques :
termes génériques ( broader termes)
termes spécifiques (narrower terms)
relations d'équivalence :
termes employés pour un autre (employé pour, seen from, used for)
relations d'association :
termes voisins (related terms, see also)
Exemple mots clé “urgences” sur Cismef 14 : description
14
Cismef : catalogue et index des sites médicaux de langue Française www.cismef.org
ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia
Page 10
Exemple mots clé “urgences” sur le portail de terminologie de Cismef : Mesh inserm
L’arborescence « d’urgences » : hiérarchie
Concernant les ressources, après avoir choisi les qualificatifs pour mieux affiner la recherche vous cliquez
sur Cismef pour les ressources françaises ou Pubmed pour la base médicale américaine Medline en Anglais
ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia
Page 11