Recherche documentaire sur Internet Sommaire
Transcription
Recherche documentaire sur Internet Sommaire
Recherche documentaire sur Internet Sommaire Objectifs de ce cours .................................................................................................. 2 Les outils de recherche............................................................................................... 2 Les navigateurs ............................................................................................................................................. 2 Un moteur de recherche .............................................................................................................................. 2 Les Métamoteurs ......................................................................................................................................... 3 L’annuaire..................................................................................................................................................... 3 Un catalogue de bibliothèque ...................................................................................................................... 3 Un répertoire................................................................................................................................................ 4 Base de données ou banque de données bibliographiques ......................................................................... 4 Système de veille : ........................................................................................................................................ 5 Un agrégateur .............................................................................................................................................. 5 Les revues et la recherche documentaire en sciences infirmières .............................. 5 Evaluer des sites Internet ........................................................................................... 6 Déchiffrer une adresse Web ......................................................................................................................... 6 La « toile visible » et la « toile invisible ».................................................................... 7 Ces outils permettent d'obtenir des documents pertinents en évitant le bruit et le silence. ....................................................................................................................... 8 Les opérateurs booléens .............................................................................................................................. 8 La troncature ................................................................................................................................................ 9 Les limitations .............................................................................................................................................. 9 Champs......................................................................................................................................................... 9 Bruit et Silence ............................................................................................................................................. 9 Le thésaurus ............................................................................................................................................... 10 ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia Page 1 Objectifs de ce cours L’étudiant devra à parti de ce cours : • Localiser un document à distance • Analyser une information médicale en ligne • Recherche des définitions fiables pour les sciences infirmières • Hiérarchiser du contenu à partir de site Internet de base de données • Utiliser des ressources institutionnelles pour ses travaux • Responsabiliser ses recherches en citant ses sources Les outils de recherche Une fois vous avez cerné votre sujet de recherche à partir de vos propres connaissances pour les confronter avec d’autres sources (professionnelles et/ ou scientifiques), la construction d’une liste de mots clés sera nécessaire pour effectuer des requêtes appropriées sur des moteurs de recherche 1. Il est alors important de concevoir quelles sont les modalités pratiques pour : • Connaitre les différents navigateurs, la différence entre un moteur de recherche généralisé, un moteur de recherche spécialisé, un méta moteur, un annuaire, un répertoire, un catalogue et une base de données • effectuer une veille documentaire et • repérer les lieux de recherche spécifiques (centres de documentation CNUDST ou organismes spécialisés, Bibliothèques spécialisées, sites certifiés…). Les navigateurs Un navigateur web est un logiciel conçu pour consulter le World Wide Web (www). Techniquement, en utilisant le protocole Hypertext Transfer Protocol (http). Il existe de nombreux navigateurs web, pour toute sorte de matériels (ordinateur personnel, tablette tactile, téléphones mobiles, etc.) et pour différents systèmes d'exploitation (Linux, Windows, Mac OS…). Les plus utilisés en 2012 sont : Google Chrome, Mozilla Firefox, Internet Explorer, Safari et Opera Le terme navigateur Web est inspiré de Netscape Navigator. Le premier terme utilisé était browser, comme en anglais. Au Québec, il est appelé fureteur. Un moteur de recherche C’est une application web permettant de retrouver des ressources (pages web, articles de forums Usenet, images, vidéo, fichiers, etc.) associées à des mots quelconques. Certains sites web offrent un moteur de recherche comme principale fonctionnalité ; on appelle alors moteur de recherche le site lui-même (Google Video par exemple est un moteur de recherche vidéo). Le moteur de recherche spécialisé dans le domaine de la santé est Google Scholar. http://scholar.google.fr/ . C'est par abus de langage qu'on appelle également moteurs de recherche des sites web proposant des annuaires. Ce sont des instruments de recherche élaborés par des personnes qualifiées , qui répertorient et classifient 1 Recherche documentaire http://sidoc.fr/node/570 visité le 01/09/2012 ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia Page 2 des sites web jugés dignes d'intérêt, et non des robots d'indexation — on peut citer par exemple Voilà et Yahoo! etc. Les moteurs de recherche ne s'appliquent pas qu'à Internet : certains moteurs sont des logiciels installés sur un ordinateur personnel (PC). Ce sont des moteurs dits desktop qui combinent la recherche parmi les fichiers stockés sur le PC et la recherche parmi les sites Web — on peut citer par exemple Exalead Desktop, Google Desktop et Copernic Desktop Search, etc. Les Métamoteurs On trouve également des métamoteurs, c'est-à-dire des sites web où une même recherche est lancée simultanément sur plusieurs moteurs de recherche (les résultats étant ensuite fusionnés pour être présentés à l'internaute) — on peut citer Ixquick, https://www.ixquick.com/fra/ Mamma, http://www.mamma.com/ Kartoo, http://www.kartoo.com/ Seek.fr, http://www.seek.fr/ metacrawler etc. http://metacrawler.com L’annuaire Un annuaire web, répertoire web, annuaire Internet ou répertoire Internet est un site web proposant une liste classée de sites Web. Contrairement aux moteurs de recherche, la classification dans les annuaires est réalisée par des humains. Le classement se fait typiquement dans une arborescence de catégories, censée couvrir tout ou partie des centres d'intérêt des visiteurs. Chaque catégorie contient : • • des sous-catégories concernant des aspects plus pointus d'un sujet donné ; des hyperliens vers les sites agrémentés d'une description. L'Open Directory Project (ODP), plus connu sous le nom de dmoz est un répertoire de sites web créé en 1998, sous licence Open Directory. C'était aussi le répertoire de Google. http://www.dmoz.org/ . Le répertoire de yahoo est http://dir.yahoo.com/ Un catalogue de bibliothèque Il sert à faciliter la recherche des livres qui se trouvent dans une bibliothèque, ou de plusieurs bibliothèques dans le cas des catalogues collectifs et des catalogues virtuels. Leur version informatisée, le plus souvent, se présente sous forme de base de données. Le catalogue est destiné à identifier les documents (décrits dans des notices2) et à faciliter leur recherche ou leur localisation. Le catalogage consiste à analyser le document en tant que support. Le catalogage fait partie des deux opérations intellectuelles nécessaire à la constitution d'un catalogue : catalogage (Description physique) & indexation (Description intellectuelle). Je cite par exemple Le catalogue du Système Universitaire de Documentation http://www.sudoc.abes.fr/ 2 Une notice bibliographique est une fiche qui décrit un objet (document) manipulé dans une bibliothèque, traditionnelle ou numérique : livre, fascicule, article etc. Elle comporte un ensemble d'indications permettant de l'identifier, de le localiser ou de le décrire sommairement ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia Page 3 Un répertoire C‘est un outil de collecte de données, initialement d'adresses ou de noms de personnes. C'est un instrument de recherche présentant des informations, quel qu'en soit le support, classées par ordre alphabétique, numérique, chronologique ou systématique pour l'identification, la description ou la localisation de personnes, de documents, d'organismes, de lieux, de ressources Web ou d'objets. Dans les domaines des ressources humaines et de la formation, un Référentiel de compétences est un répertoire de compétences nécessaires pour tenir un poste, une fonction ou un métier. Exemple le référentiel de compétences des infirmiers. Base de données ou banque de données bibliographiques Les bases de données bibliographiques répertorient toute catégorie d'objets bibliographiques : livres, collections, revues, articles de revues etc. Elles sont le fruit de l'informatisation des catalogues de bibliothèque, et permettent des recherches à l'aide de mots-clefs (titre, auteur, etc.) ainsi que l'analyse des données (bibliométrie, etc.). Exemples • • • • • • • • • • WorldCat 3 http://worldcat.org./ un catalogue de bibliothèque : RERO http://opac.rero.ch/gateway une bibliographie : Eric Education Ressource Information Center(version gratuite) http://www.eric.ed.gov/ des périodiques : Des revues scientifiques et universitaires en texte intégral validées, accessibles gratuitement, couvrant toutes les disciplines et de nombreuses langues Directory of Open Access Journals http://www.doaj.org/doaj?func=home une collection de documents : Google scholar http://scholar.google.com/ un ouvrage de référence : Grand Robert électronique http://gr.bvdep.com/ Pubmed est l’interface de la bibliothèque médicale Américaine. Il s’agit de résumé d’article mais les textes intégrales e en langue française existent: http://www.ncbi.nlm.nih.gov/pubmed La Banque de données en santé publique (BDSP) est un réseau documentaire d'informations en santé publique http://www.bdsp.ehesp.fr/ Portail de la santé publique française http://www.anasys.org/ La base Cochrane en langue française : http://cochrane.fr/ Comment interroger une banque de données ? Il n'est pas si facile d'y trouver une information complète et pertinente. Vous devrez vous familiariser avec le système d'interrogation propre à chaque banque, mais surtout apprendre à exploiter son contenu. Pour une bonne stratégie de recherche documentaire, vous devez : • • • 3 bien délimiter votre sujet, en étudiant les concepts concernés de votre discipline. choisir des mots-clés exprimant votre recherche et correspondant au vocabulaire d'indexation de la banque. Les termes spécifiques et précis sont à essayer en priorité. dans certains cas, apprendre à utiliser les opérateurs logiques (et, ou, sauf). ne pas hésiter à modifier les termes de votre question si les réponses ne sont pas satisfaisantes : utiliser des synonymes ou des termes plus généraux en cas de réponses insuffisantes, prévoir des moyens de limiter la question (par date, par pays, par langues..) en cas de résultats trop nombreux. WorldCat est la base de données bibliographiques en ligne de l’OCLC (Online Computer Library Center) ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia Page 4 Chaque base de données a une interface de recherche 4 qu’il faut savoir interroger. Exemple Pubmed pour Medline et Web of Knowledge pour Web of science etc… Système de veille : Afin d’être à jour sur votre sujet de recherche faite la veille documentaire. • • • La création d’Alerte sur Google en mettant votre mot-clé: http://www.google.com/alerts?hl=fr La création d’alerte sur la plateforme des éditeurs à partir de votre sujet de recherche L’abonnement au flux RSS 5. Un flux RSS est une ressource Web dont le contenu est produit automatiquement en fonction des mises à jour d’un site Web. Vous avez besoin d’un agrégateur sur votre navigateur pour les lire. Le navigateur Mozilla Firefox est doté d’un lecteur de Flux RSS Un agrégateur Il s’agit d’un logiciel permettant de suivre plusieurs fils de syndication6 en même temps. Il prévient de la mise à jour d'un site web ou des actualités qu'il publie (par notification sonore, visuelle, etc.). Également, il importe le contenu nouveau en question et il le fait pour un ensemble de sites. Les revues et la recherche documentaire en sciences infirmières Echantillon de Quelques périodiques : • APORIA (Canada) http://www.oa.uottawa.ca/journals/aporia/?lang=fr • • • • KRANKENPFLEGE (suisse) est la revue spécialisée la plus lue en Suisse dans le domaine des soins http://www.sbk-asi.ch/ Recherche en soins infirmiers (RSI) éditée par ARSI http://www.asso-arsi.fr/ L’infirmière clinicienne (revue électronique canadienne) http://revue-infirmiereclinicienne.uqar.ca/ Savoirs et sciences infirmières (Elsevier Masson) http://www.emconsulte.com/article/221335/introduction-a-la-recherche-en-sciences-infirmiere L’infirmière canadienne http://www.cna-aiic.ca/fr/formation-continue/linfirmiere-cliniciennespecialisee-et-linfirmiere-praticienne/ JALMALV (jusqu’à la mort, accompagnant la vie) http://www.jalmalv.fr/do.php?n=Home.Accueil Objectif soins (édition Lamare-wolterskluwer) http://www.wolterskluwerfrance.fr/ Perspective infirmière (ordre des infirmiers du Quebec) http://www.oiiq.org/publications/perspective-infirmiere Perspective soignante (édition Seli Arslan) http://www.praqsi.org/praqsi-nos-publications.php Laennec (édité par centre Laennec) http://www.jesuites.com/actu/2011/laennec.htm • • • • • • 4 Interface de recherche est un Système qui permet le dialogue entre un utilisateur et un ordinateur au moyen de menus, formulaires, liens hypertexte, etc 5 RSS (sigle venant de l'anglais « Really Simple Syndication ») est une famille de formats de données basés sur XML et utilisés pour la syndication de contenu Web. 6 La syndication de contenu Web est une forme de syndication dans laquelle une partie d'un site est accessible depuis d'autres sites. Cela est possible en y ajoutant une licence accordée à ses utilisateurs ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia Page 5 • • Santé mentale (société Acte Presse) http://www.santementale.fr/ Pratique et organisation des soins : http://www.ameli.fr/l-assurance-maladie/statistiques-etpublications/la-revue-pratiques-et-organisation-des-soins/ Evaluer des sites Internet Le premier indice vous sera fourni par la nature et la fiabilité du site d'accueil, élément important d'appréciation sur la qualité des informations apportées. De prime abord, la lecture de l'adresse du site, qu'il faut apprendre à déchiffrer, orientera votre jugement. Déchiffrer une adresse Web L'adresse d'une page sur un site web, souvent désignée par le sigle URL 7indique généralement: la méthode d'accès (http 8, telnet9, ftp 10), le nom du serveur, le nom du domaine et sous-domaine, éventuellement le répertoire et le nom du fichier correspondant au document. Exemples : Abréviation Interprétation .tn,.fr, .ca, .de, .it abréviation du nom du pays (Tunisie, France, Canada, Allemagne, Italie...) .edu université américaine - ex : <http://www.georgetown.edu/> .com site commercial .gov organisme gouvernemental .univ- .... .fr université française - ex: <http://www.mshs.univ-poitiers.fr> .asso.fr association française - ex: <http://www.societes-savantes-toulouse.asso.fr/> Comparaison des ressources sélectionnées par trois robots de recherche "académiques" Exemple : quels sont les résultats trouvés pour les mots- clés Soins palliatifs = Palliative care Google Scholar = http://scholar.google.com/ - (456 000 résultats trouvés) Oaister 11 = http://www.oclc.org/fr/fr/default.htm = (7 résultats trouvés) Portail Sudoc = http://www.sudoc.abes.fr/ (855- résultats trouvés) Pour chacun des moteurs de recherches, vous observez la première page de résultats - Comparez ces résultats et dégagez les caractéristiques principales des réponses fournies par chaque outil ? - Quel est celui dont les résultats sont les plus intéressants pour votre recherche et pourquoi ? Essayez de répondre à cet exercice. 7 8 9 URL = Uniform Resource Locator http = hyper text laguage protocole. C’est le protocole de navigation Telnet (TErminal NETwork ou TELecommunication NETwork, ou encore TELetype NETwork) est un protocole réseau utilisé sur tout réseau prenant en charge le protocole TCP/IP ( Transfert Control Protocol/ Internet Protocole) 10 11 FTP= file transfert protocole Oaister : Fondé en 1967, OCLC Online Computer Library Center est un organisme de recherche à but non lucratif qui offre des services aux bibliothèques afin qu'elles puissent accroître leur accès à l'information mondiale tout en réduisant leurs coûts ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia Page 6 Voici quelques critères de validité à considérer 12 : Contenu *Le contenu du site montre-t-il un thème traité avec une profondeur suffisante? *Le niveau est-il approprié à votre travail ? L'expression est-elle trop compliquée, trop spécialisée ou trop simple au contraire? *Est-ce que le site articule de l'information de type "recherche", "éducation", "savante ou scientifique" avec un produit commercial ou un service de promotion -vente (publicité)? *L'information n'est-elle pas, périmée, obsolète? Sources et date *Le site est-il mis à jour ? la page datée et signée ? Vérifier aussi ces éléments dans la bibliographie citée. Y-a-t-il suffisamment de références à d'autres travaux? * S'agit-il d'une source stable, produite et mise à jour par un organisme reconnu, une université, une bibliothèque? *Les auteurs du site sont-ils des chercheurs ou des spécialistes dans ce domaine? Appartiennent-ils à des sociétés savantes, des institutions, des organismes reconnus? Peut-on vérifier leurs qualités et identifier leur établissement de rattachement? Peut-on trouver certaines de leurs publications dans des livres, des périodiques ou d'autres documents multimedia? Sont-ils cités dans des bibliographies spécialisées? *Si la page est trouvée à l'aide d'un moteur (ou d'un robot) elle apparaît sortie de son contexte. Vérifier soigneusement son contenu. Ne pas hésiter à remonter jusqu'à la page d'accueil du site pour bien vérifier l'appartenance de la page. Consulter aussi le plan du site ou le sommaire. Ces outils permettent d'avoir une vue d'ensemble du contenu. Divers *L'information est-elle gratuite ou payante? *Vérifiez les qualités formelles de la page ou du site : la lisibilité, la qualité de l'expression et de l'orthographe. *Dispose-t-on de fonctionnalités de recherche, sommaire, index ou plan de site? *A-t-on besoin de télécharger des utilitaires pour lire et utiliser le site ou certaines pages? Outils de recherche: répertoire Répertoire de liens sur la qualité des services en ligne : http://www.temesis.com/ La « toile visible » et la « toile invisible » On parle souvent de la toile visible et de la toile invisible sur le web, mais qu'est-ce que cela signifie ? En fait une part importante des ressources Internet n'est pas explorée par les robots des moteurs (soit parce les pages sont en accès réservé, soit parce qu'elles appartiennent aux banques de données). Schématiquement: • la Toile visible peut être assimilée à celle explorée par les moteurs type Google. • La Toile invisible est donc la partie complémentaire non accessible aux moteurs classiques, donc les pages appartenant aux banques de données ( Medline, Inist, Cismef...) et toutes les pages en accès réservé ( pages à accès professionnel restreint, aux abonnés d'un journal, aux membres d'une association…). En pratique les robots ont fait des progrès et arrivent maintenant à lire les notices de Medline et autres base de donnée, alors, Pourquoi cette distinction ? Tout simplement parce que pour explorer la toile invisible on ne pourra pas passer par un moteur de recherche. 12 http://urfist.enc.sorbonne.fr/cerise/cerTDeco.htm Maj 17-01-06, visité le 02/09/2012 ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia Page 7 Ces outils permettent d'obtenir des documents pertinents en évitant le bruit et le silence. La majorité des interfaces de recherche vous proposent les outils suivants 13 : • • • Les opérateurs booléens permettent la combinaison de termes ou de concepts en vue d'augmenter ou de diminuer le nombre des résultats. (et, ou, sauf) La troncature (truncation, wild card) permet d'exprimer en une seule fois toutes les formes d'un terme : singulier, pluriel, terminaisons diverses, variations orthographiques internes. Elle élargit la recherche (*, ?). Exemple inf* Les limitations servent à préciser une recherche et à rétrécir ou élargir le nombre des résultats. On trouve différents types de limitations : de champs, de dates, de types de documents, etc. Les opérateurs booléens Opérateurs Effets de leur emploi • Additionne les termes (synonymes ou quasisynonymes) exprimant un même concept • Combine deux concepts différents Diminue le nombre de résultats et les rend plus précis OU / OR ET / AND • • SAUF / NOT /AND NOT 13 • • Exclut un ensemble de documents du sujet recherché Diminue le nombre de résultats Attention aux documents pertinents qui risquent d'être exclus dans l'opération ! Autoformation :http://www.unige.ch/biblio/ses/afbdd00.html ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia Page 8 La troncature Il faut déterminer les signes de troncature spécifiques à l'interface : * ? + et déterminer précisément la longueur du radical : Longueur Effets de leur emploi Trop court Provoquera du bruit Trop long Provoquera du silence Exemples cat* = catastrophe, catapulte, cathédrale....alors que vous cherchiez "catholique"... Juste racism* = racisme, racismes, mais pas "racial" réfugié* = réfugié-és-ée-ées Les limitations Types de limitations Recherche sans limitations Limitations de champs, dates, langues, types de publications, etc. Effets de leur emploi Exemples à cliquer Risque de bruit Augmente la pertinence Diminue le nombre des résultats Champs Nom donné aux différentes parties de la référence : champ auteur, champ titre, champ sujet (descripteur), etc. Chaque champ est désigné par une étiquette : Auteur (AU), Titre (TI), Descripteurs (DE), etc. Selon les interfaces, appelés aussi Field, Catégories, etc. Bruit et Silence Le Bruit : références hors sujet obtenues à la suite d'une interrogation trop large. Le Silence : références pertinentes manquées à la suite d'une recherche trop étroite, alors qu'elles existent dans la base. ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia Page 9 Le thésaurus Le thésaurus est la liste des mots-sujets ou descripteurs attribués aux documents, organisés hiérarchiquement. Chaque descripteur est accompagné des termes ayant une signification commune (son environnement sémantique) : relations hiérarchiques : termes génériques ( broader termes) termes spécifiques (narrower terms) relations d'équivalence : termes employés pour un autre (employé pour, seen from, used for) relations d'association : termes voisins (related terms, see also) Exemple mots clé “urgences” sur Cismef 14 : description 14 Cismef : catalogue et index des sites médicaux de langue Française www.cismef.org ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia Page 10 Exemple mots clé “urgences” sur le portail de terminologie de Cismef : Mesh inserm L’arborescence « d’urgences » : hiérarchie Concernant les ressources, après avoir choisi les qualificatifs pour mieux affiner la recherche vous cliquez sur Cismef pour les ressources françaises ou Pubmed pour la base médicale américaine Medline en Anglais ISSIT-2013-2014- http://www.issit.tn cours Recherche documentaire sur Internet-L3S5-Triki Monia Page 11