la recherche documentaire sur internet - e

Transcription

la recherche documentaire sur internet - e
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
LA RECHERCHE DOCUMENTAIRE SUR INTERNET
INTERNET C’EST QUOI ?
Internet = Web + messageries + … autres protocoles
Depuis son invention dans les années 90, le Web a beaucoup évolué : on est passé du web 1.0
statique des années 90 au Web 2.0 depuis 2004 qui se caractérise par les possibilités
d’interaction qui rendent les pages web « dynamiques »
Aujourd’hui on parle même de web 3.0 !
Problème de la recherche sur le WEB : Le web est énorme
La difficulté provient en partie de la taille du Web et du nombre considérable de documents
qui s’y trouvent hébergés, répartis sur de nombreux sites. Il est impossible de connaître le
nombre exact de ces sites et de ces documents, qui augmentent de façon exponentielle.
Voici quelques chiffres valables en sept. 2005. :
 Nombre de sites Web
 Nombre de "pages" Web
:
:
70 millions.
20 milliards.
Distinguer sites web et pages web (important pour la bibliographie) :
Des pages web = une adresse précise à l’intérieur d’un site (= un chapitre d’un livre ou une page d’un livre)
Un site web = ensemble de pages web (= un livre : une adresse source + des ramifications dans les adresses
URL)
De plus, Internet n’est pas un ensemble organisé et structuré comme une bibliothèque :
il n’est pas facile d’y trouver des documents d’information par thème.
Google n’est pas un catalogue de bibliothèque !
Pas de classification des sites par genre, par auteurs, par thèmes …
On ne recherche jamais directement sur le Web
Ce qu’on peut faire seulement avec un navigateur c’est accéder aux outils de recherche
intermédiaires qui sont disponibles et qui indexent, chacun à leur manière, les sites Web.
Cette base n’est qu’une petite partie de la totalité des documents Web existants.
Il faut distinguer le WEB VISIBLE du WEB INVISIBLE
- Web visible : ce qui est indexé par les moteurs de recherche de type Google
- Web invisible : ce qui n’est pas indexé par les moteurs de recherche de type Google
Google n’indexe que 20% de tout le contenu du Web !
De plus, les sites n’ont pas tous une caution intellectuelle ou scientifique : il faut
EVALUER l’information que vous trouvez sur le web
1
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
I. CONNAITRE LES OUTILS DE RECHERCHE SUR LE WEB
1. Annuaires de recherche - Répertoires de sites - Signets
Historiquement, les annuaires sont les plus anciens des outils de recherche. Cet outil recense
des sites web. Il est constitué de rubriques (ou catégories), elles-mêmes subdivisées en sousrubriques. A l’intérieur de ces sous-rubriques, nous trouvons des listes de sites web :
Catégorie
Sous-rubrique
Sous-sous rubrique
Listes de sites web
On circule dans ces catégories et rubriques en développant des ARBORESCENCES
Un annuaire est libre de prendre ou de refuser un site. Une condition d’efficacité
de l’annuaire est sa taille, c’est à dire le nombre de sites référencés dans son index.
L’annuaire peut s’utiliser de deux façons :
 soit l’internaute consulte les catégories : il navigue alors de rubriques en sousrubriques jusqu’aux sites
 soit il effectue sa recherche grâce à des mots clefs.
Avantage :
Cet outil de recherche permet une navigation simple et l’internaute est guidé par un
fil conducteur. De plus, les sites de l’annuaire ont été sélectionnés. Ils fournissent
des réponses de qualité.
Inconvénient :
Le gros inconvénient de l’annuaire, c’est qu’il est construit manuellement. De ce
fait, sa taille est réduite, il est difficile de le tenir à jour. Enfin, les sujets très
spécifiques et très pointus sont difficiles à localiser.
En conclusion, l’annuaire fournit des résultats pertinents
mais peu nombreux.
2
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
a) L’annuaire généraliste Dmoz (http://dmoz.org) :
Ce répertoire est géré par une vaste communauté d’éditeurs bénévoles. Il répertorie 5.089.427
(au 18/10/12) adresses Internet classées dans plus de 1 million de catégories.
b) Les signets de la BNF (http://signets.bnf.fr)
RAPPEL : les signets sont des sites recommandés par des institutions culturelles ou éducatives
La Bibliothèque nationale de France propose sur son site un répertoire de 7000 ressources
mises à jour et contrôlées régulièrement : les sites recommandés sont peu nombreux mais
d’une très grande qualité.
La navigation s’effectue dans l’arborescence thématique. Il est également possible
d’effectuer une recherche de sites par mots-clefs (« recherche ») ou de consulter l’index
alphabétique des mots clés
« Recherche » :
Pour effectuer une
recherche par mots
dans les signets de la
BnF
Les signets sont classés
soit par ordre
alphabétique, avec des
renvois, soit par thème
3
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
Exercices sur le site des signets de la BnF
http://signets.bnf.fr/
ou à partir du portail, rubrique Les incontournables, sous rubrique Signets
1) Grâce au classement alphabétique, retrouvez la catégorie consacrée aux métiers du
Journalisme. Dans cette catégorie, relevez un site consacré à la critique des médias, en
particulier de la presse écrite. Décrivez l’arborescence (Thème/Sous-thème) utilisée.
Quel est le nom de ce site ? Quand a-t-il été contrôlé par la BnF la dernière fois ?
2) Sur le site trouvé dans la question 1), retrouvez des articles sur les relations entre les
journalistes et la politique. Observez la présentation des résultats. Citez la référence de
deux articles pertinents.
3) Sur ce même site, retrouvez des adresses de sites internet recommandés sur les
médias, en particulier dans la catégorie « Education aux médias ».
4
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
2. Les moteurs de recherche
Les moteurs de recherche sont des robots qui indexent automatiquement des millions de
pages web, sans intervention humaine. Contrairement aux annuaires, les moteurs
permettent de trouver sur le web une quantité considérable de sites Internet, mais dont la
qualité et la fiabilité n’est jamais ni contrôlée ni vérifiée.
La recherche s’effectue uniquement par mots-clés. Celle-ci peut être simple ou avancée.
Toutefois, la couverture du web par les moteurs de recherche reste parcellaire : seulement
20% du web est indexé par les robots. Toute la partie du Web qui n’est pas indexée par les
robots s’appelle le WEB INVISIBLE
Chaque moteur de recherche a son propre robot et fonctionne donc à sa manière : c’est
pourquoi les résultats peuvent être différents pour une même requête selon le moteur
utilisé.
Il existe des moteurs de recherche
- généralistes : Google, Exalead, Yahoo, Bing …..
- spécialisés : Google maps, Google images, Google Scholar….
- Google Book ou Gallica pour les livres libres de droit et numérisés
A. Les moteurs de recherche généralistes
1) Google : moteur de recherche généraliste le plus connu et le plus performant en termes de
pages indexées. Le critère de classement des résultats se fait par rapport à la popularité
du site : Page-Rank = l’indice de popularité d’une page
Page Rank :
 Page Rank : calcule le nombre de fois qu’un site X est cité par d’autres sites A, B, C,
D…
 Mais il prend aussi en compte la popularité des sites A, B, C, D: être cité par des sites
qui sont eux-mêmes populaires augmente la popularité de X
 Inconvénient : des sites récents n’apparaîtront pas tout de suite (pas le temps d’être
cités)
Utiliser les critères de la recherche avancée de Google pour cibler davantage vos
recherches :
5
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
2) Exalead : moteur de recherche francophone. Possibilité de pré visualiser les pages. Les
termes ou expressions associés aux mots clefs de la requête s’affichent, de même que les
catégories en relation avec la requête.
B. Les moteurs de recherche spécialisés

Google maps/earth : cartes et localisations satellites. Vue piétonne.

Google images/video : recherches d’images et de documents audiovisuels présents dans
les pages qui contiennent le mot recherché

Google Scholar : moteur de recherche spécialisé sur les documents scientifiques et
académiques. Il existe une grande variété de documents : articles, livres, thèses, rapports…
Le domaine des sciences techniques et médicales est mieux couvert que celui des sciences
sociales et humaines.
 Outil de recherche de travaux universitaires en ligne : thèses, articles, rapports de
recherche…
 Recherche dans le texte intégral, même si le texte intégral n’est pas accessible à tout
le monde
 Indique entre crochets le type de résultat : citation, livre…
Exercice sur les moteurs de recherche
4) Faites une recherche sur le journalisme à la télévision dans ces trois
moteurs de recherche et comparez les résultats
Google
Exalead
Google scholar
http://www.google.fr/ http://www.exalead.com/ http://scholar.google.fr
Nombre total de réponses
Référence du 1er article
trouvé
Rang de classement du
1er article intéressant
Avantages de ce moteur
Inconvénients
moteur
de
ce
6
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
3. Les métamoteurs de recherche
Les métamoteurs sont des outils qui interrogent plusieurs moteurs de recherche
simultanément. Ils n’ont pas d’index propre mais utilisent les index des moteurs de recherche
qu’ils interrogent : lors de l’affichage des résultats ils éliminent les doublons.
Exemples de métamoteurs : Copernic (téléchargement obligatoire, gratuit pour certaines
versions), Clusty, Findloo, Ixquick…
Avantages
 La recherche est plus rapide car elle interroge simultanément plusieurs moteurs de
recherche à la fois.
 La recherche est plus exhaustive car une plus grande couverture du web est couverte.
Inconvénients
 Ils filtrent moins qu’un seul moteur de recherche généraliste
 Les recherches sont moins pointues.
Exercices sur un métamoteur
5) Connectez-vous sur http://fr.findloo.com/fr/ . Recherchez des documents sur Pierre
Bourdieu. Comment sont présentés les résultats ? Quels sont les moteurs de recherche
utilisés ?
Quel outil de recherche privilégier pour ses requêtes ?
Vous pouvez choisir l’annuaire pour débuter une recherche ou pour vous faire une
idée des sites existants dans un domaine que vous découvrez. De plus, l’annuaire
permet de repérer des ressources du web invisible.
Vous privilégierez le moteur de recherche pour la taille de son index et la rapidité
de mise à jour. Le moteur de recherche va vous servir a effectuer une recherche
pointue à partir de mots clefs précis ou d’élargir la portée de votre requête à une
grande partie du web. Mieux vaut dans ce cas privilégier la recherche avancée.
7
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
II. 6 CRITERES POUR EVALUER LES SITES
Toute information doit répondre à 2 exigences :
 Pertinence : une information pertinente est celle qui répond à la question que vous vous
posez.
 Validité : une information validée est une information exacte.
Internet est un espace « ouvert ». On y trouve une multitude d’informations qui ne sont pas
contrôlées ni vérifiées. N’importe qui peut publier un document. En effet, contrairement à un
espace « fermé » (la bibliothèque par exemple), il n’y a aucune sélection a priori des
documents qui s’y trouvent.
Bouleversements du Web
 Le Web permet de s’auto-publier
 L’étape de validation de l’écrit par un éditeur n’est plus
nécessaire
 L’anonymat couvre parfois les auteurs
 Généralisation du copié-collé et des références dont on
n’évoque pas les sources
Il est difficile d’identifier un document et sa source. Les compétences de l’éditeur et celle
de l’auteur sont mélangées car l’auteur est son propre éditeur. Les genres documentaires sont
également mélangés, ce qui peut mener à des confusions.
Ainsi, la surabondance d’informations (des dizaines de milliards de pages web) conduit à la
désinformation (médiocrité de l’information).
Alexandre Serres parle d’ « info-pollution ».
Cette désinformation est amplifiée par le marketing invisible, l’espace commercial, les
rumeurs et fausses informations. A ce propos, Hoaxbuster est un site qui répertorie les
rumeurs sur Internet (www.hoaxbuster.com).
Comment lutter contre cette désinformation ? Par des moyens techniques (anti-spams),
juridiques (responsabilité des hébergeurs) et humains (il faut réfléchir, faire appel à sa culture
générale et à son esprit critique pour évaluer l’information que l’on trouve).
Sur un sujet qu’on ne connaît pas, il faut appliquer des critères d’évaluation.
Une information validée est une information identifiée, fiable,
précise, exacte et exhaustive, d’actualité, structurée.
8
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
Ces 6 critères d’évaluation permettent d’identifier un document du web et de mesurer sa
validité
1. Identifier la nature du document
Est-ce une page web ou un site entier ? Est-ce un article de périodique, un
compte-rendu, un brevet, une thèse, un blog, une information circulante
(forum) ?
2. Identifier la date du document
Quelle est sa date de création, sa date de mise à jour ? La période correspondelle à vos besoins ? Les liens sont-ils toujours à jour ?
3. Identifier la fonction du document
A qui le document s’adresse-t-il et à quoi sert-il ? Est-ce un document scientifique, politique,
de vulgarisation, d’expression, commercial, universitaire, personnel ? Le site est-il personnel
ou commercial ? Quel est le public visé ?
4. Identifier la nature de l’organisme « éditeur » (URL = Uniform
Ressource Locator)




Adresse officielle du site internet, identique pour tous les internautes
URL ≠ du nom du site
URL est construite selon une syntaxe précise
Plus l’adresse URL est construite plus la structure du site est complexe
Vous devez décrypter l’adresse URL qui se décompose en trois éléments :
- nom du protocole (http://, news://…)
- nom de domaine (c’est l’adresse du serveur hébergeant la ressource)
- chemin d’accès à la ressource (il s’agit du nom du fichier et des sous-fichiers,
et son emplacement).
La structure de base d'une URL est celle-ci :
protocole://nom-du-serveur.nom-du-domaine/répertoire/nom-du-fichier
Les extensions de domaine fournissent des informations très précises sur le document. Il
existe des extensions thématiques et des extensions géographiques.
Quelques exemples d’extensions thématiques :
- .gouv : site du gouvernement
- .com : site commercial
- .org : pour les organisations et les associations
- .net : pour les réseaux
- .info : site d’information
- ac, .edu : site d’éducation.
9
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
Quelques exemples d’extensions géographiques (à savoir : chaque pays dans le
monde possède son domaine propre) :
-
.fr : France
.be : Belgique
.ca : Canada
Attention!
Les noms de domaine ou des serveurs ne sont pas toujours des indications directes sur
la localisation et la source de l'information.
On peut donner n'importe quel nom à son serveur; et il est possible d'enregistrer des
noms de domaine qui donnent de fausses impressions.
Trucs et informations pratiques
Effacer des parties de l'URL pour en apprendre plus sur le site
Il peut être très utile d'effacer sur la droite des parties de l'URL pour découvrir où cette
nouvelle adresse, plus courte vous entraîne. En faisant cela, vous pouvez trouver des
indications sur votre position à l'intérieur du site ainsi que sur sa structure. En effaçant tout ce
qui est situé à droite de la première barre oblique (/) vous remontez l'arbre du répertoire et
pouvez comprendre comment le fichier est implanté dans le site.
Regardez par exemple, ce qui se passe si vous effacez une partie de l'URL suivante:
affiche:
URL
http://www.ariadne.ac.uk/issue56/
conole#The_Tension_between_Web_2.0_an un article en ligne
d_Education
signifie:
ceci est un article en
ligne
http://www.ariadne.ac.uk/issue56/
le sommaire de la
livraison 13 d'un journal
l'article fait partie du
n° 13 de ce journal
http://www.ariadne.ac.uk/
la page d'accueil d'un
journal électronique
l'article est contenu
dans ce journal
Cette technique est particulièrement utile pour de longues adresses URL.
Trouver la page d'accueil d'un site web
La page d'accueil est la première page d'un site web - l'équivalent de la
couverture d'un livre - et fournit beaucoup d'informations comme le titre, le nom de
l'auteur et une présentation sommaire de l'objectif du site. Souvent, les hyperliens
vous entraînent au beau milieu d'un site par opposition à la page d'accueil. Il est
ainsi difficile de savoir où l'on est. C'est une bonne habitude de regarder la page
10
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
d'accueil d'un site avant de l'utiliser, tout simplement pour vérifier ce que vous
regardez.
Les URL vous aident sur ce point - la racine d'une URL vous emmènera souvent
sur la page d'accueil. Ça ne marchera pas toujours - mais essayez d'effacer le nom
du fichier et celui des répertoires à droite de l'adresse, puis appuyez sur la touche
Entrée (assurez-vous que la nouvelle URL se termine par une barre oblique / ou
html ou htm). Ceci vous emmènera vraisemblablement à la page d'accueil.
Ex : le site web du Président de la République française
http://www.elysee.fr/chronologie/#e4905,2013-1117,visite-d-etat-en-israel-visite-officielle-dans-les-territoirespalestiniens
une page loin dans le
site
http://www.elysee.fr/
la page d'accueil
Le tilde ~ :
Dans certaines URL vous verrez le tilde qui s'écrit ainsi : ~ (Par exemple :
http://www.ilrt.bris.ac.uk/~cmpac/)
La plupart des serveurs web utilisent le ~ pour indiquer qu'il s'agit de répertoires personnels.
Si l'URL contient un tilde, alors sachez que probablement (pas systématiquement cependant)
vous regardez une page personnelle, présentant des opinions personnelles et non sur un
site officiel transmettant la ligne de pensée officielle. Ceci ne signifie pas, cependant, que
l'information soit de mauvaise qualité.
Par exemple la page suivante contient un tilde : http://www.ilrt.bris.ac.uk/~cmpac/
Cette page est hébergée sur le serveur de l'Université de Bristol, mais n'est PAS une page
officielle de l'université - c'est la page personnelle d'un membre du personnel.
5. Identifier l’auteur de la page Web
Vous pouvez regarder sur la page web (souvent dans la rubrique « contacts ») ou sur le site
s’il y a des informations. Si un nom est indiqué, vous pouvez vérifier sa notoriété sur ce site :
http://www.123people.fr . Qu’a écrit l’auteur du document ? Est-il un spécialiste du
domaine ? Quel est son point de vue, ses motivations ?
L’identification de l'auteur d'un site est souvent essentielle, pour pouvoir identifier clairement
la nature du site, et évaluer la fiabilité de l'information. Cette opération n'est pas toujours
aisée. Voici quelques astuces techniques pour identifier un auteur :
a/ Bien explorer le site : pied de page de la page d'accueil, pages dédiées ("A propos",
"Copyright"...), adresse électronique...
b/ Vérifier l'adresse d'un lien pointant vers une adresse e-mail, en passant le curseur de la
souris sur le lien (certains liens pointent en fait vers des pages HTML)
c/ Remonter ou descendre l'arborescence pour trouver d'autres informations sur l'auteur
11
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
d/ Consulter les métadonnées, qui contiennent des éléments de description du document,
notamment parfois la mention de responsabilité, le nom de l'auteur, voire son adresse
électronique. Pour afficher les métadonnées : menu "Afficher la source" (par le bouton droit
de la souris)
e/ Utiliser les outils de recherche généralistes et spécialisés : Après avoir trouvé le nom de
l'auteur ou du propriétaire du site, faire une recherche sur les moteurs généralistes (Google...)
ou les moteurs de personnes (123 People), pour trouver des informations sur cette personne.
6. Identifier la notoriété du site
Ce site est-il référencé par d’autres sites ? Par des sites de qualité ? Utiliser Google recherche
avancée, la fonction « Liens » (link) pour voir quels sites pointent la page étudiée.
Exercices sur l’évaluation des sites internet
6) Appliquez les 6 critères d’évaluation pour chacun des sites suivants.
Cherchez à repérer en particulier : l’auteur, la date, la fiabilité et la
pertinence des documents
Pour une étude sur Internet comme média d’information, puis-je utiliser les
sites suivants :
a) http://le-journalisme.e-monsite.com/pages/3-1-internet-poursuit-sa-progression-versle-moyen-d-information-le-plus-utilise.html
Nature du texte :
Date du document :
Fonction du document :
Nature de l’éditeur :
Identifier l’auteur de la page :
Quelle est la notoriété de ce site :
REPONSE :
12
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
b)
http://sem.unige.ch/wp/pedagogie-medias/files/2009/06/res-la-fin-des-journaux-bpoulet1.pdf
Nature du texte :
Date du document :
Fonction du document :
Nature de l’éditeur :
Identifier l’auteur de la page :
Quelle est la notoriété de ce site :
REPONSE :
13
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
III. LES ARCHIVES OUVERTES
A. Les bibliothèques numériques

Google books (Google Livres) : ouvrages numérisés
 Numérisation d’un grand nombre d’ouvrages de plusieurs grandes
bibliothèques (Harvard, Oxford, BM Lyon)
 Ouvrages dans le domaine public en entier
 Ouvrages encore sous droits partiellement disponibles (sommaire,
introduction)
Les enjeux de Google Books :




Conditions d’accès : autoroute où on peut à tout moment mettre un péage
Choix des ouvrages : risque de prédominance anglo-saxonne, perte de diversité
culturelle
But de la numérisation : accords avec les plateformes de vente (Amazon), plus une
incitation d’achat qu’un pas en faveur de l’accès libre
Outils de recherche : moteur de recherche, ce n’est pas un catalogue donc pas
d’indexation
 Gallica : Bibliothèque numérique de la BnF : www.gallica.bnf.fr
Suite à l’offensive de Google en 2004, J. N. Jeanneney (ex-président de la BnF) lance un
appel en faveur d’une véritable politique européenne de numérisation pour préserver la
pluralité de langues et des cultures. Création de Gallica 2 :
 Ouvrages dans le domaine public (<1939)
 Beaucoup en mode texte (recherche dans le texte intégral)
 Aperçu possible d’ouvrages récents
 Possibilité de se créer un compte pour sélectionner et gérer les documents
 Possibilité de charger des e-books

Les classiques des sciences sociales : http://classiques.uqac.ca/
Plate-forme québécoise qui propose 5000 e-books. C’est une des plus grandes bibliothèques
numériques en sciences sociales
14
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
Exercices : les Bibliothèques numériques
7) Pouvez-vous trouver le roman de Balzac les
Illusions perdues en texte intégral sur Google Book ?
A qui est dédicacé ce roman dans l’édition de 1865 ?
8) Retrouver dans Gallica (http://gallica.bnf.fr/)
l’édition de l’Aurore du 13 janvier 1898 dans lequel
Zola écrit J’accuse. Explorez les différents modes
d’affichage proposés. Quel est le numéro du Journal
dans lequel est paru cet article ? Quel est la
première phrase de cet article ?
9) Recherche dans les Classiques en sciences sociales
(http://classiques.uqac.ca/) l’ouvrage intitulé Les
Médias c’est aussi la Culture. Quel en l’auteur ?
Quelle est la date d’édition de ce livre ?
15
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
B. Explorer les Archives ouvertes
Définition
Sites de publication et de diffusion de revues, d’articles, de cours, de « littérature grise » (non
publié). Le terme « archive ouverte » désigne un réservoir où sont déposées des données
issues de la recherche scientifique et de l’enseignement et dont l’accès se veut ouvert, c’està-dire sans barrière.
On parle d’articles en « libre accès » (Open Acess »)
«Par "accès libre", nous entendons sa mise à disposition gratuite sur l'Internet public,
permettant à tout utilisateur de lire, télécharger, copier, distribuer, imprimer, recherche, ou un
lien vers le texte intégral de ces articles, les disséquer pour les l'indexation, les passer comme
des données à un logiciel, ou de les utiliser pour toute autre but légitime, sans barrières
financières, légales ou techniques autres que celles indissociables de l'accès à l'Internet luimême. " (Budapest Open Access Initiative, www.soros.org/openaccess/.)
- Soit des revues en libre accès sur Internet: plus de 1400 revues en libre accès (ex : Acta
Fabula)
- Soit des sites internet sur lesquels les auteurs publient leurs articles : il existe plus de 600
répertoires dans le monde entier (référencés dans DOAJ)
1) DOAJ : Répertoire des Revues en libre accès : www.doaj.org
Plateforme qui recense les journaux en libre accès. Multidisciplinaire, à couverture
internationale, ce site propose 3890 revues scientifiques en libre accès
« L'objectif du Directory of Open Access Journals (Répertoire des revues en
libre accès) est d'améliorer la visibilité et la facilité d'utilisation des revues
scientifiques et universitaires en libre accès, en promouvant ainsi leur usage et
leur impact croissants. Le répertoire se veut exhaustif et couvre toutes les revues
scientifiques et universitaires en libre accès qui utilisent un système de contrôle
pour garantir la qualité de leur contenu. En résumé, le DOAJ est un guichet
unique pour les utilisateurs de revues en libre accès. »
Sélectionner la
langue de
l’interface
369 revues en libre accès
dans la catégorie Languages
and Literatures
16
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
2) HAL : Serveur des archives nationales en France : http://hal.archives-ouvertes.fr/
Accès à TEL pour la recherche des thèses électroniques : http://tel.archives-ouvertes.fr
Créé en 2001 à l’initiative du CNRS, HAL permet de stocker des articles, des thèses, des
communications et même des documents non textuels. Il couvre toutes les disciplines.
Environ 90.000 textes dont 20.000 thèses, avec une croissance de 15.000 dépôts par an
+ Indexation de 290.000 références seules (sans le texte) : détournement de la fonction
première de l’AO.
3) PERSEE : site de revues numérisées en sciences humaines et sociales
http://www.persee.fr/web/guest/home
Développé par le Ministère depuis 2003. Donne accès gratuitement à une centaine de revues
- Voir TD3 : les BDD spécialisées
4) REVUE.ORG : http://www.revues.org/
Regroupement de revues en SHS + quelques livres - Voir TD3 : les BDD spécialisées
5) Autres sites d’archives ouvertes
SPIRE : http://spire.sciences-po.fr/ : les archives ouvertes de Science Po
ISIDORE : http://www.rechercheisidore.fr/index : portail du CNRS pour les sciences
humaines et sociales
Exercices : les Archives ouvertes
10) Utiliser DOAJ pour
votre sujet de recherche
retrouver
des
articles
sur
11) Utiliser HAL pour retrouver des documents
(livres, articles, rapports, thèses…) sur votre sujet
17
BULCO – Méthodologie documentaire 2013/2014 - TD4 : Rechercher de l’information sur Internet – L1 LEA
IV. UTILISER LES SERVICES DE REPONSE EN LIGNE
= Faire faire les recherches par d’autres que vous
Un service de renseignements en ligne vous permet d’obtenir une aide personnalisée à
distance lors d’une recherche documentaire.
Plusieurs bibliothèques en France organisent ces services :
 UBIB, le service de la BULCO : (cf présentation au TD1)
 La Bibliothèque Publique d’Information (BPI : BiblioSésame),
 La BnF (Sindbad : Service d' INformation Des Bibliothécaires A Distance)
 La bibliothèque municipale de Lyon (Le guichet du Savoir) :
http://www.guichetdusavoir.org/, contient en particulier : Accès thématique aux
Questions / Réponses
Le Guichet du Savoir comprend :
- un service questions-réponses permettant de poser tout type de questions d'ordre
documentaire
- une base de connaissances, qui permet des recherches fines sur les informations capitalisées
par le Guichet : les questions et réponses sélectionnées sont accessibles à la fois via un accès
thématique sur la page d’accueil du Guichet du Savoir et à partir d’un moteur de recherche
élargie
Le service est soumis à inscription : "L'inscription est ouverte à tous, sans contrainte
géographique, inscrits à la Bibliothèque municipale de Lyon ou non. Elle est gratuite."
18