LA RECHERCHE DOCUMENTAIRE SUR INTERNET

Transcription

LA RECHERCHE DOCUMENTAIRE SUR INTERNET
BULCO – Méthodologie documentaire 2011/2012 - TD4 : Rechercher de l’information sur Internet – L1 LEA
LA RECHERCHE DOCUMENTAIRE SUR
INTERNET
INTERNET C’EST QUOI ?
Internet = Web + messageries + … autres protocoles
Depuis son invention dans les années 90, le Web a beaucoup évolué : on est passé du web 1.0
statique des années 90 au Web 2.0 depuis 2004 qui se caractérise par les possibilité
d’intéraction qui rendent les pages web « dynamiques »
Aujourd’hui on parle même de web 3.0 !
Problème de la recherche sur le WEB : Le web est énorme
La difficulté provient en partie de la taille du Web et du nombre considérable de documents
qui s’y trouvent hébergés, répartis sur de nombreux sites. Il est impossible de connaître le
nombre exact de ces sites et de ces documents, qui augmentent de façon exponentielle.
Voici quelques chiffres valables en sept. 2005. :
 Nombre de sites Web
 Nombre de "pages" Web
:
:
70 millions.
20 milliards.
Distinguer sites web et pages web (important pour la bibliographie) :
Des pages web = une adresse précise à l’intérieur d’un site (= un chapitre d’un livre ou une page d’un livre)
Un site web = ensemble de pages web (= un livre : une adresse source + des ramifications dans les adresses
URL)
De plus, Internet n’est pas un ensemble organisé et structuré comme une bibliothèque :
il n’est pas facile d’y trouver des documents d’information par thème.
Google n’est pas un catalogue de bibliothèque !
Pas de classification des sites par genre, par auteurs, par thèmes …
On ne recherche jamais directement sur le Web
Ce qu’on peut faire seulement avec un navigateur c’est accéder aux outils de recherche
intermédiaires qui sont disponibles et qui indexent, chacun à leur manière, les sites Web.
Cette base n’est qu’une petite partie de la totalité des documents Web existants.
Il faut distinguer le WEB VISIBLE du WEB INVISIBLE
- Web visible : ce qui est indexé par les moteurs de recherche de type Google
- Web invisible : ce qui n’est pas indexé par les moteurs de recherche de type Google
Google n’indexe que 20% de tout le contenu du Web !
1
BULCO – Méthodologie documentaire 2011/2012 - TD4 : Rechercher de l’information sur Internet – L1 LEA
De plus, les sites n’ont pas tous une caution intellectuelle ou scientifique : il faut
EVALUER l’information que vous trouvez sur le web
1.
RECHERCHE SUR LE WEB
CONNAITRE LES OUTILS DE
1. Annuaires de recherche - Répertoires de sites - Signets
Historiquement, les annuaires sont les plus anciens des outils de recherche. Cet outil recense
des sites web. Il est constitué de rubriques (ou catégories), elles-mêmes subdivisées en sousrubriques. A l’intérieur de ces sous-rubriques, nous trouvons des listes de sites web :
Catégorie
Sous-rubrique
Sous-sous rubrique
Listes de sites web
On circule dans ces catégories et rubriques en développant des ARBORESCENCES
Un annuaire est libre de prendre ou de refuser un site. Une condition d’efficacité
de l’annuaire est sa taille, c’est à dire le nombre de sites référencés dans son index.
L’annuaire peut s’utiliser de deux façons :
 soit l’internaute consulte les catégories : il navigue alors de rubriques en sousrubriques jusqu’aux sites
 soit il effectue sa recherche grâce à des mots clefs.
Avantage :
Cet outil de recherche permet une navigation simple et l’internaute est guidé par un
fil conducteur. De plus, les sites de l’annuaire ont été sélectionnés. Ils fournissent
des réponses de qualité.
Inconvénient :
Le gros inconvénient de l’annuaire, c’est qu’il est construit manuellement. De ce
fait, sa taille est réduite, il est difficile de le tenir à jour. Enfin, les sujets très
spécifiques et très pointus sont difficiles à localiser.
En conclusion, l’annuaire fournit des résultats pertinents
mais peu nombreux.
2
BULCO – Méthodologie documentaire 2011/2012 - TD4 : Rechercher de l’information sur Internet – L1 LEA
b) L’annuaire généraliste Dmoz (http://dmoz.org) :
Ce répertoire est géré par une vaste communauté d’éditeurs bénévoles. Il répertorie 4.768.439
(4 millions sept cent soixante huit mille quatre cent trente neuf) adresses Internet classées
dans plus de 1 million de catégories.
Exercices sur Dmoz
http://www.dmoz.org/
1) Dans la catégorie « Regional », en descendant
dans
l’arborescence,
trouvez
la
sous-catégorie
« Péru » et la rubrique « Literature ». Combien de
sites trouvez-vous dans cette rubrique ? Ré-écrivez
en détail les chemins de l’arborescence
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------2) Dans la catégorie Society, sous-catégorie
History, retrouvez les sites consacrés à l’empire
inca. Combien en trouvez-vous ? Ecrivez le chemin de
l’arborescence développée.
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------3) Entrez dans la barre de recherche générale "Mario
Vargas Llosa". Combien de sites classés dans combien
3
BULCO – Méthodologie documentaire 2011/2012 - TD4 : Rechercher de l’information sur Internet – L1 LEA
de catégories trouvez-vous ? Limitez les résultats
aux sites de la catégorie « World: Español: Artes:
Literatura: Autores: Grandes escritores de la lengua
hispana: Vargas Llosa, Mario ». Combien y en a-til ?
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------c) Les signets de la BNF (http://signets.bnf.fr)
RAPPEL : les signets sont des sites recommandés par des institutions culturelles ou éducatives
(ex : les signets de l’Université : vus en TD2)
La Bibliothèque nationale de France propose sur son site un répertoire de 7000 ressources
mises à jour et contrôlées régulièrement : les sites recommandés sont peu nombreux mais
d’une très grande qualité.
La navigation s’effectue dans l’arborescence thématique. Il est également possible
d’effectuer une recherche de sites par mots-clefs (« recherche ») ou de consulter l’index
alphabétique des mots clés
4
BULCO – Méthodologie documentaire 2011/2012 - TD4 : Rechercher de l’information sur Internet – L1 LEA
« Recherche » :
recherche par mots
dans les signets de la
BnF
Les signets sont classés
soit par ordre
alphabétique, avec des
renvois, soit par thème
Exercices sur le site des signets de la BnF
http://signets.bnf.fr/
ou dans colonne « collections et services » depuis la page d’accueil
4)Dans
la
catégorie
« langues
et
littératures
étrangères », retrouvez un site consacré aux revues
des
langues
indigènes
d’Amérique.
Ecrivez
l’arborescence utilisée. Quel est le nom de ce
site ? Quand a t-il été contrôlé par la BnF la
dernière fois ?
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------5
BULCO – Méthodologie documentaire 2011/2012 - TD4 : Rechercher de l’information sur Internet – L1 LEA
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------5) Grâce au classement alphabétique, retrouvez la
catégorie consacrée à l’histoire de l’Amérique
latine. Dans cette catégorie, relevez un site dédié
à l’étude des civilisations méso-américaines.
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------6) Sur le site trouvé dans la question 5), retrouvez
les liens proposés sur d’autres sites web consacrés
à
l’étude
des
société
précolombiennes.
En
particulier, relevez l’adresse du site Mesoweb sur
lequel vous rechercherez l’article intitulé « Life
and Death in Ancient Mexico ». Qui est l’auteur de
cet article ?
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------6
BULCO – Méthodologie documentaire 2011/2012 - TD4 : Rechercher de l’information sur Internet – L1 LEA
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
7) Repérez également sur le site Mesoweb la partie
encyclopédie. A la lettre A, retrouvez l’article sur
la légende de la migration aztèque. Quel est le
titre du recueil d’où est issue cette légende ?
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
7
BULCO – Méthodologie documentaire 2011/2012 - TD4 : Rechercher de l’information sur Internet – L1 LEA
2. Les moteurs de recherche
Les moteurs de recherche sont des robots qui indexent automatiquement des millions de
pages web, sans intervention humaine. Contrairement aux annuaires, les moteurs
permettent de trouver sur le web une quantité considérable de sites Internet, mais dont la
qualité et la fiabilité n’est jamais contrôlée ni vérifiée.
La recherche s’effectue uniquement par mots-clés. Celle-ci peut être simple ou avancée.
Toutefois, la couverture du web par les moteurs de recherche reste parcellaire : seulement
20% du web est indexé par les robots. Toute la partie du Web qui n’est pas indexée par les
robots s’appelle le WEB INVISIBLE
Chaque moteur de recherche a son propre robot et fonctionne donc à sa manière : c’est
pourquoi les résultats peuvent être différents pour une même requête selon le moteur
utilisé.
Il existe des moteurs de recherche
- généralistes : Google, Exalead, Yahoo…..
- spécialisés : Google maps, Google images, Google Scholar….
- Google Book ou Gallica pour les livres libres de droit et numérisés
Exercice sur les moteurs de recherche
8.
Faites une recherche sur la
civilisation précolombienne dans ces trois moteurs de
recherche et comparez les résultats
Recherche « civilisation précolombienne »
Google
Exalead
Google scholar
http://www.google.fr/ http://www.exalead.com/ http://scholar.google.fr
Nombre
réponses
total
de
Référence du
article trouvé
1er
Rang de classement
du
1er
article
intéressant
Avantages
moteur
de
ce
Inconvénients de ce
moteur
9. Rechercher
le journal d’une femme de chambre
d’Octave Mirbeau dans Google Books.
3.
Les métamoteurs de recherche
8
BULCO – Méthodologie documentaire 2011/2012 - TD4 : Rechercher de l’information sur Internet – L1 LEA
Les métamoteurs sont des outils qui interrogent plusieurs moteurs de recherche
simultanément. Ils n’ont pas d’index propre mais utilisent les index des moteurs de recherche
qu’ils interrogent : lors de l’affichage des résultats ils éliminent les doublons.
Exemples de métamoteurs : Copernic, Clusty, Findloo, Ixquick…
Avantages
 La recherche est plus rapide car elle interroge simultanément plusieurs moteurs de
recherche à la fois.
 La recherche est plus exhaustive car une plus grande couverture du web est couverte.
Inconvénients
 Ils filtrent moins qu’un seul moteur de recherche généraliste
 Les recherches sont moins pointues.
Exercices sur un métamoteur
10. Connectez-vous sur http://fr.findloo.com/fr/ .
Recherchez des documents sur Tristes tropiques, de
Claude Lévi-Strauss. Comment sont présentés les
résultats ? Quels sont les moteurs de recherche
utilisés ?
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------Toujours
sur
ce
métamoteur,
recherchez
la
définition de l'anthropologie culturelle. Quels sont
les dictionnaires en ligne utilisés ?
11.
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------Quel outil de recherche privilégier pour ses requêtes ?
Vous pouvez choisir l’annuaire pour débuter une recherche ou pour vous faire une
idée des sites existants dans un domaine que vous découvrez. De plus, l’annuaire
permet de repérer des ressources du web invisible.
Vous privilégierez le moteur de recherche pour la taille de son index et la rapidité
de mise à jour. Le moteur de recherche va vous servir a effectuer une recherche
9
BULCO – Méthodologie documentaire 2011/2012 - TD4 : Rechercher de l’information sur Internet – L1 LEA
pointue à partir de mots clefs précis ou d’élargir la portée de votre requête à une
grande partie du web. Mieux vaut dans ce cas privilégier la recherche avancée.
1.
DOCUMENTAIRE
ORGANISER UNE VEILLE
Définition d’une veille documentaire :
« La veille documentaire s’appuie sur des techniques de « surveillance automatisée » de type
push ou pull et permet d’être régulièrement et automatiquement informé des nouvelles
publications dans son domaine de recherche ou dans des champs d’intérêt précis. »
(www.bib.umontreal.ca/infosphere/sciences/glossaire.html)
= Lorsqu’un site nous intéresse, il est possible d’être automatiquement informé des
nouveautés qui paraissent sur ce site sans être obligé d’aller le consulter.
Plusieurs méthodes :
- on s’abonne à la lettre d’information de ce site (newsletter) : un mél sur les
nouveautés arrivera dans notre boite mél
- On peut se créer un agrégateur de flux (ex : iGoole, ou Netvives) sur lequel
viendront régulièrement s’afficher tous les flux RSS auxquels on est abonnée
Exemple : http://culturel.mal217.org/fr/
S’abonner à la lettre
d’information qu’on
recevra sur notre boite
mél dès qu’il y aura
une nouveauté sur ce
site
S’abonner au flux
RSS qui viendra
alimenter l’agrégateur
de flux qu’on se sera
fabriqué
Le site de la maison d’Amérique
latine propose 2 manières de
rester informé régulièrement de
leur nouveautés :
10
BULCO – Méthodologie documentaire 2011/2012 - TD4 : Rechercher de l’information sur Internet – L1 LEA
Quand on s’abonne à un flux RSS, le système nous demande de choisir l’agrégateur qu’on
utilise :
Le flux de la Maison de
l’Amérique Latine vient
se positionner dans mon
agrégateur personnalisé
Exercices d’application : se créer un agrégateur de
flux i-Google (condition : avoir une adresse mél sur
Gmail)
11
BULCO – Méthodologie documentaire 2011/2012 - TD4 : Rechercher de l’information sur Internet – L1 LEA
III.
UTILISER LES SERVICES DE REPONSE EN LIGNE
= Faire faire les recherches par d’autres que vous
Un service de renseignements en ligne vous permet d’obtenir une aide personnalisée à
distance lors d’une recherche documentaire.
Plusieurs bibliothèques en France organisent ces services : la Bibliothèque Publique d’Information (BPI : BiblioSésame), la BnF (Sindbad : Service d' INformation Des Bibliothécaires
A Distance), les Bu de l’Ouest de la France bientôt rejointes par la BULCO (Ubib :
http://www.ubib.fr/) et la bibliothèque municipale de Lyon (Le guichet du Savoir)
Le Guichet du Savoir de la Bibliothèque municipale de Lyon :
http://www.guichetdusavoir.org/
contient en particulier : Accès thématique aux Questions / Réponses
Le Guichet du Savoir comprend :
- un service questions-réponses permettant de poser tout type de questions d'ordre
documentaire
- une base de connaissances, qui permet des recherches fines sur les informations capitalisées
par le Guichet : les questions et réponses sélectionnées sont accessibles à la fois via un accès
thématique sur la page d’accueil du Guichet du Savoir et à partir d’un moteur de recherche
élargie
Le service est soumis à inscription : "L'inscription est ouverte à tous, sans contrainte
géographique, inscrits à la Bibliothèque municipale de Lyon ou non. Elle est gratuite."
Le GDS donne une réponse dans les 72 heures
Le GDS se caractérise par l’ouverture de sa politique de service et l’étendue des questions
traitées : les seules questions exclues sont les consultations juridiques ou médicales et les
travaux scolaires ; le GDS répond y compris à des questions sur la vie pratique ou à des
questions de simple curiosité.
12
BULCO – Méthodologie documentaire 2011/2012 - TD4 : Rechercher de l’information sur Internet – L1 LEA
Accès thématique possible
Possibilité recherche par mot clé
Ex : mites
« Bonjour,
petite question qui a l'air bête et qui l'est sûrement, mais sait-on jamais...
J'ai plusieurs fois découvert des petits trous sur mes vêtements, ce qui n'a pas manqué de
m'agacer car à chaque fois il s'agissait des vêtements tout juste achetés. Et aujourd'hui,
illumination, je me suis rendue compte que absolument toutes les fringues trouées sont de
couleur verte!!!
Existerait-il des mites (ou autre insecte textilovore) chromosensible, avec une préférence pour
le vert?
Je me rends bien compte que ça a l'air stupide
mais je vous jure que c'est vrai!
Merci beaucoup et bonne journée »
13
BULCO – Méthodologie documentaire 2011/2012 - TD4 : Rechercher de l’information sur Internet – L1 LEA
14