Chapitre III : Les outils de recherche

Transcription

Chapitre III : Les outils de recherche
INTERNET
Chapitre III : Les
outils de recherche
Pierre Terramorsi
Le volume d'informations disponibles sur Internet est de plus en plus important, il convient donc d'utiliser des
outils permettant de rechercher et de trouver l'information d'une manière rapide et efficace.
Deux types d'outils nous permettent d'effectuer des recherches :
Les annuaires de recherche
les moteurs de recherche
I. Les annuaires
Définition
Un annuaire est un outil de recherche qui recense un certain nombre de sites au travers de fiches
descriptives comprenant, en règle générale, le titre, l'adresse (l'URL) et un bref descriptif d'une longueur
allant le plus souvent de 15 à 25 mots au maximum.
Chaque site est inscrit dans une ou plusieurs catégorie(s) - on parle également de rubrique(s) - .
Les rubriques sont classées thématiquement sous forme d’arborescence
Lorsqu'un mot-clé est saisi dans le formulaire proposé, l'annuaire effectue une recherche sur les
occurrences de ce terme dans ses fiches descriptives de site, et non pas dans le contenu des pages du site
en question. Il s'agit là de la différence la plus notable avec les moteurs de recherche.
IMPORTANT : Les annuaires sont de moins en moins utilisés par les Internautes; Les recherches se font, pour le
plus grand nombre à l'heure actuelle, à l'aide de moteurs de recherche. De nombreux annuaires ont adopté une
technologie moteur de recherche, et ont abandonné l’annuaire. exemple : voila.fr
Principaux annuaires mondiaux :
Yahoo! International [en]Annuaire International de Yahoo
DMOZ Open Directory Project (ODP) [en/fr] Annuaire très important : les
éditeurs sont des internautes !
Princpaux annuaires Francophones:
Yahoo! France ]Annuaire Français de Yahoo
DMOZ Open Directory Project (ODP) [en/fr]
Annuaire Lycos France
2
INTERNET
Chapitre III : Les
outils de recherche
Pierre Terramorsi
II – Les moteurs de recherche
Définition
Le moteur de recherche fonctionne sur un système radicalement différent de celui de l'annuaire. Des
robots logiciels (appelés crawler ou spider) scrutent le Web, vont de page en page (en fait de lien en lien)
et sauvegardent au fur et à mesure de leurs pérégrinations le contenu texte des pages rencontrées,
constituant ainsi un "index", c'est-à-dire une collection plus ou moins grande de pages Web.
Lorsque l'internaute saisit un mot clé dans le formulaire proposé, le moteur va en rechercher les
occurrences dans son index, c'est-à-dire dans le contenu texte des pages Web sauvegardées au préalable.
Le moteur de recherche effectue donc ses recherches sur des pages Web, alors que l'annuaire vous proposera
des sites Web. Là est toute la différence qui explique qu'il est absolument impossible de comparer les résultats
fournis par les deux types d'outils.
Principaux moteurs :
http://www.google.fr/
http://search.yahoo.fr/
http://search.msn.fr/
http://www.exalead.com/
3
INTERNET
Chapitre III : Les
outils de recherche
Pierre Terramorsi
III - Comparatif
Index (constitution de la base de
données)
Organisation et classement
Type de documents indexés
Recherche
Résultats
Moteurs
La base de données est constituée
à l’aide de logiciels robots (crawler
ou spider) qui parcourent le web de
lien en lien et qui enregistrent les
documents trouvés.
Aucun. la recherche s’effectue par
mot clef
Tous types de documents.
En priorité des pages web mais
aussi des images, des .doc, .xls,
.pdf…….
Mot clef tapé par l’internaute.
La recherche porte sur le contenu
réel des documents indexés
Les résultats proposés sont des
pages web ou autre type de
documents qui correspondent dans
leur contenu au mot clef recherché.
Annuaires
Constitué par des humains qui
visitent les sites web et établissent
une fiche descriptive pour chaque
site. Cette fiche comporte l’Url, une
description et un titre
Classement des sites par rubriques
et sous rubriques thématiques ou
géographiques. Sous forme
d’arborescence.
Uniquement des sites web
répertoriés sous forme de fiches
Mot clef tapé par l’internaute.
La recherche s’effectue sur les
fiches descriptives.
Ou navigation à travers
l’arborescence
Résultats sont les fiches
descriptives qui correspondent dans
leur contenu au mot clef tapé.
Les liens renvoient vers la page
d’accueil du site web
Les liens ouvrent le document
sélectionné.
INDEX:
Terme utilisé plus particulièrement pour les moteurs.
Désigne la « base de données », d’un outil de recherche, dans laquelle sont enregistrés les documents qui
vont servir à fournir les résultats de la recherche.
On dira qu’une page web est indexée, lorsqu’elle figure dans cette base et que par conséquent, elle peut
« sortir » comme résultat pour une recherche précise.
On peut dire qu'on utilisera un annuaire pour rechercher un site général sur un sujet donné.
On utilisera, en revanche, un moteur de recherche pour effectuer une recherche sur un sujet beaucoup plus
précis, plus fin.
Pour donner un exemple simple (voire simpliste), on cherchera le site Web d'une entreprise sur un annuaire,
mais des renseignements sur un de ses produits (recherche donc à l'intérieur des sites) sur les moteurs de
recherche
4