Chapitre III : Les outils de recherche
Transcription
Chapitre III : Les outils de recherche
INTERNET Chapitre III : Les outils de recherche Pierre Terramorsi Le volume d'informations disponibles sur Internet est de plus en plus important, il convient donc d'utiliser des outils permettant de rechercher et de trouver l'information d'une manière rapide et efficace. Deux types d'outils nous permettent d'effectuer des recherches : Les annuaires de recherche les moteurs de recherche I. Les annuaires Définition Un annuaire est un outil de recherche qui recense un certain nombre de sites au travers de fiches descriptives comprenant, en règle générale, le titre, l'adresse (l'URL) et un bref descriptif d'une longueur allant le plus souvent de 15 à 25 mots au maximum. Chaque site est inscrit dans une ou plusieurs catégorie(s) - on parle également de rubrique(s) - . Les rubriques sont classées thématiquement sous forme d’arborescence Lorsqu'un mot-clé est saisi dans le formulaire proposé, l'annuaire effectue une recherche sur les occurrences de ce terme dans ses fiches descriptives de site, et non pas dans le contenu des pages du site en question. Il s'agit là de la différence la plus notable avec les moteurs de recherche. IMPORTANT : Les annuaires sont de moins en moins utilisés par les Internautes; Les recherches se font, pour le plus grand nombre à l'heure actuelle, à l'aide de moteurs de recherche. De nombreux annuaires ont adopté une technologie moteur de recherche, et ont abandonné l’annuaire. exemple : voila.fr Principaux annuaires mondiaux : Yahoo! International [en]Annuaire International de Yahoo DMOZ Open Directory Project (ODP) [en/fr] Annuaire très important : les éditeurs sont des internautes ! Princpaux annuaires Francophones: Yahoo! France ]Annuaire Français de Yahoo DMOZ Open Directory Project (ODP) [en/fr] Annuaire Lycos France 2 INTERNET Chapitre III : Les outils de recherche Pierre Terramorsi II – Les moteurs de recherche Définition Le moteur de recherche fonctionne sur un système radicalement différent de celui de l'annuaire. Des robots logiciels (appelés crawler ou spider) scrutent le Web, vont de page en page (en fait de lien en lien) et sauvegardent au fur et à mesure de leurs pérégrinations le contenu texte des pages rencontrées, constituant ainsi un "index", c'est-à-dire une collection plus ou moins grande de pages Web. Lorsque l'internaute saisit un mot clé dans le formulaire proposé, le moteur va en rechercher les occurrences dans son index, c'est-à-dire dans le contenu texte des pages Web sauvegardées au préalable. Le moteur de recherche effectue donc ses recherches sur des pages Web, alors que l'annuaire vous proposera des sites Web. Là est toute la différence qui explique qu'il est absolument impossible de comparer les résultats fournis par les deux types d'outils. Principaux moteurs : http://www.google.fr/ http://search.yahoo.fr/ http://search.msn.fr/ http://www.exalead.com/ 3 INTERNET Chapitre III : Les outils de recherche Pierre Terramorsi III - Comparatif Index (constitution de la base de données) Organisation et classement Type de documents indexés Recherche Résultats Moteurs La base de données est constituée à l’aide de logiciels robots (crawler ou spider) qui parcourent le web de lien en lien et qui enregistrent les documents trouvés. Aucun. la recherche s’effectue par mot clef Tous types de documents. En priorité des pages web mais aussi des images, des .doc, .xls, .pdf……. Mot clef tapé par l’internaute. La recherche porte sur le contenu réel des documents indexés Les résultats proposés sont des pages web ou autre type de documents qui correspondent dans leur contenu au mot clef recherché. Annuaires Constitué par des humains qui visitent les sites web et établissent une fiche descriptive pour chaque site. Cette fiche comporte l’Url, une description et un titre Classement des sites par rubriques et sous rubriques thématiques ou géographiques. Sous forme d’arborescence. Uniquement des sites web répertoriés sous forme de fiches Mot clef tapé par l’internaute. La recherche s’effectue sur les fiches descriptives. Ou navigation à travers l’arborescence Résultats sont les fiches descriptives qui correspondent dans leur contenu au mot clef tapé. Les liens renvoient vers la page d’accueil du site web Les liens ouvrent le document sélectionné. INDEX: Terme utilisé plus particulièrement pour les moteurs. Désigne la « base de données », d’un outil de recherche, dans laquelle sont enregistrés les documents qui vont servir à fournir les résultats de la recherche. On dira qu’une page web est indexée, lorsqu’elle figure dans cette base et que par conséquent, elle peut « sortir » comme résultat pour une recherche précise. On peut dire qu'on utilisera un annuaire pour rechercher un site général sur un sujet donné. On utilisera, en revanche, un moteur de recherche pour effectuer une recherche sur un sujet beaucoup plus précis, plus fin. Pour donner un exemple simple (voire simpliste), on cherchera le site Web d'une entreprise sur un annuaire, mais des renseignements sur un de ses produits (recherche donc à l'intérieur des sites) sur les moteurs de recherche 4