Rechercher des informations avec un moteur de recherche
Transcription
Rechercher des informations avec un moteur de recherche
TPE 1ère Rechercher des informations avec un moteur de recherche Un moteur de recherche est un outil de recherche sur le Web de pages Web. Il permet aux internautes de lancer des requêtes par mots-clés sur le texte intégral des pages Web. Comment fonctionne un moteur de recherche : C’est un outil automatique contrairement au logiciel documentaire du CDI (E-Sidoc) où c’est le documentaliste qui indexe les documents en donnant un ou plusieurs mots-clés pour chaque site internet, livre, ou article de périodique. Un moteur de recherche est constitué de trois éléments : 1 – Un robot appelé crawler ou spider parcourt le web de façon automatique. Le robot de Google s’appelle Google Bot. En partant d’une liste d’adresses prédéfinies le robot va tester tous les liens hypertextes. C’est-à-dire des liens qui renvoient à d’autres sites. Naviguant de site Internet en site Internet ce robot rapatrie le contenu des pages web dans sa base. Il va également visiter les pages Web soumises par les éditeurs de sites dans la cadre du référencement. Les créateurs de ces sites payent pour que leurs sites soient trouvés lors d’une recherche. Ce parcours du Crawler lui prend en moyenne 4 semaines. Une fois ce parcours effectué le Crawler recommence pour mettre à jour sa base. Il peut donc y avoir des pages non indexées dans la base : on appelle cela le web invisible. 2- Un index qui est la liste de tous les mots de toutes les pages Web rapatriées par le robot (texte intégrale de la page et métadonnées : les balises méta sont des informations insérées par le webmaster qui ne s’affichent pas à l’écran mais donnent des indications sur la page comme le titre, mot-clé) 3- Un serveur web qui offre une interface de recherche. 1 TPE 1ère Trouver les bons mots-clés pour interroger un moteur de recherche : Des mots suffisamment précis sur les moteurs Choisir de préférence des noms, Utiliser les autres mots (verbes, adjectifs, adverbes, pronoms) plutôt dans les expressions entre guillemets. Plus il y a de mots, plus la question se restreint Un seul mot peut suffire, essayer de ne pas dépasser 3 mots au départ Faire attention à l’ordre des mots : Quels mots-clés sont prioritaires ? Commencer par les mots-clés les plus importants. Combiner les mots-clés en utilisant les opérateurs booléens ET / OU. ET permet de trouver toutes les pages web comportant tous les critères demandés à la fois. C’est l’opérateur par défaut sur Google. Le résultat de la requête Chien ET chat proposera toutes les pages Web qui correspondent aux deux termes c’est-à-dire des chiens et des chats. OU permet de trouver toutes les pages web ou images qui correspondent soit à l’un ou l’autre des critères demandés. Le résultat de la requête chien OU chat proposera toutes les pages Web qui correspondent à l’un des deux termes. SAUF permet d’exclure un mot clé. Chien SAUF labrador recherchera des pages Web sur les chiens SAUF sur les labradors. Il existe d’autres moteurs de recherche que Google à utiliser selon la spécificité de la recherche d’information : -Yahoo search -Exalead . Windows live . Kvisu Bing Qwant 2 TPE 1ère Comparaison des moteurs de recherche GOOGLE et EXALAED. D’après le tableau récupéré le 8/02/2007 sur le site SearchEnginesMatrix Généralités Exalead Google URL du moteur www.exalead.fr ou www.exalead.com France www.google.fr ; USA URL de l'aide www.exalead.fr www.google.com 2002 1998 Créateur François Bourdoncle Larry Page et Sergey Brin Conception France USA Date de lancement www.google.com Opérateurs de recherche ET Opérateur par défaut. Utilisez également l’opérateur « AND » Opérateur par défaut OU Utilisez l’opérateur « OR » Utilisez « OR » ou bien « | ». Attention le « OR » doit être saisi en majuscule SAUF Utilisez le signe « - » ou l’opérateur Utilisez le signe « - » précédé et non « AND NOT » suivi d’un espace pour exclure un mot Utilisez les guillemets, mais aussi « - », « / », « . », « = » Expression exacte Utilisez les guillemets « » Exiger la présence d’un mot Utilisez le « + » pour exiger la présence d’un mot Opérateur de proximité Utilisez l’opérateur « NEAR » pour trouver les termes de la requête à moins de 16 mots de distance l’un Non de l’autre. L’opérateur « NEXT » trouve les termes de la requête l’un à côté de l’autre Utilisez le « + » accolé au mot Non Parenthésage Oui 3 TPE 1ère Opérations linguistiques Exalead Approximation phonétique Correction orthographique Lemmatisation Google Utilisez l’opérateur « soundslike: » Si vous saisissez un mot avec une graphie fautive, Exalead vous Si vous saisissez un mot avec une suggère, la graphie correcte. Vous graphie fautive, Google vous suggère la pouvez également effectuer un graphie correcte. Utilisez la fonction « recherche avec une orthographe spell: » approchée en utilisant l’opérateur « spellslike: » Exalead recherche sur les mots tel Google recherche sur les mots tel qu’ils qu’ils sont saisis. Il distingue entre sont saisis. Il distingue entre le singulier le singulier et le pluriel ainsi et le pluriel ainsi qu’entre les différentes qu’entre les différentes déclinaisons d’un verbe déclinaisons d’un verbe Pour la troncature, utilisez l’astérisque « * » collé à la racine du mot à rechercher. Pour le Troncature/Masque masque, utilisez le « . ». A ce moment le mot doit être placé entre slash oblique « / » Joker Non Non Utilisez l’astérisque « * » en guise de joker Non Utilisez le « ~ » précédé d’un espace et accolé au mot recherché Synonyme Définition Non Utilisez « define: », mais aussi le raccourci « définition de ». Le résultat Non n’est pas le même Traduction Non Recherche multilingue Non A partir de la page de résultats, cliquez sur « Traduire cette page » s’il y a lieu. Autrement, il suffit de cliquer sur « Outils linguistiques » pour traduite un texte ou une page Web Non 4 TPE 1ère Dans « Affiner la recherche » la rubrique « Termes associés » Accesible à partir de labs.google.fr ou affiche une liste d’expressions www.google.com Disponible Suggestions de apparaissant fréquemment dans uniquement en anglais recherche les requêtes. Cliquez sur un terme pour restreindre la requête Règles de saisie Exalead Google Accents Insensible aux accents Insensible aux accents. Pour le forcer à les prendre en considération ajouter le « + » précédé d’un espace et accolé au mot recherché Casse Insensible à la casse Insensible à la casse Mots-vides Ordre des mots Les mots-vides sont ignorés ainsi que Les mots vides sont ignorés sauf si les mots spécialisés tels que « http » et vous les faites précédés par le « + « .com » et les lettres/chiffres d’un seul » caractère Aucune incidence sur la requête Ne change pas les resultats renvoyés, change leur ordre Recherche par champs Exalead Google Domaine Utilisez l’opérateur « site: » Passez par le mode de « recherche avancée » ou bien utilisez l’opérateur « site: » Nom de domaine Utilisez l’opérateur « site: » Passez par le mode de « recherche avancée » ou bien utilisez l’opérateur « site: » Utilisez l’opérateur « inurl: » Passez par le mode de « recherche avancée » ou bien utilisez « inurl: » ou « allinurl ». « inurl:wifi norme » = pages qui ont dans leur URL le mot wifi et dans le contenu (URL comprise) le mot norme. « allinurl: wifi norme » trouve les 2 dans l'URL Dans la colonne « Affiner la recherche » cliquez sur « Plus de choix ». Dans la rubrique « Situation géographique » cliquez sur la zone géographique qui vous intéresse Non URL Localisation géographique 5 TPE 1ère Exalead Google Utilisez l’opérateur « intitle: » Passez par le mode de « recherche avancée » ou bien utilisez « intitle: » ou « allintitle ». idem que URL, mais pour titre Non Passez par le mode de « recherche avancée » ou bien utilisez « intext: » ou « allintext ». « Idem que URL, mais pour texte Lien Utilisez l’opérateur « Link: » Passez par le mode de « recherche avancée » ou bien utilisez « inanchor: » ou « allinanchor ». Idem que URL, mais pour lien hypetexte Langue Utilisez l’opérateur « language: » suivi du code de la langue. Dans la colonne « Affiner la recherche », la rubrique « Langues » affiche des statistiques sur la répartition des résultats par langue Passez par le mode de « recherche avancée » pour une recherche ponctuelle et par les « préférences » pour une configuration permanente Titre Texte 6