Rechercher des informations avec un moteur de recherche

Transcription

Rechercher des informations avec un moteur de recherche
TPE 1ère
Rechercher des informations avec un moteur de recherche
Un moteur de recherche est un outil de recherche
sur le Web de pages Web. Il permet aux
internautes de lancer des requêtes par mots-clés
sur le texte intégral des pages Web.
Comment fonctionne un moteur de recherche :

C’est un outil automatique contrairement
au logiciel documentaire du CDI (E-Sidoc)
où c’est le documentaliste qui indexe les
documents en donnant un ou plusieurs
mots-clés pour chaque site internet, livre,
ou article de périodique.
Un moteur de recherche est constitué de trois
éléments :
1 – Un robot appelé crawler ou spider parcourt le
web de façon automatique. Le robot de Google
s’appelle Google Bot. En partant d’une liste
d’adresses prédéfinies le robot va tester tous les
liens hypertextes. C’est-à-dire des liens qui
renvoient à d’autres sites. Naviguant de site
Internet en site Internet ce robot rapatrie le
contenu des pages web dans sa base. Il va
également visiter les pages Web soumises par les
éditeurs de sites dans la cadre du référencement.
Les créateurs de ces sites payent pour que leurs
sites soient trouvés lors d’une recherche. Ce
parcours du Crawler lui prend en moyenne 4
semaines. Une fois ce parcours effectué le Crawler
recommence pour mettre à jour sa base. Il peut
donc y avoir des pages non indexées dans la base :
on appelle cela le web invisible.
2- Un index qui est la liste de tous les mots de
toutes les pages Web rapatriées par le robot (texte
intégrale de la page et métadonnées : les balises
méta sont des informations insérées par le
webmaster qui ne s’affichent pas à l’écran mais
donnent des indications sur la page comme le titre,
mot-clé)
3- Un serveur web qui offre une interface de
recherche.
1
TPE 1ère
Trouver les bons mots-clés pour interroger un moteur de recherche :
 Des mots suffisamment précis sur les moteurs
 Choisir de préférence des noms,
Utiliser les autres mots (verbes, adjectifs, adverbes, pronoms)
plutôt dans les expressions entre guillemets.
 Plus il y a de mots, plus la question se restreint
Un seul mot peut suffire, essayer de ne pas dépasser 3 mots au départ
 Faire attention à l’ordre des mots :
Quels mots-clés sont prioritaires ? Commencer par les mots-clés les plus
importants.
Combiner les mots-clés en utilisant les opérateurs booléens ET / OU.
ET permet de trouver toutes les pages web comportant tous les critères demandés à la fois. C’est
l’opérateur par défaut sur Google.
Le résultat de la requête Chien ET chat proposera toutes les pages Web qui correspondent aux deux
termes c’est-à-dire des chiens et des chats.
OU permet de trouver toutes les pages web ou images qui correspondent soit à l’un ou l’autre des
critères demandés.
Le résultat de la requête chien OU chat proposera toutes les pages Web qui correspondent à l’un des
deux termes.
SAUF permet d’exclure un mot clé. Chien SAUF labrador recherchera des pages Web sur les chiens
SAUF sur les labradors.
Il existe d’autres moteurs de recherche que
Google à utiliser selon la spécificité de la
recherche d’information :
-Yahoo search
-Exalead
. Windows live
. Kvisu
Bing
Qwant
2
TPE 1ère
Comparaison des moteurs de recherche GOOGLE et EXALAED.
D’après le tableau récupéré le 8/02/2007 sur le site SearchEnginesMatrix
Généralités
Exalead
Google
URL du moteur
www.exalead.fr ou
www.exalead.com
France www.google.fr ; USA
URL de l'aide
www.exalead.fr
www.google.com
2002
1998
Créateur
François Bourdoncle
Larry Page et Sergey Brin
Conception
France
USA
Date de
lancement
www.google.com
Opérateurs de recherche
ET
Opérateur par défaut. Utilisez
également l’opérateur « AND »
Opérateur par défaut
OU
Utilisez l’opérateur « OR »
Utilisez « OR » ou bien « | ». Attention le
« OR » doit être saisi en majuscule
SAUF
Utilisez le signe « - » ou l’opérateur Utilisez le signe « - » précédé et non
« AND NOT »
suivi d’un espace pour exclure un mot
Utilisez les guillemets, mais aussi « - »,
« / », « . », « = »
Expression exacte Utilisez les guillemets « »
Exiger la
présence d’un mot
Utilisez le « + » pour exiger la
présence d’un mot
Opérateur de
proximité
Utilisez l’opérateur « NEAR » pour
trouver les termes de la requête à
moins de 16 mots de distance l’un
Non
de l’autre. L’opérateur « NEXT »
trouve les termes de la requête l’un
à côté de l’autre
Utilisez le « + » accolé au mot
Non
Parenthésage
Oui
3
TPE 1ère
Opérations linguistiques
Exalead
Approximation
phonétique
Correction
orthographique
Lemmatisation
Google
Utilisez l’opérateur « soundslike: »
Si vous saisissez un mot avec une
graphie fautive, Exalead vous
Si vous saisissez un mot avec une
suggère, la graphie correcte. Vous
graphie fautive, Google vous suggère la
pouvez également effectuer un
graphie correcte. Utilisez la fonction «
recherche avec une orthographe
spell: »
approchée en utilisant l’opérateur «
spellslike: »
Exalead recherche sur les mots tel
Google recherche sur les mots tel qu’ils
qu’ils sont saisis. Il distingue entre
sont saisis. Il distingue entre le singulier
le singulier et le pluriel ainsi
et le pluriel ainsi qu’entre les différentes
qu’entre les différentes
déclinaisons d’un verbe
déclinaisons d’un verbe
Pour la troncature, utilisez
l’astérisque « * » collé à la racine
du mot à rechercher. Pour le
Troncature/Masque
masque, utilisez le « . ». A ce
moment le mot doit être placé
entre slash oblique « / »
Joker
Non
Non
Utilisez l’astérisque « * » en guise de
joker
Non
Utilisez le « ~ » précédé d’un espace et
accolé au mot recherché
Synonyme
Définition
Non
Utilisez « define: », mais aussi le
raccourci « définition de ». Le résultat
Non
n’est pas le même
Traduction
Non
Recherche
multilingue
Non
A partir de la page de résultats, cliquez
sur « Traduire cette page » s’il y a lieu.
Autrement, il suffit de cliquer sur « Outils
linguistiques » pour traduite un texte ou
une page Web
Non
4
TPE 1ère
Dans « Affiner la recherche » la
rubrique « Termes associés »
Accesible à partir de labs.google.fr ou
affiche une liste d’expressions
www.google.com Disponible
Suggestions de apparaissant fréquemment dans
uniquement en anglais
recherche
les requêtes. Cliquez sur un terme
pour restreindre la requête
Règles de saisie
Exalead
Google
Accents
Insensible aux accents
Insensible aux accents. Pour le forcer à
les prendre en considération ajouter le «
+ » précédé d’un espace et accolé au
mot recherché
Casse
Insensible à la casse
Insensible à la casse
Mots-vides
Ordre des mots
Les mots-vides sont ignorés ainsi que
Les mots vides sont ignorés sauf si
les mots spécialisés tels que « http » et
vous les faites précédés par le « +
« .com » et les lettres/chiffres d’un seul
»
caractère
Aucune incidence sur la requête
Ne change pas les resultats renvoyés,
change leur ordre
Recherche par champs
Exalead
Google
Domaine
Utilisez l’opérateur « site: »
Passez par le mode de « recherche
avancée » ou bien utilisez l’opérateur «
site: »
Nom de domaine
Utilisez l’opérateur « site: »
Passez par le mode de « recherche
avancée » ou bien utilisez l’opérateur «
site: »
Utilisez l’opérateur « inurl: »
Passez par le mode de « recherche
avancée » ou bien utilisez « inurl: » ou «
allinurl ». « inurl:wifi norme » = pages qui
ont dans leur URL le mot wifi et dans le
contenu (URL comprise) le mot norme. «
allinurl: wifi norme » trouve les 2 dans
l'URL
Dans la colonne « Affiner la
recherche » cliquez sur « Plus de
choix ». Dans la rubrique «
Situation géographique » cliquez
sur la zone géographique qui vous
intéresse
Non
URL
Localisation
géographique
5
TPE 1ère
Exalead
Google
Utilisez l’opérateur « intitle: »
Passez par le mode de « recherche
avancée » ou bien utilisez « intitle: » ou
« allintitle ». idem que URL, mais pour
titre
Non
Passez par le mode de « recherche
avancée » ou bien utilisez « intext: » ou
« allintext ». « Idem que URL, mais pour
texte
Lien
Utilisez l’opérateur « Link: »
Passez par le mode de « recherche
avancée » ou bien utilisez « inanchor: »
ou « allinanchor ». Idem que URL, mais
pour lien hypetexte
Langue
Utilisez l’opérateur « language: »
suivi du code de la langue. Dans la
colonne « Affiner la recherche », la
rubrique « Langues » affiche des
statistiques sur la répartition des
résultats par langue
Passez par le mode de « recherche
avancée » pour une recherche
ponctuelle et par les « préférences »
pour une configuration permanente
Titre
Texte
6