La recherche sur Internet

Transcription

La recherche sur Internet
La recherche sur Internet
Table des matières
1- Internet est comme une bibliothèque publique.......................................................................................................2
Comment on utilise une bibliothèque ordinaire................................................................................................2
L'Internet n'est pas une bibliothèque ordinaire..................................................................................................2
Synthèse.............................................................................................................................................................2
2- Se faire aider pour trouver les informations sur l'Internet......................................................................................3
Où est le bibliothécaire?....................................................................................................................................3
3- Comment les moteurs de recherche... cherchent.................................................................................................... 4
Les serveurs d'indexation..................................................................................................................................4
4- Fonctionnement des moteurs de recherche: les requêtes........................................................................................5
5- Analyse des résultats d'une recherche.....................................................................................................................6
Les publicités................................................................................................................................................6
Les résultats non publicitaires......................................................................................................................7
Qualité des résultats de recherche.....................................................................................................................7
6- Affiner le travail sur un moteur de recherche......................................................................................................... 8
Bien choisir les mots-clés utilisés......................................................................................................................8
Varier les combinaisons de mots-clés utilisées.............................................................................................8
Attention aux acccents..................................................................................................................................8
Les directives particulières................................................................................................................................8
Singulier et pluriel........................................................................................................................................8
Synonymes....................................................................................................................................................8
Le joker *......................................................................................................................................................9
Donner des directives aux moteurs de recherche..............................................................................................9
Recherche sur une expression.......................................................................................................................9
Exclure des mots...........................................................................................................................................9
Rendre un mot obligatoire............................................................................................................................9
Rendre plusieurs mots obligatoires simultanément......................................................................................9
Laisser le choix entre plusieurs mots............................................................................................................9
L'ordre des termes dans la requête peut être important..............................................................................10
Faire une recherche dans un site web seulement........................................................................................10
Voir les sites liés à un autre.........................................................................................................................10
7- Les options avancées des moteurs de recherche...................................................................................................11
Utiliser les outils de recherche avancée...........................................................................................................11
1- Internet est comme une bibliothèque publique
Comment on utilise une bibliothèque ordinaire
Lorsque l'on cherche des informations sur un sujet, dans une bibliothèque ordinaire, on dispose de deux alliés:
1. Le fichier catalogue de tous les livres, journaux et
revues disponibles dans la bibliothèque.
2. Le bibliothécaire: il oriente le lecteur vers les sources
d'informations qu'il connaît bien.
Le travail du bibliothécaire est:
1. d'indiquer tous les ouvrages disponibles dans le catalogue et de les ranger avec ordre sur les étagères;
2. de sélectionner et d'acheter les meilleurs ouvrages;
3. de conseiller les lecteurs à la recherche d'informations.
L'Internet n'est pas une bibliothèque ordinaire
L'Internet est un peu comme une gigantesque bibliothèque publique où l'on peut consulter tous les documents.
AttentionMais il existe quelques différences entre une bibliothèque et l'Internet
1. La quantité d'informations disponibles est bien plus grande sur l'Internet que dans n'importe quelle
bibliothèque.
2. Il n'y a pas de bibliothécaire et il n'existe pas de catalogue.
3. Les documents ne sont pas rangés: lorsqu'un document arrive, il est simplement ajouté à l'ensemble des
documents existants
4. Tout le monde peut venir déposer un document ou enlever un document qu'il avait déposé.
2- Se faire aider pour trouver les informations sur l'Internet
Où est le bibliothécaire?
La recherche d'informations sur l'Internet pose au moins trois problèmes:
1. La quantité d'informations disponibles est colossale
2. On ne sait pas sur quel site aller pour trouver une information intéressante
3. N'importe qui peut venir déposer des informationss sur l'Internet; même des informations fausses
Dans une bibliothèque classique, on peut faire appel au bibliothécaire.
Mais personne n'est chargé du rôle de bibliothécaire sur l'Internet.
Un moteur de recherche est un programme d'ordinateur capable de trouver des informations parmi un grand
nombre de documents de différents types
Un certain nombre de sites web proposent un moteur de recherche. Parmi les moteurs de recherche les plus
connus
Altavista
Yahoo
Google
Ecosia
Bing
... etc
3- Comment les moteurs de recherche... cherchent
Une vidéo (en anglais, mais des sous-titres sont possibles en français) qui explique le fonctionnement du
moteur de recherche Google: http://youtu.be/BNHR6IQJGZs
Quand tu te sens prêt(e) à répondre à des questions sur le contenu de cette page, passe à la page suivante.
Les serveurs d'indexation
Les pages "lues" par les spiders sont envoyées vers une autre série d'ordinateurs: les serveurs d'indexation. Leur
rôle est de tenir à jour un index des informations lues par les spiders.
Cet index se présente comme l'index d'un livre: à chaque mot, on fait correspondre la page où ce mot se trouve.
Mais en beaucoup plus gros. Il constitue une gigantesque banque de données dans laquelle il sera possible de
chercher très rapidement des informations.
4- Fonctionnement des moteurs de recherche: les requêtes
Lorsque l'on effectue une requête sur un moteur de recherche, celui-ci interroge la banque de données (les
serveurs d'index) dont il dispose pour répondre à la question posée.
Définition : Une requête sur un moteur de recherche est une question posée à la base de données du moteur de
recherche.
Les différentes phases du processus:
1.
2.
3.
4.
Un internaute envoie une requête sur un moteur de recherche
Les systèmes informatiques du moteur de recherche interrogent la banque de données des serveurs d'index
Les serveurs d'index renvoient une série de résultats pour la requête qui a été transmise
Le serveur web du moteur de recherche retourne les résultats à l'internaute
5- Analyse des résultats d'une recherche
Lorsque l'on a reçu les résultats d'une requête sur un moteur de recherche, il faut toujours les analyser afin de
trouver les meilleurs résultats pour nous.
Ci-dessous, une page typique de résultats renvoyés par le moteur de recherche de Google. La recherche portait sur
les endroits où l'on peut trouver des fleurs à Bruxelles.
Les publicités
• En haut de la page figurent une série de liens publicitaires. Les sites qui y figurent ont payé pour s'y
trouver lorsque certains mots-clés sont utilisés.
• Le plan en haut à droite est également une publicité pour différentes boutiques que l'on peut trouver dans
la ville. Les références des boutiques figurent dans les résultats.
• À droite de la page figure une troisième zone de liens publicitaires payants.
Curieusement, deux liens publicitaires sont au Canada. La raison en est qu'une recherche juste précédente portait
sur des vendeurs de voitures au Québec.
Les résultats non publicitaires
En principe, les autres résultats ne sont pas des publicités payantes. Un exemple de résultat non publicitaire sur
cette requête:
1. Sur la première ligne, en bleu, le titre de la page nous donne une bonne indication de son contenu, s'il a
été bien rédigé par le responsable du site web.
2. Ensuite vient un résumé du contenu de la page. Ce résumé doit toujours être lu attentivement et comparé
aux résumés des autres résultats trouvés. Souvent, il permettra de trouver la meilleure page ou le meilleur
site.
3. L'adresse du site donne aussi une information. Dans l'exemple ci-dessus, il s'agit évidemment du site web
officiel de la ville de Bruxelles.
L'adresse du site permet souvent de se rendre compte s'il s'agit d'un site d'une institution, d'un site
scientifique, d'un site web personnel,...
Vous me disiez que les meilleurs résultats arrivent en premier. C'est bien joli, mais je constate que vous voulez me
vendre des publicités.
Effectivement, il faut mettre une petite nuance. Sauf les publicités, les meilleurs résultats selon le moteur de
recherche sont les premiers.
Alors, j'aimerais bien savoir ce qui fait que ces premiers résultats sont les meilleurs...
Je vous propose donc d'examiner certains des critères. Mais tous ne sont pas connus; certains sont tenus secrets
par les sites de moteurs de recherches.
Qualité des résultats de recherche
Parmi les critères connus pour la qualité d'une page, selon la plupart des moteurs de recherche:
•
•
•
•
•
•
Le fait que les mots-clés figurent dans le titre de la page
Le fait que les mots-clés apparaissent plusieurs fois dans les sous-titres ou même dans le texte de la page
Un ou plusieurs mots-clés apparaissent dans l'adresse du site
Le fait que le site web soit renommé (beaucoup d'autres sites web font un lien vers ce site)
Le nombre de clics enregistrés sur le lien lors d'une recherche sur ce moteur (le site est populaire)
...
Conclusion: cela ne veut pas du tout dire que les pages trouvées seront bonnes selon mes critères...
C'est tout à fait exact. C'est pourquoi il ne faut pas se contenter de la première page renvoyée par le moteur de
recherche, mais qu'il faut poursuivre l'analyse ou changer la requête.
Quand tu as pris conscience qu'il faut analyser les résultats revoyés par un moteur de recherche avant leur
utilisation, passe à la page suivante.
6- Affiner le travail sur un moteur de recherche
Dans certains cas, les moteurs de recherche renvoient des résultats sans rapport avec le sujet qui nous intéresse.
Comment éviter cela et mieux cibler la recherche?
Bien choisir les mots-clés utilisés
• Avant de commencer toute recherche, éteindre l'ordinateur et trouver les mots-clés qui correspondent
bien au sujet à étudier.
• Ne pas hésiter à utiliser des synonymes ("masse éléphant Afrique" au lieu de "poids...", par exemple).
• Élargir le champ de recherches avec des termes plus généraux (pour obtenir plus de résultats).
• Affiner les résultats en ajoutant des termes plus précis.
• Ne pas faire des recherches contenant moins de deux ou trois mots-clés bien choisis simultanément.
• Certains mots trop commun qui pourraient figurer dans une requête sont écartés par les moteurs de
recherche (le, la, de, un, des, ...). Ils ne servent donc à rien.
Les moteurs de recherche ne sont, à l'heure actuelle, pas vraiment conçus pour reconnaître les langues
naturelles. Ni le français, ni l'anglais, ni même le chinois.
Il ne sert donc à rien de poser une question en langue naturelle.
Varier les combinaisons de mots-clés utilisées
Ne pas hésiter à faire des recherches sur des variantes de combinaisons de mots-clés.
Pour un moteur de recherche, les deux expressions suivantes seront totalement différentes :
• hôtel côte belge
• vacances mer Nord
Pour un être humain (qui connaît la Belgique), il est clair qu'elles portent quasiment sur le même sujet.
Attention aux acccents
En principe, les caractères accentués sont sans importance. Une recherche sur "bébé phoque" donnera les mêmes
résultats que la recherche sur "bebe phoque".
Attention toutefois si le mot accentué existe dans une autre langue (c'est fréquent entre le français et l'anglais) et a
un sens différent (c'est ce que l'on appelle un "faux-ami"). Dans ce cas précis, il faudra être attentif aux accents.
Dans le doute, c'est toujours mieux d'y être attentif.
Les directives particulières
Singulier et pluriel
On vérifie aisément que les recherches portant sur des mots au singulier ne donnent pas forcément les mêmes
résultats que pour les mots au pluriel.
Exemple: faire une recherche sur "éléphant" et "éléphants". Conclure.
Synonymes
Si l'on manque soi-même d'idées pour trouver des synonymes aux mots-clés de la recherche, on peut demander au
moteur de recherche de faire le travail à notre place.
Exemple: faire une recherche sur "maison" et "~maison". Conclure. Fonctionne avec Google.
Le joker *
Pour remplacer un mot ou une partie de mot dans une recherche, on peut utiliser le caractère * qui le remplacera.
Exemple: faire une recherche sur "papier" et "papier *"
Donner des directives aux moteurs de recherche
Recherche sur une expression
Pour obliger le moteur de recherche à trouver une expression précise plutôt que les mots séparés:
• mettre les mots entre des guillemets
Exemple: "Le village de Rossignol"
Exclure des mots
Lorsqu'une recherche renvoie des résultats connexes qui ne sont pas souhaités, on peut demander à ce que certains
mots soient évités:
• mettre un signe "-" devant le mot
Exemple: Je cherche des informations sur la biologieu du Rossignol. Mais beaucoup de sites web évoquent le mot
"Rossignol" sans aucun rapport avec les oiseaux. Je peux donc chercher
rossignol -ski -camping -village -"centre culturel" -chambres -domaine
Rendre un mot obligatoire
Pour n'obtenir que les résultats qui contiennent obligatoirement un mot précis:
• mettre un signe "+" devant le mot
Exemple: Rossignol +oiseau
Exemple: Python +reptile
Rendre plusieurs mots obligatoires simultanément
Pour obtenir les résultats qui contiennent en même temps plusieurs mots
•
utiliser l'opérateur "AND" (qui signifie "ET", en français)
Attention, tous les moteurs de recherche n'acceptent pas cette directive. cf BING
Exemple: diamant AND émeraude
Laisser le choix entre plusieurs mots
Pour obtenir les résultats qui contiennent l'un ou l'autre des mots,
• utiliser l'opérateur "OR" (qui signifie "OU", en français)
Il faut obligatoirement utiliser l'opérateur en lettre majuscules.
Test: Faire une recherche
1. sur les 3 mots-clés diamant or émeraude puis
2. diamant OR émeraude
Quelle différence constate-t-on?
Exemples:
cheval OR chevaux
Gand OR Gent (la ville de Belgique en français ou en néerlandais)
L'ordre des termes dans la requête peut être important
Les premiers mots de la requête définissent le contexte, les mots suivants précisent le domaine de recherche.
Exemple:
• Pour chercher des informations sur un congrès de géographie se déroulant à Bruxelles, demander
• "géographie Bruxelles" plutôt que "Bruxelles géographie" (qui évoquera surtout la géographie de
Bruxelles)
Faire une recherche dans un site web seulement
Pour restreindre la recherche à un seul site web:
• ajouter l'expression site:www.insee.fr/fr/ aux mots-clés de la recherche
Exemple: traitement texte site:www.insee.fr/fr/
Voir les sites liés à un autre
Pour voir tous les sites qui ont établi un lien hypertexte vers un autre site:
• ajouter l'expression link:www.insee.fr/fr/ aux mots-clés de la recherche
Exemple:
• Pour chacune des options de recherche de cette page, trouve une application personnelle.
• Note ces applications et propose-les finalement au professeur.
Quand tes exemples d'utilisation des options de recherche sont approuvés, passe à la page suivante.
7- Les options avancées des moteurs de recherche
Utiliser les outils de recherche avancée
Certains outils de recherche permettent de choisir parmi des options dans une page séparée.
Recherche avancée sur altavista.com
Recherche avancée sur google.com
Recherche avancée sur Exalead