Optimiser ses recherches sur Internet

Transcription

Optimiser ses recherches sur Internet
Rechercher sur Internet .............................................................................................................. 2
Comment une page Web est-elle composée ? ........................................................................ 2
Les outils de recherche :............................................................................................................. 3
Les moteurs de recherche ....................................................................................................... 3
Les points forts :................................................................................................................. 3
Les points faibles :.............................................................................................................. 3
Les annuaires.......................................................................................................................... 4
Les avantages : ................................................................................................................... 4
Inconvénients : ................................................................................................................... 4
Quelques conseils et stratégies................................................................................................... 5
L’utilisation de Google........................................................................................................... 6
Les méta moteurs ................................................................................................................... 7
Les méta moteurs de navigation............................................................................................. 7
Les portails ............................................................................................................................. 9
Les listes de diffusion :........................................................................................................... 9
JJ. Thibault
Animateur multimédia au CRDP de l’académie de Versailles
1
Rechercher sur Internet
En préambule…
Comment une page Web est-elle composée ?
Lorsque vous affichez une page Web sur votre écran d’ordinateur, il faut être conscient que
certaines informations ne vous apparaissent pas.
Le site officiel de la tous Eiffel nous servira d’exemple. Il se trouve à l’adresse suivante :
http://www.tour-eiffel.fr/
Si vous cliquez sur « affichage » / « source » . Vous verrez apparaître alors la page de codes
HTML (le langage informatique) utilisés pour créer cette page.
Elle commence ainsi :
<html>
<head>
<title>Le site officiel de la Tour Eiffel</title>
<meta name="Keywords" content="Tour Eiffel, Gustave Eiffel, Monuments de Paris,
Champ de mars, Paris, SNTE">
<meta name="Description" content="Le site officiel de la Tour Eiffel : 500 pages, 1 000
illustrations, visites virtuelles à 360° et en 3D, vidéos du scintillement de la Tour Eiffel et du
feu d’artifice du nouveau millénaire, dossiers, jeux...">
<meta name="copyright" content="Copyright 1997-2002 - SNTE ">
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style type="text/css">
« Le site de la tour Eiffel » apparaissant entre les deux balises « title » est le titre de la page.
Ce titre n’est pas visible sur la page elle-même mais si vous effectuez une recherche en
demandant à prendre exclusivement en compte les titres des pages, c’est dans ce champ que
s’effectuera la recherche.
De la même manière, les mots en caractères gras apparaissant après « Keywords » content=
sont des descripteurs choisis par l’auteur de la page. On comprend ainsi qu’une requête
portant sur les monuments de Paris aura de fortes chances d’aboutir sur cette page.
Ces informations, invisibles sur la page elle-même, s’appellent les « méta données »
On comprend donc l’importance de la pertinence des termes employés dans les titres des
pages et dans les descripteurs.
Si vous vous voyez proposer à l’issue d’une recherche sur le Web, une page qui
manifestement n’a aucun rapport avec votre requête, la cause peut être due au titre ou aux
descripteurs inadaptés (de manière volontaire quelquefois).
Notons cependant que de nombreux moteurs ne « lisent » plus les méta données, car les
concepteurs en ont souvent abusé…
2
Les outils de recherche :
Les moteurs
Les annuaires
Les méta moteurs
Les portails
Les moteurs de recherche
Les moteurs de recherche sont en fait des robots qui scrutent le Web, qui repèrent, analysent,
classent les millions de pages Web en fonction de différents critères : mots clés, occurrence de
mots, champs sémantiques etc.
Les points forts :
Très grand nombre de pages indexées. L’automatisation du travail permet effectivement de
recenser un très grand nombre de sites, y compris ceux traitant de sujets très pointus et très
spécialisés.
Les moteurs mettent leur base de données à jour régulièrement.
Les moteurs référencent les pages des sites, que le Web master se soit référencé ou non.
Les points faibles :
Les critères de sélection, de classement et de tri ne sont pas toujours très fins. De ce fait,
certains sites pourtant fort pertinents peuvent échapper au moteur (silence) et inversement,
certaines pages sans rapport avec la recherche peuvent figurer parmi les résultats (bruit.)
Les moteurs de recherche vont lire par exemple, les balises méta des pages Web (partie
invisible d’une page où figurent des mots-clés choisis par le créateur du site). Si le site a été
mal indexé (intentionnellement ou pas), la pertinence des résultats peut être nulle.
Il faut savoir que les différents moteurs de recherche possèdent chacun leurs propres
algorithmes de recherche et que les critères pris en compte diffèrent de l’un à l’autre. Aucun
moteur n’est capable, aussi puissant soit-il, d’indexer l’intégralité des pages Web. Notons
enfin que certains moteurs sont spécialisés sur un domaine particulier (musique, sport, cinéma
etc.)
Les moteurs de recherche proposent presque tous une fonction « recherche avancée »,
conjuguant multiples opérateurs et fonctionnalités permettant d’affiner la recherche :
Recherche d’une expression exacte
Interdire certains mots
Choix de la langue
Date de mise à jour du site
Etc.
On trouve plusieurs centaines de moteurs de recherche sur le Web. Inutile de changer
constamment d’outil de recherche. C’est au contraire par la pratique régulière de deux ou trois
d’entre eux que l’on finit par comprendre leur mode de fonctionnement et que les recherches
deviennent fructueuses.
Les moteurs de recherche sont donc particulièrement indiqués lorsque vous devez faire une
recherche sur un sujet très spécialisé qui aura par conséquent peu de chance de figurer sur un
annuaire.
Citons parmi les plus célèbres :
http://fr.altavista.com
http://www.google.fr (sans doute le plus utilisé aujourd’hui)
http://www.ecila.fr (http://www.nomade.fr)
3
http://www.lycos.fr
http://www.voila.fr
http://www.northernlight.com
Notons que Google vous propose d’installer une barre supplémentaire qui vous propose
certaines options intéressantes (blocage des fenêtres popup, historique des recherches…)
Les annuaires
Contrairement aux moteurs de recherche, les annuaires recensent des sites indexés par des
équipes éditoriales. Ils constituent des catalogues de sites classés par catégories et souscatégories. On progresse ainsi du plus large vers le plus spécifique en affinant sa recherche.
Ainsi, pour trouver les règles du jeu de tarot, on pourrait imaginer un cheminement qui
partirait d’un terme générique « loisirs » puis : jeux/jeux de société et jeux de cartes/ jeux de
cartes/ jeu de tarot.
Cependant, pour une recherche précise, il est tout à fait possible d’introduire des mots clés dès
le début de sa recherche. La distinction entre moteur et annuaire n’est de fait plus très nette.
De nombreux annuaires élargissent leur recherche à l’aide d’un moteur lorsque la requête qui
leur est formulée ne trouve pas de réponse dans les catégories proposées.
Les avantages :
Bien entendu, le fait que les sites soient visités, recensés, indexés par des hommes rend
beaucoup plus fiable la pertinence des résultats. De plus, les éventuels renvois sur des sites
directement en relation avec la recherche sont rendus possibles grâce précisément à ce travail
humain.
Le contenu des sites est normalement vérifié avant leur référencement pour éviter les
indexations mensongères.
Ils vous permettent d’éviter le bruit en lançant votre recherche uniquement dans une catégorie
bien déterminée. Si vous tapez « Prost » en ayant choisi la catégorie
Inconvénients :
Le nombre de pages visitées est très inférieur à celui indexé par un moteur.
Certains sites pourtant très pertinents peuvent ne pas figurer dans l’annuaire si personne ne l’a
référencé
Il existe souvent un délai important entre la demande d’ajout dans l’annuaire et l’ajout
effectif. (ex : Yahoo France reçoit plusieurs centaines de demandes de référencement par jour
et il faut compter un mois entre la demande d’ajout et l’ajout éventuel.
Les annuaires sont tout indiqués pour effectuer une recherche sur un sujet relativement large.
Vous aurez ainsi plus de chance d’être aiguillé vers des sites auxquels vous n’aviez peut-être
pas pensé et qui viennent pourtant parfaire intelligemment votre recherche.
Quelques annuaires :
Lycos.fr
Yahoo.fr
Excite.fr
Remarque :
On trouve de plus en plus d’outils de recherche offrant à la fois les fonctionnalités d’un
moteur et d’un annuaire. Ainsi, Lycos vous propose de lancer une recherche sur le Web
français ou mondial ou de limiter votre domaine de recherche aux « catégories » qu’il
propose : la recherche se fera alors dans l’annuaire.
4
Quelques conseils et stratégies
D’une manière générale, ne vous contentez pas de rester sur le premier écran de votre moteur
ou de votre annuaire : utilisez les fonctions de la recherche avancée.
Prenez le temps de lire les aides à la recherche car chaque moteur possède ses propres
fonctionnalités et les syntaxes de recherche sont bien souvent différentes.
(D’où l’importance de travailler régulièrement avec un ou deux outils pour apprendre à bien
les connaître.)
Vérifier l’orthographe et la syntaxe de la requête.
En effet, la moindre faute de frappe peut rendre une recherche infructueuse. Evitez « les mots
vides », prépositions, articles ou certains termes trop généraux.
Attention à l’ordre des mots.
Certains moteurs accordent une plus grande importance aux premiers mots-clés de la
recherche.
Recherchez des synonymes
Il suffit parfois de taper un mot ou une expression synonyme pour se voir proposer de
nouveaux sites.
Recherchez des expressions complètes.
Une recherche sur une chaîne de caractère évite souvent le bruit et permet de cibler de
manière plus précise.
Ainsi, si vous recherchez un poème précis de Victor Hugo, il suffira de taper un extrait d’un
vers entre guillemets pour trouver le poème. (De nombreux moteurs et annuaires vous
proposent en mode « recherche avancée » de rechercher une expression complète.)
Utiliser les limiteurs de champ.
Certains moteurs ou annuaires (altavista, lycos, northernlight…) vous permettent de limiter
votre recherche à certains champs : l’URL de la page, le titre de la page, le texte, les images
etc.
Il suffit pour ce faire de faire précéder sa recherche du « limiteur » suivi de deux points
(aucun espace)
Ex : url :Einstein
permet de trouver les sites avec Einstein dans l’adresse.
title:Einstein
ne recherche que les pages avec Einstein dans le titre.
Image:Einstein
recherche les pages contenant l’image d’Einstein.
Notons que certains moteurs (Lycos et Google par exemple) vous proposent dans un menu
beaucoup plus convivial (simple case à cocher) de limiter votre recherche aux images, aux
sons, aux vidéos…
Utilisez les opérateurs booléens
Bon nombre de moteurs de recherche vous permettent d’affiner votre requête grâce à
l’utilisation d’opérateurs logiques qui vont forcer, autoriser ou interdire la recherche de
certains mots ou chaîne de caractères.
Le « OR » qui effectue la recherche sur au moins un des termes de la requête :
Judo OR karaté permet de rechercher des informations sur l’une ou l’autre de ces disciplines.
Le « AND » qui effectue la recherche sur tous les termes : Freud AND psychanalyse
Le “AND NOT” permet d’exclure un terme de la recherche (correspond au SAUF en
français) cinéma AND NOT muet
5
Notons que certains moteurs permettent l’utilisation des signes + (AND) et – (AND NOT).
Pour la plupart des moteurs, un espace entre les mots est interprété comme un « AND » Ainsi,
la recherche téléchargement logiciel école primaire vous affichera en priorité les sites sur
lesquels vous pourrez télécharger des logiciels destinés aux enfants de l’école primaire.
Encore une fois, il est vivement conseillé de prendre le temps de lire les conseils d’utilisation
donnés sur la page d’accueil du moteur car les options « par défaut » et les fonctionnalités
diffèrent d’un moteur à l’autre.
Aujourd’hui, les moteurs sont devenus beaucoup plus conviviaux et la plupart d’entre eux,
dans leur « recherche avancée » vous permettent d’entrer dans les fenêtres de recherche une
requête utilisant les opérateurs booléens, de manière transparente. La fenêtre « tous les mots »
place un « AND » entre chaque terme, la fenêtre « Au moins un des mots » place un « OR »
entre chaque mot etc. Pour l’utilisateur, cette formulation est beaucoup plus simple.
L’utilisation de Google
Google est actuellement le moteur de recherche le plus utilisé. Il faut avouer qu’il est
particulièrement performant et vous propose de nombreux services :
Limiter votre recherche aux pages francophones
La recherche d’images
La possibilité de ne rechercher que des pages récentes
Le choix des formats des réponses à vos recherches (ex : trouver des documents pdf…)
L’accès aux pages d’actualité
La possibilité de créer des alertes personnalisées. Cette fonction vous permet d’être averti par
courriel lorsqu’un sujet particulier est abordé dans l’actualité.
L’installation de barre de navigation.
Cette liste n’est pas exhaustive. Prenez le temps de regarder les options de la recherche
avancée.
Vous allez choisir ici les
options qui vous permettront
de cibler vos recherches.
De plus, Google vous donne accès à des outils linguistiques, permettant, par exemple, de
traduire un texte, voire une page Web. Il vous suffit, pour y accéder, de cliquer sur « Outils
linguistiques », depuis la page d’accueil de Google.
6
Les méta moteurs
Les méta moteurs (ou méta chercheurs) lancent la recherche sur plusieurs moteurs en même
temps. Ils ne possèdent pas leur propre base mais se contentent de transmettre votre requête
sur d’autres moteurs et de vous renvoyer les réponses. Bien entendu, les résultats affichés ne
représentent pas l’intégralité des réponses obtenues. Ils se contentent généralement de
sélectionner les résultats jugés les plus pertinents pour chacun des moteurs sollicités. Les
options de recherche sont généralement assez limitées car les différents moteurs ou annuaires
ne possédant pas les mêmes syntaxes de recherche, le méta-moteur n’est pas toujours capable
de traduire votre requête pour qu’elle soit compréhensible par tous les outils de recherche
utilisés. Cependant, les métamoteurs offrent de nombreux avantages :
Ils sont capables, (si ce sont de véritables métamoteurs…) d’éliminer les doublons.
Le fait d’interroger plusieurs moteurs de recherche multiplie les chances de trouver
l’information pertinente.
Ils vous font gagner un temps précieux en vous évitant d’aller interroger séparément plusieurs
moteurs.
Ils vous font découvrir, par rapport à l’objet de votre recherche, les moteurs les plus
appropriés (et auxquels vous n’auriez peut-être pas pensé !).
Par conséquent, il peut être conseillé lors d’une première recherche, d’utiliser un métamoteur
pour espérer trouver rapidement la bonne information, quitte en cas d’échec, à renouveler la
recherche sur le moteur dont les résultats vous auront semblé les plus proches de votre attente.
Certains métamoteurs vous imposent les moteurs à l’aide desquels ils travaillent, d’autres
vous laissent la possibilité de sélectionner dans une liste ceux sur lesquels vous souhaitez
lancer votre requête.
Deux métamoteurs à connaître :
Ariane6 :
http://www.ariane6.com
Ce méta moteur en langue française (mais également disponible dans de nombreuses langues
étrangères) vous permet de cocher les moteurs que vous souhaitez utiliser et vous renvoie les
résultats dans l’ordre d’arrivée sur le serveur pour diminuer le temps d’affichage des résultats.
Copernic
Copernic est proposé (en version limitée) en téléchargement sur le Web à l’adresse suivante :
http://www.copernic.com
Le logiciel est également vendu en version « complète » permettant d’interroger des moteurs
spécialisés dans différents domaines (sport, musique, cinéma, informatique etc.)
A l’inverse des autres outils de recherche, Copernic est un programme que vous devez
installer sur votre disque dur comme un autre programme. De ce fait, il est capable de
conserver vos recherches que vous pourrez archiver et retrouver ultérieurement sans devoir
relancer une recherche que vous avez déjà faite.
La version téléchargeable sur le Web est tout à fait suffisante pour mener à terme la quasitotalité des recherches.
Les méta moteurs de navigation
7
Les méta moteurs de navigation sont des outils relativement récents qui, face à la diversité et
la densité des résultats généralement proposés en réponse aux requêtes, tentent de présenter
les résultats de manière beaucoup plus ordonnée et structurée.
Vivisimo
http://vivisimo.com/
Un méta moteur qui classe les résultats sous forme d’arborescence, par catégories et souscatégories, sur la partie gauche de l’écran.
Ainsi, la recherche du terme « violon » propose la liste suivante :
+
+
+
+
+
+
+
+
concert
piano
violin
violoncelle
prix
artiste
archet
concours
Chaque signe + ouvre une nouvelle catégorie proposant les sites en relation.
Kartoo
http://www.kartoo.com/
Un moteur original qui offre de nombreuses options et qui propose une interface agréable.
Tout comme Vivissimo, Kartoo classe les résultats par catégorie.
Exalead
http://www.exalead.com/
Un extrait des explications fournies sur la page d’accueil de ce méta moteur :
En parallèle à la liste des 10 réponses les plus pertinentes, le moteur propose à chaque requête une
synthèse de l’ensemble des résultats. Cette table des matières dynamique se présente sous la forme
d’une liste des thèmes pertinents. Elle permet à l’utilisateur de visualiser immédiatement les différents
sujets couverts par sa requête et donc de valider ou d’invalider rapidement la formulation qu’il vient
d’utiliser. En cliquant sur un élément de la liste, l’utilisateur relance une requête plus précise incluant
le thème sélectionné. Le processus est itératif, rapide et efficace de sorte que 2 ou 3 clics suffisent
généralement à atteindre le niveau optimal d’affinage.
Le moteur de recherche et de navigation Exalead permet donc d’identifier d’un seul regard l’ensemble
des interprétations possibles d’une requête, de concentrer la recherche sur l’une des problématiques
sous-jacentes pour converger rapidement vers le résultat pertinent ou au contraire d’explorer
n’importe quelle dimension particulière, voire connexe, du sujet.
8
Les portails
Les portails vous permettent également l’utilisation de mots clés ou d’expressions à partir
desquels vous lancerez une recherche, mais contrairement aux moteurs de recherche ou aux
annuaires, l’information a déjà été triée pour ne vous proposer que des sites directement en
rapport avec le thème du portail qui est censé vous ouvrir l’accès à l’information. Ainsi, il
existe des portails axés sur la médecine, l’éducation, les arts etc.
Comme on peut l’imaginer, l’intérêt des portails est précisément de vous proposer des sites
très pointus sur un domaine précis. Les portails sont, la plupart du temps, alimentés par des
professionnels qui repèrent, indexent, résument les sites qu’ils pensent être intéressants. La
recherche est, de ce fait, grandement facilitée et la pertinence des réponses largement accrue.
Quelques portails pour l’enseignement :
Educlic et Educasource que l’on trouve sur la page d’accueil du CNDP (http://www.cndp.fr)
Education.fr (sur le site du ministère : http://www.education.gouv.fr/)
Le portail de l’administration française :
http://www.service-public.fr/
Vous pouvez bien entendu utiliser un moteur pour trouver un portail :
Si vous lancez sur Google, une recherche avec les mots « portail », « arts » « musées », vous
vous verrez proposer plusieurs portails spécialisés sur les arts…
Les listes de diffusion :
Les listes de diffusion permettent, un peu comme les forums de discussions, d’échanger sur
un thème précis, avec un groupe de personnes inscrites sur ces listes et par conséquent attirées
par un même centre d’intérêt.
Contrairement aux forums de discussions, (pour lesquels il suffit d’un clic de souris pour lire
et écrire dans le forum,) les listes de diffusion supposent que vous fassiez la démarche de vous
inscrire, en envoyant par mail, un formulaire électronique sur lequel figurera votre e-mail. Un
message du responsable de la liste vous parviendra rapidement vous demandant confirmation.
Vous renverrez ce message pour accord et dès lors, vous recevrez dans votre boîte à lettres
personnelle, tous les messages envoyés à la liste. Vous pourrez naturellement écrire vos
propres réflexions, participer aux débats lancés par d’autres internautes, demander des
conseils, rechercher toute information en rapport avec l’intitulé de la liste.
Certaines listes sont très actives et il n’est pas rare que plusieurs dizaines de messages soient
postés quotidiennement. Dans ce cas, ce sont autant de messages qui viendront encombrer
votre boîte à lettres. Dans ce cas, vous aurez tout intérêt à créer une boîte particulière destinée
à recevoir automatiquement le courrier de la liste.
D’autre part, lorsque vous devez vous absenter plusieurs jours, pensez à vous désabonner.
Vous risqueriez d’encombrer bien inutilement votre boîte à lettres…
Un site à connaître pour choisir la (ou les) liste(s) de diffusion qui vous intéresse(nt) :
http://www.francopholiste.com
Vous y trouverez la quasi totalité des listes de diffusion francophones.
9

Documents pareils

Guide de recherche web

Guide de recherche web remplir certaines tâches de recherche à la place de l’utilisateur. C’est cette dernière caractérise qui sert actuellement de dénominateur commun pour les applications d’agent. On distingue aujourd’...

Plus en détail

Guide Pratique Recherche d`Informations sur Internet

Guide Pratique Recherche d`Informations sur Internet Internet véhicule à l’échelle mondiale une immense quantité d’informations et représente une mine de renseignements pas toujours faciles à identifier. Pour mener une recherche efficace, il est néce...

Plus en détail

Recherches sur internet

Recherches sur internet mais on dispose maintenant de plusieurs types d'outils : 1. une solution consiste à alimenter une base de données en extrayant les adresses des messages de News ou des pages des serveurs W3 et en p...

Plus en détail

Moteurs de recherche fédérée

Moteurs de recherche fédérée Bibliothèque Chevaleret-Jussieu Paris Centre Rencontres RNBM 2007 1er - 5 octobre 2007

Plus en détail