Microsoft Office Word - Recherche sur Internet - v 2.0

Transcription

Microsoft Office Word - Recherche sur Internet - v 2.0
RECH ERCH E D ’IN FORM ATION
SUR IN TER NET
PETIT GUIDE METHODOLOGIQUE
3IE
c/o EPIT A, 14-16 Rue Voltaire
94276 Le Kremlin-Bicêtre Cedex
T el : 01 53 14 59 36
Dernière mise à jour : Décembre 2001
Fax : 01 53 14 59 28
URL : http://www.3ie.org
Email : [email protected]
3IE est une marque déposée.
Les informations contenues dans les études 3IE sont la propriété de l'EPITA. Toutes
reproductions des contenus diffusés dans cette étude sont interdites sans l'accord de 3IE.
3IE et les entreprises partenair es qui lui sont liées ne sont pas tenus responsables des
dommages que pourraient causer son analyse.
Copyright © 2001 3IE-EPITA.
T ABLE DES M ATIÈR ES
INTRO DUC TION
1
I.
2
II.
M ÉTHODOLOGIE DE RECHERCHE DOCUMENTAIRE
I.1.
Formulation de votre besoin d’inform ation.
2
I.2.
Délim itation du sujet - Extraction des concepts – Identification des mots clés 2
I.3.
Choix de votre outil de recherche
4
I.4.
Equation logique et outil de recherche
5
I.5.
Les opérateurs
5
I.5.1
Opérateurs de proximité :
6
I.5.2
I.5.3
Opérateurs booléens :
Troncatures
7
12
I.5.4
I.5.5
I.5.6
Opérateurs numériques
Séparateur d’équation
La casse des mots
12
13
13
I.6.
Les différents M ODES de recherche
14
I.7.
Evaluation des résultats de recherche
14
LES DIFFERENTS OUTILS DE RECHERCHE SUR I NTERNET
II.1.
II.1.1
II.1.2
Les ANNUAIRES, REPERT OIRES, INDEX
Généralistes internationaux :
Généralistes géographiques :
15
15
16
16
II.1.3
Annuaires thématiques SPECIALISES:
II.2.
Les m oteurs de recherche / Robot
16
17
II.3.
Les meta-moteurs, Meta-Outils, Meta-Chercheurs
18
II.4.
Les agents intelligents (ou multi-agents) sur internet
19
II.4.1
II.4.2
Les agents de recherche d’information
Les agents de veille
TAB LE DE S FIGURES
20
21
22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
INTRODUC TION
Le problème principal d’une recherche d’information sur le Web est la « surinformation » :
• on trouve à la fois tout ou rien ;
• on est vite inondé par le flot d’information trouvé ;
• on se noie.
Cette masse d’informations (le « bruit »), ce nombre excessif de résultats obtenus lors de
notre requête, rend le tri et le repérage des informations pertinentes très difficile.
Ce guide vous aidera à mieux chercher l’Information Stratégique sur Internet nécessaire à
toutes entreprises. Vous pourrez affiner les résultats que vous obtiendrez et ainsi mieux
comprendre l’organisation complexe de la sphère informationnelle sur le Web.
© 2003 – 3IE
http://w ww.3ie.org
1 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
I.
MÉTHO DOLOGIE DE RE CHE RC HE DOCUM EN TA I RE
I.1.
Formulation de votre besoin d’information.
Avant de vous lancer dans d’impérieuses recherches d’informations sur le Web, vous
devez formuler vos besoins. Cette formulation se fait par le biais d’une phrase exprimant la
recherche que vous souhaitez entreprendre.
Exemple : « Je recherche les différentes normes existantes pour la voix sur IP (VOIP)
actuellement utilisées au niveau mondial dans le cadre du développement d’applications
professionnelles »
I.2. Délimitation du sujet - Extraction des conce pts – Ide ntification
de s mots clés
L’expression de votre besoin (la phrase extraite) peut-être décomposée en plusieurs
concepts. Ceux-ci doivent être extraits et traduits en mots clés. On les ramène à leur forme
singulière ce qui per mettra de balayer toutes ambiguïtés.
Dans une seconde étape, on va expliquer les concepts dégagés au travers des outils tels
que des dic tionnair es spécialisés, des encyclopédies ou des manuels. On identifie alors la
terminologie scientif ique entourant notre sujet.
Les mots-clés seront utilisés dans la formulation de nos requêtes auprès des différents
moteurs sélectionnés.
© 2003 – 3IE
http://w ww.3ie.org
2 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
Nous classons ces mots clés selon 4 zones :
• Les mots clés primaires (ils cadrent le domaine de recherche) ;
• Les mots clés secondaires (ils précisent la recherche à effectuer) ;
• Les synonymes ;
• Les équivalents.
Nous traduisons tous les concepts extraits afin d’étendre notre recherche aux documents
étrangers : Anglais, Allemand, Espagnol...
Reprenons notre exemple de recherche des normes relatives à la Voix sur IP.
Dans le cadre de cette recherche nous traduirons les concepts dégagés du français à
l’anglais.
CLASSE
M OTS CLES
Les mots clés primaires (ils cadrent le domaine Voix sur IP
de recherche)
VOIP
Nor me
Standard
Les mots clés secondaires (ils précisent la
Application professionnelle (cible)
recherche à effectuer)
Monde (cadre géographique)
Actuellement (cadre temporel)
Les synonymes
/
Voice Over Internet Protocol
Les équiv alences
© 2003 – 3IE
Voice Over IP
Voix sur Internet Protocol
http://w ww.3ie.org
3 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
I.3.
Choix de votre outil de reche rche
On peut noter que notre recherche est assez précise. Nous pouvons donc prédire que le
nombre de sites présents sur le Web et contenant l’information désirée ne sera pas élevé (à
l’échelle du Web).
Cette étape est destinée à sélectionner l’outil de recherche avec lequel nous débuterons
nos recherches. C’est ainsi que nous nous orienterons vers un annuaire, un moteur ou un agent
intelligent (cf partie 2 – Les outils de recherche sur Internet).
Exemple : « Je recherche les différentes normes existantes de voix sur IP (VOIP)
actuellement utilisées dans le monde dans le cadre du développement d’applications
professionnelles »
L’utilisation d’un répertoire, annuaire ou index n’est pas judicieuse dans le cadre de notre
recherche. Ces outils présentent des informations (liens) sélectionnées et indexées
manuellement par des professionnels de l’information. Ils nous offrent donc une information
d’ordre générale (généralités, les thématiques et problématiques principales...). Ils permettent
dans le cadre de certaines recherches de balayer un domaine de manière globale afin d’en
dégager les notions essentielles qui feront l’objet d’une recherche plus poussée sur des
moteurs ou méta-moteurs de recherche.
Dans le cadre de notre recherche sur la voix sur IP, nous nous dirigerons davantage vers
un moteur ou un méta- moteurs car l’objet de notre recherche est déjà assez précis, cadré et
ciblé. Nous prendrons comme exemple Google : http://www .google.com .
Pour vous guider dans le choix de votre outil de recherche nous vous conseillons le site
Abondance : http://www.abondance.com . Il vous informera sur les différentes fonctionnalit és
intégrées dans chacun des outils de recherche d’informations les plus utilisés.
© 2003 – 3IE
http://w ww.3ie.org
4 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
I.4.
Equation logique e t outil de recherche
Avant de se lancer sur le Web, il faut dégager l’équation logique nécessaire à l’outil de
recherche sélectionné pour extrair e les informations les plus pertinentes (et éviter le « bruit »).
Cette équation sera constituée des mots clés que nous avons sélectionnés précédemment et
des opérateurs logiques pour établir des relations entre eux.
I.5.
Le s opérateurs
Voici une liste des principaux opérateurs mis à la disposition de l’utilisateur pour précis er
sa requête.
© 2003 – 3IE
http://w ww.3ie.org
5 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
I.5.1 Opérateurs de proximité :
ADJ / NEA R / WIT H / FOLLOWED BY / “ “
Ils indiquent la distance entre deux mots, leur ordre, s'ils doivent figurer dans le même
paragraphe. Ils sont utiles lorsque l’on interroge les documents en texte intégral et permettent
d'être plus précis que l’emploi de l’opérateur booléen ET.
Exemple :
• EXPRESSION DE NOTRE BESOIN : « Je recherche les documents sur la Voix sur IP ».
• EQUATION DE RECHERCHE : « Voix sur IP ».
L’objet de notre recherche n’est pas précis. Le champ couvert est vaste. Comme nous
l’avons noté plus haut, dans le cadre de ce type de recherche nous nous orienterons en pr iorité
vers les annuaires, les répertoires ou les index. Nous choisirons ici Voilà : http://w ww .v oila.fr
Nous élargirons l’équation de recherche aux diverses traductions :
• VOIP
• « voix sur internet protocol »
• « voice over ip”
• “voice over internet protocol”
Résultats de notre recherche sur Voilà :
• 827 trouvés
• Liens pertinents sur la première page
ƒ Plan de cours informatif (mots clés thématiques, problématiques, normes,
standards...) mais sans détails :
ƒ http://www.efort.com/ftelIP_intra.htm l
ƒ Introduction à VOIP :
ƒ http://www.easytel.fr/infos/voix.htm /
ƒ http://lsoron.free.fr/dossie rs/telip /telip.htm l /
ƒ http://www.itel.ch/technologie/telephonie/fondamentaux/voix_sur_ip.htm
ƒ Document exhaustif :
ƒ http://guill.net/reseaux/voip/Voip7.html
ƒ Informations d’actualité
© 2003 – 3IE
http://w ww.3ie.org
6 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
I.5.2 Opérateurs booléens :
OU / OR
Ils correspondent aux opérateurs d’UNION (on recherche tous les documents contenant les
termes sélectionnés).
Exemple :
• EXPRESSION DE NOTRE BESOIN : « Je recherche des informations sur la Voix sur IP
et les fournisseurs de Voix sur IP ».
• EQUATION DE RECHERCHE : « Voix sur IP » OU fournisseur
Figure 1 - Opérateur d'union
L’objet de notre recherche se précis ant, nous utiliserons le moteur de recherche Google,
http://www.google.com pour affiner nos résultats.
Nous sommes donc à la recherche d’informations sur VOIP, mais de ces fournisseurs.
Notre stratégie de recherche sera de combiner une recherche en français et an anglais.
© 2003 – 3IE
http://w ww.3ie.org
7 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
D’où le choix des équations suivantes :
• « voice over ip » OU fournisseur
• « voice over ip » OU provider
• « voix sur internet protocol » OU provider
• “voice over internet protocol” OU fournisseur
• « voice over internet protocol” OU provider
• voip OU provider
• voip OU fournisseur
Résultats de notre recherche :
• La téléphonie sur IP :
http://www .telecom.gouv.fr/documents/merlin/rap_merlin0499_2.htm
http://www .voip-telecom.com/voip/w ebfr/Biz planw eb_fichiers/frame.htm
• Dossier VOIP :
http://195.134.220.47/art/ls037/ls037106.htm
http://w 3.sba.oakland.edu/netmgt/14ec_w ireless/ch14_w ireless_detail.htm#InternetTeleph
ony
http://www .hsc.fr/ressources/articles/telephonie/telephonie-2.html
http://www .guill.net/reseaux/voip/Voip6.html
• Produits et acteurs :
http://www .hsc.fr/ressources/articles/telephonie/telephonie-6.html
http://www .art-telecom.fr/publications/pres-ip.htm
http://www .gii.co.jp/english/ab7060_voip_toc.html
• Sources d’informations à explorer :
http://www .art-telecom.fr/liens/index-d.htm
• Information d’actualité
• ...
Google nous trouve des sites d’informations sur VOIP ainsi que les grands fournisseurs
de VOIP comme : 3com, Lucent, CISCO,...
© 2003 – 3IE
http://w ww.3ie.org
8 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
ET / A ND / +
Ils correspondent à l'INT ERSECTION (on recherche tous les documents contenant les
termes en même temps).
Exemple :
• EXPRESSION DE NOTRE BESOIN : « Je recherche les fournisseurs de Voix sur IP ».
• EQUATION DE RECHERCHE : « Voix sur IP » ET fournisseur
Figure 2 - Opérateurs d'intersection
Résultats de recherche sur Google avec les équations suivantes :
• « voice over ip » AND fournisseur
• « voice over ip » AND provider
• « voix sur internet protocol » AND provider
• “voice over internet protocol” AND fournisseur
• « voice over internet protocol” AND provider
• voip AND provider
• voip AND fournisseur
© 2003 – 3IE
http://w ww.3ie.org
9 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
Résultats de notre recherche :
• Produits et standards :
http://w ww.infosyssec.com/infosyssec/voiceip1.htm
http://w ww.reseaux-telecoms.net/DOSSIERS/172_p94.htm
• Annuaire :
http://w ww.whotelecom .com /onglet2.php3
• Dossiers / Rapports :
http://danang.dinus.ac.id/naskah-25.html
http://w ww.itu.int/journal/200102/F/htm l/IP_Telephony.htm
http://w ww.techguide.com/comm/voiceip.shtm l
ftp://ftp.netlab.ohio-state.edu/pub/jain/courses/cis788-99/voip_products/index.html
http://w ww.protocols.com /papers/VoIP%20Testing%20%20A%20Practical%20Guide.pdf
http://w ww.protocols.com /voip.htm
http://w ww.mindbranch.com /p_title.php3?code=R70-14&content=toc&partner=172
• Source d’informations :
http://w ww.cis.ohio-state.edu/~jain/refs/ref_voip .htm
© 2003 – 3IE
http://w ww.3ie.org
10 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
SAUF / NOT / NOT AND / -
Ils correspondent à l'EXCL USION (on élimine les ter mes non souhaités dans les
documents recherchés).
Exemple :
• EXPRESSION DE NOTRE BESOIN : « Je recherche les fournisseurs de Voix sur IP
sauf ceux localisés à Paris ».
• EQUATION DE RECHERCHE : [« Voix sur IP » ET fournisseur] SAUF Paris
Figure 3 - Opérateurs d'exclusion
L’objet de cette recherche revient à associer la recherche par INTERSECTION en excluant le
mot Paris.
Nous sélectionnerons les équations suivantes :
• [« voice over ip » AND fournisseur] SAUF Paris
• [« voice over ip » AND provider] SAUF Paris
• [“voice over internet protocol” AND fournisseur] SAUF Paris
• [« voice over internet protocol” AND provider] SAUF Paris
• [« voix sur internet protocol” AND provider] SAUF Paris
• [voip AND provider] SAUF Paris
• [voip AND fournisseur] SAUF Paris
© 2003 – 3IE
http://w ww.3ie.org
11 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
I.5.3 Troncatures
*/?/$
Ces caractères peuvent remplacer un ou plusieurs caractères (utilité lorsqu’on n'est pas
sûr d’une orthographe ou lorsqu’on veut ouvrir notre recherche).
Exemple :
• EXPRESSION DE NOTRE BESOIN : « Je recherche des informations sur la
documentation : profession (documentalistes), matière première (document)... »
• EQUATION DE RECHERCHE : document*
Pour effectuer cette recherche générale nous utiliserons en prior ité un annuair e tel que
Yahoo : http://w ww.yahoo.f r .
Les résultats de recherche y seront multiples.
I.5.4 Opérateurs numériques
= / > / < / <= / >=
Ils permettent d'affiner l'équation de recherche sur les champs numériques (dates...).
Exemple :
EXPRESSION DE NOTRE BESOIN : « Je recherche tous les documents sur la Voix sur
IP parus en 2001 ».
EQUATION DE RECHERCHE : « Voix sur IP » = 2001
La recherche en texte intégrale effectuée sur Google nous sort les documents présentant
le mot « voip » (ou « voice over ip » / « voix sur IP » / « voix sur internet protocol » / « voice
over internet protocol ») associé à « 2001 ».
© 2003 – 3IE
http://w ww.3ie.org
12 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
I.5.5 Séparateur d’équation
[ ] /( )
On utilise les séparateurs d’équation lorsque l’on souhaite faire une recherche en mixant
plusieurs opérateurs.
Exemple :
• EXPRESSION DE NOTRE BESOIN : « Je recherche des informations sur les
fournisseurs de voix sur IP sauf ceux localisés en Allemagne ».
• EQUATION DE RECHERCHE : [« voix sur IP » AND fournisseur] SAUF Allemagne
I.5.6 La casse des mots
Certains moteurs ne tiennent pas compte de la casse des mots (vous pouvez taper
indifféremment le ter me de recherche en majuscules, en minuscules, avec ou sans accents). Ils
ne font donc pas la différence entre les minuscules et les majuscules.
La liste que nous vous présentons n’est pas exhaustive, elle est destinée à vous
présenter les opérateurs les plus couramment utilisés par les professionnels de la recherche
d’informations. D’autres opérateurs et d’autres fonctions de recherche existent (recherche par
type de documents : image,son, vidéo...; par extension de fichiers : .doc, .pdf.... – cf Google).
Ces fonctions et particularités de recherche n’apparaissent pas dans tous les moteurs de
recherche. Chaque moteur de recherche intègre ses propres spécificités.
C’est en utilisant et en testant ces différentes fonctionnalités que l’on arrive à optimiser
ses propres recherches. Vous pouvez vous orienter sur le site Abondance
( http://www .abondance.com ) qui présente bien les particularités de chaque outil de recherche.
© 2003 – 3IE
http://w ww.3ie.org
13 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
I.6.
Le s différents MODES de recherche
Les outils de recherche tiennent parfois compte des différents niveaux d’expérimentation
de leurs utilisateurs.
Ainsi nous pouvons rechercher sur un même outil de deux manières différentes :
• La recherche en m ode norm al (destiné aux utilisateurs novices). Le moteur de
recherche propose une recherche simplifiée qui comprend qu’un seul champ de saisie
généralement en texte libre.
• La recherche en mode expert (destiné aux plus expérimentés). Cette option nous
propose plus de fonctionnalités de recherche plus poussées. On peut ainsi faire une
recherche : sur les URL ; sur un champ auteurs ; sur un champ date...
I.7.
Ev aluation des résultats de recherche
Il faut toujours évaluer, analyser et croiser les documents obtenus lors d’une recherche
sur Internet. Plusieurs critères d’évaluation sont possibles :
• Signature et notoriété du ou des auteurs ;
• Organis me auquel est associé l’auteur ;
• Liste de références citées ;
• Information mise à jour selon l'année de publication ou du copyright ;
• Exactitude des informations ;
• Evaluation du niveau d’information présenté : expert, grand public, universitaire... ;
• Ergonomie ;
• Mise à jour du site ;
• Stabilité du site ;
• Hyperliens actifs et mis à jour ;
• Clarté de la page d'accueil ;
• Navigation dans le site : plan, index ;
• Accessibilité du site ;
• Caractère novateur de l’information recueillie ;
• ....
Ces critères dépendent de l’i nformation que l’on souhaite trouver et des spécificités qu’elle
possède.
© 2003 – 3IE
http://w ww.3ie.org
14 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
II.
LE S DIFFE RE NTS OUTILS DE RECHE RCHE S UR IN TE RNE T
Face à la croissance du nombre de pages présentes sur le Web, les outils facilitant la
recherche sur la toile ont vu le jour. Ceux-ci se classent dans différentes catégories.
II.1. Le s ANNUAIRES, REPERTOIRES, INDEX
Ils présentent un classement de sites en rubriques et sous rubriques thématiques,
géographiques... confectionnées par des professionnels de l’information.
Les informations y sont moins nombreuses que sur les moteurs de recherche, mais y sont
plus pertinentes du fait de son classement humain.
Deux possibilités de recherche nous sont proposées :
• la recherche par catégories, on entre alors dans l’arborescence de l’annuaire ;
• la recherche par mots clés .
•
Les annuaires ne se veulent pas exhaustifs, ils proposent une information validée. Ils sont
utilisés la plupart du temps lorsque l’on recherche une information générale sur un sujet.
Quelques exemples d’annuaires et répertoires :
© 2003 – 3IE
http://w ww.3ie.org
15 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
II.1.1 Généralistes internationaux :
• Yahoo!
http://w ww .yahoo.com/
• Galaxy
• LookSmart
http://galaxy.einet.net/
http://w ww .looksmart.com/
• Lycos
http://w ww .ly cos.com
II.1.2 Généralistes géographiques :
• France :
ƒ Yahoo
ƒ Nomade
ƒ Voilà
ƒ Lycos
http://w ww .yahoo.fr
http://w ww .nomade.fr/
http://w ww .voila.fr
http://w ww .fr.lycos.de/
• Europe :
ƒ Euroseek
http://w ww .euroseek.com/page?ilang=fr
• Monde :
• Virtual Tourist http://w ww .virtualtourist.com/?s=T&
II.1.3 Annuaires thématiques SPECIALISES:
• The Argus Clear ingHouse
• The WWW Virtual Library
http://w ww .clearinghouse.net/
http://vlib.org/
• Ressource Discovery Netw ork
http://w ww .rdn.ac.uk/
• AlphaSearch
http://w ww .calvin.edu/library/searreso/internet/as/
• FindLaw
http://w ww .findlaw .c om/
• Librarian’s Index To The Internet
• Bubl Link
http://w ww .lii.org/search/advanced
http://bubl.ac.uk/link/subjects/
© 2003 – 3IE
http://w ww.3ie.org
16 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
II.2. Le s moteurs de recherche / Robot
Ils recherchent par mots clés en texte intégral dans la multitude de pages Web que
comporte Internet.
Ils explorent donc automatiquement et périodiquement les pages Internet qu ’ils peuvent
localiser en les indexant automatiquement.
Les moteurs de recherche indexent uniquement le contenu du code HTML des pages
Web. Il ne sélectionne pas toutes les données d’un site, mais va positionner son indexation
seulement sur les premières pages.
Le moteur va donc s’infiltrer dans le code HTML des pages pour y récupérer les
informations contenues dans les balises META (auteur, résumé du site, date de mise en ligne,
mots-clés descriptifs...).
Les moteurs de recherche se veulent être exhaustifs et sont ainsi utilisés lors d’une
recherche plus précise et plus poussée.
Nous pouvons citer :
• Northernlight http://www.northernlight.com
• Google http://www.google.com
• Hotbot http://www.hotbot.com
• Excite http://www.excite.com /
• WebCraw ler
http://www.webcraw ler.com /
• ...
© 2003 – 3IE
http://w ww.3ie.org
17 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
II.3. Le s me ta-moteurs, Meta-Outils, Meta-Cherche urs
Ces logiciels entreprennent simultanément la recherche sur plusieurs moteurs de
recherche.
Nous pouvons citer par exemple :
• Open Text Query Server
• Go Gettem
http://www.queryserver.com /web1.htm
http://www.gogettem .com/
• Ixquick http://ixquick.com/
• Meta Craw ler http://www.metacraw ler.com /
• Profusion
http://www.profusion.com
• Search.com
http://www.search.com/
• DogPile
http://www.dogpile .com /
• Ariane http://www.espace2001.com /moteur/index.html
• Trouvez.com http://www.trouvez.com /
• ...
© 2003 – 3IE
http://w ww.3ie.org
18 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
II.4. Le s age nts inte lligents (ou multi-agents) sur internet
Selon la définition donnée par l’A FNOR (Agence Français e de Normalisation), les agents
intelligents sont : « des objets utilisant les techniques de l’Intelligence Artificielle. L’agent adapte
son comportement à son environnement et en mémorisant ses expériences, se comporte
comme un sous système capable d’apprentissage. Il enrichie le système qui l’utilise en ajoutant,
au cours du temps, des fonctions automatiques de traitement, de contrôle, de mémorisation ou
de transfert d’information ».
Les méta- moteurs ont constitué la première génération d’agents intelligents, mais leurs
performances étaient limitées car ils n’intègrent pas l’automatisation des tâches...
Une deuxième génération d’agents intelligents plus évolués ont donc vu le jour, intégrant
des fonctionnalités et caractéristiques diverses :
• Automatisation et autonomie de fonctionnement ;
• Mobilité ;
• Capacité d’interaction avec des interlocuteurs humains ou mécaniques ;
• Capacité à communiquer, à coopérer ;
• Capacité d’apprentissage ;
• Capacité à raisonner, à réagir face à son environnement.
Plusieurs fonctionnalités peuvent être attribuées à ces agents :
• Recherche d’information simultanée sur plusieurs outils ;
• Rapatriement et indexation des pages en local ;
• Classement et gestion des informations ;
• Elimination des doublons ;
• Création de résumé ;
• Surveillance des modifications de sites selon une périodicité paramétrable ;
• Agent pour la consultation hors ligne ;
• Aspiration d’un site Internet pour le recopier sur un poste en local, en respectant
l’arborescence du site d’origine ;
• Spécification du niveau de profondeur possible.
© 2003 – 3IE
http://w ww.3ie.org
19 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
II.4.1 Les agents de recherche d’information
Nous intégrons dans cette catégorie 3 types d’agents :
II.4.1.1
Les méta-moteurs « On-Line »
Ils permettent de rechercher de l’information dans plusieurs moteurs à la fois (cf. la
partie2.3).
II.4.1.2
Les méta-moteurs « Off-Line »
L’outil est capable de se connecter automatiquement et temporellement (date, heure
paramétrable) au Web pour effectuer la recherche voulue sans le besoin d’une intervention
humaine. Nous pouvons citer comme exemple :
• Copernic
• Inforian
http://w ww .copernic.com/
http://w ww .inforian.com
• WebFerret
• ...
http://w ww .ferretsoft.com
II.4.1.3
Les agents de recherche avancés
Les agents intègrent des fonctionnalités de recherche supplémentaires : filtrage et
archivage des informations recueillies, analyse des résultats (statistiques de pertinence...)
• Strategic Finder
http://w ww .strategicfinder.com/
• Bulls Eye 2
• DigOut4U
http://w ww .intelliseek.com/prod/bullseye/bullseye.htm
http://w ww .arisem.com/fr/
• Umap
• WebSeeker
http://w ww .umap.com/high/index.htm
http://w ww .bluesquireel.com
© 2003 – 3IE
http://w ww.3ie.org
20 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
II.4.2 Les agents de veille
Nous pouvons distinguer plusieurs types d’agents de veille, notamment :
II.4.2.1
Les agents d’alerte
Ils sont destinés à acheminer une information pertinente à l’usager selon un profil
prédéfini sans que celui-ci fasse de démarche. Les agents de type « push on-line » affichent
des informations nouvelles et proposent des services personnalisables. Les agents de type «
push off-line » fonctionnent sur le même principe à la différence que le logiciel est directement
installé sur l’ordinateur client. Ainsi, l’outil assistera l’usager pour définir son profil et récupérera
par la suite automatiquement les éléments demandés selon une périodicité prédéfinie.
• Ecatch
http://w ww .ecatch.com
• Enfish Tracker Pro
• Memo Web
http://w ww .enfish.com
http://w ww .memow eb.com
• NetMind
http://Ww w .netmind.com
• Teleport Pro
http://w ww .tenmax.com
• Webspector
• ...
http://w ww .illumix.com
II.4.2.2
Les agents d’alerte « on-line » et « off-line »
Les premiers opèrent à distance mais n’effectuent pas de veilles très poussées. Les outils
« off-line » sont des logiciels clients offrant un plus grand niveau de personnalisation pour une
veille plus performante. Les agents copient des sites entiers sur l’ordinateur de l’usager. Ils sont
consultables en mode local sans connexion à Internet. Dès que l’agent détecte des variations, il
en informe l’usager. Pour éviter que l’agent d’alerte ne dérange constamment l’usager, celui-ci
définit, à partir de mots clés, les modifications pour lesquelles il souhaite être informé.
• EntryPoint : http://www .pointcast.com
• ...
© 2003 – 3IE
http://w ww.3ie.org
21 / 22
RECHERCHE D’INFO RMAT IO N SUR INTERNET
T ABLE DES FIGUR ES
Figure 1 - Opérateur d'union.............................................................................................................7
Figure 2 - Opérateurs d'intersection.................................................................................................9
Figure 3 - Opérateurs d'exclusion...................................................................................................11
© 2003 – 3IE
http://w ww.3ie.org
22 / 22
3IE
c/o EPITA, 14-16 Rue Voltaire
94276 Le Kremlin-Bicêtre Cedex
Tel : 01 53 14 59 36
Fax : 01 53 14 59 28
URL : http://www.3ie.org
Email : [email protected]