Microsoft Office Word - Recherche sur Internet - v 2.0
Transcription
Microsoft Office Word - Recherche sur Internet - v 2.0
RECH ERCH E D ’IN FORM ATION SUR IN TER NET PETIT GUIDE METHODOLOGIQUE 3IE c/o EPIT A, 14-16 Rue Voltaire 94276 Le Kremlin-Bicêtre Cedex T el : 01 53 14 59 36 Dernière mise à jour : Décembre 2001 Fax : 01 53 14 59 28 URL : http://www.3ie.org Email : [email protected] 3IE est une marque déposée. Les informations contenues dans les études 3IE sont la propriété de l'EPITA. Toutes reproductions des contenus diffusés dans cette étude sont interdites sans l'accord de 3IE. 3IE et les entreprises partenair es qui lui sont liées ne sont pas tenus responsables des dommages que pourraient causer son analyse. Copyright © 2001 3IE-EPITA. T ABLE DES M ATIÈR ES INTRO DUC TION 1 I. 2 II. M ÉTHODOLOGIE DE RECHERCHE DOCUMENTAIRE I.1. Formulation de votre besoin d’inform ation. 2 I.2. Délim itation du sujet - Extraction des concepts – Identification des mots clés 2 I.3. Choix de votre outil de recherche 4 I.4. Equation logique et outil de recherche 5 I.5. Les opérateurs 5 I.5.1 Opérateurs de proximité : 6 I.5.2 I.5.3 Opérateurs booléens : Troncatures 7 12 I.5.4 I.5.5 I.5.6 Opérateurs numériques Séparateur d’équation La casse des mots 12 13 13 I.6. Les différents M ODES de recherche 14 I.7. Evaluation des résultats de recherche 14 LES DIFFERENTS OUTILS DE RECHERCHE SUR I NTERNET II.1. II.1.1 II.1.2 Les ANNUAIRES, REPERT OIRES, INDEX Généralistes internationaux : Généralistes géographiques : 15 15 16 16 II.1.3 Annuaires thématiques SPECIALISES: II.2. Les m oteurs de recherche / Robot 16 17 II.3. Les meta-moteurs, Meta-Outils, Meta-Chercheurs 18 II.4. Les agents intelligents (ou multi-agents) sur internet 19 II.4.1 II.4.2 Les agents de recherche d’information Les agents de veille TAB LE DE S FIGURES 20 21 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET INTRODUC TION Le problème principal d’une recherche d’information sur le Web est la « surinformation » : • on trouve à la fois tout ou rien ; • on est vite inondé par le flot d’information trouvé ; • on se noie. Cette masse d’informations (le « bruit »), ce nombre excessif de résultats obtenus lors de notre requête, rend le tri et le repérage des informations pertinentes très difficile. Ce guide vous aidera à mieux chercher l’Information Stratégique sur Internet nécessaire à toutes entreprises. Vous pourrez affiner les résultats que vous obtiendrez et ainsi mieux comprendre l’organisation complexe de la sphère informationnelle sur le Web. © 2003 – 3IE http://w ww.3ie.org 1 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET I. MÉTHO DOLOGIE DE RE CHE RC HE DOCUM EN TA I RE I.1. Formulation de votre besoin d’information. Avant de vous lancer dans d’impérieuses recherches d’informations sur le Web, vous devez formuler vos besoins. Cette formulation se fait par le biais d’une phrase exprimant la recherche que vous souhaitez entreprendre. Exemple : « Je recherche les différentes normes existantes pour la voix sur IP (VOIP) actuellement utilisées au niveau mondial dans le cadre du développement d’applications professionnelles » I.2. Délimitation du sujet - Extraction des conce pts – Ide ntification de s mots clés L’expression de votre besoin (la phrase extraite) peut-être décomposée en plusieurs concepts. Ceux-ci doivent être extraits et traduits en mots clés. On les ramène à leur forme singulière ce qui per mettra de balayer toutes ambiguïtés. Dans une seconde étape, on va expliquer les concepts dégagés au travers des outils tels que des dic tionnair es spécialisés, des encyclopédies ou des manuels. On identifie alors la terminologie scientif ique entourant notre sujet. Les mots-clés seront utilisés dans la formulation de nos requêtes auprès des différents moteurs sélectionnés. © 2003 – 3IE http://w ww.3ie.org 2 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET Nous classons ces mots clés selon 4 zones : • Les mots clés primaires (ils cadrent le domaine de recherche) ; • Les mots clés secondaires (ils précisent la recherche à effectuer) ; • Les synonymes ; • Les équivalents. Nous traduisons tous les concepts extraits afin d’étendre notre recherche aux documents étrangers : Anglais, Allemand, Espagnol... Reprenons notre exemple de recherche des normes relatives à la Voix sur IP. Dans le cadre de cette recherche nous traduirons les concepts dégagés du français à l’anglais. CLASSE M OTS CLES Les mots clés primaires (ils cadrent le domaine Voix sur IP de recherche) VOIP Nor me Standard Les mots clés secondaires (ils précisent la Application professionnelle (cible) recherche à effectuer) Monde (cadre géographique) Actuellement (cadre temporel) Les synonymes / Voice Over Internet Protocol Les équiv alences © 2003 – 3IE Voice Over IP Voix sur Internet Protocol http://w ww.3ie.org 3 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET I.3. Choix de votre outil de reche rche On peut noter que notre recherche est assez précise. Nous pouvons donc prédire que le nombre de sites présents sur le Web et contenant l’information désirée ne sera pas élevé (à l’échelle du Web). Cette étape est destinée à sélectionner l’outil de recherche avec lequel nous débuterons nos recherches. C’est ainsi que nous nous orienterons vers un annuaire, un moteur ou un agent intelligent (cf partie 2 – Les outils de recherche sur Internet). Exemple : « Je recherche les différentes normes existantes de voix sur IP (VOIP) actuellement utilisées dans le monde dans le cadre du développement d’applications professionnelles » L’utilisation d’un répertoire, annuaire ou index n’est pas judicieuse dans le cadre de notre recherche. Ces outils présentent des informations (liens) sélectionnées et indexées manuellement par des professionnels de l’information. Ils nous offrent donc une information d’ordre générale (généralités, les thématiques et problématiques principales...). Ils permettent dans le cadre de certaines recherches de balayer un domaine de manière globale afin d’en dégager les notions essentielles qui feront l’objet d’une recherche plus poussée sur des moteurs ou méta-moteurs de recherche. Dans le cadre de notre recherche sur la voix sur IP, nous nous dirigerons davantage vers un moteur ou un méta- moteurs car l’objet de notre recherche est déjà assez précis, cadré et ciblé. Nous prendrons comme exemple Google : http://www .google.com . Pour vous guider dans le choix de votre outil de recherche nous vous conseillons le site Abondance : http://www.abondance.com . Il vous informera sur les différentes fonctionnalit és intégrées dans chacun des outils de recherche d’informations les plus utilisés. © 2003 – 3IE http://w ww.3ie.org 4 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET I.4. Equation logique e t outil de recherche Avant de se lancer sur le Web, il faut dégager l’équation logique nécessaire à l’outil de recherche sélectionné pour extrair e les informations les plus pertinentes (et éviter le « bruit »). Cette équation sera constituée des mots clés que nous avons sélectionnés précédemment et des opérateurs logiques pour établir des relations entre eux. I.5. Le s opérateurs Voici une liste des principaux opérateurs mis à la disposition de l’utilisateur pour précis er sa requête. © 2003 – 3IE http://w ww.3ie.org 5 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET I.5.1 Opérateurs de proximité : ADJ / NEA R / WIT H / FOLLOWED BY / “ “ Ils indiquent la distance entre deux mots, leur ordre, s'ils doivent figurer dans le même paragraphe. Ils sont utiles lorsque l’on interroge les documents en texte intégral et permettent d'être plus précis que l’emploi de l’opérateur booléen ET. Exemple : • EXPRESSION DE NOTRE BESOIN : « Je recherche les documents sur la Voix sur IP ». • EQUATION DE RECHERCHE : « Voix sur IP ». L’objet de notre recherche n’est pas précis. Le champ couvert est vaste. Comme nous l’avons noté plus haut, dans le cadre de ce type de recherche nous nous orienterons en pr iorité vers les annuaires, les répertoires ou les index. Nous choisirons ici Voilà : http://w ww .v oila.fr Nous élargirons l’équation de recherche aux diverses traductions : • VOIP • « voix sur internet protocol » • « voice over ip” • “voice over internet protocol” Résultats de notre recherche sur Voilà : • 827 trouvés • Liens pertinents sur la première page Plan de cours informatif (mots clés thématiques, problématiques, normes, standards...) mais sans détails : http://www.efort.com/ftelIP_intra.htm l Introduction à VOIP : http://www.easytel.fr/infos/voix.htm / http://lsoron.free.fr/dossie rs/telip /telip.htm l / http://www.itel.ch/technologie/telephonie/fondamentaux/voix_sur_ip.htm Document exhaustif : http://guill.net/reseaux/voip/Voip7.html Informations d’actualité © 2003 – 3IE http://w ww.3ie.org 6 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET I.5.2 Opérateurs booléens : OU / OR Ils correspondent aux opérateurs d’UNION (on recherche tous les documents contenant les termes sélectionnés). Exemple : • EXPRESSION DE NOTRE BESOIN : « Je recherche des informations sur la Voix sur IP et les fournisseurs de Voix sur IP ». • EQUATION DE RECHERCHE : « Voix sur IP » OU fournisseur Figure 1 - Opérateur d'union L’objet de notre recherche se précis ant, nous utiliserons le moteur de recherche Google, http://www.google.com pour affiner nos résultats. Nous sommes donc à la recherche d’informations sur VOIP, mais de ces fournisseurs. Notre stratégie de recherche sera de combiner une recherche en français et an anglais. © 2003 – 3IE http://w ww.3ie.org 7 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET D’où le choix des équations suivantes : • « voice over ip » OU fournisseur • « voice over ip » OU provider • « voix sur internet protocol » OU provider • “voice over internet protocol” OU fournisseur • « voice over internet protocol” OU provider • voip OU provider • voip OU fournisseur Résultats de notre recherche : • La téléphonie sur IP : http://www .telecom.gouv.fr/documents/merlin/rap_merlin0499_2.htm http://www .voip-telecom.com/voip/w ebfr/Biz planw eb_fichiers/frame.htm • Dossier VOIP : http://195.134.220.47/art/ls037/ls037106.htm http://w 3.sba.oakland.edu/netmgt/14ec_w ireless/ch14_w ireless_detail.htm#InternetTeleph ony http://www .hsc.fr/ressources/articles/telephonie/telephonie-2.html http://www .guill.net/reseaux/voip/Voip6.html • Produits et acteurs : http://www .hsc.fr/ressources/articles/telephonie/telephonie-6.html http://www .art-telecom.fr/publications/pres-ip.htm http://www .gii.co.jp/english/ab7060_voip_toc.html • Sources d’informations à explorer : http://www .art-telecom.fr/liens/index-d.htm • Information d’actualité • ... Google nous trouve des sites d’informations sur VOIP ainsi que les grands fournisseurs de VOIP comme : 3com, Lucent, CISCO,... © 2003 – 3IE http://w ww.3ie.org 8 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET ET / A ND / + Ils correspondent à l'INT ERSECTION (on recherche tous les documents contenant les termes en même temps). Exemple : • EXPRESSION DE NOTRE BESOIN : « Je recherche les fournisseurs de Voix sur IP ». • EQUATION DE RECHERCHE : « Voix sur IP » ET fournisseur Figure 2 - Opérateurs d'intersection Résultats de recherche sur Google avec les équations suivantes : • « voice over ip » AND fournisseur • « voice over ip » AND provider • « voix sur internet protocol » AND provider • “voice over internet protocol” AND fournisseur • « voice over internet protocol” AND provider • voip AND provider • voip AND fournisseur © 2003 – 3IE http://w ww.3ie.org 9 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET Résultats de notre recherche : • Produits et standards : http://w ww.infosyssec.com/infosyssec/voiceip1.htm http://w ww.reseaux-telecoms.net/DOSSIERS/172_p94.htm • Annuaire : http://w ww.whotelecom .com /onglet2.php3 • Dossiers / Rapports : http://danang.dinus.ac.id/naskah-25.html http://w ww.itu.int/journal/200102/F/htm l/IP_Telephony.htm http://w ww.techguide.com/comm/voiceip.shtm l ftp://ftp.netlab.ohio-state.edu/pub/jain/courses/cis788-99/voip_products/index.html http://w ww.protocols.com /papers/VoIP%20Testing%20%20A%20Practical%20Guide.pdf http://w ww.protocols.com /voip.htm http://w ww.mindbranch.com /p_title.php3?code=R70-14&content=toc&partner=172 • Source d’informations : http://w ww.cis.ohio-state.edu/~jain/refs/ref_voip .htm © 2003 – 3IE http://w ww.3ie.org 10 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET SAUF / NOT / NOT AND / - Ils correspondent à l'EXCL USION (on élimine les ter mes non souhaités dans les documents recherchés). Exemple : • EXPRESSION DE NOTRE BESOIN : « Je recherche les fournisseurs de Voix sur IP sauf ceux localisés à Paris ». • EQUATION DE RECHERCHE : [« Voix sur IP » ET fournisseur] SAUF Paris Figure 3 - Opérateurs d'exclusion L’objet de cette recherche revient à associer la recherche par INTERSECTION en excluant le mot Paris. Nous sélectionnerons les équations suivantes : • [« voice over ip » AND fournisseur] SAUF Paris • [« voice over ip » AND provider] SAUF Paris • [“voice over internet protocol” AND fournisseur] SAUF Paris • [« voice over internet protocol” AND provider] SAUF Paris • [« voix sur internet protocol” AND provider] SAUF Paris • [voip AND provider] SAUF Paris • [voip AND fournisseur] SAUF Paris © 2003 – 3IE http://w ww.3ie.org 11 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET I.5.3 Troncatures */?/$ Ces caractères peuvent remplacer un ou plusieurs caractères (utilité lorsqu’on n'est pas sûr d’une orthographe ou lorsqu’on veut ouvrir notre recherche). Exemple : • EXPRESSION DE NOTRE BESOIN : « Je recherche des informations sur la documentation : profession (documentalistes), matière première (document)... » • EQUATION DE RECHERCHE : document* Pour effectuer cette recherche générale nous utiliserons en prior ité un annuair e tel que Yahoo : http://w ww.yahoo.f r . Les résultats de recherche y seront multiples. I.5.4 Opérateurs numériques = / > / < / <= / >= Ils permettent d'affiner l'équation de recherche sur les champs numériques (dates...). Exemple : EXPRESSION DE NOTRE BESOIN : « Je recherche tous les documents sur la Voix sur IP parus en 2001 ». EQUATION DE RECHERCHE : « Voix sur IP » = 2001 La recherche en texte intégrale effectuée sur Google nous sort les documents présentant le mot « voip » (ou « voice over ip » / « voix sur IP » / « voix sur internet protocol » / « voice over internet protocol ») associé à « 2001 ». © 2003 – 3IE http://w ww.3ie.org 12 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET I.5.5 Séparateur d’équation [ ] /( ) On utilise les séparateurs d’équation lorsque l’on souhaite faire une recherche en mixant plusieurs opérateurs. Exemple : • EXPRESSION DE NOTRE BESOIN : « Je recherche des informations sur les fournisseurs de voix sur IP sauf ceux localisés en Allemagne ». • EQUATION DE RECHERCHE : [« voix sur IP » AND fournisseur] SAUF Allemagne I.5.6 La casse des mots Certains moteurs ne tiennent pas compte de la casse des mots (vous pouvez taper indifféremment le ter me de recherche en majuscules, en minuscules, avec ou sans accents). Ils ne font donc pas la différence entre les minuscules et les majuscules. La liste que nous vous présentons n’est pas exhaustive, elle est destinée à vous présenter les opérateurs les plus couramment utilisés par les professionnels de la recherche d’informations. D’autres opérateurs et d’autres fonctions de recherche existent (recherche par type de documents : image,son, vidéo...; par extension de fichiers : .doc, .pdf.... – cf Google). Ces fonctions et particularités de recherche n’apparaissent pas dans tous les moteurs de recherche. Chaque moteur de recherche intègre ses propres spécificités. C’est en utilisant et en testant ces différentes fonctionnalités que l’on arrive à optimiser ses propres recherches. Vous pouvez vous orienter sur le site Abondance ( http://www .abondance.com ) qui présente bien les particularités de chaque outil de recherche. © 2003 – 3IE http://w ww.3ie.org 13 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET I.6. Le s différents MODES de recherche Les outils de recherche tiennent parfois compte des différents niveaux d’expérimentation de leurs utilisateurs. Ainsi nous pouvons rechercher sur un même outil de deux manières différentes : • La recherche en m ode norm al (destiné aux utilisateurs novices). Le moteur de recherche propose une recherche simplifiée qui comprend qu’un seul champ de saisie généralement en texte libre. • La recherche en mode expert (destiné aux plus expérimentés). Cette option nous propose plus de fonctionnalités de recherche plus poussées. On peut ainsi faire une recherche : sur les URL ; sur un champ auteurs ; sur un champ date... I.7. Ev aluation des résultats de recherche Il faut toujours évaluer, analyser et croiser les documents obtenus lors d’une recherche sur Internet. Plusieurs critères d’évaluation sont possibles : • Signature et notoriété du ou des auteurs ; • Organis me auquel est associé l’auteur ; • Liste de références citées ; • Information mise à jour selon l'année de publication ou du copyright ; • Exactitude des informations ; • Evaluation du niveau d’information présenté : expert, grand public, universitaire... ; • Ergonomie ; • Mise à jour du site ; • Stabilité du site ; • Hyperliens actifs et mis à jour ; • Clarté de la page d'accueil ; • Navigation dans le site : plan, index ; • Accessibilité du site ; • Caractère novateur de l’information recueillie ; • .... Ces critères dépendent de l’i nformation que l’on souhaite trouver et des spécificités qu’elle possède. © 2003 – 3IE http://w ww.3ie.org 14 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET II. LE S DIFFE RE NTS OUTILS DE RECHE RCHE S UR IN TE RNE T Face à la croissance du nombre de pages présentes sur le Web, les outils facilitant la recherche sur la toile ont vu le jour. Ceux-ci se classent dans différentes catégories. II.1. Le s ANNUAIRES, REPERTOIRES, INDEX Ils présentent un classement de sites en rubriques et sous rubriques thématiques, géographiques... confectionnées par des professionnels de l’information. Les informations y sont moins nombreuses que sur les moteurs de recherche, mais y sont plus pertinentes du fait de son classement humain. Deux possibilités de recherche nous sont proposées : • la recherche par catégories, on entre alors dans l’arborescence de l’annuaire ; • la recherche par mots clés . • Les annuaires ne se veulent pas exhaustifs, ils proposent une information validée. Ils sont utilisés la plupart du temps lorsque l’on recherche une information générale sur un sujet. Quelques exemples d’annuaires et répertoires : © 2003 – 3IE http://w ww.3ie.org 15 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET II.1.1 Généralistes internationaux : • Yahoo! http://w ww .yahoo.com/ • Galaxy • LookSmart http://galaxy.einet.net/ http://w ww .looksmart.com/ • Lycos http://w ww .ly cos.com II.1.2 Généralistes géographiques : • France : Yahoo Nomade Voilà Lycos http://w ww .yahoo.fr http://w ww .nomade.fr/ http://w ww .voila.fr http://w ww .fr.lycos.de/ • Europe : Euroseek http://w ww .euroseek.com/page?ilang=fr • Monde : • Virtual Tourist http://w ww .virtualtourist.com/?s=T& II.1.3 Annuaires thématiques SPECIALISES: • The Argus Clear ingHouse • The WWW Virtual Library http://w ww .clearinghouse.net/ http://vlib.org/ • Ressource Discovery Netw ork http://w ww .rdn.ac.uk/ • AlphaSearch http://w ww .calvin.edu/library/searreso/internet/as/ • FindLaw http://w ww .findlaw .c om/ • Librarian’s Index To The Internet • Bubl Link http://w ww .lii.org/search/advanced http://bubl.ac.uk/link/subjects/ © 2003 – 3IE http://w ww.3ie.org 16 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET II.2. Le s moteurs de recherche / Robot Ils recherchent par mots clés en texte intégral dans la multitude de pages Web que comporte Internet. Ils explorent donc automatiquement et périodiquement les pages Internet qu ’ils peuvent localiser en les indexant automatiquement. Les moteurs de recherche indexent uniquement le contenu du code HTML des pages Web. Il ne sélectionne pas toutes les données d’un site, mais va positionner son indexation seulement sur les premières pages. Le moteur va donc s’infiltrer dans le code HTML des pages pour y récupérer les informations contenues dans les balises META (auteur, résumé du site, date de mise en ligne, mots-clés descriptifs...). Les moteurs de recherche se veulent être exhaustifs et sont ainsi utilisés lors d’une recherche plus précise et plus poussée. Nous pouvons citer : • Northernlight http://www.northernlight.com • Google http://www.google.com • Hotbot http://www.hotbot.com • Excite http://www.excite.com / • WebCraw ler http://www.webcraw ler.com / • ... © 2003 – 3IE http://w ww.3ie.org 17 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET II.3. Le s me ta-moteurs, Meta-Outils, Meta-Cherche urs Ces logiciels entreprennent simultanément la recherche sur plusieurs moteurs de recherche. Nous pouvons citer par exemple : • Open Text Query Server • Go Gettem http://www.queryserver.com /web1.htm http://www.gogettem .com/ • Ixquick http://ixquick.com/ • Meta Craw ler http://www.metacraw ler.com / • Profusion http://www.profusion.com • Search.com http://www.search.com/ • DogPile http://www.dogpile .com / • Ariane http://www.espace2001.com /moteur/index.html • Trouvez.com http://www.trouvez.com / • ... © 2003 – 3IE http://w ww.3ie.org 18 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET II.4. Le s age nts inte lligents (ou multi-agents) sur internet Selon la définition donnée par l’A FNOR (Agence Français e de Normalisation), les agents intelligents sont : « des objets utilisant les techniques de l’Intelligence Artificielle. L’agent adapte son comportement à son environnement et en mémorisant ses expériences, se comporte comme un sous système capable d’apprentissage. Il enrichie le système qui l’utilise en ajoutant, au cours du temps, des fonctions automatiques de traitement, de contrôle, de mémorisation ou de transfert d’information ». Les méta- moteurs ont constitué la première génération d’agents intelligents, mais leurs performances étaient limitées car ils n’intègrent pas l’automatisation des tâches... Une deuxième génération d’agents intelligents plus évolués ont donc vu le jour, intégrant des fonctionnalités et caractéristiques diverses : • Automatisation et autonomie de fonctionnement ; • Mobilité ; • Capacité d’interaction avec des interlocuteurs humains ou mécaniques ; • Capacité à communiquer, à coopérer ; • Capacité d’apprentissage ; • Capacité à raisonner, à réagir face à son environnement. Plusieurs fonctionnalités peuvent être attribuées à ces agents : • Recherche d’information simultanée sur plusieurs outils ; • Rapatriement et indexation des pages en local ; • Classement et gestion des informations ; • Elimination des doublons ; • Création de résumé ; • Surveillance des modifications de sites selon une périodicité paramétrable ; • Agent pour la consultation hors ligne ; • Aspiration d’un site Internet pour le recopier sur un poste en local, en respectant l’arborescence du site d’origine ; • Spécification du niveau de profondeur possible. © 2003 – 3IE http://w ww.3ie.org 19 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET II.4.1 Les agents de recherche d’information Nous intégrons dans cette catégorie 3 types d’agents : II.4.1.1 Les méta-moteurs « On-Line » Ils permettent de rechercher de l’information dans plusieurs moteurs à la fois (cf. la partie2.3). II.4.1.2 Les méta-moteurs « Off-Line » L’outil est capable de se connecter automatiquement et temporellement (date, heure paramétrable) au Web pour effectuer la recherche voulue sans le besoin d’une intervention humaine. Nous pouvons citer comme exemple : • Copernic • Inforian http://w ww .copernic.com/ http://w ww .inforian.com • WebFerret • ... http://w ww .ferretsoft.com II.4.1.3 Les agents de recherche avancés Les agents intègrent des fonctionnalités de recherche supplémentaires : filtrage et archivage des informations recueillies, analyse des résultats (statistiques de pertinence...) • Strategic Finder http://w ww .strategicfinder.com/ • Bulls Eye 2 • DigOut4U http://w ww .intelliseek.com/prod/bullseye/bullseye.htm http://w ww .arisem.com/fr/ • Umap • WebSeeker http://w ww .umap.com/high/index.htm http://w ww .bluesquireel.com © 2003 – 3IE http://w ww.3ie.org 20 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET II.4.2 Les agents de veille Nous pouvons distinguer plusieurs types d’agents de veille, notamment : II.4.2.1 Les agents d’alerte Ils sont destinés à acheminer une information pertinente à l’usager selon un profil prédéfini sans que celui-ci fasse de démarche. Les agents de type « push on-line » affichent des informations nouvelles et proposent des services personnalisables. Les agents de type « push off-line » fonctionnent sur le même principe à la différence que le logiciel est directement installé sur l’ordinateur client. Ainsi, l’outil assistera l’usager pour définir son profil et récupérera par la suite automatiquement les éléments demandés selon une périodicité prédéfinie. • Ecatch http://w ww .ecatch.com • Enfish Tracker Pro • Memo Web http://w ww .enfish.com http://w ww .memow eb.com • NetMind http://Ww w .netmind.com • Teleport Pro http://w ww .tenmax.com • Webspector • ... http://w ww .illumix.com II.4.2.2 Les agents d’alerte « on-line » et « off-line » Les premiers opèrent à distance mais n’effectuent pas de veilles très poussées. Les outils « off-line » sont des logiciels clients offrant un plus grand niveau de personnalisation pour une veille plus performante. Les agents copient des sites entiers sur l’ordinateur de l’usager. Ils sont consultables en mode local sans connexion à Internet. Dès que l’agent détecte des variations, il en informe l’usager. Pour éviter que l’agent d’alerte ne dérange constamment l’usager, celui-ci définit, à partir de mots clés, les modifications pour lesquelles il souhaite être informé. • EntryPoint : http://www .pointcast.com • ... © 2003 – 3IE http://w ww.3ie.org 21 / 22 RECHERCHE D’INFO RMAT IO N SUR INTERNET T ABLE DES FIGUR ES Figure 1 - Opérateur d'union.............................................................................................................7 Figure 2 - Opérateurs d'intersection.................................................................................................9 Figure 3 - Opérateurs d'exclusion...................................................................................................11 © 2003 – 3IE http://w ww.3ie.org 22 / 22 3IE c/o EPITA, 14-16 Rue Voltaire 94276 Le Kremlin-Bicêtre Cedex Tel : 01 53 14 59 36 Fax : 01 53 14 59 28 URL : http://www.3ie.org Email : [email protected]