Questionnaire n°1, Question n°11
Transcription
Questionnaire n°1, Question n°11
B2-Lar e c he r c hed' i nf or ma t i on Aut e ur s: Fr a nç oi s eADREI T LucGARCI A Robe r tMORE Be r na r dPELLEFI GUE J e a nChr i s t opheSAKDAVONG Sa ndr i neCHAPOULI E Un i v e r s i t éd eTo u l o u s e2-LeMi r a i l Modul edé ve l oppéda nsl ec a dr edupr oj e tC2I MES2006, Ce r t i f i c a t i onI nf or ma t i quee tI nt e r ne t Mut ua l i s é epourl ' Ens e i gne me ntSupé r i e ur Ed i t i o n:C2 I MES, www. c 2 i me s . o r g Sc é n a r i s a t e u r s:Pa u lCa mp a n a , An g é l i q u eFr o g e r Ve r s i o n:2 . 0 Table des matières Chapitre I. Présentation du module. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 A. Crédits. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 B. Préambule. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Chapitre II. Caractéristiques générales des outils de recherche. . . 11 Partie A. Les annuaires de recherche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 11 2. Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Partie B. Les moteurs des recherche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1. Principe de fonctionnement : l'indexation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2. Présentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Partie C. Etude de l'annuaire YAHOO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1. Généralités. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2. Utilisation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Partie D. Etude du moteur GOOGLE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1. Le choix de Google. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2. Recherche et présentation des résultats. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3. Conseils pour le choix des mots-clés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 A. Annuaires ou Moteurs ?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 1. Principes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Partie E. Exercices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Exercice n°1. Recherche sur Yahoo!. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercice n°2. Recherche élémentaire sur Google. . . . . . . . . . . . . . . . . . . . . . . . . . . Exercice n°3. Recherche avancée sur Google. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercice n°4. Recherche comparée sur Yahoo! et Google. . . . . . . . . . . . . . . . . . . 26 27 29 30 4 B2 - LA RECHERCHE D'INFORMATIONS Chapitre III. Formaliser les requêtes de recherche. . . . . . . . . . . . . . . . . . . 31 Partie A. Le langage d'interrogation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 32 2. Etablir une stratégie de recherche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Partie B. Les équations de recherche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 1. Les opérateurs de recherche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 2. Etablir une requête d'interrogation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 1. Pourquoi un langage d'interrogation ?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Chapitre IV. Catalogue de bibliothèque. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 Objectifs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 Partie A. Qu'est-ce qu'un catalogue ?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 41 2. Ce qui est accessible depuis un catalogue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3. La notion d'index dans un catalogue de bibliothèque. . . . . . . . . . . . . . . . . . . . . . 43 Partie B. Rechercher dans le SUDOC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 Rechercher dans le SUDOC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 Exercice n°5. Recherche simple. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 1. Recherche avancée. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 2. Interpréter une notice. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 3. Localiser un document. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4. Exploiter les résultats. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 Partie C. Exercices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 1. Les catalogues. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercice n°6. Comparez le nombre de résultats retournés après les recherches. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 58 Exercice n°8. Rechercher des thèses. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 Exercice n°9. Limiter les recherches. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Exercice n°10. Relever la cote d'un ouvrage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 Exercice n°11. Rechercher un article. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 Exercice n°12. Application. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 Exercice n°7. Rechercher des ouvrages. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Chapitre V. Récupérer et savoir utiliser les informations (textes, images, sons, fichiers, pilotes, applications, sites ...) . . . . . . . . . . . . 65 Objectifs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 Partie A. Récupérer une page HTML. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 1. Démarche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 Table des matières 5 Partie B. Imprimer une page HTML. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 68 Partie C. Récupérer une image. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 1. Démarche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 Partie D. Télécharger un fichier ou un logiciel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 1. Démarche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 Partie E. Lire un fichier HTML en local. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 1. Démarche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 Partie F. Lire un fichier multimédia enregistré sur le Web. . . . . . . . . . . . . . . . . . . 71 1. Lire un fichier son. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 2. Lire un fichier vidéo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 Partie G. Aspirer un site internet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 1. Démarche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 1. Démarche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Chapitre VI. Comment citer un document électronique ?. . . . . . . . . . . 77 A. Rappel sur les notions juridiques relatives aux droits d'auteur. . . . . . . . . . . 77 B. Comment citer un document électronique ?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 C. Si l'on cite un document complet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 D. Si l'on cite une partie de document. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 E. Contributions dans un document. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 En conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 Questionnaire à choix multiples 1. Exercices. . . . . . . . . . . . . . . . . . . . . . . . . 85 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 Corrigés des QCM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 Chapitre I Présentation du module 8 B2 - LA RECHERCHE D'INFORMATIONS A. Crédits ♦ MODULE La recherche d'informations ♦ AUTEURS Françoise ADREIT Luc GARCIA Robert MORE Bernard PELLEFIGUE Jean-Christophe SAKDAVONG Sandrine CHAPOULIE Université Toulouse 2 Le Mirail ♦ PILOTAGE C2IMES ♦ LICENCE D'EXPLOITATION Creative Commons by-nc-sa v2.0 IMG. 1 : C2I MUTUALISÉ POUR L'ENSEIGNEMENT SUPÉRIEUR - SPÉCIFIQUE Présentation du module 9 B. Préambule Rechercher des informations, c'est rechercher des connaissances, mais à la différence de la recherche scientifique ou de la recherche appliquée qui visent à découvrir de nouvelles parcelles de savoir ou de savoir-faire, la recherche d'informations a pour objectif de satisfaire un besoin de connaissances en consultant des sources de savoir disponibles. Toute recherche d'informations met en jeu une relation client-fournisseur. Depuis des siècles, les sources d'information produites par des fournisseurs se sont multipliées et diversifiées considérablement. Cependant, quel que soit l'état des gisements de connaissances d'une époque donnée, le problème du client (celui qui est demandeur d'informations) reste le même : connaître les sources d'informations existantes et savoir les consulter. L'Internet n'est que la dernière d'une série de mutations historiques de l'information qui comportent plusieurs phases successives. Il faut cependant noter que chaque nouveau mode de production de l'information n'abolit pas le précédent mais le complète, l'ordinateur ne supprimant pas le livre. Le web fonctionne selon un modèle économique apparemment basé sur la gratuité. Cette gratuité n'existe que pour l'utilisateur de sites en libre accès dont le coût économique est supporté par des institutions, organismes publics ou privés ou par la publicité en ligne incluse dans le flux de la page ou apparaissant dans une nouvelle fenêtre. D'autres caractéristiques sont à relever : l'information y est volatile, c'est-à-dire que l'actualisation des informations fait disparaître les précédentes versions enregistrées sur un site web. Cela entraîne comme seconde particularité celle posée par l'archivage raisonnable de ces documents électroniques. Loin d'être exhaustif l'archivage du web n'a pas à ce jour de caractère systématique. ----------Web invisible, web caché, web profond Avant de commencer l'étude des outils de recherche, il faut noter qu'une partie du web est non accessible aux moteurs de recherche classiques. Le "web invisible" (deep web, hidden web) se développe parallèlement au web public et lui est certainement supérieur en taille. Le web invisible comprend des bases, banques de données et bibliothèques en ligne gratuites ou payantes. Ces données sont invisibles, elles ne sont accessibles qu'à partir de leur source et de catalogues de base de données ou de certains outils de recherche. Dadi est un répertoire en évolution constante de bases de données, en consultation gratuite : Jean Pierre LARDY, DADI (en ligne) ENSSIB, Lyon, URFIST de Lyon - Université Claude Bernard Lyon 1 [dernière mise à jour : juin 2005] consulté le 19 juillet 2005, disponible sur le web. http://dadi.enssib.fr/ [http://dadi.enssib.fr/] Chapitre II Caractéristiques générales des outils de recherche Partie A. Les annuaires de recherche 1. Principes Annuaire Un annuaire (on parle parfois de guide) est un outil de recherche qui recense un certain nombre de sites. L'annuaire est constitué de rubriques (appelées aussi catégories) telles que : Actualités et médias, Sports et loisirs, etc. Chaque rubrique est subdivisée en sous-rubriques plus précises, elles-mêmes subdivisées en sous-sous-rubrique, etc. Chaque dernière sous-rubrique est une liste de sites Web (et non de pages Web). Exemple S'il y a 14 rubriques de départ, on a donc 14 arborescences qui constituent la base de données de l'annuaire. 12 B2 - LA RECHERCHE D'INFORMATIONS Exemple En exemple, consulter la page d'accueil http://www.yahoo.fr [http://www.yahoo.fr] de l'annuaire YAHOO : 2. Présentation 2.1. Construction Elle est effectuée manuellement : chaque site est évalué par un opérateur humain, puis, s'il est de qualité suffisante, rangé dans la rubrique correspondante. Une condition d'efficacité de l'annuaire est bien sûr sa taille, c'est-à-dire le nombre de sites référencés et donc présents aux extrémités de l'arborescence. ** * Un annuaire est un sous-ensemble du WEB . 2.2. Utilisation Deux principaux modes : ♦ En naviguant (browsing) de rubrique en sous-rubrique, jusqu'aux sites accrochés dans l'annuaire : on est ainsi guidé vers une liste de sites centrés sur le thème de recherche ; ♦ Par mots-clés (searching) : ces mots sont entrés dans une boite de recherche au niveau d' une rubrique ou sous-rubrique de l'annuaire : on obtient comme résultat des rubriques de l'annuaire et des sites. L'annuaire effectue sa recherche sur les noms de rubriques de l'annuaire, les noms des sites et le bref descriptif ( non visible pour l'utilisateur ) associé à chaque site. Caractéristiques générales des outils de recherche 13 2.3. Avantages / Inconvénients ♦ Avantages - La navigation est très simple et constitue un guidage très efficace ; - Les sites ayant été sélectionnés, dans les 2 modes de recherche les sites trouvés sont de bonne qualité et bien centrés sur le thème cherché. ♦ Inconvénients L'annuaire étant construit manuellement, cela entraîne plusieurs inconvénients : - La taille de l'annuaire est réduite et ne suit pas d'assez près la croissance du Web ; - La tenue à jour de l'annuaire n'est pas très bonne (nouveaux sites, sites disparus, etc.). Ainsi un annuaire fournit des résultats pertinents mais peu nombreux et insuffisamment à jour. Partie B. Les moteurs des recherche 1. Principe de fonctionnement : l'indexation L'indexation Le moteur de recherche fonctionne sur un système radicalement différent de celui de l'annuaire, qui est celui de l'indexation : ♦ Des robots logiciels (appelés crawlers ou spiders) parcourent le Web, vont de page en page (en fait de lien en lien) et au fur et à mesure de leur parcours, indexent le contenu textuel des pages ( il s'agit ici de pages Web et non de sites ) rencontrées. Chaque mot significatif est conservé dans l'index avec l'adresse de sa page et son adresse dans cette page : il est ainsi constitué un index. La plupart du temps, les index des moteurs mondiaux indexent plusieurs centaines de millions de pages Web. Le moteur indexe les nouvelles pages, détecte les pages modifiées, tient compte des pages détruites, etc. Remarque : Ce à quoi ressemble l'index 14 B2 - LA RECHERCHE D'INFORMATIONS Les livres, les encyclopédies sont souvent pourvus d'un index complet : pour chaque mot significatif il y a une entrée dans l'index. De même dans l'index d'un moteur de recherche, à chaque mot significatif est associée la liste des adresses des pages où il apparaît. Le robot indexeur, selon les moteurs, repasse sur chaque page de tous les 15 jours à tous les mois. ** * Un moteur de recherche est un logiciel qui a construit l'index de la totalité (théoriquement) des pages du Web : cette indexation est totalement automatique. 2. Présentation 2.1. Utilisation Comment faire une recherche sur un moteur ? L’utilisateur, pour faire une recherche, présente une requête, c’est-à-dire une combinaison de mots-clés et d’opérateurs logiques tels que : ET, OU, SAUF etc. Le moteur agit en 2 étapes : ♦ Sélection des pages satisfaisant à la requête ; ♦ Présentation des adresses des pages après classement par le moteur par pertinence décroissante : le moteur a puisé les URLs de ces pages dans son index. 2.2. Construction de requêtes complexes Elle se fait principalement à l’aide des opérateurs logiques (AND, OR, NOT) et d’opérateurs avancés tels que NEAR . Caractéristiques générales des outils de recherche 15 Fondamentaux ♦ AND La requête ronaldo AND zidane sélectionne les pages portant les noms des 2 footballeurs. ♦ OR La requête ronaldo OR zidane sélectionne les pages portant le nom d’au moins l’un des 2 footballeurs. ♦ NOT La requête ronaldo NOT zidane sélectionne les pages portant le nom de ronaldo mais pas celui de zidane. ♦ NEAR La requête ronaldo NEAR zidane est semblable au AND , mais la page n’est sélectionnée que si les 2 mots sont distants de moins de n mots, n'étant fixé à l’avance par le moteur. 2.3. Avantages / inconvénients des moteurs ♦ Avantages - La taille de l’index augmente avec la taille du WEB, à cause de l’efficacité du robot d’indexation ; - La mise à jour de l’index est suffisamment fréquente ; - Le nombre de résultats en réponse à une requête est souvent énorme. ♦ Inconvénients - La réelle difficulté de choisir les bons mots-clés, en particulier lorsque la recherche est faite vers des pages en langue étrangère ; - La sélection des pages correspondant à une requête étant automatique, certaines de ces pages seront non pertinentes par rapport au thème de recherche. 16 B2 - LA RECHERCHE D'INFORMATIONS Partie C. Etude de l'annuaire YAHOO 1. Généralités L'annuaire YAHOO Le plus ancien annuaire www.yahoo.com [www.yahoo.com] (américain) est aussi le plus puissant (celui qui répertorie le plus grand nombre de sites). Il existe des versions françaises, espagnoles, allemandes etc. (www.yahoo.fr [www.yahoo.fr] , www.yahoo.es [www.yahoo.es] , www.yahoo.de [www.yahoo.de] , etc.) . Chez YAHOO, l’annuaire est appelé Guide. En fait, YAHOO est un portail, c’est-à-dire un site proposant aussi des informations financières, de la météo, du courrier, etc. Nous nous intéresserons ici exclusivement à la fonction annuaire de YAHOO. 2. Utilisation 2.1. La recherche par navigation (browsing) Elle se fait à l'URL : http://fr.dir.yahoo.com/ [http://fr.dir.yahoo.com/] Fin d’une recherche par navigation sur l’ impressionnisme Fin d'une recherche par navigation sur l'impressionnisme : ♦ Liste des catégories suivies Guide Web [http://fr.dir.yahoo.com/] > Art et culture [http://fr.dir.yahoo.com/Art_et_culture/] > Histoire de l'art [http://fr.dir.yahoo.com/Art_et_culture/Histoire_de_l_art/] > Périodes et mouvements [http://fr.dir.yahoo.com/Art_et_culture/Histoire_de_l_art/Periodes_et_mouvements/] > Impressionnisme [http://fr.dir.yahoo.com/Art_et_culture/Histoire_de_l_art/Periodes_et_mouvements/Impression > Artistes ♦ Liste des sites - Bocquet, Paul (1868-1947)@ [http://fr.dir.yahoo.com/Art_et_culture/Arts_plastiques/Peinture/Artistes_pe - Caillebotte, Gustave (1848-1894)@ [http://fr.dir.yahoo.com/Art_et_culture/Histoire_de_l_art/Artistes/Peintres/Par_ordre_alpha Caractéristiques générales des outils de recherche - 17 Cézanne, Paul (1839-1906)@ [http://fr.dir.yahoo.com/Art_et_culture/Histoire_de_l_art/Artistes/Peintres/Par_ordre_ Corot, Camille (1796-1875)@ [http://fr.dir.yahoo.com/Art_et_culture/Histoire_de_l_art/Artistes/Peintres/Par_ordre_ Degas, Edgar (1834-1917)@ [http://fr.dir.yahoo.com/Art_et_culture/Histoire_de_l_art/Artistes/Peintres/Par_ordre_ Delaunay, Robert (1885-1941)@ [http://fr.dir.yahoo.com/Art_et_culture/Histoire_de_l_art/Artistes/Peintres/Par_ordre_ Manet, Édouard (1832, 1883)@ [http://fr.dir.yahoo.com/Art_et_culture/Histoire_de_l_art/Artistes/Peintres/Par_ordre_ Monet, Claude (1840-1926)@ [http://fr.dir.yahoo.com/Art_et_culture/Histoire_de_l_art/Artistes/Peintres/Par_ordre_ Morisot, Berthe (1841-1895)@ [http://fr.dir.yahoo.com/Art_et_culture/Histoire_de_l_art/Artistes/Pein Renoir, Pierre Auguste (1841-1919)@ [http://fr.dir.yahoo.com/Art_et_culture/Histoire_de_l_art/Artistes/Peintres/Par_ordre_ Van Gogh, Vincent (1853-1890)@ [http://fr.dir.yahoo.com/Art_et_culture/Histoire_de_l_art/Artistes/Peintres/Par_ordre_ IMG. 2 18 B2 - LA RECHERCHE D'INFORMATIONS Remarque En 2006, Yahoo semble avoir modifié sa politique : la recherche par navigation dans le Guide a perdu beaucoup d'importance au profit de la recherche par mots-clés dans le Guide Yahoo. 2.2. La recherche simple par mots-clés (searching) Elle se fait à l'URL : http://fr.search.yahoo.com/ [http://fr.search.yahoo.com/] Dans les résultats d'une recherche par mots-clés apparaissent : ♦ les rubriques dont le nom contient le mot-clé ; ♦ les sites dont le nom ( ou la description que ne voit pas l'internaute ) contient le mot-clé. Exemple d'une recherche par mots-clefs Exemple d'une recherche par mots-clefs, avec comme seul mot-clef : impressionnisme. Résultats ♦ Principales rubriques du guide WEB - Impressionnisme [http://fr.wrs.yahoo.com/S=2114716020/K=impressionnisme/v=2/SID=e/l=DS0/R=1/TR=3 - Néo-impressionnisme [http://fr.wrs.yahoo.com/S=2114716020/K=impressionnisme/v=2/SID=e/l=DS0/R=2/TR=3 - Pointillisme [http://fr.wrs.yahoo.com/S=2114716020/K=impressionnisme/v=2/SID=e/l=DS0/R=3/TR=3 ♦ Sites - Impressionnisme (L') - Réalisme, naturalisme, impressionnisme : documents pour une approche interdisciplinaire [http://fr.wrs.yahoo.com/S=2114716020/K=impressionnisme/v=2/SID=e/l= Caractéristiques générales des outils de recherche IMG. 3 2.3. La recherche avancée par mots-clés (searching) Elle permet de préciser plusieurs paramètres de la recherche : ♦ tous les mots, la phrase, etc. ; ♦ la période de fabrication de la page ; ♦ le domaine ( .com, .fr , .edu, etc.) ; ♦ le format des fichiers ; ♦ le pays. 19 20 B2 - LA RECHERCHE D'INFORMATIONS IMG. 4 Caractéristiques générales des outils de recherche 21 Partie D. Etude du moteur GOOGLE 1. Le choix de Google Google [http://www.google.fr] (http://www.google.fr [http://www.google.fr] ) est le moteur le plus utilisé dans le monde pour les raisons suivantes : ♦ Sa page d'accueil est d'une extrême simplicité ; ♦ Il est très puissant : en 2006, Google a dans son index plus de 8 Milliards de pages ; ♦ Il est très rapide : le temps de réponse moyen à une requête est de 0,5 seconde ; ♦ Le classement de ses résultats est très efficace : les meilleurs résultats de ses recherches sont placés en tête. 22 B2 - LA RECHERCHE D'INFORMATIONS 2. Recherche et présentation des résultats Recherche élémentaire 1. Requête minimale. Google sélectionne les pages comportant le ou les mots-clés qui sont dans la requête. 2. Le ET logique. Le AND est implicitement ajouté : la requête Zidane Ronaldo sélectionne les pages portant chacun des 2 mots. 3. Termes ignorés (Stop words). Google ignore les mots tels que le, la, un, mais, etc. Pour forcer leur recherche, il faut les faire précéder d’un + . 4. MAJUSCULES, minuscules et accents. Les recherches Google ne tiennent pas compte de la "casse" des lettres (MAJUSCULES/minuscules). Par défaut, les recherches Google ne tiennent pas compte des accents ou autres signes diacritiques (cédille, tilde espagnol, Umlaut allemand, etc.). 5. Exclure des mots. Pour exclure un mot d’une recherche, placer le signe moins ( - ) immédiatement devant ce mot (le signe moins doit être précédé d'un espace). 6. Recherche d'expression. Pour rechercher une expression (par exemple, "imprimante laser couleur"), il faut utiliser des guillemets. Les recherches portant sur plusieurs mots placés entre guillemets sont particulièrement utiles pour retrouver une citation, un proverbe, un titre de livre ou de film, un titre ou un vers de chanson, un lieu géographique, un personnage célèbre. 7. On peut indiquer l’alternative entre 2 mots avec OR. Recherche avancée Elle permet : ♦ de limiter la recherche aux pages d'un site donné ; ♦ de limiter la recherche aux pages rédigées dans une langue donnée ; ♦ de préciser le champ de la recherche : dans toute la page ou dans les titres seulement ou dans les URLs ; ♦ de limiter la recherche à une période donnée ; ♦ d'étendre le recherche à des fichiers .doc, .xls, .pdf. La "recherche avancée" de Google permet d'appliquer ces différents critères. Caractéristiques générales des outils de recherche IMG. 5 : ECRAN DE RECHERCHE AVANCÉE - SPÉCIFIQUE IMG. 6 : FONCTIONS DE RECHERCHE - SPÉCIFIQUE 23 24 B2 - LA RECHERCHE D'INFORMATIONS Présentation des pages dans les résultats de Google La production des résultats se passe en 2 étapes : 1. l'extraction : il a été indiqué plus haut comment Google sélectionne les pages en réponse à une requête. 2. le classement : ces pages sont ensuite classées, les pages les meilleures devant apparaître en tête. Google a défini un critère de classement qui est celui de la popularité de la page : c'est l'algorithme de PageRanking. Google calcule pour chaque page sélectionnée combien de liens sur le Web pointent sur cette page : les pages les plus populaires sont présentées en tête dans les résultats. 3. Conseils pour le choix des mots-clés Choix des mots-clefs 1. Mettre autant que possible des noms dans les requêtes Ce sont les mots représentant des choses concrètes qui sont le plus précis. 2. Utiliser les mots qui sont les plus probables sur les pages cherchées Utiliser [ Nelson Mandela naissance ] plutôt que [ Nelson Mandela anniversaire ] ou [ Nelson Mandela âge ] On trouve très rarement l’âge et jamais l’anniversaire dans une page Web, mais à peu près toujours la date de naissance. 3. Etre précis : utiliser plusieurs mots pour affiner la requête Utiliser [ Java Indonesia ], [ java coffee ] ou [ langage de programmation java ] plutôt que [ java ] le mot "Java" tout seul a des sens très différents, il est nécessaire de préciser avec 1 ou 2 mots qui écartent les pages aberrantes. 4. Inutile d'avoir une orthographe juste Si on entre : [ Anna Kornikova tennis ] Google répond : Vous voulez dire : Anna Kournikova tennis. Caractéristiques générales des outils de recherche En résumé ... Lors de l'écriture d'une requête, il faut : ♦ Etre précis ; ♦ Utiliser des mots concrets ; ♦ Mettre les mots les plus importants en tête ; ♦ Pour être sûr qu'un mot soit cherché mettre " + " devant ; ♦ Utiliser au moins 3 mots-clés dans la requête ; ♦ Quand c'est possible, rechercher des phrases ; ♦ Eviter les mots trop communs, sauf dans des phrases, par exemple, "eau" dans "eau gazeuse". "eau" est effectivement peu significatif s'il est tout seul ; ce n'est plus le cas dans le bout de phrase "eau gazeuse". Penser à tous les mots probables (et improbables) dans le corps de la page. Il faut essayer de se mettre à la place des personnes qui rédigent les pages Web pour trouver ces mots probables. Il faut aussi penser aux mots qui ont peu de chance d'être dans les pages. Par exemple, si l' on cherche un document sur la Shoah , il est probable que le mot "document" ne sera pas dans les pages. Précisions sur la réponse de Google aux requêtes ♦ Google renvoie des pages qui contiennent exactement les mots-clés. Par exemple, si l'on entre le terme "cheval", Google ne fait pas porter la recherche sur "chevaux", "chevaline" ou "chevalerie", mais uniquement sur le terme "cheval" . ♦ Google favorise les pages qui ont les mots-clés dans le même ordre que dans la requête. ♦ Google ignore les signes de ponctuation et les caractères spéciaux en particulier : - la virgule ( , ) le point ( . ) le point- virgule ( ; ) le point d'interrogation ( ? ) les crochets ( [ ] ) les parenthèses ( ) l'arobase ( @ ) le slash ( / ) 25 26 B2 - LA RECHERCHE D'INFORMATIONS - le dièse ( # ) A. Annuaires ou Moteurs ? Raisons de choisir un annuaire Les annuaires sont construits à la main : ♦ Les sites accrochés sont donc de qualité ; ♦ Ils sont classés bien à leur place dans l'arborescence ; ♦ Les sites importants y sont : sites institutionnels ( ministères etc... ) ; ♦ Sur un thème donné, on ne trouvera pas seulement 1 site mais en général toute une catégorie de sites. Si l'on cherche une information non ponctuelle (par exemple, si l'on cherche des informations sur l'Impressionnisme plutôt que sur le peintre Monet), c'est-à-dire une information générale, on trouvera dans un annuaire une liste de sites relatifs à ce thème. Raisons de choisir un moteur L'index d'un moteur est construit de manière automatique : ♦ Les résultats seront beaucoup plus nombreux ; ♦ Les résultats seront en général "plus frais", c'est-à-dire mis à jour plus récemment ; ♦ Beaucoup de ces résultats ne seront pas pertinents, mais en fait l'utilisateur ne les verra pas car ils seront très mal classés dans la liste des résultats. Il semble que dans tous les cas sauf celui de thèmes de recherche généraux (tels que : mouvement artistique, thème institutionnel, etc.), il soit préférable d’utiliser un moteur. Cette position est confortée par'l'inflation du nombre de pages indexées : 8 Milliards de pages pour Google en 2006. Partie E. Exercices Exercice n°1. Recherche sur Yahoo! La Recherche par Navigation Appeler la page fr.search.yahoo.comhttp://fr.search.yahoo.com En descendant dans l'arborescence, trouver dans la rubrique impressionnisme : ♦ la rubrique des peintres impressionnistes, ♦ une liste de sites consacrés à l'impressionnisme. Caractéristiques générales des outils de recherche 27 Il est clair que cette recherche par navigation conduit à des résultats généraux apportant des informations sur le contexte du thème cherché. Dans la recherche par navigation sur Yahoo! français, il est toujours possible d'étendre la recherche sur le Yahoo! américain en cliquant sur le lien : Poursuite de la recherche sur Yahoo!US. La Recherche par mots-clés Les mots-clés sont entrés dans la boîte de recherche et la recherche sera faite dans la rubrique concernée ( et non sur l'ensemble du Web ). Recherche simple Entrer dans la boîte de recherche le nom d'un peintre impressionniste connu (par ex. Renoir). Observer les résultats. Recherche avancée Cliquer sur le lien : Recherche Avancée Lancer une recherche sur la requête : Renoir ou Monet Observer les résultats. Utilisation de l'annuaire Yahoo! US Appeler la page search.yahoo.com Cet annuaire fonctionne comme yahoo.fr : par Navigation ( browsing ) et par Recherche par mots-clés ( searching ). Navigation Trouver la rubrique ( en anglais : category ) de l'impressionnisme. Ici encore, les résultats sont généraux mais plus riches encore puisque l'annuaire est beaucoup plus étendu. Recherche simple Entrer dans la boîte de recherche le nom d'un peintre impressionniste que vous connaissez (par exemple Renoir. Observer les résultats). Recherche avancée ( Advanced Directory Research ) Cliquer sur le lien : Recherche Avancée. Lancer une recherche sur la requête : Renoir ou Monet. Observer les résultats. Exercice n°2. Recherche élémentaire sur Google Rechercher des cours d'Internet ( enseignant l'Internet ) sur les pages Web écrites en français... La recherche simple 28 B2 - LA RECHERCHE D'INFORMATIONS Soit le modèle de recherche suivant : ♦ a/ Exprimer clairement l'objet de la recherche : je veux trouver des cours d'Internet ♦ b/ Extraire les mots-clés correspondants : Internet ( ou Web ) cours ( ou guide ou tutoriel ) leçons ( ou exercices ) ♦ c/ Ecrire des requêtes possibles internet guide leçons internet tutoriel exercices etc... Attention à l'orthographe , bien que Google supporte les fautes d'orthographe ! En appliquant ce modèle, effectuer avec Google les recherches suivantes : ♦ Rechercher des écrivains ou des poètes. ♦ Pour chacun des poètes ci-dessous, retrouver une page portant les informations suivantes : - Arthur Rimbaud : son portrait ( ou sa caricature ), sa biographie. - Guillaume Apollinaire : son portrait, sa biographie. - Georges Brassens : son portrait, sa biographie. ♦ Recherche sur des artistes ou des oeuvres d'art. ♦ Rechercher des pages significatives sur le peintre français Antoine Watteau, sa biographie. ♦ Rechercher directement l'oeuvre suivante : " Pèlerinage à l'île de Cythère " ♦ Retrouver des poèmes ou des chansons. ♦ Retrouver le poème ( auteur, titre, extrait ) portant le morceau de phrase suivant : " A la cime argentée, je reconnus la déesse " ♦ Retrouver le poème portant le bout de phrase : " Voie lactée ô soeur lumineuse " ♦ Retrouver la chanson portant le bout de phrase : " Les gens qui voient de travers " Recherche rapide de media, institutions, entreprises, etc... (Plutôt que d'essayer des URLs approximatives, on lancera une recherche simple sur le nom cherché : on obtiendra toujours la page cherchée dans les 2 ou 3 premiers résultats). Caractéristiques générales des outils de recherche 29 Trouver les pages d'accueil suivantes : ♦ En France : l'Université de Toulouse Le Mirail, la mairie de Toulouse, la mairie de Paris, la mairie de Biarritz, le gouvernement, l'académie française, le constructeur Peugeot, le musée du Louvre etc... Le Monde, Le Figaro, Libération, La Dépêche du Midi, Le Point, L'Express etc... ♦ A l'étranger : - le MIT, la CIA, le FBI, la NASA, la Maison Blanche, le musée du Prado de Madrid, le musée des Offices de Florence en Italie, - le New York Times, die Welt, the Times, the Guardian, El Pais, Il Corriere della Sera etc... Exercice n°3. Recherche avancée sur Google Faire varier les champs de recherche : Chercher : ♦ "cours internet" dans les pages, ♦ "cours internet" dans les titres, ♦ cours internet dans les titres. Comparer les résultats. La recherche d'images : Dans la page d'accueil de Google, cliquer sur l'onglet Images. Faire apparaître des images ou photos : ♦ de ballons, de ballons rouges, ♦ de poissons, de poissons rouges, ♦ d'ordinateurs, ♦ de Jean Paul Sartre, de Rudolph Nureyev, de Nicole Kidman, ♦ de papillons jaunes, d'ordinateurs jaunes. La recherche d'informations et les mots-clés : On essaie des mots-clés différents mais synonymes. Présenter les requêtes suivantes : ♦ Apprendre l'Internet ♦ Aide internet ♦ Découvrir internet 30 B2 - LA RECHERCHE D'INFORMATIONS ♦ Tutoriel internet, etc. Notez les différences trouvées avec les différentes requêtes. Construction d'un guide élémentaire de recherche sur Google : En s' inspirant des pages d'aide en français du site Google : voir le lien "A propos de Google"/"Aide sur la recherche"/ pour la recherche sur l'interface française de GOOGLE. Concevez un guide de requêtes : dans ce guide, il faudra donner toutes les règles d'écriture des requêtes en y associant chaque fois un exemple. Ce guide sera élaboré à partir d'un logiciel de traitement de texte de type Microsoft Word ou Open Office Writer. Exercice n°4. Recherche comparée sur Yahoo! et Google Cet exercice essaie de caractériser le domaine d'application des 2 outils, Yahoo! et Google. 1. Recherche sur une donnée institutionnelle ♦ Rechercher avec Yahoo! les informations sur les présidents de la république française ( on s'intéressera aux sites qui sont strictement dans l'annuaire ). ♦ Rechercher avec Google ces mêmes informations ( on s'intéressera aux pages trouvées directement avec Google ). 2. Recherche d'une donnée historique ♦ Rechercher avec Yahoo! des informations brèves sur 4 Châteaux de la Loire. ♦ Rechercher avec Google ces mêmes informations. 3. Recherche d'une donnée de type culture populaire ♦ Rechercher avec Yahoo! les chansons sur Paris, paroles, auteurs, compositeurs ( on s'intéressera aux pages qui sont sélectionnées directement par les requêtes ). ♦ Rechercher avec Google ces mêmes informations. 4. Recherche d'une donnée de l'actualité ♦ Rechercher avec Yahoo!, des informations sur la fin de carrière du boxeur américain Mike Tyson. ♦ Rechercher avec Google ces mêmes informations. Chapitre III Formaliser les requêtes de recherche Partie A. Le langage d'interrogation "Sans aucun doute, l'informatique est l'ossature d'Internet, mais la clé de voûte du Réseau des réseaux est le mot. La personne qui détient la maîtrise des mots, détient la clé de la Toile. Aucune erreur d'orthographe ni de sémantique n'est permise. A la moindre erreur, la page web est perdue." ♦ Objectifs pédagogiques du module Comment traduire un besoin d'information en un vocabulaire de recherche assimilé par les outils de la recherche informatisée (catalogues, bases de données, moteurs et annuaires). ♦ Plan de la séquence 1. Partie 1 : Pourquoi un langage d'interrogation. 2. Partie 2 : Etablir une stratégie de recherche. ♦ Temps d'apprentissage estimé 20 minutes. ♦ Niveau de difficulté du module Débutant, intermédiaire. ♦ Pré-requis Avoir défini ses besoins d'information en fonction du type de travail à réaliser. 32 B2 - LA RECHERCHE D'INFORMATIONS 1. Pourquoi un langage d'interrogation ? Même s'il est possible d'interroger certains outils par des phrases du langage courant, retenez qu'il est plus efficace d'utiliser le langage propre aux outils pour chercher car l'interrogation dans la langue courante n'est pas encore aussi efficace qu'on le désirerait, l'ordinateur ayant des difficultés à interpréter sa complexité. Remarque Des travaux sont en cours sur la réalisation d’un "Web sémantique", mais ce "Web intelligent" n’est pas encore vraiment une réalité ! Quand on lance une recherche dans les outils informatisés, actuellement, quel que soit l’outil utilisé (catalogues, bases bibliographiques, annuaires, moteurs…), on fait exécuter par un logiciel une comparaison entre une chaîne de caractères (les termes que l’on saisit) et l'ensemble des chaînes contenues dans la base de données concernée par l’outil : la moindre différence est donc signifiante pour l’outil (pas de pardon pour la faute d’orthographe, la faute de frappe mais aussi le pluriel et le singulier), tout ce qui touche la chaîne de caractères a des répercussions sur les résultats (ou le silence) que l’outil interrogé nous rapatrie. Conseil Lors de la première utilisation d’un outil de recherche informatisée, il est conseillé de lire soit le guide de recherche soit l’aide en ligne. En effet, loin de vous faire perdre du temps, ce petit détour avant votre interrogation, vous permettra de connaître les "règles du jeu" de l’outil utilisé et d’être beaucoup plus efficace dans votre recherche. Par exemple, prise en compte ou non des accents, des majuscules, de la ponctuation, etc. Il n'est donc pas question ici de travail sur le « sens » du mot ; la sémantique n'est pas « compréhensible » par les outils de recherche d'information ! Aujourd'hui on ne peut pas "parler" aux outils informatisés comme on se parle entre pairs dans le "langage naturel" ou "langage courant" mais c'est dans un "langage d'interrogation" qu'il va falloir traduire son besoin d'information pour être efficace dans ses recherches. Attention Attention, n'oubliez pas qu'il existe de multiples parasites engendrés par l'existence de synonymie, d'homonymie, de polysémie avec les termes que vous utilisez pour votre interrogation qui vont venir interférer dans la pertinence des résultats rapatriés. Formaliser les requêtes de recherche 33 Exemple Une interrogation avec « vélo » ne donnera pas tous les résultats trouvés avec bicyclette, cyclisme... Exemple Une interrogation avec « Mercure » va rapatrier des résultats sur : ♦ Mercure (mythologie) ; ♦ Mercure (planète) ; ♦ Mercure (chimie). C'est donc l'une des grandes difficultés de la recherche d'information : outre le fait qu'il est important de bien choisir le "bon" outil de recherche d'information (le plus adéquate), il faut aussi savoir "parler" la langue de l'outil interrogé. Remarque Certains outils utilisent des langages documentaires qui leurs sont propres. Par exemple, la plupart des catalogues de bibliothèques universitaires utilisent le répertoire RAMEAU qui permet de constituer l'index des sujets de ces catalogues. 2. Etablir une stratégie de recherche Traduire son besoin d'information Il faut essayer de formuler son besoin d'information sous la forme d'une ou plusieurs questions. Il sera ainsi plus facile par la suite de sélectionner la pertinence des résultats au regard des réponses. Exemple Quel est le rôle de la télévision sur le développement de conduites violentes chez l'enfant ? 34 B2 - LA RECHERCHE D'INFORMATIONS Extraire les concepts A partir de son sujet, il faut apprendre à faire un travail "d'écrémage" pour ne garder que les principaux concepts sur lesquels va porter la recherche. Il ne faut garder que les termes significatifs et éviter les mots trop généraux (cause, conséquence, effet, condition...) ou les mots vides. Exemple Quel est le rôle de la télévision sur le développement de conduites violentes chez l'enfant ? Choisir les mots-clefs Afin d'augmenter le nombre de mots-clés, on cherche pour chacun des concepts principaux, des termes ayant une relation sémantique. Pour réaliser ce travail, on peut tout simplement s’appuyer sur un dictionnaire ou une encyclopédie qui permet d'identifier les différents synonymes, terminologies et orthographes susceptibles d'être rencontrés dans les bases de données des outils de recherche. CONCEPT 1 CONCEPT 2 CONCEPT 3 télévision violence enfant médias conflit jeune film agression mineur ... ... ... TAB. 1 : COMMENT CHOISIR SES MOTS-CLEFS ? Remarque Il faut comme toujours tenir compte de l'outil interrogé et adapter son vocabulaire aux règles propres de fonctionnement de cet outil. Un catalogue de bibliothèque travaille avec un vocabulaire documentaire (cf. RAMEAU) qui synthétise le contenu général du document. Un moteur de recherche travaille sur une recherche de type texte intégral et donne accès à une page précise d'un document. Ces mots-clés vont donc être beaucoup plus faciles à gérer par un outil de recherche que la question de départ. Mais il est possible de recréer des relations entre ces mots en les combinant avec des opérateurs logiques (et, ou, sauf,...). Formaliser les requêtes de recherche 35 Partie B. Les équations de recherche ♦ Objectifs pédagogiques du module Comprendre l’élaboration d’une équation de recherche en utilisant les opérateurs logiques et savoir ajuster sa requête pour travailler l’efficacité de sa recherche. ♦ Plan de la séquence 1. Partie 1 : Les opérateurs de recherche. 2. Partie 2 : Etablir une requête d’interrogation. ♦ Temps d'apprentissage estimé 30 minutes. ♦ Niveau de difficulté du module Intermédiaire, avancé. ♦ Pré-requis Avoir dégagé les mots-clés ou les concepts de sa recherche d’information. 36 B2 - LA RECHERCHE D'INFORMATIONS 1. Les opérateurs de recherche 1.1. Les opérateurs booléens Affiner avec « ET » / « AND » IMG. 7 : LE « ET » EST L’OPÉRATEUR DE L’INTERSECTION - SPÉCIFIQUE Cet opérateur permet de croiser les concepts de recherche entre eux. Il sert à affiner une recherche, car il faut que dans les résultats les documents contiennent absolument les deux termes recherchés . C'est donc uniquement l'intersection entre les deux notions qui s'affiche. exemple Si on croise violence ETenfant, il y a aura moins de résultats, car il faut que chaque document contienne absolument les deux termes de la recherche. attention Dans certains outils, lorsque plusieurs mots sont utilisés sans les lier avec un opérateur, le système de recherche peut par défaut affecter l’opérateur "ET" sans le faire apparaître à l’écran ! Formaliser les requêtes de recherche 37 Elargir avec « OU » / « OR » IMG. 8 : LE "OU" EST L’OPÉRATEUR DE L’UNION - SPÉCIFIQUE Le "OU" permet de chercher les références où l'un ou l'autre des mots exprimant un même concept apparaissent. C'est l'union des termes d'un concept qui s'affiche. Il sert à élargir la recherche, car il y a aura plus de résultats rapatriés par l'outil, qui devront contenir au moins un des termes de la requête. exemple L'opérateur permet de faire une recherche avec tous les synonymes d'un concept, on explore ainsi tout le champ sémantique du terme. On peut croiser utilement : Télévision OU média OU film Exclure avec « SAUF » / « NOT » IMG. 9 : LE « SAUF » EST L’OPÉRATEUR DE L’EXCLUSION - SPÉCIFIQUE Le "SAUF" permet l'exclusion d'une notion à partir d'un concept recherché. Cet opérateur est à utiliser avec précaution et après avoir déjà effectué une première recherche sur le concept qui aurait donné des résultats trop nombreux. exemple mineurs SAUF adolescents si l'on s'intéresse uniquement aux enfants. 38 B2 - LA RECHERCHE D'INFORMATIONS 1.2. La troncature Elle permet de remplacer un nombre de caractères après la racine du mot, ce qui au niveau de la recherche permet de prendre en compte les variantes d'un terme (pluriel, féminin...) et de ne pas avoir à relancer la recherche pour chaque variante d'écriture du terme. Elle est symbolisée par le caractère étoile « * » ou par le « ? » pour ne remplacer qu'un seul caractère. Exemple enfan* fera la recherche sur enfant, enfants, enfance, enfantin. La troncature peut être utilisée : ♦ à droite d'un mot ; ♦ à gauche d'un mot ; ♦ à l'intérieur d'un mot. Attention Pour un outil de recherche, la saisie d’un terme au pluriel ou au singulier représente deux syntaxes totalement différentes. Donc en utilisant la troncature à la fin d’un mot cela permet d’être assuré de rapatrier l’ensemble des documents sur le sujet que le mot soit trouvé au singulier ou au pluriel. 1.3. La recherche d’expression exacte Les expressions sont placées entre guillemets "..." . A utiliser pour une requête dans laquelle les termes ne sont pas recherchés séparément (mot par mot), mais comme une expression. Exemple "gaz à effet de serre" dans le cas d'une recherche sur le web, un moteur trouvera uniquement des pages web contenant ces mots les uns à côté des autres, dans l'ordre indiqué. Formaliser les requêtes de recherche 39 2. Etablir une requête d'interrogation On peut formuler des équations de recherche en liant les concepts avec les opérateurs logiques appropriés. On peut formuler plusieurs équations simples de recherche ou créer des sous-ensembles que l'on met entre parenthèses et que l'on relie ensuite entre eux. IMG. 10 : LES REQUÊTES D'INTERROGATION - SPÉCIFIQUE Exemple ♦ télévision ET violen* ET enfan* ♦ média* ET confli* ET jeune* ♦ film* ET agressi* ET mineur* Formulation par équation de recherche (télévision OU média* OU film*) ET (violen* OU confli* OU agressi*) ET (enfan* OU jeune* OU mineur*) ** * Pour mener une recherche efficace qui garantisse des résultats pertinents, il faut ... : ♦ éviter d’interroger les outils de recherche avec des phrases ; ♦ choisir les concepts essentiels de sa recherche et les exprimer sous la forme de mots-clés ; ♦ si on trouve trop de références (bruit), choisir des termes spécifiques ( dictionnaires) ; ♦ relier les mots-clés avec les opérateurs de recherche ; 40 B2 - LA RECHERCHE D'INFORMATIONS ♦ consulter les règles particulières d'interrogation de l’outil utilisé (aide en ligne ou recherche avancée). Chapitre IV Catalogue de bibliothèque Objectifs Savoir mener une recherche dans un catalogue de bibliothèque, en prenant pour exemple le SUDOC (Système Universitaire de Documentation) ; repérer des documents, savoir où les consulter, savoir lire une notice et utiliser le module d'exploitation des résultats. Partie A. Qu'est-ce qu'un catalogue ? 1. Les catalogues Catalogue Au sens général, un catalogue est une liste (du grec katalogos : liste). Concernant une bibliothèque, c'est la liste de tous les documents possédés par cette bibliothèque, quel que soit leur type : livre, thèse, revue, cédérom, carte ... Remarque Un catalogue peut être propre à une bibliothèque (catalogue de la Bibliothèque Nationale de France), ou concerner les collections de plusieurs bibliothèques : on parle alors de catalogue collectif. 42 B2 - LA RECHERCHE D'INFORMATIONS Exemple Le SUDOC [http://corail.sudoc.abes.fr/] (Système Universitaire de Documentation : http://corail.sudoc.abes.fr/ [http://corail.sudoc.abes.fr/] ), qui est le catalogue collectif des Universités françaises (plus de 5 millions de références). Pourquoi utiliser un catalogue de bibliothèque ? ♦ Pour savoir si la bibliothèque possède les ouvrages dont l'enseignant vous a donné les références, ♦ Pour rechercher les ouvrages ou les thèses traitant d'un sujet particulier, ♦ Pour savoir si la bibliothèque de votre université possède la revue qui a publié l'article dont vous avez la référence. Le but d'un catalogue est donc de permettre d'identifier un document puis de le localiser. Identifier un document Savoir qu'un document existe, après une recherche dans une base de données ou un catalogue. Localiser un document Après l'avoir identifié, savoir où il se trouve : dans quelle bibliothèque si on interroge un catalogue collectif, puis à quel endroit dans la bibliothèque. 2. Ce qui est accessible depuis un catalogue Un catalogue de bibliothèque, dans sa fonction d'identification, donne accès à la notice bibliographique du document. Notice bibliographique La notice bibliographique est l'ensemble des éléments de description d'un document (voir paragraphe " interpréter une notice "). Dans sa fonction localisation, le catalogue donne la liste des bibliothèques qui Catalogue de bibliothèque 43 possèdent le document et la cote de celui-ci. On y trouve également, de plus en plus, des liens vers des documents en ligne. La cote La cote est un ensemble de caractères alphanumériques attribué à un document et permettant de le retrouver sur les rayonnages de la bibliothèque. 3. La notion d'index dans un catalogue de bibliothèque Index Un index est une liste élaborée à partir des éléments de description des documents. On aura ainsi des index alphabétiques des auteurs, des titres, des sujets et des index numériques des ISBN et des ISSN... ISBN ISBN (International Standard Book Number) : numéro international unique attribué à un livre. ISSN ISSN (International Standard Serial Number) : numéro international unique attribué à un titre de revue. Exemple Exemple tiré de l'index auteur : Proust, Louis Proust, Marcel Proust, Marianne Proust, Martine Proust, Nathalie Exemple 44 B2 - LA RECHERCHE D'INFORMATIONS Exemple tiré de l'index des titres : Proust a biography Proust à Cabourg Proust, a collection of critical essays Proust à l'écran Exemple ISBN : 2-02-005169-9 ; correspondant à l'ouvrage : Duverger, C. La fleur létale : économie du sacrifice aztèque. Paris : éditions du Seuil, 1979. Exemple ISSN : 0183-570X ; correspondant à la revue : L'Ordinateur individuel. Conseil L' ISSN est le moyen le plus efficace pour localiser une revue dans un catalogue. Le SUDOC comprend de nombreux index, certains très spécialisés. Les plus couramment employés sont : ♦ Les mots du titre (exemple :seigneurs instrumentalité ; monde diplomatique) ; ♦ Les mots sujets (exemples : diglossie, " vie rurale ") ; ♦ Les mots auteurs (exemples : Balzac, Stendhal) ; ♦ La collection (exemples : Quadrige, Que Sais-je). Catalogue de bibliothèque 45 Partie B. Rechercher dans le SUDOC Rechercher dans le SUDOC Démarche Se connecter au catalogue à l'adresse : http://corail.sudoc.abes.fr [http://corail.sudoc.abes.fr] Puis choisir la base " SUDOC - Catalogue ". La recherche s'opère sur des "index"[Un index est une liste élaborée à partir des éléments de description des documents.]. Pour afficher la liste des index, cliquer sur la flèche pointe en bas à droite de la case « recherche » IMG. 11 : LISTE DES INDEX - SPÉCIFIQUE Conseil Veillez à bien choisir votre index : par exemple, pour une recherche "sur " Balzac, vous devrez interroger l'index mots du sujet, et non l'index auteur. Attention 46 B2 - LA RECHERCHE D'INFORMATIONS Attention à l'orthographe ! Le SUDOC ne propose pas d'alternative en cas de saisie erronée. Si vous interrogez par les mots sujets, utilisez le français. Les index numériques On aura ainsi des index alphabétiques des auteurs, des titres, des sujets, et des index numériques des ISBN[ISBN (International Standard Book Number) : numéro international unique attribué à un livre.] et des ISSN[ISSN (International Standard Serial Number) : numéro international unique attribué à un titre de revue.]... Exemple d'ISBN ISBN : 2-02-005169-9 ; correspondant à l'ouvrage : Duverger, C. La fleur létale : économie du sacrifice aztèque. Paris : éditions du Seuil, 1979 Exemple d'ISSN ISSN : 0183-570X ; correspondant à la revue : l'Ordinateur individuel Conseil L'ISSN est le moyen le plus efficace pour localiser une revue dans un catalogue. Les requêtes de recherche Pour effectuer une recherche, on peut employer les opérateurs booléens (et, ou, sauf) et la troncature * Exemple de recherche sur les mots sujets : ♦ danse* trouvera danse, danses, danseur(s), danseuse(s) ; ♦ danse* et romantisme affichera les titres contenant les deux termes ; ♦ danse* ou ballet* affichera les titres contenant l'un ou l'autre terme, ou les deux. Exercice n°5. Recherche simple Comparez le nombre de résultats retournés après les recherches, dans l'index « mots sujet », sur les éléments suivants : Catalogue de bibliothèque 47 ♦ vie rurale ♦ "vie rurale" Question : D'après vous, quelle syntaxe va-t-elle retourner le plus de réponses : avec ou sans les guillemets ? Effectuez la recherche et comparez les résultats. Solution : Les termes sans guillemets retournent plus de 6200 réponses, ( le système prendra les termes "vie" et "rurale" indépendamment), alors que l'expression entre guillemets en retourne 1700 (le système ne prenant que les deux termes réunis). 1. Recherche avancée On peut faire une recherche sur une combinaison d'index : par exemple, collection et mots du sujet. 48 B2 - LA RECHERCHE D'INFORMATIONS Exercice d'application Rechercher les ouvrages de la collection "Que sais-je" sur la vie rurale. IMG. 12 : ECRAN DE RECHERCHE - SPÉCIFIQUE IMG. 13 : ECRAN DE RÉSULTATS - SPÉCIFIQUE Démarche C'est dans l'écran de recherche avancée qu'on peut limiter la recherche à certains types de documents : thèses, titres de revues ; vous devez décocher tous les types de documents, en cliquant sur le lien " aucun ", et cocher la case du type de document sur Catalogue de bibliothèque 49 lequel vous souhaitez faire votre recherche. Vous pouvez rajouter une limite de localisation : par exemple, limiter aux thèses sur la vie rurale soutenues dans un département ; dans ce cas, il vous faut cocher le département correspondant dans la section " filtre de localisation ". 50 B2 - LA RECHERCHE D'INFORMATIONS Exercice d'application Rechercher les thèses dont le sujet est la vie rurale. ♦ Solution Cocher la case "thèses", écrire "vie rurale" en mots sujets, cliquer sur "rechercher". IMG. 14 : ECRAN DE RECHERCHE AVANCÉE - SPÉCIFIQUE Catalogue de bibliothèque 51 IMG. 15 : ECRAN DE RÉSULTATS - SPÉCIFIQUE Conseil Vous pouvez rajouter une limite de localisation : par exemple, limiter aux thèses sur la vie rurale soutenues dans un département ; dans ce cas, il vous faut cocher le département correspondant dans la section "filtre de localisation". 52 B2 - LA RECHERCHE D'INFORMATIONS IMG. 16 : ECRAN DE RECHERCHE - SPÉCIFIQUE Exercice d'application Limiter la recherche sur les thèses sur la vie rurale soutenues en Haute Garonne. IMG. 17 : ECRAN DE RÉSULTATS - SPÉCIFIQUE Catalogue de bibliothèque 53 Accéder à une notice à partir d'une liste de résultats Comment accéder à une notice à partir d'une liste de résultats ? Cliquer sur le titre que vous souhaitez localiser. Exemple Faites une recherche sur la vie rurale au Moyen Age ; puis cliquez sur un titre : vous afficherez alors la notice du document. 2. Interpréter une notice Notice bibliographique La notice bibliographique est la fiche descriptive du document. Pour un ouvrage : auteur, titre, éditeur, année de publication, mention d'édition, ISBN, format, nombre de pages, ... IMG. 18 Pour une revue : titre de la revue, éditeur, date du 1er numéro, périodicité, ISSN, ... 54 B2 - LA RECHERCHE D'INFORMATIONS IMG. 19 Pour une thèse : auteur, titre, date, année et lieu de soutenance, directeur de thèse, ... IMG. 20 Catalogue de bibliothèque 55 3. Localiser un document Démarche Cliquer sur le bouton "localisation" pour afficher la liste des bibliothèques possédant le document. Il vous faudra relever la cote du document pour pouvoir le retrouver dans les rayons ; la cote est un ensemble de caractères alphanumériques, et est propre à chaque bibliothèque. Exercice d'application Relevez la cote de l'ouvrage : « les paysages médiévaux du Languedoc », d'Aline Durand, paru aux Presses Universitaires du Mirail en 1998, et possédé par la bibliothèque de Toulouse 2 Le Mirail. ♦ Solution : 944.8 DUR Attention Lorsque vous localisez un titre de revue, pensez à vérifier l'état de collection possédé par la bibliothèque. Exemple L'article que vous recherchez date de 1960 ; il se peut que la bibliothèque possède la revue qui vous intéresse, mais seulement depuis 1975 ... 56 B2 - LA RECHERCHE D'INFORMATIONS Exercice d'application Vous recherchez un article de 1892 paru dans « The Sewanee Review » : Où le trouverez-vous ? ♦ Solution A la BIU Centrale de la Sorbonne et dans les collections patrimoniales de la BNF. De nombreuses bibliothèques françaises possèdent cette revue, mais pas depuis l'origine. IMG. 21 : LOCALISATION ET ACCESSIBILITÉ DE LA REVUE RECHERCHÉE - SPÉCIFIQUE 4. Exploiter les résultats Vous pouvez constituer un panier de sauvegarde avec les notices qui vous intéressent : Démarche Cliquez sur le bouton "Sauvegarder " en bas de la notice ; répétez la même démarche pour toutes les notices que vous souhaitez sélectionner. Catalogue de bibliothèque 57 IMG. 22 Cliquez dans la colonne de gauche sur le bouton "Lot de sauvegarde" pour afficher le contenu de votre panier. IMG. 23 Cliquez sur le bouton "Télécharger" en bas de l'écran : un nouvel écran apparaît, intitulé "Transférer les notices". 58 B2 - LA RECHERCHE D'INFORMATIONS IMG. 24 Vous pouvez alors choisir d'envoyer tout ou partie du panier par messagerie électronique, ou imprimer ou sauvegarder, après avoir cliqué sur le bouton "écran". Partie C. Exercices Exercice n°6. Comparez le nombre de résultats retournés après les recherches Comparez le nombre de résultats retournés après les recherches : ♦ vie rurale ♦ " vie rurale " Solution : les termes sans guillemets retournent plus de 6200 réponses (le système prendra les termes " vie " et " rurale " indépendamment), alors que l'expression entre guillemets en retourne 1700 (le système ne prenant que les deux termes réunis) . Exercice n°7. Rechercher des ouvrages Rechercher les ouvrages de la collection " Que sais-je " sur la vie rurale Ecran de résultat : Catalogue de bibliothèque 59 IMG. 25 C'est dans l'écran de recherche avancée qu'on peut limiter la recherche à certains types de documents : thèses, titres de revues ; vous devez décocher tous les types de documents, en cliquant sur le lien " aucun ", et cocher la case du type de document sur lequel vous souhaitez faire votre recherche. Exercice n°8. Rechercher des thèses Rechercher les thèses dont le sujet est la vie rurale Ecran de recherche avancée : 60 B2 - LA RECHERCHE D'INFORMATIONS IMG. 26 Ecran de résultats : IMG. 27 Vous pouvez rajouter une limite de localisation : par exemple, limiter aux thèses sur la vie rurale soutenues dans un département ; dans ce cas, il vous faut cocher le Catalogue de bibliothèque département correspondant dans la section " filtre de localisation ". Ecran de recherche : IMG. 28 Exercice n°9. Limiter les recherches Limiter la recherche sur les thèses sur la vie rurale soutenues en Haute Garonne. Ecran de résultats 61 62 B2 - LA RECHERCHE D'INFORMATIONS IMG. 29 IMG. 30 Catalogue de bibliothèque 63 Exercice n°10. Relever la cote d'un ouvrage Relevez la cote de l'ouvrage : " Les paysages médiévaux du Languedoc ", d'Aline Durand, paru aux Presses Universitaires du Mirail en 1998, et possédé par la bibliothèque de Toulouse 2 Le Mirail. Solution : 944.8 DUR Attention : lorsque vous localisez un titre de revue, pensez à vérifier l'état de collection possédé par la bibliothèque. Exemple : l'article que vous recherchez date de 1960 ; il se peut que la bibliothèque possède la revue qui vous intéresse, mais seulement depuis 1975 ... Exercice n°11. Rechercher un article Vous recherchez un article de 1892 paru dans " The Sewanee Review ". Où le trouverez-vous ? Solution : à la BIU Centrale de la Sorbonne et dans les collections patrimoniales de la BNF. De nombreuses bibliothèques françaises possèdent cette revue, mais pas depuis l'origine. IMG. 31 64 B2 - LA RECHERCHE D'INFORMATIONS Comment lire un état de collection : ♦ vol.35, n°1, 1927 - vol.111, n°3, 2003 : tous numéros entre 1927 et 2003 ; la bibliothèque ne reçoit plus cette revue. ♦ 1969 - ... : tous numéros depuis 1969 ; la bibliothèque reçoit toujours cette revue. ♦ Vol.56, n°3, 1948 - vol.59, n°2, 1951 ; vol.62, n°1, 1954 ; vol.53, 1955 ; vol.101, 1993 ... : la bibliothèque possède quelques numéros entre 1948 et 1951 ; deux numéros de 1954 et 1955 ; puis elle reçoit la revue régulièrement depuis 1993. ♦ Vous trouverez parfois la mention (lac), qui indique que des numéros sont manquants. Exercice n°12. Application 1. Rechercher les bibliothèques possédant " Autant en emporte le vent " 2. Rechercher les bibliothèques possédant " Gone with the wind " 3. Rechercher des documents sur Freud et le complexe d'Oedipe 4. Rechercher quelles bibliothèques possèdent la " Revue française de sociologie " depuis le premier numéro 5. Rechercher des thèses sur l'exode rural 6. Faire une recherche sur le thème : l'impact de la violence télévisée sur les enfants, en utilisant Google et le SUDOC ; comparez les résultats Chapitre V Récupérer et savoir utiliser les informations (textes, images, sons, fichiers, pilotes, applications, sites ...) Objectifs Apprendre à récupérer, puis à manipuler les informations trouvées sur le Web en vue d'une utilisation ultérieure. Attention Le Web est un réservoir d'information que vous savez exploiter mais vous garderez à l'esprit que de simples " copier-coller " ne suffisent pas pour construire un texte. 66 B2 - LA RECHERCHE D'INFORMATIONS Partie A. Récupérer une page HTML 1. Démarche Vous pouvez sauvegarder, sous la forme d'un fichier sur le support de votre choix, la page web que vous avez affichée. Démarche La plupart des navigateurs vous proposent l'option "Enregistrer la page sous...". Déroulez le menu "Fichier" puis cliquez sur "Enregistrer la page sous...". IMG. 32 Récupérer et savoir utiliser les informations (textes, images, sons, fichiers, pilotes, applications, sites ...) 67 Dans la fenêtre "Enregistrer sous" sélectionnez l'emplacement où vous souhaitez sauvegarder la page. Le dossier "Mes documents" peut être utilisé à cet effet. Repérez le nom de fichier sous lequel vous pourrez par la suite retrouver votre sauvegarde puis cliquez sur le bouton "Enregistrer". Vous avez le choix d'enregistrer la page web complète texte + images, icônes (ainsi que le fichier de style lié à la page) ou la page html uniquement. Sélectionnez l'option dans " Type " : IMG. 33 Si vous souhaitez par la suite consulter cette page, rendez-vous dans le répertoire utilisé et double-cliquez sur le nom du fichier sous lequel vous l'avez enregistrée. Remarque Les sites qui proposent du contenu interactif ne peuvent être visualisés correctement que si la connexion à Internet est établie. Hors connexion, certains éléments de la page ne seront pas visibles. 68 B2 - LA RECHERCHE D'INFORMATIONS Partie B. Imprimer une page HTML 1. Démarche Démarche Lorsque vous désirez imprimer une page Web, déroulez le menu "Fichier" puis cliquez sur "Imprimer...". La fenêtre "Impression" s'ouvre, sélectionnez votre imprimante. Vous imprimerez la totalité de la page web, vous pouvez également définir la zone d'impression et le nombre de copies. IMG. 34 Cliquez sur le bouton "Imprimer". Une copie papier de la page Web s'imprime. Remarque Pour une impression correcte, certains sites proposent une mise en page spécifique, sinon vous pouvez rencontrer quelques anomalies lors de l'impression. Récupérer et savoir utiliser les informations (textes, images, sons, fichiers, pilotes, applications, sites ...) Partie C. Récupérer une image 1. Démarche Démarche Pour enregistrer une image de la page Web affichée dans un dossier : ♦ Cliquez avec le bouton droit de votre souris sur l'image que vous désirez sauvegarder. ♦ Dans le menu contextuel qui apparaît, cliquez sur la commande "Enregistrer l'image sous..." IMG. 35 ♦ Sélectionnez le répertoire de stockage ♦ Enregistrer dans => ouvrez le répertoire choisi dans l'arborescence. ♦ Nom du fichier => précisez un nom pour l'image dans ce champ. ♦ Choisissez le Type => menu déroulant. ♦ Cliquez sur Enregistrer. 69 70 B2 - LA RECHERCHE D'INFORMATIONS Conseil Le menu contextuel associé aux images permet aussi de Copier l'image dans le Presse-papier pour la copier dans un logiciel de retouche d'image Partie D. Télécharger un fichier ou un logiciel 1. Démarche Différents protocoles d'Internet permettent de télécharger des fichiers images, sons, fichiers au format PDF, fichiers compressés, etc. Démarche Par un simple lien vers le fichier à télécharger. IMG. 36 Choisissez "Enregistrer ce fichier" sur le répertoire de votre choix ou, par défaut, dans le répertoire " téléchargement ". Récupérer et savoir utiliser les informations (textes, images, sons, fichiers, pilotes, applications, sites ...) 71 IMG. 37 Enregistrez le fichier en sélectionnant "Enregistrer la cible du lien sous..." avec un clic droit sur le lien, vous pouvez choisir un répertoire. Partie E. Lire un fichier HTML en local 1. Démarche Vous pouvez ouvrir un fichier html préalablement enregistré et Travailler hors connexion, accessible par le menu Fichier. Partie F. Lire un fichier multimédia enregistré sur le Web 1. Lire un fichier son Remarque La liste des formats de fichiers audio présentée ici n'est pas exhaustive. 72 B2 - LA RECHERCHE D'INFORMATIONS ♦ MP3 : format de musique compressée, très utilisé. ♦ .AIF, .AIFF, .AIFC : Les fichiers portant l'extension .aif, .aiff, .aifc sont des clips sonores, ils peuvent être lus grâce à un lecteur multimédia. ♦ MOV : Fichier QuickTime Movie. ♦ RAM, .RA : Fichier au format Real Audio. ♦ WMA : Format de musique compressée, format propriétaire de la société Microsoft. Les fichiers ont une moins bonne qualité que le MP3. Certains peuvent être protégés par une licence. ♦ MID/MIDI : fichiers uniquement de musique générés par des instruments reliés à la carte son du PC. ♦ WAV : Format de musique très répandu, fichiers non compressés. Il existe plusieurs logiciels lisant de nombreux formats, " Winamp " semble le plus utilisé, il est disponible dans les environnements Windows et Mac sur le site http://www.winamp.com/player/free.php [http://www.winamp.com/player/free.php] , où vous pourrez télécharger la dernière version et l'installer. Vous pouvez utiliser le logiciel de windows qui ne devrait plus à l'avenir être préinstallé : " Windows Media Player ". 2. Lire un fichier vidéo Lire de la vidéo sur le web suppose un équipement en logiciel de lecture, généralement commun aux fichier audio, et une connexion au réseau haut débit (ADSL, Câble ...) permettant un transfert des données suffisamment rapide pour conserver la continuité du flux de lecture. Deux modes de lecture permettent de lire différents types de fichiers : ♦ Le streaming, qui traduit la notion de flux vidéo accessible dès la connexion et alimenté au fur et à mesure de la diffusion. ♦ Le téléchargement du fichier suivi de la lecture en différé. Explication Les formats de vidéo : La vidéo numérique consiste à afficher une succession d'images numériques à une cadence variable par unité de temps : 25 images/seconde pour la plus haute qualité. On procède à une compression des images basée : ♦ sur la perception des information visuelles de façon subjective et en prenant en compte leur interprétation, par notre cerveau, selon des références culturelles ; Récupérer et savoir utiliser les informations (textes, images, sons, fichiers, pilotes, applications, sites ...) 73 ♦ sur des algorithmes permettant de réduire significativement les flux de données en compressant / décompressant les données vidéos, notamment selon le principe de redondance temporelle. On appelle ces algorithmes CoDec (pour COmpression / DECompression). Complément Parmi les différents systèmes existants, MJPEG et MPEG sont normalisés par l'ISO. Cet organisme de normalisation a institué deux groupes de travail : le JPEG (Joint Photographic Expert Group), créé au départ pour les images fixes et le MPEG ( Moving Picture Expert Group ), pour la vidéo. Lecteurs audio-vidéo IMG. 38 74 B2 - LA RECHERCHE D'INFORMATIONS Partie G. Aspirer un site internet 1. Démarche Aspirer (un site Internet) Aspirer, c'est-à-dire copier tout les fichiers d'un site Web, peut se faire avec un logiciel qui enregistre les fichiers dans un de vos répertoires. La structure complète du site est ainsi accessible hors connexion sur votre ordinateur. Outre l'encombrement de votre mémoire de stockage, vous perdrez toutes les informations dynamiques, notamment celles issues d'une base de données. Il existe des logiciels qui vous permettront d'effectuer cette opération. En voici quelques exemples : Récupérer et savoir utiliser les informations (textes, images, sons, fichiers, pilotes, applications, sites ...) 75 IMG. 39 Exemple Exemple avec Memoweb : L'utilisation la plus simple suppose seulement que vous entriez l'adresse du site que vous souhaitez aspirer. L'interface vous guidera dans les choix à effectuer, notamment pour déterminer la profondeur à laquelle vous irez chercher les information dans un site donné. Attention 76 B2 - LA RECHERCHE D'INFORMATIONS Respectez scrupuleusement les droits de propriété intellectuelle lors de l'utilisation de sites aspirés. Voir chapitre droits d'auteur, notamment la partie sur les normes de citation des documents électroniques. IMG. 40 Chapitre VI Comment citer un document électronique ? A. Rappel sur les notions juridiques relatives aux droits d'auteur 1.1. Généralités sur la notion d'oeuvre Parmi les oeuvres protégées le législateur cite comme oeuvres de l'esprit au sens du présent code : Fondamentaux Article L112-2 (Loi nº 94-361 du 10 mai 1994 art. 1 Journal Officiel du 11 mai 1994) Les livres, brochures et autres écrits littéraires, artistiques et scientifiques ; Les compositions musicales avec ou sans paroles ; Les oeuvres cinématographiques et autres oeuvres consistant dans des séquences animées d'images, sonorisées ou non, dénommées ensemble oeuvres audiovisuelles ; Les oeuvres de dessin, de peinture, d'architecture, de sculpture, de gravure, de lithographie ; Les oeuvres graphiques et typographiques ; Les oeuvres photographiques et celles réalisées à l'aide de techniques analogues à la photographie ; Les oeuvres des arts appliqués ; Les illustrations, les cartes géographiques ; Les plans, croquis et ouvrages plastiques relatifs à la géographie, à la topographie, à l'architecture et aux sciences. [...] 78 B2 - LA RECHERCHE D'INFORMATIONS 1.2. Généralités sur le droit moral Conséquences de la protection dont il bénéficie, l'auteur dispose d'un droit moral, perpétuel inaliénable et imprescriptible, qui a pour caractéristiques : ♦ Droit au nom ; ♦ Droit de divulgation : l'auteur a seul le droit de divulguer son oeuvre ; ♦ Droit au respect de l'oeuvre ; ♦ Droit de repentir ou de retrait. 1.3. Généralités sur les droits patrimoniaux L'auteur dispose de droits patrimoniaux : Le droit d'exploitation appartenant à l'auteur comprend le droit de représentation et le droit de reproduction (Article L122-1). Par ignorance des limite du droit de diffusion, un abus fréquent est la diffusion d'une oeuvre au delà de l'autorisation accordée. Or la loi indique : Fondamentaux Article L122-7 Le droit de représentation et le droit de reproduction sont cessibles à titre gratuit ou à titre onéreux. La cession du droit de représentation n'emporte pas celle du droit de reproduction. La cession du droit de reproduction n'emporte pas celle du droit de représentation. Lorsqu'un contrat comporte cession totale de l'un des deux droits visés au présent article, la portée en est limitée aux modes d'exploitation prévus au contrat. Il en résulte que l'utilisation d'une oeuvre requiers de vérifier que l'on dispose bien de la totalité des droits. Remarque Il faut noter que les droits de reproductions ne sont pas souvent respectés notamment dans l'usage fait lors d'une utilisation pédagogique. En France une législation plus tolérante sur le modèle européen est depuis plusieurs mois en discussion. Partant du principe que le droit à l'éducation prime sur le droit de propriété, une franchise assurant la gratuité des droits patrimoniaux permettrait de communiquer la reproduction d'oeuvres dans le cadre d'une utilisation pédagogique. Comment citer un document électronique ? 79 Le cas particulier des logiciels Pour en savoir plus sur le cas spécifique des logiciels : Voir Fiche-Complément en fin de fascicule : "cliquez ici" B. Comment citer un document électronique ? La première façon de respecter les droits des auteurs, c'est de les citer correctement. Une norme internationale précise existe, il convient donc de l'appliquer. Dans les faits, beaucoup de sites oublient de référencer correctement leurs citations. En cas de litige, seule l'application des normes de citation peut prouver la bonne foi du créateur d'un site web qui aurait emprunté un élément texte ou image en oubliant de demander à disposer des droits d'utilisation. D'autre part, les travaux scientifiques publiés sur le Web sont évalués par le nombre de références qui pointent vers ce document électronique. C'est donc une reconnaissance du travail des auteurs/chercheurs qu'il s'agit de conforter pour valider l'utilisation du Web comme outil reconnu pour les publication scientifique. Fondamentaux Extraits de la Norme internationale ISO 690-2 : http://www.nlc-bnc.ca/iso/tc46sc9/standard/690-2f.htm [http://www.nlc-bnc.ca/iso/tc46sc9/stand Cette partie de la norme ISO 690-2 énonce les éléments ainsi que l'ordre qui leur est prescrit dans les références bibliographiques relatives aux documents électroniques : " Information et documentation - Références bibliographiques - Documents électroniques ou parties de ceux-ci ". Complément ♦ Document électronique : Document existant sous une forme électronique accessible par la technologie informatique. [Terme anglais : electronic document] 80 B2 - LA RECHERCHE D'INFORMATIONS C. Si l'on cite un document complet Monographies électroniques, bases de données et programmes informatiques Il faut indiquer : ♦ Responsabilité principale - auteur (obligatoire) ; ♦ Titre (obligatoire) ; ♦ Type de support (obligatoire) ; ♦ Responsabilité secondaire (facultatif) ; ♦ Édition (obligatoire) ; ♦ Lieu de publication (obligatoire) ; ♦ Éditeur (obligatoire) ; ♦ Date de publication (obligatoire) ; ♦ Date de mise à jour ou de révision (obligatoire) ; ♦ Date de la référence (obligatoire pour les documents en ligne; facultatif pour les autres) ; ♦ Collection (facultatif) ; ♦ Notes (facultatif) ; ♦ Disponibilité et accès (obligatoire pour les documents en ligne; facultatif pour les autres) ; ♦ Numéro normalisé (obligatoire). D. Si l'on cite une partie de document Parties de monographies électroniques, bases de données et programmes informatiques. De façon générale, les parties d'un document ne sont pas indépendantes du contexte fourni par ce document hôte. Si l'item référencé peut être traité comme une unité indépendante sans perte significative, il convient de donner sa référence en tant que contribution (voir l'information suivante). Complément Comment citer un document électronique ? 81 ♦ Document hôte : Document comprenant des contributions ou des parties identifiables séparément tout en n'étant indépendantes ni physiquement, ni bibliographiquement [Adapté de l'ISO 690:1987]. [Terme anglais : host document] Il faut indiquer : ♦ Responsabilité principale -auteur (du document hôte) (obligatoire) ; ♦ Titre (du document hôte) (obligatoire) ; ♦ Type de support (obligatoire) ; ♦ Responsabilité secondaire (du document hôte) (facultatif) ; ♦ Édition (obligatoire) ; ♦ Lieu de publication (obligatoire) ; ♦ Éditeur (obligatoire) ; ♦ Date de publication (obligatoire) ; ♦ Date de mise à jour ou de révision (obligatoire) ; ♦ Date de la référence (obligatoire pour les documents en ligne; facultatif pour les autres) ; ♦ Chapitre ou désignation équivalente (de la partie) (obligatoire) ; ♦ Titre (de la partie) (obligatoire) ; ♦ Numérotation à l'intérieur du document hôte (facultatif) ; ♦ Localisation dans le document hôte (obligatoire) ; ♦ Notes (facultatif) ; ♦ Disponibilité et accès (obligatoire pour les documents en ligne; facultatif pour les autres) ; ♦ Numéro normalisé (obligatoire). Exemple 82 B2 - LA RECHERCHE D'INFORMATIONS (http://www.collectionscanada.ca/iso/tc46sc9/standard/690-2f.htm) ICC British Company Financial Datasheets [en ligne]. Hampton (Middlesex, GB): ICC Online, 1992, updated 3 March 1992 [réf. du 11 mars 1992]. Robert Maxwell Group PLC. Accession no. 01209277. Disponible sur DIALOG Information Services, Palo Alto (Calif.). CARROLL, Lewis. Alice's Adventures in Wonderland [en ligne]. Texinfo. ed. 2.2. [Dortmund, Allemagne]: WindSpiel, November 1994 [réf. du 30 mars 1995]. Chapter VII. A Mad Tea-Party. Disponible sur World Wide Web: http://www.germany.eu.net/books/carroll/alice_10.html#SEC13 [http://www.germany.eu.net/boo Remarque Toutes les informations ne sont pas toujours disponibles car les auteurs des documents électroniques ne référencient pas toujours correctement leur site web. E. Contributions dans un document Contributions aux monographies électroniques, bases de données et programmes informatiques. Complément ♦ Contribution : Unité indépendante formant une partie d'un document [Adapté de l'ISO 690:1987] . [Terme anglais : contribution] Il faut indiquer : ♦ Responsabilité principale auteur (de la contribution) (obligatoire) ; ♦ Titre (de la contribution) (obligatoire) ; ♦ Responsabilité principale (du document hôte) (obligatoire) ; ♦ Titre (du document hôte) (obligatoire) ; ♦ Type de support (obligatoire) ; ♦ Édition (obligatoire) ; ♦ Lieu de publication (obligatoire) ; ♦ Éditeur (obligatoire) ; ♦ Date de publication (obligatoire) ; Comment citer un document électronique ? 83 ♦ Date de mise à jour ou de révision (obligatoire) ; ♦ Date de la référence (obligatoire pour les documents en ligne; facultatif pour les autres) ; ♦ Numérotation à l'intérieur du document hôte (facultatif) ; ♦ Localisation à l'intérieur du document hôte (obligatoire) ; ♦ Notes (facultatif) ; ♦ Disponibilité et accès (obligatoire pour les documents en ligne; facultatif pour les autres) ; ♦ Numéro normalisé (obligatoire). Exemple (http://www.collectionscanada.ca/iso/tc46sc9/standard/690-2f.htm [http://www.collectionscanada. ) Belle de Jour. Magill's Survey of Cinema [en ligne]. Pasadena (Calif.): Salem Press, 1985- [réf. du 1994-08-04]. Accession no. 0050053. Disponible sur DIALOG Information Services, Palo Alto (Calif.). MCCONNELL, WH. Constitutional History. The Canadian Encyclopedia [CD-ROM]. Macintosh version 1.1. Toronto: McClelland and Stewart, c1993. ISBN 0-7710-1932-7. Une partie des informations sont à rechercher dans les pages du site. Souvent, en bas de page un lien donne accès à ces informations. La consultation du code source du document permet également de retenir les informations placées dans l'entête entre les balises : <head> meta... </head> En conclusion ♦ Le droit moral de l'auteur doit être toujours respecté. ♦ Toute exploitation de l'oeuvre ne peut se faire sans l'autorisation de son auteur, il convient dans tous les cas de le citer selon les normes en vigueur. ♦ L'auteur a droit à une rémunération pour toute exploitation de son oeuvre mais il peut autoriser l'exploitation à titre gratuit. Questionnaire à choix multiples 1 Exercices QUESTION N°1 Lesquels de ces outils sont des bases de données de SITES Web choisis par des professionnels de l'information ? A Les moteurs de recherche B Les annuaires QUESTION N°2 Les moteurs de recherche sont des bases de données de PAGES web indexées automatiquement et régulièrement par un robot. A Vrai B Faux QUESTION N°3 Lorsqu'on effectue une recherche à l'aide de mots-clés dans un annuaire, celui-ci recherchera l'occurrence du mot dans le contenu des pages Web indexées dans sa base de données. A Vrai B Faux 86 B2 - LA RECHERCHE D'INFORMATIONS QUESTION N°4 Tout outil de recherche (annuaire ou moteur) propose une page de recherche simple et une page de recherche avancée. A Vrai B Faux QUESTION N°5 Tout outil de recherche (annuaire ou moteur) propose un lien vers son mode d'emploi. A Vrai B Faux QUESTION N°6 La construction d'un Outil de recherche ... A est manuelle. B est automatique. C dépend de la nature de l'outil. QUESTION N°7 Un recherche dans un annuaire s'exerce sur ... : A les pages Web elles-mêmes. B les catégories et les noms des sites. C les pages d'accueil des sites. QUESTION N°8 Un moteur de recherche, c'est l'index ... : A de tous les sites du Web. B de tous les titres des pages d'accueil du Web. C de toutes les pages du Web. Exercices 87 QUESTION N°9 Lors de la construction de l' annuaire ... : A tous les sites qui le demandent sont placés dans l'annuaire. B les sites sont placés automatiquement dans l'annuaire C les sites sont évalués par un opérateur humain et s'ils sont de qualité, ils sont placés manuellement dans l'annuaire. QUESTION N°10 Quelle est la différence entre le Guide ( l'annuaire ) de Yahoo et un moteur de recherche ? A Un Guide est une arborescence dans laquelle on peut naviguer, ce que n'est pas le moteur. B Il n'y a pas de différence entre un guide et un moteur. C Les deux utilisent un robot d'indexation. QUESTION N°11 L'utilisation de Yahoo et Google ... : A est la même. B n'est pas la même : Yahoo sur un thême, Google sur un point précis. C ces outils n'ont pas de spécificité particulière. QUESTION N°12 Une seule affirmation est vraie : A Google ne tient compte ni de la casse, ni des accents. B Il est obligatoire de mettre les opérateurs AND et OR. C Les articles et les conjonctions sont importants. 88 B2 - LA RECHERCHE D'INFORMATIONS QUESTION N°13 L'écran de recherche avancée : A n'est pas très utile. B est très performant. C est très peu lisible. QUESTION N°14 Parmi les paramètres de recherche avancée ... : A celui sur le type de fichier n'a aucun intérêt. B celui sur la langue est important. C celui sur le champ de recherche ( URL, titre ) est important. QUESTION N°15 L' ordre d'affichage des résultats d'une requête ... : A n'a aucune importance. B est significatif. C dépend de la taille des pages. QUESTION N°16 Je consulte le SUDOC pour ... : A trouver des articles encyclopédiques. B trouver des livres sur un sujet précis. C consulter mon dossier administratif. QUESTION N°17 Quel index choisir pour une recherche sur la guerre de Sécession ? Exercices QUESTION N°18 Quel index choisir pour une recherche sur André Malraux ? QUESTION N°19 Quel index choisir pour avoir la liste des ouvrages d'André Malraux ? 89 Synthèse Conclusion Synthèse du module Notions étudiées : ♦ Recherche sur le Web - Outils de recherche : principes des annuaires et des moteurs. - Yahoo! : description, utilisation, domaine d'utilisation. - Google : description, caractéristiques particulières, puissance de Google. ♦ Catalogue de bibliothèque : - Comment l'interroger. - Comment localiser un document. - Comment utiliser un panier de résultats. ♦ Citation d'un document électronique. Webographie Notions étudiées : Foire aux questions (FAQ) sur la recherche d'informations : ♦ Réseau Abondance, La recherche d'information sur le Web. Ed : Réseau Abondance (France), consulté le mardi 19/07/2005, Disponible sur World Wide Web: http://www.abondance.com/docs/faq_recherche.html [http://www.abondance.com/docs/faq_rech (français ) ♦ http://www.cln.org/searching_faqs.html [http://www.cln.org/searching_faqs.html] ( anglais ) ♦ http://www.monash.com/spidap2.html anglais ) [http://www.monash.com/spidap2.html] ( 92 B2 - LA RECHERCHE D'INFORMATIONS Sites importants sur la recherche d'informations : ♦ www.abondance.com [www.abondance.com] ( français ) ♦ http://www.webrankinfo.com/google/pagerank/pagerank.php [http://www.webrankinfo.com/google/p ( français ) ♦ http://www.bibliotheques.uqam.ca/InfoSphere/ [http://www.bibliotheques.uqam.ca/InfoSphere/] ( français ) ♦ www.searchenginewatch.com [www.searchenginewatch.com] ( anglais ) ♦ www.searchengineshowdown.com [www.searchengineshowdown.com] (anglais ) ♦ www.googleguide.com [www.googleguide.com] ( anglais ) Corrigés des QCM Questionnaire n°1, Question n°1 Proposition correcte : B Questionnaire n°1, Question n°2 Proposition correcte : A Questionnaire n°1, Question n°3 Proposition correcte : B Questionnaire n°1, Question n°4 Proposition correcte : A Questionnaire n°1, Question n°5 Proposition correcte : A Questionnaire n°1, Question n°6 Proposition correcte : C Questionnaire n°1, Question n°7 Proposition correcte : B Questionnaire n°1, Question n°8 Proposition correcte : C 94 B2 - LA RECHERCHE D'INFORMATIONS Questionnaire n°1, Question n°9 Proposition correcte : C Questionnaire n°1, Question n°10 Proposition correcte : A Questionnaire n°1, Question n°11 Proposition correcte : B Questionnaire n°1, Question n°12 Proposition correcte : A Questionnaire n°1, Question n°13 Proposition correcte : B Questionnaire n°1, Question n°14 Proposition correcte : C Questionnaire n°1, Question n°15 Proposition correcte : B Questionnaire n°1, Question n°16 Proposition correcte : B Questionnaire n°1, Question n°17 mots sujet / "mots sujet" / " mots sujet " / index mots sujet Questionnaire n°1, Question n°18 mots sujet / "mots sujet" / " mots sujet " / index mots sujet Questionnaire n°1, Question n°19 mots auteur / "mots auteur" / " mots auteur " / index mots auteur Fiches-Compléments 96 B2 - LA RECHERCHE D'INFORMATIONS cliquez ici Une bataille d'intérêt oppose les industriels multinationaux aux utilisateurs sur la brevabilité des logiciels. Le parlement européen a refusé en juillet 2005, de légiférer sur cette question car il considère que de tels brevets porteraient atteinte à la liberté de création d'oeuvre de l'esprit, au sens défini par la loi. D'autre particularités concernent le droit sur les logiciels : Il faut noter que : sauf dispositions statutaires ou stipulations contraires, les droits patrimoniaux sur les logiciels et leur documentation créés par un ou plusieurs employés dans l'exercice de leurs fonctions ou d'après les instructions de leur employeur sont dévolus à l'employeur qui est seul habilité à les exercer. Article L113-9 De même l'auteur d'un logiciel ne peut : 1. S'opposer à la modification du logiciel par le cessionnaire des droits mentionnés au 2º de l'article L. 122-6, lorsqu'elle n'est préjudiciable ni à son honneur ni à sa réputation ; 2. Exercer son droit de repentir ou de retrait. Article L121-7 (Loi nº 94-361 du 10 mai 1994 art. 2 Journal Officiel du 11 mai 1994) complement ♦ Document : Information enregistrée qui peut être considérée comme une unité au cours d'un traitement documentaire indépendamment de sa forme physique et de ses caractéristiques [ISO 5127/1:1983]. [Terme anglais : document] ♦ Auteur : Personne ou collectivité responsable du contenu intellectuel ou artistique d'un document [ISO 690:1987]. [Terme anglais : author] ♦ Editeur : Personne ou collectivité responsable de la production et de la diffusion d'un document [ISO 5127/3a:1981]. [Terme anglais : publisher] ♦ Edition : Ensemble des exemplaires d'un document dont le contenu correspond intégralement à une copie unique utilisée comme original (voir aussi: version). [Terme anglais : edition] Fiches-Compléments 97 ♦ Titre : Dénomination apparaissant généralement sur le document, par laquelle il convient de le citer, utilisée pour l'identifier et qui souvent (quoique pas nécessairement) le distingue d'un autre document [ISO 690:1987]. [Terme anglais : title]