Veille informationnelle et technologique
Transcription
Veille informationnelle et technologique
1 Veille informationnelle et technologique David Gasparotto – Master BioMane, 08/09/2014 [email protected] 2 La veille documentaire et technologique ● Définitions, historique, concepts sur internet ● Démarche de recherche ● La Veille ● L'information ● L'information en mode « pull » ● L'information en mode « push » ● L'information spécialisée ● Archivage du web ● Outils de collecte et de gestion d'informations ● Outils de rédaction / citation / bibliographie ● Les flux RSS, Rssowl Définitions ● Le world wide web est l'ensemble des entités informatiques (textes, images, fichiers, boîtes aux lettres...) accessible indépendamment d'autres ressources. Petit historique d'internet 3 1962 : début du projet ARPANET (US Air Force) qui vise à mettre en réseau décentralisé plusieurs ordinateurs 1982 : définition du terme Internet Concept anglais « internetting » qui serait traduit par « interconnexion des réseaux ». Le but du jeu est de créer un ensemble d'outil capable d'interconnecter et de faire communiquer via des protocoles spécifiques différents matériels. Amalgame « net » (réseau) et le « web » (toile d'araignée) qui désigne plutôt le www « world wide web » (Toile d’araignée mondiale) 4 5 ● ● ● ● Web 1.0 ou web statique (années 90 – 2000) : pages html avec hyperliens Web 1.5 ou dynamique (2000 – 2003) : système de gestion de contenu qui créent des pages html la volée. Cela requière une base de données Web 2.0 : interactivité, social, participatif, effet de réseau : l'internaute est au coeur du web et contribue à son enrichissement Web 3.0 ? : web des données ?, web sémantique ? 6 Définitions complémentaires ● Protocole : Description des formats de messages et règles selon lesquels deux ordinateurs ou deux programmmes échangeront des données. Ex : TCP, IP, DHCP, Telnet, FTP, UDP... HTTP(pour HyperText Transfer Protocol) est le protocole de communication communément utilisé pour transférer les ressources du Web. HTTPS : variante sécurisée 7 Une URL (pour Uniform Resource Locator) pointe sur une ressource. C’est une chaîne de caractères permettant d’indiquer un protocole de communication et un emplacement pour toute ressource du Web. Adresse IP : Série de 4 nombres, tous compris entre 0 et 255, identifiant de manière unique tout ordinateur ou serveur connecté à l'internet. (IP = Internet Protocol) 8 ● Serveur : Ordinateur qui exécute des opérations à la demande d'autres ordinateurs, surnommés clients. ● ● Serveur DNS (Domain Name Server). Correspondance adresse IP – nom de domaine Client : logiciel installé sur le poste de travail qui permet d'accéder à un serveur De ce fait, on parle d'architecture réseau clientserveur 9 ● HTML : Hypertext Markup Language. Format de données conçu pour représenter les pages web. Il permet de créer des documents interopérables avec des équipements très variés de manière conforme aux exigences de l’accessibilité du web 10 ● XML (eXtensible Markup Language) : langage informatique permettant aux concepteurs de documents HTML de définir leurs propres marqueurs, dans le but de personnaliser la structure des données qu'ils comptent présenter. XML est une recommandation du W3C. L'objectif initial de XML était de faciliter le partage de textes et d'informations structurées, par exemple au travers de l'Internet, en séparant le contenu (les données) du contenant (la présentation des données). 11 ● ● ● Métadonnées : données servant à décrire, caractériser et structurer des ressources numériques Mégadonnées (big data) : ensemble de données très volumineux nécessitant des outils informatiques de nouvelle génération pour le stockage et le traitement des données Informatique dans les nuages (cloud computing) : système de stockage des données déporté de manière à pouvoir y accéder depuis différents ordinateurs (et endroits) Etape de la recherche documentaire Définir ses besoins Rapport, Dissertation, Travail de session... Préparer sa recherche Cerner le sujet, le vocabulaire, but du travail Choisir le type de documents appropriés Articles, publications officielles, ouvrages de base... Rechercher/Repèrer les documents Bases de données, Catalogue, Web, Bibliographie... Localiser les documents Bibliothèques, Web... Evaluer les documents Pertinence, type d'information Citer les documents utilisés 12 Veille et stratégie de veille Différentes définitions selon les contextes et les types d’organisation ● ● 1 : La veille est un processus à valeur ajoutée basé sur un ensemble de technologie permettant la recherche, la collecte, le tri et la diffusion d'information en vue de produire de la connaissance pour orienter tout système d'aide à la décision 2 : « Activité continue et en grande partie itérative visant à une surveillance active de l’environnement technologique, commercial, etc., pour en anticiper les évolutions. » (AFNOR, 1998) 13 14 Pourquoi faire de la veille ? ● Anticipations ● Connaître/surveiller la concurrence/alliés Les limites ● Langue ● Plagiat ● Désinformation 15 Typologies de veille Peut dépendre : de l'environnement surveillé, du temps consacré, de l'objectif poursuivit Exemple en fonction de l'environnement surveillé : ● Veille technologique/scientifique ● Veille marketing/commerciale/concurrentielle ● Veille sociétale/environnementale ● Veille réglementaire/juridique ● Veille sanitaire L'information On distingue 3 types d'informations : l'information blanche, accessible classiquement ● l'information grise, qui nécessite des techniques de recherche plus avancées ● l'information noire (espionnage industriel) ● ● Il convient de distinguer 2 types d'informations en fonction des flux de données : ● L'information en méthode « pull » : – ● le client va chercher les informations sur le serveur L'information en méthode « push » – le serveur envoi l'information au client 17 De l’invention à la mise sur le marché d’un produit : l’information nécessaire Technique Technico-économique Scientifique Technologique Recherche Développement Production Rég le nt e m e onn r i v n E it é r u c é et s men ta ire e t Marché jurid ique 18 20 CHERCHEUR - AUTEUR - ENSEIGNANT Cours (lecture) Brevets (patents) Information primaire Travail de recherche Etude sur un sujet Résultats à diffuser ou à protéger Articles (articles, papers…) Présentation à un congrès, une conférence (meetings, congress, workshops…) Livres (books) Rapports (reports) Thèses (dissertations) Bases de données bibliographiques Catalogues Actes de congrès (proceedings) Signalement des documents Références communiquées par des experts Périodiques spécialisés (serials) Bibliographies • D’articles • De rapports • De livres… Information secondaire 21 L'information en méthode « pull » ● Définir son profil de recherche ● ● ● ● Identifier les sources (base de données, ressources internet...) Formuler une stratégie de recherche Relancer manuellement et régulièrement la recherche Évaluer l'information obtenue 22 Avantage/inconvénients ● Retourner régulièrement sur les sources, relancer les recherches... Méthode longue ● ● Obligatoire au départ Permet d'identifier de nouvelles sources potentielles 23 Web surfaçique / web profond ● 2001 : 1% du web indexé Michael K. Bergman. 2001. The Deep Web: Surfacing Hidden Value . The journal of electronic publishing, vol. 7, no. 1 doi : http://dx.doi.org/10.3998/3336451.0007.104 ● 2008 : 25 à 30% du web indexé Pisani Francis et Piotet Dominique. Comment le web change le monde : l'alchimie des multitudes. Editions Pearson, 2008 (ISBN 978-2-7440-6261-2) http://www.worldwidewebsize.com/ 24 Web surfaçique / opaque / profond ● 2001 : 1% du web indexé Michael K. Bergman. 2001. The Deep Web: Surfacing Hidden Value . The journal of electronic publishing, vol. 7, no. 1 doi : http://dx.doi.org/10.3998/3336451.0007.104 ● 2008 : 25 à 30% du web indexé Pisani Francis et Piotet Dominique. Comment le web change le monde : l'alchimie des multitudes. Editions Pearson, 2008 (ISBN 978-2-7440-6261-2) http://www.worldwidewebsize.com/ 25 Web surfaçique ● Web surfacique est la partie du World Wide Web qui est accessible en ligne et indexable par les robots d'indexation des moteurs de recherche généralistes Web opaque ● Web qui pourrait être indexé mais qui ne l'est pas Web profond ● Types de fichiers spécifiques ● sites non indexés ● contenu à accès limité ● contenu non lié ● contenu dynamique (contenu généré suite au remplissage de formulaire) 26 27 Web de surface Web opaque Web profond Schématisation du web ● Web social : wikis, blogs, forums... ● Web institutionnel ● Web entreprise ● Web juridique, réglementaire ● Web profond/opaque Web social Web insitutionnel Web entreprise Web juridique/réglementaire Web scientifique et technique Web profond bibliothèques, archives ouvertes, bases bibliographiques, autres... 28 30 Les moteurs de recherche ● définition ● Les opérateurs ● Métamoteurs ● Moteurs de recherche « généralistes » ● Moteurs de recherche « sémantiques » ● Moteurs de recherche de blog ● Moteurs de recherche d'images ● Moteurs de recherche de vidéos ● Moteurs de recherche spécialisés 31 Les moteurs de recherche ● Définition : ● ensemble de programmes informatiques permettant de retrouver des ressources (pages web, forums Usenet, images, vidéos etc...) associées à des mots quelconques. (source: SARL CLEVACTI http://www.techno-science.net/?onglet=glossaire&definition=342, consulté le 20/08/2009) ● Fonctionnement : ● ● consiste à parcourir des URLs de départ et continuer de proche en proche afin de parcourir un maximum d'informations diverses (fichiers, liens...) grâce à des robots (=spiders) Exemple avec la constitution de fichiers inverses Exemple de fichiers inverses Titre : Page 1 Texte : Tintin, milou, Capitaine Haddock Titre : Page 2 Titre : Page 3 Texte : Tintin Texte : Milou URL2 URL3 URL1 Constitution des indexes : Tintin : Page 1/URL1 Page 2/URL2 Milou : Page 1/URL1 Page 3/URL3 Robot Algorythme de pondération Capitaine Haddock : Page1/URL1 Interface de recherche Requête : Affiche les pages qui mentionnent « Milou » Page 1 URL1 Page 3 URL 3 32 33 Les opérateurs ● Opérateurs booléens pour les moteurs de recherche du web (Ask, Yahoo!, Bing, Exalead, Google...) : Inclusion : + A B A+B Exclusion : - A B B-A ● ● ● Expression exacte : « » Troncature : * (0 à n caractères après l'occurence) Autres (cf. tableau ci-dessous) 34 Les opérateurs ● Opérateurs boobléens pour les moteurs de recherche de bases spécialisées (ex : Scopus) : OU : OR Inclusion : AND Exclusion : NOT (AND NOT) 35 Exemple de syntaxe complémentaire Ask Expression exacte “ ” Exclusion Joker * OU OR Intervalle de date ou de nombres last:, afterdate:, beforedate:, betweendate Format de fichier filetype : Dans la page de titre intitle: Dans le corps de la page Yahoo! Bing Exalead Google “ ” “ ” “ ” “ ” - - - ou NOT - * * * OR OR OR OR after: et before: intitle: filetype: filetype: filetype: ou ext: intitle: intitle: intitle: ou allintitle: inbody: intext: ou allintext: 36 Dans l'adresse URL inurl: inurl: inurl: inanchor: Dans les liens de la page Dans le site site: site: ou domain: ou hostname: Lien vers inlink: link: ou linkdomain: site: inurl: ou allinurl: site: inanchor: ou allinanchor: site: link: link: Pages apparentées related: Cache cache: ● http://www.faganfinder.com/google2.html Source : Anderruthy, J.-N. 2009, Techniques de veille et e-réputation. St Herblain : Editions ENI, Collections Objectif Solutions, 355p. ISBN 978-2-7460-4928-4 37 Les métamoteurs Source : Wikimedia commons 38 ● ● Envoie des requêtes sur plusieurs moteurs de recherche et synthétise les réponses Exemples ● Refseek : http://www.refseek.com (ressources anglophones pour étudiants, chercheurs...) ● Dogpile : http://www.dogpile.com (compile les résultats de Google, Yahoo!, et Yandex) ● Kartoo : http://fr.kartoo.com/ 39 Les Métamoteurs sociaux ● ● Spécialisation dans les réseaux sociaux et forums Exemples ● WhosTalkin : http://www.whostalkin.com ● Samepoint : http://www.samepoint.com 40 Réseaux sociaux professionnels ● Viadeo : http://www.viadeo.com ● Linkedin : http://www.linkedin.com 41 Moteurs dits « sémantiques » ● Powerset : http://www.powerset.com (Rachat par microsoft) ● Iseek : http://www.iseek.com ● Wolfram Alpha : http://www.wolframalpha.com/ 42 Moteurs de recherche de blogs ● Technorati : http://technorati.com ● Twingly : http://www.twingly.com/search ● Keyblog : http://www.keyblog.fr/ ● Meltwater Ice rocket : http://www.icerocket.com Moteurs de recherche d'images ● TinEye : http://tineye.com ● Flickr : http://www.flickr.com ● Google images : http://images.google.com Moteurs de recherche de vidéos ● Google vidéo : http://video.google.com ● Youtube : http://www.youtube.com ● Dailymotion : http://www.dailymotion.com ● http://voxaleadnews.labs.exalead.com : trouver du texte dans les vidéos, sons 43 Les archives ouvertes • Années 90 : Associations maladies orpheline, chercheurs (physiciens), congrès américain s'opposent aux éditeurs • février 2002 : initiative de Budapest pour l’accès ouvert (BOAI), avec deux solutions pour la mise en ligne libre et sans restriction des résultats de la recherche : l’auto-archivage et les revues alternatives. • octobre 2003 : la Déclaration de Berlin étend le modèle du libre accès à l’ensemble des résultats de la recherche, telles que les données brutes. • mars 2006, protocole d’accord pour la recherche française 44 45 Les archives ouvertes ● Recherche française : HAL (Hyper Articles en Ligne) http://hal.archives-ouvertes.fr/ ● D'instituts en particulier http://prodinra.inra.fr/ ● OAIster : http://www.oaister.org/ ● Scholar Google : http://scholar.google.fr/ 46 Les bases de données spécialisées ● Web of science ● SCOPUS ● INSPEC ● Ressources de votre bibliothèque universitaire : ● http://bu.univ-lorraine.fr/ressources/ressources-en-li Système Universitaire de DOCumentation, Catalogues de bibliothèques et bibliothèques électroniques ● SUDOC : http://www.sudoc.abes.fr ● Gallica : http://gallica.bnf.fr/ ● Europeana : http://www.europeana.eu/portal/ ● Bibliothèque d'Alexandrie : http://www.bibalex.org 47 Supports ou sources d'information électronique ● Supports/sources dits « lents » ● Supports/sources du web « rapide » 48 49 Supports rapides ● Billets de blog ● Wikis ● Forums ● CMS (Content Management System) Avantage : ● publication instantanée 50 Inconvénient des sources dites rapides : Validité et pertinence de l'information ? Qui, quand, quoi ? ● effet de buzz ● Lobbying facile ● Identification des sources et des auteurs 51 Supports électroniques « lents » ● Savoir « encyclopédique » ● Exemples : ● encyclopédies généralistes : – – Encyclopaedia universalis Techniques de l'ingénieur ● Livres ● Articles scientifiques ou technique Délais de publication L'édition scientifique et technique support lent ● Article scientifique ● Actes de congrès ● Thèse ● Livre Inconvénient : lenteur du cycle d'édition (1 mois à 2 an) Internet permet d'accélérer l'étape d'édition Avantages : information validée par les pairs citation des sources 52 53 Received: 5 June 2008 Accepted:24 April 2009 Published: 24 April 2009 54 ● ● Complémentarité des supports en fonction des informations que l'on souhaite identifier Complémentarité des outils et des moteurs de recherche La norme Une norme est un document qui définit des exigences, des spécifications, des lignes directrices ou des caractéristiques à utiliser systématiquement pour assurer l'aptitude à l'emploi des matériaux, produits, processus et services. pas obligatoire sauf pour celles qui le sont rendues par un texte réglementaire ou décret de loi. ● AFNOR : http://www.afnor.fr ● ISO : http://www.iso.org Source ISO 55 56 ● ● ● ISO. Cosmétiques -- Microbiologie -- Lignes directrices pour l'appréciation du risque et l'identification de produits à faible risque microbiologique. ISO 29621 2010, Genève : ISO, 18 p. AFNOR. Cosmétiques -- Microbiologie -- Lignes directrices pour l'appréciation du risque et l'identification de produits à faible risque microbiologique. NF EN ISO 29621 2011, Paris : AFNOR, 18 p. Normes expérimentales XP (5 ans maximum) 57 Le brevet Le brevet protège une innovation technique, c'est-à-dire un produit ou un procédé qui apporte une solution technique à un problème technique donné. L'invention pour laquelle un brevet pourra être obtenu, en France, auprès de l'Institut national de la propriété industrielle (INPI) doit également être nouvelle, impliquer une activité inventive et être susceptible d'application industrielle. Source INPI 58 Le brevet ● Protection sur la durée (20 à 25 ans) ● Protection géographique ● WIPO (World intellectual property organization) http://patentscope.wipo.int/search/fr/search.jsf ● EPO (European patent organization) http://www.epo.org/ ● INPI (Institut national de la propriété indutrielle) http://www.inpi.fr http://fr.espacenet.com/quickSearch?locale=fr_FR 59 La marque Au sens de la propriété industrielle, la marque est un « signe » permettant de distinguer précisément les produits ou prestations de services d'une entreprise de ceux de ses concurrents. Le signe peut être un mot, un nom, un slogan, un logo, un dessin, etc. ou la combinaison de ces différents éléments. http://bases-marques.inpi.fr/ Source INPI 60 Entreprises ● INSEE http://www.sirene.fr ● Annuaire d'entreprise : http://www.kompass.com ● Annuaire de réseau / association ● Sites web ● Rapports annuels ● Bilans comptables http://www.anafinance.com/ 61 Les affiliations 62 Les affiliations ● Servent aux classements internationaux des établissement Forte tendance à la normalisation ● Servent à repérer les laboratoires, entreprises... qui font de la recherche/développement dans votre activité et les concurrents potentiels 63 Les citations, la bibliographie ● Cf document joint : ● Guide de gestion des réfèrences bibliographiques ● Zotero 64 Instructions aux auteurs ● Destiné surtout à la publication dans les périodiques ● Diffère selon les revues ● Motif de rejets de publication 65 Recherche du vocabulaire ● Utiliser les indexes des bases bibliographiques ● Thésaurus ● Mots-clés d'auteurs ● Dictionnaires spécialisés ● Modules de traduction 66 En savoir plus... ● ● Anderruthy, Jean-Noël. 2009. Techniques de veille et e-réputation - Comment exploiter les outils Internet ? St Herblain : Editions ENI. collection Objectif Solutions, 355p. ISBN 9782746049284 Gilles, Balmisse, et Denis Meingan. 2008. La Veille 2.0 et ses Outils. Paris : Hermes Science Publications, collection Management et informatique, 230p. ISBN 978-2746219298