Veille informationnelle et technologique

Transcription

Veille informationnelle et technologique
1
Veille informationnelle
et technologique
David Gasparotto – Master BioMane, 08/09/2014
[email protected]
2
La veille documentaire et technologique
●
Définitions, historique, concepts sur internet
●
Démarche de recherche
●
La Veille
●
L'information
●
L'information en mode « pull »
●
L'information en mode « push »
●
L'information spécialisée
●
Archivage du web
●
Outils de collecte et de gestion d'informations
●
Outils de rédaction / citation / bibliographie
●
Les flux RSS, Rssowl
Définitions
●
Le world wide web est l'ensemble des entités
informatiques (textes, images, fichiers, boîtes aux
lettres...) accessible indépendamment d'autres
ressources.
Petit historique d'internet
3
1962 : début du projet ARPANET (US Air Force)
qui vise à mettre en réseau décentralisé plusieurs
ordinateurs
1982 : définition du terme Internet
Concept anglais « internetting » qui serait traduit
par « interconnexion des réseaux ».
Le but du jeu est de créer un ensemble d'outil
capable d'interconnecter et de faire communiquer
via des protocoles spécifiques différents matériels.
Amalgame « net » (réseau) et le « web » (toile
d'araignée) qui désigne plutôt le www « world
wide web » (Toile d’araignée mondiale)
4
5
●
●
●
●
Web 1.0 ou web statique (années 90 – 2000) :
pages html avec hyperliens
Web 1.5 ou dynamique (2000 – 2003) : système de
gestion de contenu qui créent des pages html la
volée. Cela requière une base de données
Web 2.0 : interactivité, social, participatif, effet de
réseau : l'internaute est au coeur du web et
contribue à son enrichissement
Web 3.0 ? : web des données ?, web sémantique ?
6
Définitions complémentaires
●
Protocole :
Description des formats de messages et règles
selon lesquels deux ordinateurs ou deux
programmmes échangeront des données.
Ex : TCP, IP, DHCP, Telnet, FTP, UDP...
HTTP(pour HyperText Transfer Protocol) est le
protocole de communication communément utilisé
pour transférer les ressources du Web.
HTTPS : variante sécurisée
7
Une URL (pour Uniform Resource Locator) pointe
sur une ressource. C’est une
chaîne de caractères permettant d’indiquer un
protocole de communication et un emplacement
pour toute ressource du Web.
Adresse IP : Série de 4 nombres, tous compris
entre 0 et 255, identifiant de manière unique tout
ordinateur ou serveur connecté à l'internet. (IP =
Internet Protocol)
8
●
Serveur : Ordinateur qui exécute des
opérations à la demande d'autres ordinateurs,
surnommés clients.
●
●
Serveur DNS (Domain Name Server).
Correspondance adresse IP – nom de domaine
Client : logiciel installé sur le poste de travail qui
permet d'accéder à un serveur
De ce fait, on parle d'architecture réseau clientserveur
9
●
HTML : Hypertext Markup Language. Format de
données conçu pour représenter les pages
web. Il permet de créer des documents
interopérables avec des équipements très
variés de manière conforme aux exigences de
l’accessibilité du web
10
●
XML (eXtensible Markup Language) : langage
informatique permettant aux concepteurs de
documents HTML de définir leurs propres
marqueurs, dans le but de personnaliser la
structure des données qu'ils comptent
présenter.
XML est une recommandation du W3C.
L'objectif initial de XML était de faciliter le
partage de textes et d'informations structurées,
par exemple au travers de l'Internet, en
séparant le contenu (les données) du contenant
(la présentation des données).
11
●
●
●
Métadonnées : données servant à décrire,
caractériser et structurer des ressources
numériques
Mégadonnées (big data) : ensemble de
données très volumineux nécessitant des outils
informatiques de nouvelle génération pour le
stockage et le traitement des données
Informatique dans les nuages (cloud
computing) : système de stockage des données
déporté de manière à pouvoir y accéder depuis
différents ordinateurs (et endroits)
Etape de la recherche documentaire
Définir ses besoins
Rapport, Dissertation, Travail de session...
Préparer sa recherche
Cerner le sujet, le vocabulaire, but du travail
Choisir le type de documents appropriés
Articles, publications officielles, ouvrages de base...
Rechercher/Repèrer les documents
Bases de données, Catalogue, Web, Bibliographie...
Localiser les documents
Bibliothèques, Web...
Evaluer les documents
Pertinence, type d'information
Citer les documents utilisés
12
Veille et stratégie de veille
Différentes définitions selon les contextes et les
types d’organisation
●
●
1 : La veille est un processus à valeur ajoutée
basé sur un ensemble de technologie
permettant la recherche, la collecte, le tri et la
diffusion d'information en vue de produire de la
connaissance pour orienter tout système d'aide
à la décision
2 : « Activité continue et en grande partie
itérative visant à une surveillance active de
l’environnement technologique, commercial,
etc., pour en anticiper les évolutions. »
(AFNOR, 1998)
13
14
Pourquoi faire de la veille ?
●
Anticipations
●
Connaître/surveiller la concurrence/alliés
Les limites
●
Langue
●
Plagiat
●
Désinformation
15
Typologies de veille
Peut dépendre : de l'environnement surveillé,
du temps consacré, de l'objectif poursuivit
Exemple en fonction de l'environnement surveillé :
●
Veille technologique/scientifique
●
Veille marketing/commerciale/concurrentielle
●
Veille sociétale/environnementale
●
Veille réglementaire/juridique
●
Veille sanitaire
L'information
On distingue 3 types d'informations :
l'information blanche, accessible classiquement
● l'information grise, qui nécessite des techniques de
recherche plus avancées
● l'information noire (espionnage industriel)
●
●
Il convient de distinguer 2 types d'informations
en fonction des flux de données :
●
L'information en méthode « pull » :
–
●
le client va chercher les informations sur le serveur
L'information en méthode « push »
–
le serveur envoi l'information au client
17
De l’invention à la mise sur le
marché d’un produit :
l’information nécessaire
Technique
Technico-économique
Scientifique
Technologique
Recherche
Développement
Production
Rég
le
nt
e
m
e
onn
r
i
v
n
E
it é
r
u
c
é
et s
men
ta
ire e
t
Marché
jurid
ique
18
20
CHERCHEUR - AUTEUR - ENSEIGNANT
Cours
(lecture)
Brevets
(patents)
Information
primaire
Travail de recherche
Etude sur un sujet
Résultats à diffuser ou à protéger
Articles
(articles, papers…)
Présentation à un congrès, une conférence
(meetings, congress, workshops…)
Livres (books)
Rapports (reports)
Thèses (dissertations)
Bases de données
bibliographiques
Catalogues
Actes de congrès
(proceedings)
Signalement
des documents
Références communiquées
par des experts
Périodiques spécialisés
(serials)
Bibliographies
• D’articles
• De rapports
• De livres…
Information
secondaire
21
L'information en méthode « pull »
●
Définir son profil de recherche
●
●
●
●
Identifier les sources (base de données, ressources
internet...)
Formuler une stratégie de recherche
Relancer manuellement et régulièrement la
recherche
Évaluer l'information obtenue
22
Avantage/inconvénients
●
Retourner régulièrement sur les sources,
relancer les recherches...
Méthode longue
●
●
Obligatoire au départ
Permet d'identifier de nouvelles sources
potentielles
23
Web surfaçique / web profond
●
2001 : 1% du web indexé
Michael K. Bergman. 2001. The Deep Web: Surfacing Hidden Value . The
journal of electronic publishing, vol. 7, no. 1
doi : http://dx.doi.org/10.3998/3336451.0007.104
●
2008 : 25 à 30% du web indexé
Pisani Francis et Piotet Dominique. Comment le web change le monde :
l'alchimie des multitudes. Editions Pearson, 2008 (ISBN 978-2-7440-6261-2)
http://www.worldwidewebsize.com/
24
Web surfaçique / opaque / profond
●
2001 : 1% du web indexé
Michael K. Bergman. 2001. The Deep Web: Surfacing Hidden Value . The
journal of electronic publishing, vol. 7, no. 1
doi : http://dx.doi.org/10.3998/3336451.0007.104
●
2008 : 25 à 30% du web indexé
Pisani Francis et Piotet Dominique. Comment le web change le monde :
l'alchimie des multitudes. Editions Pearson, 2008 (ISBN 978-2-7440-6261-2)
http://www.worldwidewebsize.com/
25
Web surfaçique
●
Web surfacique est la partie du World Wide
Web qui est accessible en ligne et indexable
par les robots d'indexation des moteurs de
recherche généralistes
Web opaque
●
Web qui pourrait être indexé mais qui ne l'est
pas
Web profond
●
Types de fichiers spécifiques
●
sites non indexés
●
contenu à accès limité
●
contenu non lié
●
contenu dynamique (contenu généré suite au
remplissage de formulaire)
26
27
Web de surface
Web opaque
Web profond
Schématisation du web
●
Web social : wikis, blogs, forums...
●
Web institutionnel
●
Web entreprise
●
Web juridique, réglementaire
●
Web profond/opaque
Web social
Web insitutionnel
Web entreprise
Web juridique/réglementaire
Web scientifique et technique
Web profond
bibliothèques, archives ouvertes, bases bibliographiques, autres...
28
30
Les moteurs de recherche
●
définition
●
Les opérateurs
●
Métamoteurs
●
Moteurs de recherche « généralistes »
●
Moteurs de recherche « sémantiques »
●
Moteurs de recherche de blog
●
Moteurs de recherche d'images
●
Moteurs de recherche de vidéos
●
Moteurs de recherche spécialisés
31
Les moteurs de recherche
●
Définition :
●
ensemble de programmes informatiques permettant
de retrouver des ressources (pages web, forums
Usenet, images, vidéos etc...) associées à des
mots quelconques.
(source: SARL CLEVACTI http://www.techno-science.net/?onglet=glossaire&definition=342, consulté le 20/08/2009)
●
Fonctionnement :
●
●
consiste à parcourir des URLs de départ et
continuer de proche en proche afin de parcourir un
maximum d'informations diverses (fichiers, liens...)
grâce à des robots (=spiders)
Exemple avec la constitution de fichiers inverses
Exemple de fichiers inverses
Titre : Page 1
Texte : Tintin,
milou, Capitaine
Haddock
Titre : Page 2
Titre : Page 3
Texte : Tintin
Texte : Milou
URL2
URL3
URL1
Constitution des indexes :
Tintin :
Page 1/URL1
Page 2/URL2
Milou :
Page 1/URL1
Page 3/URL3
Robot
Algorythme de
pondération
Capitaine Haddock :
Page1/URL1
Interface de
recherche
Requête :
Affiche les pages qui
mentionnent « Milou »
Page 1
URL1
Page 3
URL 3
32
33
Les opérateurs
●
Opérateurs booléens pour les moteurs de
recherche du web (Ask, Yahoo!, Bing, Exalead,
Google...) :
Inclusion : +
A
B
A+B
Exclusion : -
A
B
B-A
●
●
●
Expression exacte : « »
Troncature : * (0 à n caractères après
l'occurence)
Autres (cf. tableau ci-dessous)
34
Les opérateurs
●
Opérateurs boobléens pour les moteurs de
recherche de bases spécialisées (ex : Scopus) :
OU : OR
Inclusion : AND
Exclusion : NOT (AND NOT)
35
Exemple de syntaxe complémentaire
Ask
Expression
exacte
“ ”
Exclusion
Joker
*
OU
OR
Intervalle de
date ou de
nombres
last:,
afterdate:,
beforedate:,
betweendate
Format de
fichier
filetype :
Dans la
page de titre
intitle:
Dans le
corps de la
page
Yahoo!
Bing
Exalead
Google
“ ”
“ ”
“ ”
“ ”
-
-
- ou NOT
-
*
*
*
OR
OR
OR
OR
after: et
before:
intitle:
filetype:
filetype:
filetype: ou
ext:
intitle:
intitle:
intitle:
ou allintitle:
inbody:
intext:
ou allintext:
36
Dans
l'adresse
URL
inurl:
inurl:
inurl:
inanchor:
Dans les
liens de la
page
Dans le site
site:
site:
ou domain:
ou
hostname:
Lien vers
inlink:
link:
ou
linkdomain:
site:
inurl:
ou allinurl:
site:
inanchor:
ou
allinanchor:
site:
link:
link:
Pages
apparentées
related:
Cache
cache:
●
http://www.faganfinder.com/google2.html
Source : Anderruthy, J.-N. 2009, Techniques de veille et e-réputation. St Herblain : Editions ENI, Collections Objectif
Solutions, 355p. ISBN 978-2-7460-4928-4
37
Les métamoteurs
Source : Wikimedia commons
38
●
●
Envoie des requêtes sur plusieurs moteurs de
recherche et synthétise les réponses
Exemples
●
Refseek : http://www.refseek.com
(ressources anglophones pour étudiants, chercheurs...)
●
Dogpile : http://www.dogpile.com
(compile les résultats de Google, Yahoo!, et Yandex)
●
Kartoo : http://fr.kartoo.com/
39
Les Métamoteurs sociaux
●
●
Spécialisation dans les réseaux sociaux et
forums
Exemples
●
WhosTalkin : http://www.whostalkin.com
●
Samepoint : http://www.samepoint.com
40
Réseaux sociaux professionnels
●
Viadeo : http://www.viadeo.com
●
Linkedin : http://www.linkedin.com
41
Moteurs dits « sémantiques »
●
Powerset : http://www.powerset.com
(Rachat par microsoft)
●
Iseek : http://www.iseek.com
●
Wolfram Alpha : http://www.wolframalpha.com/
42
Moteurs de recherche de blogs
●
Technorati : http://technorati.com
●
Twingly : http://www.twingly.com/search
●
Keyblog : http://www.keyblog.fr/
●
Meltwater Ice rocket : http://www.icerocket.com
Moteurs de recherche d'images
●
TinEye : http://tineye.com
●
Flickr : http://www.flickr.com
●
Google images : http://images.google.com
Moteurs de recherche de vidéos
●
Google vidéo : http://video.google.com
●
Youtube : http://www.youtube.com
●
Dailymotion : http://www.dailymotion.com
●
http://voxaleadnews.labs.exalead.com : trouver
du texte dans les vidéos, sons
43
Les archives ouvertes
• Années 90 : Associations maladies orpheline, chercheurs
(physiciens), congrès américain s'opposent aux éditeurs
• février 2002 : initiative de Budapest pour l’accès ouvert
(BOAI), avec deux solutions pour la mise en ligne libre et sans
restriction des résultats de la recherche : l’auto-archivage et les
revues alternatives.
• octobre 2003 : la Déclaration de Berlin étend le modèle du
libre accès à l’ensemble des résultats de la recherche, telles que
les données brutes.
• mars 2006, protocole d’accord pour la recherche française
44
45
Les archives ouvertes
●
Recherche française : HAL (Hyper Articles en
Ligne)
http://hal.archives-ouvertes.fr/
●
D'instituts en particulier
http://prodinra.inra.fr/
●
OAIster : http://www.oaister.org/
●
Scholar Google : http://scholar.google.fr/
46
Les bases de données spécialisées
●
Web of science
●
SCOPUS
●
INSPEC
●
Ressources de votre bibliothèque universitaire :
●
http://bu.univ-lorraine.fr/ressources/ressources-en-li
Système Universitaire de
DOCumentation, Catalogues de
bibliothèques et bibliothèques
électroniques
●
SUDOC : http://www.sudoc.abes.fr
●
Gallica : http://gallica.bnf.fr/
●
Europeana : http://www.europeana.eu/portal/
●
Bibliothèque d'Alexandrie :
http://www.bibalex.org
47
Supports ou sources d'information
électronique
●
Supports/sources dits « lents »
●
Supports/sources du web « rapide »
48
49
Supports rapides
●
Billets de blog
●
Wikis
●
Forums
●
CMS (Content Management System)
Avantage :
●
publication instantanée
50
Inconvénient des sources dites rapides :
Validité et pertinence de l'information ?
Qui, quand, quoi ?
●
effet de buzz
●
Lobbying facile
●
Identification des sources et des auteurs
51
Supports électroniques « lents »
●
Savoir « encyclopédique »
●
Exemples :
●
encyclopédies généralistes :
–
–
Encyclopaedia universalis
Techniques de l'ingénieur
●
Livres
●
Articles scientifiques ou technique
Délais de
publication
L'édition scientifique et technique
support lent
●
Article scientifique
●
Actes de congrès
●
Thèse
●
Livre
Inconvénient : lenteur du cycle d'édition (1 mois
à 2 an)
Internet permet d'accélérer l'étape d'édition
Avantages : information validée par les pairs
citation des sources
52
53
Received: 5 June 2008
Accepted:24 April 2009
Published: 24 April 2009
54
●
●
Complémentarité des supports en fonction des
informations que l'on souhaite identifier
Complémentarité des outils et des moteurs de
recherche
La norme
Une norme est un document qui définit des
exigences, des spécifications, des lignes
directrices ou des caractéristiques à utiliser
systématiquement pour assurer l'aptitude à
l'emploi des matériaux, produits, processus et
services.
pas obligatoire sauf pour celles qui le sont
rendues par un texte réglementaire ou décret de
loi.
●
AFNOR : http://www.afnor.fr
●
ISO : http://www.iso.org
Source ISO
55
56
●
●
●
ISO. Cosmétiques -- Microbiologie -- Lignes
directrices pour l'appréciation du risque et
l'identification de produits à faible risque
microbiologique. ISO 29621 2010, Genève :
ISO, 18 p.
AFNOR. Cosmétiques -- Microbiologie -- Lignes
directrices pour l'appréciation du risque et
l'identification de produits à faible risque
microbiologique. NF EN ISO 29621 2011,
Paris : AFNOR, 18 p.
Normes expérimentales XP (5 ans maximum)
57
Le brevet
Le brevet protège une innovation technique,
c'est-à-dire un produit ou un procédé qui
apporte une solution technique à un problème
technique donné. L'invention pour laquelle un
brevet pourra être obtenu, en France, auprès
de l'Institut national de la propriété industrielle
(INPI) doit également être nouvelle, impliquer
une activité inventive et être susceptible
d'application industrielle.
Source INPI
58
Le brevet
●
Protection sur la durée (20 à 25 ans)
●
Protection géographique
●
WIPO (World intellectual property organization)
http://patentscope.wipo.int/search/fr/search.jsf
●
EPO (European patent organization)
http://www.epo.org/
●
INPI (Institut national de la propriété indutrielle)
http://www.inpi.fr
http://fr.espacenet.com/quickSearch?locale=fr_FR
59
La marque
Au sens de la propriété industrielle, la marque
est un « signe » permettant de distinguer
précisément les produits ou prestations de
services d'une entreprise de ceux de ses
concurrents. Le signe peut être un mot, un
nom, un slogan, un logo, un dessin, etc. ou la
combinaison de ces différents éléments.
http://bases-marques.inpi.fr/
Source INPI
60
Entreprises
●
INSEE
http://www.sirene.fr
●
Annuaire d'entreprise :
http://www.kompass.com
●
Annuaire de réseau / association
●
Sites web
●
Rapports annuels
●
Bilans comptables
http://www.anafinance.com/
61
Les affiliations
62
Les affiliations
●
Servent aux classements internationaux des
établissement
Forte tendance à la normalisation
●
Servent à repérer les laboratoires, entreprises...
qui font de la recherche/développement dans
votre activité et les concurrents potentiels
63
Les citations, la bibliographie
●
Cf document joint :
●
Guide de gestion des réfèrences bibliographiques
●
Zotero
64
Instructions aux auteurs
●
Destiné surtout à la publication dans les
périodiques
●
Diffère selon les revues
●
Motif de rejets de publication
65
Recherche du vocabulaire
●
Utiliser les indexes des bases bibliographiques
●
Thésaurus
●
Mots-clés d'auteurs
●
Dictionnaires spécialisés
●
Modules de traduction
66
En savoir plus...
●
●
Anderruthy, Jean-Noël. 2009. Techniques de
veille et e-réputation - Comment exploiter les
outils Internet ? St Herblain : Editions ENI.
collection Objectif Solutions, 355p. ISBN 9782746049284
Gilles, Balmisse, et Denis Meingan. 2008. La
Veille 2.0 et ses Outils. Paris : Hermes Science
Publications, collection Management et
informatique, 230p. ISBN 978-2746219298