KB Crawl

Transcription

KB Crawl
Solutions de veille sur Internet
KB CRAWL
Séminaire DIXIT du GFII, veille & innovation
De la compétitive intelligence à la
business intelligence : quand la
donnée se fait discrète…
Mercredi 12 mars 2014
Bruno Etienne, Président-Fondateur de KB Crawl
La discrète
De la compétitive intelligence à la business intelligence :
quand la donnée se fait discrète…
Définition de la discrétisation
Opération consistant à
remplacer des relations portant
sur des fonctions continues,
dérivables, etc., par un nombre
fini de relations algébriques
portant sur les valeurs prises
par ces fonctions en un nombre
fini de points de leur ensemble
de définition.
(Larousse)
Avant d’aller plus loin,
la Business Intelligence, pour quoi faire ?
« Ce qui ne se mesure pas n’existe pas »
(Niels Bohr, théoricien de la physique quantique, prix Nobel en 1922)
« L'information n'est pas le savoir »
(Albert Einstein, illustre tireur de langue)
 C’est le savoir qui améliore la prise de décision et favorise le progrès.
 L'information n'est que la matière première, il faut qu’elle soit
exploitable.
 Nous sommes noyés sous des déluges d'information…
L'Union Européenne consacre chaque année un budget d'environ 100 millions d'euros à
Eurostat, l'organisme de statistique, la France consacre 400 millions au budget de l'INSEE.
(sources étude Les Echos 2011)
 Sommes-nous capables d'exploiter les informations produites ?
 Et où pouvons-nous les trouver ?
Sources
Une source infinie (ou presque) : le web visible et invisible.


Avec des données de type flux (réseaux sociaux) de plus en plus volumineux
Des sites web de mieux en mieux structurés
Traitement des flux
ou des volumes de médias important
 Le text-mining statistique ou sémantique
 Le TAL (traitement automatique des langues) à beaucoup progressé
en 20 ans
 Le big-data se dote d’outils d’analyse et d’uniformisation de données
hybrides
 La finalité : discrétiser l’information pour en obtenir des concepts,
des groupes nominaux (sociétés, personnes, lieu, date,…) liés en eux
et propices à la BI (Business Intelligence)
 Par extension, détermination de modèles comportementaux
Une autre piste
Exploiter la structuration des sites
« La forme, c’est le fond qui remonte à la surface »
(Victor Hugo, 1802-1885, prosateur romantique à succès)
Et avec les technologies de publication, les sites sont de plus en plus
« rigoureusement » structurés et font remonter à la surface :
 Le web invisible et ses données sous-jacentes.
 Une valorisation des contenus : un titre à plus de poids qu’un soustitre… Identifier l’auteur une information importante, isoler un prix
constitue une mine d’information…
Principe : profiter de cette structuration très
« mécanique » pour lui donner toute sa valeur (et
éventuellement la pondérer pour une démarche
de text-mining ultérieure).
L’apport de KB Crawl
Avec KB Crawl Suite, l’utilisateur (documentaliste, veilleur, décisionnaire,
stratégiste,…) dispose d’outils et de services pour mettre en œuvre toute
la chaine de traitement de l’information.
La version 6 présente des évolutions majeures et permet à l’utilisateur de
s’assurer de la qualité de la collecte de l’information.
Comment ?
Comment ?
Exemple de livrable
Et le bon sens dans tout cela ?
Gérer ce qui ne se mesure pas…
 Identification du besoin
 Détermination des indicateurs pertinents
Pour paraphraser Robert Kaplan (concepteur du Balanced Scorecard), avant de monter dans
l'avion la prochaine fois, demandez-vous si par hasard le cockpit n'aurait pas été conçu par
un financier, c'est-à-dire avec pour seul indicateur l'heure prévue d'arrivée à destination (sans
information sur le carburant, l'altitude, la circulation des avions à proximité etc.) ou par un
informaticien adepte du BI, c'est-à-dire avec tellement d'indicateurs que le pilote n'aura assez
de la durée du vol pour en prendre connaissance.
 L’humain reste au centre du processus de décision
Je vous remercie de votre attention.
KB Crawl
www.kbcrawl.com
[email protected]