Décryptages et Tendances 2010`s - search

Transcription

Décryptages et Tendances 2010`s - search
Décryptages
et Tendances
2010’s
Et les entreprises
qu’attendent-elles ?
■
Comment évoluent leurs
besoins ?
■
■
Q&A
Renaud Finaz de Villaine
06 64 00 46 35
[email protected]
Problématiques à résoudre pour 2010
■ Augmentation
du volume de données & d’informations interne comme
externe à l’entreprise
■ Apparition de nouvelles technologies :
- Liées aux Web 2.0 / web 3.0
- Recherche & visualisation des données structurées et non structurées
■ Faciliter
l’introduction des SBA (Search based Applications) dans le SI
d’entreprise
■ Continuer à augmenter la réactivité et l’agilité des entreprises en ne
sacrifiant pas à la performance et la rapidité des nouvelles solutions de
BI Web 2.0
■ Trouver « la glue intelligente » entre les différentes applications
critiques des entreprises (BI, CRM, ERP, ECM, PLM, …)
2
Et d’autre part…
■ Problème
dans l’entreprise de recherche te de veille sur internet
- Google en France + 90% de part de marché!!
■ Plus
de 36% des recherches sur internet sont infructueuses
■ Méconnaissance de :
- Des sources pertinentes sur internet
- La e-réputation
- De l’offre des outils de recherche et de veille
■ Outils
personnels utilisés inadaptés par rapport à leur besoin de veille
3
Parts de trafic des moteurs de recherche en France Oct.09
Octobre 2009. Source : At Internet Institute
4
Top 5 des moteur d recherche en part de visite Web 8/09
5
Comparaison de Moteurs
Les 100 cercles représentent les 100 premières pages identiques
Les cercles sont vides lorsque la page a été identifiée par un seul des outils et
plein lorsque la page figure dans les résultats des deux moteurs, on peut donc
comparer le classement de la page sur les deux outils.
18 mars 2009
8
L’Explosion de l’Information
2015: 280Md
2010: 130Md
2006: 68Md
2004: 48Md
2003: 24Md
Cave paintings,
Bone tools 40,000 BCE
Writing 3500 BCE
2002: 12Md
0 C.E.
Paper 105
2001: 6Md
Printing 1450
Electricity, Telephone 1870
Computing 1950
Internet (DARPA) Late 1960s
The Web 1993
1999
GIGABYTES
Transistor 1947
GIGABYTES
2001: 3Md
Source: UC Berkeley, School of Information Management and Systems
• Croissance de l’Information = 1%
par semaine
• Mais pas la capacité à la digérer!!
2008: 98Md
9
Mapping du Cyberespase 2010
Réseaux
Sociaux
Blogs
World Wide Web
Google
Altavista
Excite
HotBot
Infoseek
Lycos
NorthenLight
Yahoo
Webcrawler
Gopher
Veronica
FTP
Archie
Mondes
Virtuels
Telnet
Wais
E-mail
http://people.yahoo.com/
www.bigyellow.com/
www.Bigfootcom
Whowhere.lycos.com
Netscape
Usenet (Newsgroup)
Altavista
Excite
Infoseek/go.com
Dejanews/
http://groups.google.com/
Jammed
Mailing Lists
Jammed
Reference
Services en ligne
Bases de Données
Réseaux de BBS
Extranets
Autres réseaux
Quel évolution pour le web ?
11
L’Explosion de l’Information via les applications
Réseaux
Sociaux
Portails
Collaboratif
ECM/GED
CRM
Bases
de données
Systèmes
transactionnels
1990
Portails
Emails
1995
+100% par an
Business
Intelligence
14 Applications
2005
2010
ERP
2000
Source Gartner + Sinequa
L’apport des Réseaux Sociaux
13
14 Applications en moyenne dans l’entreprise
Bases de
données
ECM
Archives
& Back-up
Intranets
CRM
ERP
Email
Archives
email
Environ 5 heures
perdues par semaine
Baisse de l’efficacité
opérationnelle
Corp
Web site
Portails
collaboratifs
Répertoires
Réseaux
ECM
Métier
BI analytics
& Reporting
Veille
Concurrentielle
Site web
eBusiness
extranet
Annuaires
Social Network
Source Gartner + IDC
Panorama des applications générateurs d’Information
Volume
Bases de
données
ECM
Archives
& Back-up
CRM
ERP
Email
Archives email
MDM
Portails
collaboratifs
Annuaires
Social Network
ECM
Métier
Répertoires
Réseaux
Site web
Intranets
eBusiness
extranet
BI analytics
& Reporting
Veille
Concurrentielle
Corp
Web site
Taille = niveau de
désorganisation
Données critiques
Source Gartner + IDC
Domaines d’utilisation du Search en 2010
-
Intranet search
Web search
Call centers
enterprise applications BI, ERP
and CRM
eDiscovery and litigation
support applications
Compliance applications
Predictive analytics
Product early warning
applications
Ecommerce applications
-
Publishing applications
Rich media search
Web advertising platforms
Recommendation engines
Reputation and opinion
monitoring applications
Social media applications
Fraud detection applications
Border security applications
Spam detection applications
2010 : La fin de l’hégémonie des Bases de Données
Relationnelles
■ Avant
2010 tout le SI tournait autour des bases de données
relationnelles et des applications en silos (CRM, ERP, SCM, GED,
applications métiers, messagerie, archivage…)
■ Un nouveau défi pour l’entreprise gérer le nouveau flux d’information
semi ou non structurée qui aujourd’hui contient autant de valeur ajoutée
(sinon plus) pour l’utilisateur
■ Un nouveau concept le SBA (Search Based Application)
- Conçues sur la base de technologies de type Index et Web, les SBAs offrent
aux entreprises les moyens de concevoir rapidement des services d’accès à
l’information innovants pour leurs collaborateurs, leurs clients et leur
partenaires sans bouleverser les architectures en place.
- Il s’agit donc de construire des applications qui vont reposer non plus sur
une base de données mais sur l’index d’un moteur de recherche. Les
écrans de l’application se basant sur un index sont à créer from scratch, en
fonction du besoin métier (BI, CRM, …) auquel on souhaite répondre
17
Avantages des applications SBA
■ Ce
re-positionnement des technologies d’indexation dans le périmètre
du système d’information permet :
- des projets rapides, les temps de mise en œuvre sont fortement réduits ;
- des coûts beaucoup plus intéressants que ceux qu’induisent la mise en
place de progiciels ou de développements spécifiques autour d’une nouvelle
base de données;
- une orientation sur l’utilisateur avec des principes d’utilisation calqués sur
les applications web.
18
Exemple de SBA (portail décisionnel étendu)
Zone de recherche « langage
naturel » Exalead
Composant outil BI
Fonctions de recherche basées
sur des sources internes
inexploitées
Zone de
paramètres
personnalisés
Indicateurs construits par le
moteur de recherche Exalead et
consolidés par un outil de BI
Exploitation des
données structurées
Associations par des
fonction classiques de
recherche
Les Moteurs de Recherche 2010
eDiscovery
YouTube
Trendalyzer
Teracent
Google
Neven Vision
DoubleClick
Gizmo5 (30M$)
AppJet
AdMob (750M$)
Aardvark 50M$
Maktoob Kelkoo
Geocities
The
Tops 3
Actonomy
Kaseon/EMC
Rocommind
Microsoft
Autonomy/ZantaZ
Fast Search & Transfer (800M€) Iron Mountain/ Stratify
Powerset (100M$)
Bing
E-Reputation
AMI
Opinion Tracker
Right
Media
Zimbra
Digimind Tracker
(680M$)
Les SBAs Spotter
YahooIndexTools
Broadcast.com
Visualisation
Kartoo (2001)
Exalead (Fr)
Autonomy (US)
ClaraBridge (US)
ZyLAB (US)
Recommind (US)
Ixxo (2002)
LexisNexis
Zylab
Moteurs Moteurs
de Veillede Recherche
d’entreprise
Digimind (98)
Ami Software (99)
Arisem 96)
Qwam (2003)
Pikko (2002)
Miner3D
KB Crawl
Inxight/SAP
Mapinfo CMS, GED
Neotia
Text Mining
Performance Alfresco (Lucene)
Map
Knowings
Acetic
Panopticon
Grimmersoft
Ever Team EMC
Lingway (Lucene 01)
Open Text Novadys
Temis
DIP Systemes
Nstein.com Ca
Autonomy US
Attivio (Lucene )US
Antidot (99) Endeca US
E-commerce Coveo US
Exalead (2000)
Sinequa
Lucene (Open Source)
Iscope (2000) Pertimm (97)
PolySpot (2001)
LuceneSource)
Carrot ² (Open
Spotter
Vivisimo US
21
Les Moteurs de Recherche : Une Bataille Mondiale !!!
■ Pour
lancer Google
- plus de 1 000 Millions $ d’investissement
- Budget Marketing > 200 M$ /an
■ Google
en 2008 :
- ± 90 % de parts de marché en France
- ± 60 % de parts de marché aux Etats-Unis
- ± 19 milliards de requêtes en mars 2008 en Europe (79%)
- CA : 1T08 : +5 milliards de $
- Résultat : 1T08 : 1,3 milliard de $
■ Stratégie de Google : diversification « à tout va »
- lancement de produits et services concernant : la recherche d’images,
d’actualités, de vidéos, de blogs…, la création de blogs et la lecture de
fils RSS, les images satellites de la Terre et du ciel, la numérisation
des livres, les moteurs personnalisables, la traduction, les services
mail, la littérature scientifique, les photos, les téléphones portables…
22
Quelques Sociétés rachetées par Google entre 07 & 2010 !
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
AppJet , novembre 2009 : traitement de texte collaboratif en ligne
Teracent , novembre 2009 : outil d'optimisation de bannières publicitaires
AdMob, novembre 2009 : régie publicitaire spécialisée pour les mobiles
Gizmo5, novembre 2009
TextCube, Septembre 2008 : logiciel de gestion de blogs et outils communautaires, à installer sur un
site
Omnisio, Juillet 2008 : outils d'annotations de vidéos, de synchronisation avec des slides, etc. pour
YouTube
ZAO Begun, Juillet 2008
Jaiku, Octobre 2007 : micro-blogging
Zingku, Octobre 2007 : outil de networking pour mobile
Image America, Juillet 2007
Postini, Juillet 2007
GrandCentral, Juillet 2007
Zenter, Juin 2007 : outil de gestion de présentation en ligne
FeedBurner, Mai 2007 : Le spécialiste des flux RSS et Atom
PeakStream, Mai 2007 : Experts en programmation multicoeur
Panoramio, Mai 2007 : Ce service permet aux utilisateurs de créer leur propre carte du monde avec
jusqu'à 2 gigas de photos, ou encore de tracer des itinéraires et les partager, via Google Earth et
Google Maps.
Greenborder, Mai 2007 : Editeur d'un logiciel anti-virus
Marratech (site, annonce), Avril 2007 : logiciel de vidéo conférence par Internet (seul le logiciel est
23
racheté, pas la société)
Sur la période 2005 / 2007
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
■
Tonic Systems (annonce), Avril 2007 : logiciel de création de diaporamas
DoubleClick, Avril 2007 : régie publicitaire (le rachat doit encore être validé par la FTC américaine)
Trendalyzer (logiciel de Gapminder) (site, annonce), Mars 2007 : logiciel de visualisation de données
AdscapeMedia, Mars 2007 : publicité dans les jeux vidéo en ligne
Endoxon (site, annonce) : éditeur de logiciels de cartographie sur Internet et téléphone mobile
YouTube (site, blog, communiqué), Octobre 2006 : service de partage et visionnage de clips vidéo
Neven Vision : société spécialisée dans la reconnaissance d'images (notamment de visages)
Reqwireless, Juillet 2006
2Web Technologies, Juin 2006 : société ayant développé la technologie XL2Web utilisée ensuite par
Google pour son tableur en ligne
Orion : algorithme inventé par Ori Allon
@Last Software (site, communiqué), Mars 2006 : éditeur de SketchUp, un logiciel de modélisation 3D
Writely (site, blog), Mars 2006 : Traitement de texte collaboratif en ligne
Upstartle, Mars 2006
Measure Map (site, article), Février 2006 : Outil de statistiques pour les blogs
dMarc Broadcasting (site, communiqué), Janvier 2006 : régie publicitaire pour les radios
AllPay, Décembre 2005
BruNET, Décembre 2005
Phatbits, Décembre 2005
Skia, Novembre 2005
Android (site), Août 2005 : développement de logiciels pour téléphones mobiles
Akwan Information Technologies (site, communiqué), Juillet 2005
24
Dodgeball, mai 2005 : logiciel pour réseaux sociaux adapté aux téléphones mobiles, utilisé dans
Google Mobile.
Sur la période 2001 / 2004
■
■
■
■
■
■
■
■
■
■
■
■
■
■
Urchin Software (site, communiqué), Mars 2005 : analyse du trafic d'un site web. Urchin a été
rebaptisé Google Analytics.
Zipdash, décembre 2004 : Aide à la navigation routière, avec guidage par GPS, via téléphone mobile,
en temps réel.
Where 2 Technologies, Octobre 2004 : systèmes cartographiques sur Internet (utilisés depuis dans
Google Maps).
Keyhole (site, communiqué), octobre 2004 : logiciel de cartes satellites, désormais Google Earth.
Picasa (site, communiqué), juillet 2004 : logiciel de gestion de photos numériques
Ignite Logic , Mai 2004
Genius Labs (communiqué), Octobre 2003 (ex Biz Stone)
Sprinks (article), Octobre 2003 : système de liens sponsorisés de Primedia
Kaltix (communiqué), Septembre 2003 : recherche personnalisée (faite par les chercheurs Taher
Haveliwala, Glen Jeh, et Sepandar Kamvar). Ces chercheurs ont également participé à améliorer la
vitesse de calcul du PageRank.
Applied Semantics (site, communiqué), avril 2003 : publicité contextuelle à la base de AdSense (et
AdWords ?)
Neotonic Software, Avril 2003 : système de support technique par email
Pyra Labs (site), Février 2003 : créateur de Blogger.
Outride (communiqué), Septembre 2001 : analyse sémantique et data mining (issu de Xerox PARC)
Deja News (site, communiqué), Février 2001 : archives des newsgroups ; désormais Google G
25
Aujourd’hui en 2008…..Une explosion dans les moteurs !
■ Plus
-
de 4 500 moteurs dans le monde
B to B
B to C
Verticaux par marchés (banques, assurances, labos pharma,
distribution, immobilier…..)
Par Pays
Par Langue (Baidu, Alibaba moteurs chinois débarquent en Europe!)
Par Produits
Par sources (web, forums, blogs, wikis…)
Pour Son, image, vidéo
…..
26
Les Nouveaux Moteurs de Recherche
cooliris
28
29
30
Search Cube
Searchcube est très
certainement aujourd'hui le
moteur le plus abouti dans sa
présentation en trois dimensions
des résultats de ses recherches.
A la manière d'un Rubik's Cube,
les parois du cube affichent les
pages issues de la requête. On
peut les faire pivoter
dans n'importe quel sens en
utilisant les flèches clavier ou
par un Shift+Clic prolongé.
http://www.search-cube.com/
Searchcube utilise l'API Google
Ajax Search, kit de
développement permettant
d'interroger directement la base
de données de Google. Le rendu
3D est quant à lui généré
par la librairie Open Source
31
Sandy 3D Engine.
L'innovation au coeur du moteur de recherche de demain
Des acteurs proposent déjà une
solution de recherche alternative et
innovante. Parmi ces start-up figurent
Mahalo, Cuill, Wikia, Hakia, Blekko ou
encore Powerset.
Des entreprises remarquées dans le
monde fermé des moteurs. Exalead et
Sinequa représentent la France en
proposant des options originales.
Parmi ces créateurs, deux modèles se
distinguent : ceux qui fournissent une
solution d'automatisation, comme Cuill
ou Blekko et ceux qui se basent sur
les facteurs humains, dont font partie
Mahalo et Wikia.
32
33
34
35
36
37
Copmment Blackle économise l’énergie?
Blackle was created by Heap Media to remind us all
of the need to take small steps in our everyday lives
to save energy. Blackle searches are powered by
Google Custom Search.
Blackle saves energy because the screen is
predominantly black. "Image displayed is primarily
a function of the user's color settings and desktop
graphics, as well as the color and size of open
application windows; a given monitor requires
more power to display a white (or light) screen than
a black (or dark) screen." Roberson et al, 2002
In January 2007 a blog post titled Black Google
Would Save 750 Megawatt-hours a Year proposed
the theory that a black version of the Google search
engine would save a fair bit of energy due to the
popularity of the search engine. Since then there
has been skepticism about the significance of the
energy savings that can be achieved and the cost in
terms of readability of black web pages.
We believe that there is value in the concept
because even if the energy savings are small, they
all add up. Secondly we feel that seeing Blackle
every time we load our web browser reminds us
that we need to keep taking small steps to save
energy.
38
39
40
41
42
TinEye
Le moteur de recherche
inversée TinEye a de quoi
surprendre. A la place d'une
recherche traditionnelle, il
trouve à partir d'une image les
sites Internet où celle-ci se
trouve (sa base est composée
de 500 millions d'images).
L'algorithme se base sur
l'analyse des pixels pour
identifier les caractéristiques
d'une image. Cela permet au
moteur de retrouver une image
même si ses couleurs sont
altérées ou si elle a été rognée.
43
Dit : ça ressemble à quoi le Futur ?
■http://www.ted.com/talks/view/id/481
44
Merci
Questions / réponses
www.micropole-univers.com