Décryptages et Tendances 2010`s - search
Transcription
Décryptages et Tendances 2010`s - search
Décryptages et Tendances 2010’s Et les entreprises qu’attendent-elles ? ■ Comment évoluent leurs besoins ? ■ ■ Q&A Renaud Finaz de Villaine 06 64 00 46 35 [email protected] Problématiques à résoudre pour 2010 ■ Augmentation du volume de données & d’informations interne comme externe à l’entreprise ■ Apparition de nouvelles technologies : - Liées aux Web 2.0 / web 3.0 - Recherche & visualisation des données structurées et non structurées ■ Faciliter l’introduction des SBA (Search based Applications) dans le SI d’entreprise ■ Continuer à augmenter la réactivité et l’agilité des entreprises en ne sacrifiant pas à la performance et la rapidité des nouvelles solutions de BI Web 2.0 ■ Trouver « la glue intelligente » entre les différentes applications critiques des entreprises (BI, CRM, ERP, ECM, PLM, …) 2 Et d’autre part… ■ Problème dans l’entreprise de recherche te de veille sur internet - Google en France + 90% de part de marché!! ■ Plus de 36% des recherches sur internet sont infructueuses ■ Méconnaissance de : - Des sources pertinentes sur internet - La e-réputation - De l’offre des outils de recherche et de veille ■ Outils personnels utilisés inadaptés par rapport à leur besoin de veille 3 Parts de trafic des moteurs de recherche en France Oct.09 Octobre 2009. Source : At Internet Institute 4 Top 5 des moteur d recherche en part de visite Web 8/09 5 Comparaison de Moteurs Les 100 cercles représentent les 100 premières pages identiques Les cercles sont vides lorsque la page a été identifiée par un seul des outils et plein lorsque la page figure dans les résultats des deux moteurs, on peut donc comparer le classement de la page sur les deux outils. 18 mars 2009 8 L’Explosion de l’Information 2015: 280Md 2010: 130Md 2006: 68Md 2004: 48Md 2003: 24Md Cave paintings, Bone tools 40,000 BCE Writing 3500 BCE 2002: 12Md 0 C.E. Paper 105 2001: 6Md Printing 1450 Electricity, Telephone 1870 Computing 1950 Internet (DARPA) Late 1960s The Web 1993 1999 GIGABYTES Transistor 1947 GIGABYTES 2001: 3Md Source: UC Berkeley, School of Information Management and Systems • Croissance de l’Information = 1% par semaine • Mais pas la capacité à la digérer!! 2008: 98Md 9 Mapping du Cyberespase 2010 Réseaux Sociaux Blogs World Wide Web Google Altavista Excite HotBot Infoseek Lycos NorthenLight Yahoo Webcrawler Gopher Veronica FTP Archie Mondes Virtuels Telnet Wais E-mail http://people.yahoo.com/ www.bigyellow.com/ www.Bigfootcom Whowhere.lycos.com Netscape Usenet (Newsgroup) Altavista Excite Infoseek/go.com Dejanews/ http://groups.google.com/ Jammed Mailing Lists Jammed Reference Services en ligne Bases de Données Réseaux de BBS Extranets Autres réseaux Quel évolution pour le web ? 11 L’Explosion de l’Information via les applications Réseaux Sociaux Portails Collaboratif ECM/GED CRM Bases de données Systèmes transactionnels 1990 Portails Emails 1995 +100% par an Business Intelligence 14 Applications 2005 2010 ERP 2000 Source Gartner + Sinequa L’apport des Réseaux Sociaux 13 14 Applications en moyenne dans l’entreprise Bases de données ECM Archives & Back-up Intranets CRM ERP Email Archives email Environ 5 heures perdues par semaine Baisse de l’efficacité opérationnelle Corp Web site Portails collaboratifs Répertoires Réseaux ECM Métier BI analytics & Reporting Veille Concurrentielle Site web eBusiness extranet Annuaires Social Network Source Gartner + IDC Panorama des applications générateurs d’Information Volume Bases de données ECM Archives & Back-up CRM ERP Email Archives email MDM Portails collaboratifs Annuaires Social Network ECM Métier Répertoires Réseaux Site web Intranets eBusiness extranet BI analytics & Reporting Veille Concurrentielle Corp Web site Taille = niveau de désorganisation Données critiques Source Gartner + IDC Domaines d’utilisation du Search en 2010 - Intranet search Web search Call centers enterprise applications BI, ERP and CRM eDiscovery and litigation support applications Compliance applications Predictive analytics Product early warning applications Ecommerce applications - Publishing applications Rich media search Web advertising platforms Recommendation engines Reputation and opinion monitoring applications Social media applications Fraud detection applications Border security applications Spam detection applications 2010 : La fin de l’hégémonie des Bases de Données Relationnelles ■ Avant 2010 tout le SI tournait autour des bases de données relationnelles et des applications en silos (CRM, ERP, SCM, GED, applications métiers, messagerie, archivage…) ■ Un nouveau défi pour l’entreprise gérer le nouveau flux d’information semi ou non structurée qui aujourd’hui contient autant de valeur ajoutée (sinon plus) pour l’utilisateur ■ Un nouveau concept le SBA (Search Based Application) - Conçues sur la base de technologies de type Index et Web, les SBAs offrent aux entreprises les moyens de concevoir rapidement des services d’accès à l’information innovants pour leurs collaborateurs, leurs clients et leur partenaires sans bouleverser les architectures en place. - Il s’agit donc de construire des applications qui vont reposer non plus sur une base de données mais sur l’index d’un moteur de recherche. Les écrans de l’application se basant sur un index sont à créer from scratch, en fonction du besoin métier (BI, CRM, …) auquel on souhaite répondre 17 Avantages des applications SBA ■ Ce re-positionnement des technologies d’indexation dans le périmètre du système d’information permet : - des projets rapides, les temps de mise en œuvre sont fortement réduits ; - des coûts beaucoup plus intéressants que ceux qu’induisent la mise en place de progiciels ou de développements spécifiques autour d’une nouvelle base de données; - une orientation sur l’utilisateur avec des principes d’utilisation calqués sur les applications web. 18 Exemple de SBA (portail décisionnel étendu) Zone de recherche « langage naturel » Exalead Composant outil BI Fonctions de recherche basées sur des sources internes inexploitées Zone de paramètres personnalisés Indicateurs construits par le moteur de recherche Exalead et consolidés par un outil de BI Exploitation des données structurées Associations par des fonction classiques de recherche Les Moteurs de Recherche 2010 eDiscovery YouTube Trendalyzer Teracent Google Neven Vision DoubleClick Gizmo5 (30M$) AppJet AdMob (750M$) Aardvark 50M$ Maktoob Kelkoo Geocities The Tops 3 Actonomy Kaseon/EMC Rocommind Microsoft Autonomy/ZantaZ Fast Search & Transfer (800M€) Iron Mountain/ Stratify Powerset (100M$) Bing E-Reputation AMI Opinion Tracker Right Media Zimbra Digimind Tracker (680M$) Les SBAs Spotter YahooIndexTools Broadcast.com Visualisation Kartoo (2001) Exalead (Fr) Autonomy (US) ClaraBridge (US) ZyLAB (US) Recommind (US) Ixxo (2002) LexisNexis Zylab Moteurs Moteurs de Veillede Recherche d’entreprise Digimind (98) Ami Software (99) Arisem 96) Qwam (2003) Pikko (2002) Miner3D KB Crawl Inxight/SAP Mapinfo CMS, GED Neotia Text Mining Performance Alfresco (Lucene) Map Knowings Acetic Panopticon Grimmersoft Ever Team EMC Lingway (Lucene 01) Open Text Novadys Temis DIP Systemes Nstein.com Ca Autonomy US Attivio (Lucene )US Antidot (99) Endeca US E-commerce Coveo US Exalead (2000) Sinequa Lucene (Open Source) Iscope (2000) Pertimm (97) PolySpot (2001) LuceneSource) Carrot ² (Open Spotter Vivisimo US 21 Les Moteurs de Recherche : Une Bataille Mondiale !!! ■ Pour lancer Google - plus de 1 000 Millions $ d’investissement - Budget Marketing > 200 M$ /an ■ Google en 2008 : - ± 90 % de parts de marché en France - ± 60 % de parts de marché aux Etats-Unis - ± 19 milliards de requêtes en mars 2008 en Europe (79%) - CA : 1T08 : +5 milliards de $ - Résultat : 1T08 : 1,3 milliard de $ ■ Stratégie de Google : diversification « à tout va » - lancement de produits et services concernant : la recherche d’images, d’actualités, de vidéos, de blogs…, la création de blogs et la lecture de fils RSS, les images satellites de la Terre et du ciel, la numérisation des livres, les moteurs personnalisables, la traduction, les services mail, la littérature scientifique, les photos, les téléphones portables… 22 Quelques Sociétés rachetées par Google entre 07 & 2010 ! ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ AppJet , novembre 2009 : traitement de texte collaboratif en ligne Teracent , novembre 2009 : outil d'optimisation de bannières publicitaires AdMob, novembre 2009 : régie publicitaire spécialisée pour les mobiles Gizmo5, novembre 2009 TextCube, Septembre 2008 : logiciel de gestion de blogs et outils communautaires, à installer sur un site Omnisio, Juillet 2008 : outils d'annotations de vidéos, de synchronisation avec des slides, etc. pour YouTube ZAO Begun, Juillet 2008 Jaiku, Octobre 2007 : micro-blogging Zingku, Octobre 2007 : outil de networking pour mobile Image America, Juillet 2007 Postini, Juillet 2007 GrandCentral, Juillet 2007 Zenter, Juin 2007 : outil de gestion de présentation en ligne FeedBurner, Mai 2007 : Le spécialiste des flux RSS et Atom PeakStream, Mai 2007 : Experts en programmation multicoeur Panoramio, Mai 2007 : Ce service permet aux utilisateurs de créer leur propre carte du monde avec jusqu'à 2 gigas de photos, ou encore de tracer des itinéraires et les partager, via Google Earth et Google Maps. Greenborder, Mai 2007 : Editeur d'un logiciel anti-virus Marratech (site, annonce), Avril 2007 : logiciel de vidéo conférence par Internet (seul le logiciel est 23 racheté, pas la société) Sur la période 2005 / 2007 ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Tonic Systems (annonce), Avril 2007 : logiciel de création de diaporamas DoubleClick, Avril 2007 : régie publicitaire (le rachat doit encore être validé par la FTC américaine) Trendalyzer (logiciel de Gapminder) (site, annonce), Mars 2007 : logiciel de visualisation de données AdscapeMedia, Mars 2007 : publicité dans les jeux vidéo en ligne Endoxon (site, annonce) : éditeur de logiciels de cartographie sur Internet et téléphone mobile YouTube (site, blog, communiqué), Octobre 2006 : service de partage et visionnage de clips vidéo Neven Vision : société spécialisée dans la reconnaissance d'images (notamment de visages) Reqwireless, Juillet 2006 2Web Technologies, Juin 2006 : société ayant développé la technologie XL2Web utilisée ensuite par Google pour son tableur en ligne Orion : algorithme inventé par Ori Allon @Last Software (site, communiqué), Mars 2006 : éditeur de SketchUp, un logiciel de modélisation 3D Writely (site, blog), Mars 2006 : Traitement de texte collaboratif en ligne Upstartle, Mars 2006 Measure Map (site, article), Février 2006 : Outil de statistiques pour les blogs dMarc Broadcasting (site, communiqué), Janvier 2006 : régie publicitaire pour les radios AllPay, Décembre 2005 BruNET, Décembre 2005 Phatbits, Décembre 2005 Skia, Novembre 2005 Android (site), Août 2005 : développement de logiciels pour téléphones mobiles Akwan Information Technologies (site, communiqué), Juillet 2005 24 Dodgeball, mai 2005 : logiciel pour réseaux sociaux adapté aux téléphones mobiles, utilisé dans Google Mobile. Sur la période 2001 / 2004 ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Urchin Software (site, communiqué), Mars 2005 : analyse du trafic d'un site web. Urchin a été rebaptisé Google Analytics. Zipdash, décembre 2004 : Aide à la navigation routière, avec guidage par GPS, via téléphone mobile, en temps réel. Where 2 Technologies, Octobre 2004 : systèmes cartographiques sur Internet (utilisés depuis dans Google Maps). Keyhole (site, communiqué), octobre 2004 : logiciel de cartes satellites, désormais Google Earth. Picasa (site, communiqué), juillet 2004 : logiciel de gestion de photos numériques Ignite Logic , Mai 2004 Genius Labs (communiqué), Octobre 2003 (ex Biz Stone) Sprinks (article), Octobre 2003 : système de liens sponsorisés de Primedia Kaltix (communiqué), Septembre 2003 : recherche personnalisée (faite par les chercheurs Taher Haveliwala, Glen Jeh, et Sepandar Kamvar). Ces chercheurs ont également participé à améliorer la vitesse de calcul du PageRank. Applied Semantics (site, communiqué), avril 2003 : publicité contextuelle à la base de AdSense (et AdWords ?) Neotonic Software, Avril 2003 : système de support technique par email Pyra Labs (site), Février 2003 : créateur de Blogger. Outride (communiqué), Septembre 2001 : analyse sémantique et data mining (issu de Xerox PARC) Deja News (site, communiqué), Février 2001 : archives des newsgroups ; désormais Google G 25 Aujourd’hui en 2008…..Une explosion dans les moteurs ! ■ Plus - de 4 500 moteurs dans le monde B to B B to C Verticaux par marchés (banques, assurances, labos pharma, distribution, immobilier…..) Par Pays Par Langue (Baidu, Alibaba moteurs chinois débarquent en Europe!) Par Produits Par sources (web, forums, blogs, wikis…) Pour Son, image, vidéo ….. 26 Les Nouveaux Moteurs de Recherche cooliris 28 29 30 Search Cube Searchcube est très certainement aujourd'hui le moteur le plus abouti dans sa présentation en trois dimensions des résultats de ses recherches. A la manière d'un Rubik's Cube, les parois du cube affichent les pages issues de la requête. On peut les faire pivoter dans n'importe quel sens en utilisant les flèches clavier ou par un Shift+Clic prolongé. http://www.search-cube.com/ Searchcube utilise l'API Google Ajax Search, kit de développement permettant d'interroger directement la base de données de Google. Le rendu 3D est quant à lui généré par la librairie Open Source 31 Sandy 3D Engine. L'innovation au coeur du moteur de recherche de demain Des acteurs proposent déjà une solution de recherche alternative et innovante. Parmi ces start-up figurent Mahalo, Cuill, Wikia, Hakia, Blekko ou encore Powerset. Des entreprises remarquées dans le monde fermé des moteurs. Exalead et Sinequa représentent la France en proposant des options originales. Parmi ces créateurs, deux modèles se distinguent : ceux qui fournissent une solution d'automatisation, comme Cuill ou Blekko et ceux qui se basent sur les facteurs humains, dont font partie Mahalo et Wikia. 32 33 34 35 36 37 Copmment Blackle économise l’énergie? Blackle was created by Heap Media to remind us all of the need to take small steps in our everyday lives to save energy. Blackle searches are powered by Google Custom Search. Blackle saves energy because the screen is predominantly black. "Image displayed is primarily a function of the user's color settings and desktop graphics, as well as the color and size of open application windows; a given monitor requires more power to display a white (or light) screen than a black (or dark) screen." Roberson et al, 2002 In January 2007 a blog post titled Black Google Would Save 750 Megawatt-hours a Year proposed the theory that a black version of the Google search engine would save a fair bit of energy due to the popularity of the search engine. Since then there has been skepticism about the significance of the energy savings that can be achieved and the cost in terms of readability of black web pages. We believe that there is value in the concept because even if the energy savings are small, they all add up. Secondly we feel that seeing Blackle every time we load our web browser reminds us that we need to keep taking small steps to save energy. 38 39 40 41 42 TinEye Le moteur de recherche inversée TinEye a de quoi surprendre. A la place d'une recherche traditionnelle, il trouve à partir d'une image les sites Internet où celle-ci se trouve (sa base est composée de 500 millions d'images). L'algorithme se base sur l'analyse des pixels pour identifier les caractéristiques d'une image. Cela permet au moteur de retrouver une image même si ses couleurs sont altérées ou si elle a été rognée. 43 Dit : ça ressemble à quoi le Futur ? ■http://www.ted.com/talks/view/id/481 44 Merci Questions / réponses www.micropole-univers.com