Luxid, solution de découverte et d`analyse de l`information par TEMIS
Transcription
Luxid, solution de découverte et d`analyse de l`information par TEMIS
VSST’ 2007 Luxid®, solution de découverte et d'analyse de l'information Sylvie Guillemin-Lanne, Project Manager, TEMIS Agenda 1 Positionnement du Text Mining 2 Introduction à TEMIS 3 Introduction à Luxid® 4 Démonstration 5 Cas clients Copyright © 2007 TEMIS - All Rights Reserved Slide 2 Positionnement Marché Search Engines Content Provider 80% of data is unstructured text Business Intelligence Enterprise Content Management Copyright © 2007 TEMIS - All Rights Reserved Slide 3 Chercher des documents? Copyright © 2007 TEMIS - All Rights Reserved Slide 4 … où trouver des réponses? Copyright © 2007 TEMIS - All Rights Reserved Slide 5 Comment? Du Texte au Sens Acomplia 500 mg makes me feel dizzy after ingestion Term Prop. [0-8] Entity Product Fact Meaning Num. Abrev. Verb /3rd Pron. Verb [10-12] [14-15] [17-21] [23-24] [26-29] Dosing Drug Action Target Adj. [31-35] State Symptom Prep. [37-41] Noun [43-51] Event Action Condition Meaning = Potential Adverse Effect Drug = Acomplia Dosing = 500mg Symptom = Tiredness When = After administration Copyright © 2007 TEMIS - All Rights Reserved Slide 6 Et… du Sens à la Connaissance! Copyright © 2007 TEMIS - All Rights Reserved Slide 7 Agenda 1 Positionnement du Text Mining 2 Introduction à TEMIS 3 Introduction à Luxid® 4 Démonstration 5 Cas clients Copyright © 2007 TEMIS - All Rights Reserved Slide 8 TEMIS - Faits & Historique TEMIS = TExt MIning Solutions Éditeur de logiciels français créé en 2000 • Équipe de développeurs/dirigeants issus d’IBM et de XEROX (Xerox Linguistics acquise 2003) • XeLDA® 20 ans de R&D, 26 brevets mondiaux Chef de file européen du Text Mining Paris (France) Heidelberg (Germany) Philadelphia Grenoble (USA) (France) Modena (IT) Copyright © 2007 TEMIS - All Rights Reserved Slide 9 TEMIS - Faits & Historique Entreprise en fort développement • > 50% de croissance annuelle en 3 ans • 50 employés, #1 en Europe • 200 sites en production Copyright © 2007 TEMIS - All Rights Reserved Slide 10 TEMIS - Faits & Historique Entreprise en fort développement Innovation permanente • Solution multilingue (20 langues, dont Chinois, Japonais, Coréen, Arabe) • Concept unique Skill Cartridges™ • Extraction des entités et des relations sémantiques • Nouveau paradigme de visualisation et d’analyse Copyright © 2007 TEMIS - All Rights Reserved Slide 11 TEMIS - update Entreprise en fort développement Innovation permanente Knowledge Browser Nouveau paradigme de visualisation et d’analyse Extraction de relations sémantiques Support de 20 langues Extraction des entités Skill Cartridges™ 2000 XeLDA™ 12 langues 2001 2002 Copyright © 2007 TEMIS - All Rights Reserved 2003 2004 2005 2006 Slide 12 TEMIS – Des références prestigieuses Copyright © 2007 TEMIS - All Rights Reserved Slide 13 Agenda 1 Positionnement du Text Mining 2 Introduction à TEMIS 3 Introduction à Luxid® 4 Démonstration 5 Cas clients Copyright © 2007 TEMIS - All Rights Reserved Slide 14 Luxid® - En 4 Points! Une nouvelle solution d’entreprise complète 1. 2. 3. 4. Collection des données textuelles Analyse métier et détaillée du contenu Découverte et compréhension de l’information Partage et mise en alerte des phénomènes 1 3 2 Copyright © 2007 TEMIS - All Rights Reserved Luxid® Repository 4 Slide 15 Luxid® - En 4 Points! Une solution puissante et ergonomique Une plateforme technologique modulaire • Plateforme formée de 3 couches applicatives Luxid® Annotation Factory Copyright © 2007 TEMIS - All Rights Reserved Slide 16 Luxid® - En 4 Points! Une solution puissante et ergonomique Une plateforme technologique modulaire • Plateforme formée de 3 couches applicatives Luxid® Information Mart Luxid® Annotation Factory Copyright © 2007 TEMIS - All Rights Reserved Slide 17 Luxid® - En 4 Points! Une solution puissante et ergonomique Une plateforme technologique modulaire • Plateforme formée de 3 couches applicatives Luxid® Information Analytics Luxid® Information Mart Luxid® Annotation Factory Copyright © 2007 TEMIS - All Rights Reserved Slide 18 Luxid® - En 4 Points! Une nouvelle solution d’entreprise complète Une nouvelle plateforme technologique Un nouveau paradigme, innovant & performant • Nouveau modèle de représentation de l’information Documents Entités & relations Connaissance • Nouveaux outils de navigation et de visualisation Copyright © 2007 TEMIS - All Rights Reserved Slide 19 Luxid® - En 4 Points! Une nouvelle solution d’entreprise complète Une nouvelle plateforme pour des solutions dédiées Un nouveau paradigme, innovant & performant Une nouvelle architecture • • • • Basée sur la plateforme applicative UIMA (IBM) Intégrant +6 années d’expertise TEMIS +18 mois de développement & stabilisation Résultat d’une étroite collaboration avec nos clients stratégiques Copyright © 2007 TEMIS - All Rights Reserved Slide 20 Paradigme Innovant Pharmacia Corp. was bought Pertinence Excellent Good Average Sémantique Phrase by Pfizer Inc. in 2003 Target Action Buyer Date Company Acquisition Company Year • • • • Meaning = Acquisition (action) Target = Pharmacia Corp. Buyer = Pfizer Inc Amount = unknown Date = 2003 Document Copyright © 2007 TEMIS - All Rights Reserved Slide 21 Paradigme Innovant Pertinence Excellent Good Sémantique Phrase Concept Entité Agence de Régulation Federal Drug Administration Drug Average Document Copyright © 2007 TEMIS - All Rights Reserved Mot Swiss Regulation Agency Swiss Federal Admlnistration Agency Regulatory Slide 22 Paradigme Innovant Pertinence Sémantique Concept Excellent Relation Co-Occurence Proximité ÙIdentifier les Mots ou Entités ou Concepts proches dans une un mêm document ou paragraphe. phrase. … The experimental medicine's pedigree is convoluted. It was discovered by San Francisco-based Sugen, a biotechnology Phrase by pharmaceuticalEntité Good that was purchased company company Pharmacia Corp. Five months later, Pfizer bid for Pharmacia, maker of the popular Average arthritis drug Celebrex and hair-loss treatment Rogaine. Document Mot Copyright © 2007 TEMIS - All Rights Reserved Relation Proximité CoOccurence Slide 23 Paradigme Innovant Pertinence Excellent Good Average Sémantique Concept Relation Phrase Entité Proximité Mot CoOccurence Document TEMIS Luxid® Copyright © 2007 TEMIS - All Rights Reserved Moteurs de Recherche Slide 24 Luxid® Plateforme & Solutions Copyright © 2007 TEMIS - All Rights Reserved Slide 25 Luxid® Plateforme & Solutions Copyright © 2007 TEMIS - All Rights Reserved Slide 26 Agenda 1 Positionnement du Text Mining 2 Introduction à TEMIS 3 Introduction à Luxid® 4 Démonstration 5 Cas clients Copyright © 2007 TEMIS - All Rights Reserved Slide 27 Luxid® Annotation Factory Objectifs • Plateforme standard d’enrichissement des documents • Performance et montée en charge • Robustesse et facilité d’intégration Fonctionnalités clefs • • • • • Extraction sémantique & statistique Détection des mots, entités, concepts et relations Annotation et surlignage du texte Catégorisation automatique Regroupement par similarité (clustering) Bénéfices UIMA Ù ouverture & scalabilité • Intégration d’annotateurs du marché • Intégration dans applicatifs clients/partenaires (ECM, IR, …) Copyright © 2007 TEMIS - All Rights Reserved Slide 28 Luxid® Information Mart Objectifs • Organisation et distribution des 3 tâches principales 1. Connexions aux sources et collection des documents 2. Analyse et extraction avec un prisme métier 3. Stockage des informations extraites pour analyse • Gestion centralisée des référentiels d’information Fonctionnalités clefs • Définition des sources de données (Fichiers Systèmes, Courriers, Moteurs de Recherche, Medline, MicroPatent, …) • Définition des plans et workflows d’annotations • Optimisation des référentiels d’annotations Bénéfices UIMA Ù ouverture • Connexion simple aux sources de données Copyright © 2007 TEMIS - All Rights Reserved (« UIMA Collection Reader ») Slide 29 Luxid® Information Analytics Objectifs • Découvrir, analyser et partager la connaissance • Offrir des fonctionnalités avancées mais simples à utiliser • Améliorer la productivité des utilisateurs Fonctionnalités clefs • • • • • • • • • Recherche et filtrage avancés (Faceted Navigation) Lecture rapide et guidée de documents Analyses multidimensionnelles (prédéfinies & ad’hoc) Scénarios d’analyses ciblées & pertinentes Recherche de proximité Navigation sémantique (Knowledge Browsing) Personnalisation de l’interface (utilisateur/administrateur) Partage d’analyses (Centers of Interest) Actualisation des tableaux de bord & mise en alerte Copyright © 2007 TEMIS - All Rights Reserved Slide 30 Luxid™ Information Analytics Copyright © 2007 TEMIS - All Rights Reserved Slide 31 Luxid™ Information Analytics Copyright © 2007 TEMIS - All Rights Reserved Slide 32 Luxid™ Information Analytics Copyright © 2007 TEMIS - All Rights Reserved Slide 33 Cas Client # 1 Objective • Watch competition on Oil and Gas markets • Automate daily competitive report generation • Provide business users with a directly usable data Sources • Factiva, Lexis-Nexis • Web Crawlers • > 5 000 articles analyzed daily Customer • Project Code « Information Miner » • VIA (Watch Information Archive) department, reporting to the Corporate Holding • Specialized Intelligence Groups within Exploration, Refinery, Marketing Copyright © 2007 TEMIS - All Rights Reserved Slide 34 Cas Client # 1 List of areas of interest Text annotation Relationship details Detected relationships (in one area of interest) Copyright © 2007 TEMIS - All Rights Reserved Slide 35 Cas Client # 1 Factiva (XML) Information Miner Lexis Nexis (XML) Automatic Intelligence reports Web Crawlers SPECIFIC TOPIC 2 Key customers Copyright © 2007 TEMIS - All Rights Reserved SPECIFIC TOPIC 1 Refinery Shutdowns INTELLIGENCE TOPICS Financial Infrastructure Field Mergers COMPANY Gazprom Shell Sibneft … Slide 36 Cas Client # 1 From Text to Business Value Reads all news Anticipate oil market value Extract production information « … The refinery, in the northeastern province of Liaoning was expected to process 110,000 bpd of crude next month, down from 123,000 bpd in October… » « … Idemitsu Kosan Co., Japan's third-largest refiner, aims to restart a unit crippled by fire in its 140,000 bpd Hokkaido refinery in northern Japan in mid-November… » « … Kuwait's 450,000 bpd al-Ahmadi refinery was shut down Sunday after a power cut hit the industrial Shueiba area… » Update Worldwide Refinery Capacity « …The FCC unit at Golden Eagle will be down for 18 days toward the end of the quarter, and the plant should average around 135,000-140,000 bpd » … Copyright © 2007 TEMIS - All Rights Reserved Slide 37 Cas Client # 2 From Text to Reads open-ended Business Value questions Customer’s Interactions Consumer Marketing reports Adverse Events and Product Complaints Identify Adverse Events and Product Complaints « … I am taking Lipitor 20mg and this morning my left leg was twitching just above the knee, my chest doesn’t feel that great, sort of constricted… » « … I take Zyprexa 1.5 mg per day, because doctors have diagnosed a psychosomatic illness; it doesn’t seem to help a bit, it seems that visual disturbance is worse… » « … I too was on Nexium 40mg before my surgery and now I'm down to 20mg... I ain’t getting no relief from the Nexium that stinks. Could you tell what to do?… » Create AE Reports & Escalate « …My girlfriend uses Ambien and it has a VERY BAD side effect on her. She has hallucinations and according to her things and walls start to move….» … Copyright © 2007 TEMIS - All Rights Reserved Slide 38 Merci à tous! www.temis.com