Luxid, solution de découverte et d`analyse de l`information par TEMIS

Transcription

Luxid, solution de découverte et d`analyse de l`information par TEMIS
VSST’ 2007
Luxid®, solution de découverte
et d'analyse de l'information
Sylvie Guillemin-Lanne, Project Manager, TEMIS
Agenda
1
Positionnement du Text Mining
2
Introduction à TEMIS
3
Introduction à Luxid®
4
Démonstration
5
Cas clients
Copyright © 2007 TEMIS - All Rights Reserved
Slide 2
Positionnement Marché
Search Engines
Content Provider
80%
of
data is
unstructured
text
Business Intelligence
Enterprise Content
Management
Copyright © 2007 TEMIS - All Rights Reserved
Slide 3
Chercher des documents?
Copyright © 2007 TEMIS - All Rights Reserved
Slide 4
… où trouver des réponses?
Copyright © 2007 TEMIS - All Rights Reserved
Slide 5
Comment? Du Texte au Sens
Acomplia 500 mg makes me feel dizzy after ingestion
Term
Prop.
[0-8]
Entity
Product
Fact
Meaning
Num. Abrev. Verb /3rd Pron. Verb
[10-12] [14-15]
[17-21] [23-24] [26-29]
Dosing
Drug
Action
Target
Adj.
[31-35]
State
Symptom
Prep.
[37-41]
Noun
[43-51]
Event
Action
Condition
Meaning = Potential Adverse Effect
Drug = Acomplia
Dosing = 500mg
Symptom = Tiredness
When = After administration
Copyright © 2007 TEMIS - All Rights Reserved
Slide 6
Et… du Sens à la Connaissance!
Copyright © 2007 TEMIS - All Rights Reserved
Slide 7
Agenda
1
Positionnement du Text Mining
2
Introduction à TEMIS
3
Introduction à Luxid®
4
Démonstration
5
Cas clients
Copyright © 2007 TEMIS - All Rights Reserved
Slide 8
TEMIS - Faits & Historique
„
TEMIS = TExt MIning Solutions
„
Éditeur de logiciels français créé en 2000
• Équipe de développeurs/dirigeants issus d’IBM
et de XEROX (Xerox Linguistics acquise 2003)
• XeLDA® 20 ans de R&D, 26 brevets mondiaux
„
Chef de file européen du Text Mining
Paris
(France)
Heidelberg
(Germany)
Philadelphia Grenoble
(USA)
(France)
Modena
(IT)
Copyright © 2007 TEMIS - All Rights Reserved
Slide 9
TEMIS - Faits & Historique
„
Entreprise en fort développement
• > 50% de croissance annuelle en 3 ans
• 50 employés, #1 en Europe
• 200 sites en production
Copyright © 2007 TEMIS - All Rights Reserved
Slide 10
TEMIS - Faits & Historique
„
Entreprise en fort développement
„
Innovation permanente
• Solution multilingue (20 langues, dont Chinois, Japonais,
Coréen, Arabe)
• Concept unique Skill Cartridges™
• Extraction des entités et des relations sémantiques
• Nouveau paradigme de visualisation et d’analyse
Copyright © 2007 TEMIS - All Rights Reserved
Slide 11
TEMIS - update
„
Entreprise en fort développement
„
Innovation permanente
Knowledge
Browser
Nouveau paradigme de
visualisation et
d’analyse
Extraction de relations
sémantiques
Support de 20 langues
Extraction des entités
Skill
Cartridges™
2000
XeLDA™
12 langues
2001
2002
Copyright © 2007 TEMIS - All Rights Reserved
2003
2004
2005
2006
Slide 12
TEMIS – Des références prestigieuses
Copyright © 2007 TEMIS - All Rights Reserved
Slide 13
Agenda
1
Positionnement du Text Mining
2
Introduction à TEMIS
3
Introduction à Luxid®
4
Démonstration
5
Cas clients
Copyright © 2007 TEMIS - All Rights Reserved
Slide 14
Luxid® - En 4 Points!
„
Une nouvelle solution d’entreprise complète
1.
2.
3.
4.
Collection des données textuelles
Analyse métier et détaillée du contenu
Découverte et compréhension de l’information
Partage et mise en alerte des phénomènes
1
3
2
Copyright © 2007 TEMIS - All Rights Reserved
Luxid®
Repository
4
Slide 15
Luxid® - En 4 Points!
„
Une solution puissante et ergonomique
„
Une plateforme technologique modulaire
• Plateforme formée de
3 couches applicatives
Luxid® Annotation Factory
Copyright © 2007 TEMIS - All Rights Reserved
Slide 16
Luxid® - En 4 Points!
„
Une solution puissante et ergonomique
„
Une plateforme technologique modulaire
• Plateforme formée de
3 couches applicatives
Luxid® Information Mart
Luxid® Annotation Factory
Copyright © 2007 TEMIS - All Rights Reserved
Slide 17
Luxid® - En 4 Points!
„
Une solution puissante et ergonomique
„
Une plateforme technologique modulaire
• Plateforme formée de
3 couches applicatives
Luxid® Information Analytics
Luxid® Information Mart
Luxid® Annotation Factory
Copyright © 2007 TEMIS - All Rights Reserved
Slide 18
Luxid® - En 4 Points!
„
Une nouvelle solution d’entreprise complète
„
Une nouvelle plateforme technologique
„
Un nouveau paradigme, innovant & performant
• Nouveau modèle de représentation de l’information
Documents
Entités & relations
Connaissance
• Nouveaux outils de
navigation et de
visualisation
Copyright © 2007 TEMIS - All Rights Reserved
Slide 19
Luxid® - En 4 Points!
„
Une nouvelle solution d’entreprise complète
„
Une nouvelle plateforme pour des solutions dédiées
„
Un nouveau paradigme, innovant & performant
„
Une nouvelle architecture
•
•
•
•
Basée sur la plateforme applicative UIMA (IBM)
Intégrant +6 années d’expertise TEMIS
+18 mois de développement & stabilisation
Résultat d’une étroite collaboration avec nos clients
stratégiques
Copyright © 2007 TEMIS - All Rights Reserved
Slide 20
Paradigme Innovant
Pharmacia Corp. was bought
Pertinence
Excellent
Good
Average
Sémantique
Phrase
by Pfizer Inc. in 2003
Target
Action
Buyer
Date
Company
Acquisition
Company
Year
•
•
•
•
Meaning = Acquisition (action)
Target = Pharmacia Corp.
Buyer = Pfizer Inc
Amount = unknown
Date = 2003
Document
Copyright © 2007 TEMIS - All Rights Reserved
Slide 21
Paradigme Innovant
Pertinence
Excellent
Good
Sémantique
Phrase
Concept
Entité
Agence de Régulation
Federal Drug
Administration
Drug
Average
Document
Copyright © 2007 TEMIS - All Rights Reserved
Mot
Swiss Regulation
Agency
Swiss
Federal
Admlnistration
Agency
Regulatory
Slide 22
Paradigme Innovant
Pertinence
Sémantique
Concept
Excellent
Relation
Co-Occurence
Proximité
ÙIdentifier les Mots ou Entités ou Concepts proches dans une
un mêm
document ou paragraphe.
phrase.
… The experimental medicine's pedigree is convoluted. It was
discovered by San Francisco-based Sugen, a biotechnology
Phrase by pharmaceuticalEntité
Good that was purchased
company
company
Pharmacia Corp.
Five months later, Pfizer bid for Pharmacia, maker of the popular
Average
arthritis
drug Celebrex
and hair-loss treatment Rogaine.
Document
Mot
Copyright © 2007 TEMIS - All Rights Reserved
Relation
Proximité
CoOccurence
Slide 23
Paradigme Innovant
Pertinence
Excellent
Good
Average
Sémantique
Concept
Relation
Phrase
Entité
Proximité
Mot
CoOccurence
Document
TEMIS Luxid®
Copyright © 2007 TEMIS - All Rights Reserved
Moteurs de Recherche
Slide 24
Luxid® Plateforme & Solutions
Copyright © 2007 TEMIS - All Rights Reserved
Slide 25
Luxid® Plateforme & Solutions
Copyright © 2007 TEMIS - All Rights Reserved
Slide 26
Agenda
1
Positionnement du Text Mining
2
Introduction à TEMIS
3
Introduction à Luxid®
4
Démonstration
5
Cas clients
Copyright © 2007 TEMIS - All Rights Reserved
Slide 27
Luxid® Annotation Factory
„
Objectifs
• Plateforme standard d’enrichissement des documents
• Performance et montée en charge
• Robustesse et facilité d’intégration
„
Fonctionnalités clefs
•
•
•
•
•
„
Extraction sémantique & statistique
Détection des mots, entités, concepts et relations
Annotation et surlignage du texte
Catégorisation automatique
Regroupement par similarité (clustering)
Bénéfices UIMA Ù ouverture & scalabilité
• Intégration d’annotateurs du marché
• Intégration dans applicatifs clients/partenaires (ECM, IR, …)
Copyright © 2007 TEMIS - All Rights Reserved
Slide 28
Luxid® Information Mart
„
Objectifs
• Organisation et distribution des 3 tâches principales
1. Connexions aux sources et collection des documents
2. Analyse et extraction avec un prisme métier
3. Stockage des informations extraites pour analyse
• Gestion centralisée des référentiels d’information
„
Fonctionnalités clefs
• Définition des sources de données (Fichiers Systèmes,
Courriers, Moteurs de Recherche, Medline, MicroPatent, …)
• Définition des plans et workflows d’annotations
• Optimisation des référentiels d’annotations
„
Bénéfices UIMA Ù ouverture
• Connexion simple aux sources de données
Copyright © 2007 TEMIS - All Rights Reserved
(« UIMA Collection Reader »)
Slide 29
Luxid® Information Analytics
„
Objectifs
• Découvrir, analyser et partager la connaissance
• Offrir des fonctionnalités avancées mais simples à utiliser
• Améliorer la productivité des utilisateurs
„
Fonctionnalités clefs
•
•
•
•
•
•
•
•
•
Recherche et filtrage avancés (Faceted Navigation)
Lecture rapide et guidée de documents
Analyses multidimensionnelles (prédéfinies & ad’hoc)
Scénarios d’analyses ciblées & pertinentes
Recherche de proximité
Navigation sémantique (Knowledge Browsing)
Personnalisation de l’interface (utilisateur/administrateur)
Partage d’analyses (Centers of Interest)
Actualisation des tableaux de bord & mise en alerte
Copyright © 2007 TEMIS - All Rights Reserved
Slide 30
Luxid™ Information Analytics
Copyright © 2007 TEMIS - All Rights Reserved
Slide 31
Luxid™ Information Analytics
Copyright © 2007 TEMIS - All Rights Reserved
Slide 32
Luxid™ Information Analytics
Copyright © 2007 TEMIS - All Rights Reserved
Slide 33
Cas Client # 1
„
Objective
• Watch competition on Oil and Gas markets
• Automate daily competitive report generation
• Provide business users with a directly usable data
„
Sources
• Factiva, Lexis-Nexis
• Web Crawlers
• > 5 000 articles analyzed daily
„
Customer
• Project Code « Information Miner »
• VIA (Watch Information Archive) department,
reporting to the Corporate Holding
• Specialized Intelligence Groups within Exploration,
Refinery, Marketing
Copyright © 2007 TEMIS - All Rights Reserved
Slide 34
Cas Client # 1
List of areas of interest
Text annotation
Relationship details
Detected relationships (in one area of interest)
Copyright © 2007 TEMIS - All Rights Reserved
Slide 35
Cas Client # 1
Factiva
(XML)
Information
Miner
Lexis Nexis
(XML)
Automatic
Intelligence reports
Web Crawlers
SPECIFIC TOPIC 2
Key customers
Copyright © 2007 TEMIS - All Rights Reserved
SPECIFIC TOPIC 1
Refinery Shutdowns
INTELLIGENCE TOPICS
Financial
Infrastructure
Field
Mergers
COMPANY
Gazprom
Shell
Sibneft
…
Slide 36
Cas Client # 1
From Text to
Business
Value
Reads
all news
Anticipate
oil
market value
Extract production
information
« … The refinery, in the northeastern province of Liaoning
was expected to process 110,000 bpd of crude next
month, down from 123,000 bpd in October… »
« … Idemitsu Kosan Co., Japan's third-largest refiner, aims to
restart a unit crippled by fire in its 140,000 bpd Hokkaido
refinery in northern Japan in mid-November… »
« … Kuwait's 450,000 bpd al-Ahmadi refinery was shut
down Sunday after a power cut hit the industrial Shueiba
area… »
Update
Worldwide
Refinery
Capacity
« …The FCC unit at Golden Eagle will be down for 18
days toward the end of the quarter, and the plant should
average around 135,000-140,000 bpd »
…
Copyright © 2007 TEMIS - All Rights Reserved
Slide 37
Cas Client # 2
From
Text to
Reads
open-ended
Business
Value
questions
Customer’s
Interactions
Consumer Marketing reports
Adverse Events and
Product Complaints
Identify Adverse
Events and Product
Complaints
« … I am taking Lipitor 20mg and this morning my left
leg was twitching just above the knee, my chest doesn’t
feel that great, sort of constricted… »
« … I take Zyprexa 1.5 mg per day, because doctors have
diagnosed a psychosomatic illness; it doesn’t seem to
help a bit, it seems that visual disturbance is worse… »
« … I too was on Nexium 40mg before my surgery and
now I'm down to 20mg... I ain’t getting no relief from
the Nexium that stinks. Could you tell what to do?… »
Create AE
Reports &
Escalate
« …My girlfriend uses Ambien and it has a VERY BAD
side effect on her. She has hallucinations and according
to her things and walls start to move….»
…
Copyright © 2007 TEMIS - All Rights Reserved
Slide 38
Merci à tous!
www.temis.com

Documents pareils