Comment le Big Data et l`analytique d`IBM optimisent la détection de

Transcription

Comment le Big Data et l`analytique d`IBM optimisent la détection de
Comment le Big Data et l'analytique d'IBM optimisent la détection
IBM Smarter Analytics:
de fraude aux finances
publiques
britanniques
(HMRC*)
Fraud, error and
analyticsin UK public
sector
Christophe BURGAUD, IBM Big Data Architect
Laurent SERGUEENKOFF, IBM Analytics Sales Leader
* Her Majesty Revenue & Customs (https://www.gov.uk/government/organisations/hm-revenue-customs)
© 2016 IBM Corporation
Un constat qui frappe
En 2012, l’évasion fiscale au Royaume-Uni était estimée à 20 milliard de £
Elle se ventile ainsi :
− Evasion frauduleuse : 14 milliards de £
− Erreurs de déclaration, optimisation fiscale : 6 milliards de £
2
© 2016 IBM Corporation
Une solution existante insuffisante
Modélisation basée sur les données d’historiques de déclaration en
position du HMRC et les dossiers de fraudes avérées uniquement
Modèles prédictifs incomplets et statiques
Faible fiabilité (beaucoup de faux positifs). Les schémas de fraude
sont plus complexes et nécessitent des données complémentaires
3
© 2016 IBM Corporation
Une collaboration d’IBM avec le HMRC qui a permis :
De constituer une plateforme Big Data pour :
Accueillir les données d’historiques de déclarations et les dossiers de fraudes
avérées avec argumentation.
Accueillir des Open Data (cadastres, assurance, réseaux sociaux, etc …) pour
enrichir la connaissance sur le profil du contribuable.
Avoir la capacité de faire tourner des analyses sur toutes ces données de
manière régulière afin de multiplier les modèles et s’adapter.
4
© 2016 IBM Corporation
Architecture IBM Big Data
Unstructured
data
Business data
Claimant details
e.g. Organisation,
Fraud Score Risks
Knowledge Discovery –
Social Network Analytics
External/ Third party
sources
Unsupervised
Techniques
Supervised
Techniques
Social Network visualization
Claimant
Case Packs
Single view of a
claimant
Internal/ legacy sources
Generation of rules
Fraud
Discovery – Social
Scoring Rules
Search
Transactional data
Tax
filings
e.g. Claim payment,
Structured
data
5
Monitoring and
reporting (BI)
© 2016 IBM Corporation
Sizing / Technologies utilisées / Compétences
Volumétrie
− 1.5 million de dossiers / an déjà filtrés à compléter
Technologies
− InfoSphere Streams (Social Data)
− Watson Explorer & Content Management (WEX)
− Identity Insight
− Personality Insight
− I2 – Graph Visualization
− SPSS Modeler
− BigInsights for Apache Hadoop
Compétences
− Architectes Big Data (Streams, WEX, BigInsights)
− Data Scientists
− Plateforme dans le Cloud IBM en PAAS
6
© 2016 IBM Corporation
Compétences
Architectes Big Data (Streams, Watson Explorer, BigInsights)
Data Scientists
Plateforme dans le Cloud IBM en PAAS
7
© 2016 IBM Corporation
Pourquoi IBM ?
Collaboration historique
Capacité d’hébergement, de sécurisation et d’analyses des données
Efficacité des modèles : réduction du taux de faux-positifs de 10% la première
année
Réduction du délai de traitement des dossiers
Modèle économique gagnant-gagnant
Architecture dupliquée avec adaptation pour la fraude de prestations de santé
(optique et dentaire en France)
8
© 2016 IBM Corporation
9
© 2016 IBM Corporation