Comment le Big Data et l`analytique d`IBM optimisent la détection de
Transcription
Comment le Big Data et l`analytique d`IBM optimisent la détection de
Comment le Big Data et l'analytique d'IBM optimisent la détection IBM Smarter Analytics: de fraude aux finances publiques britanniques (HMRC*) Fraud, error and analyticsin UK public sector Christophe BURGAUD, IBM Big Data Architect Laurent SERGUEENKOFF, IBM Analytics Sales Leader * Her Majesty Revenue & Customs (https://www.gov.uk/government/organisations/hm-revenue-customs) © 2016 IBM Corporation Un constat qui frappe En 2012, l’évasion fiscale au Royaume-Uni était estimée à 20 milliard de £ Elle se ventile ainsi : − Evasion frauduleuse : 14 milliards de £ − Erreurs de déclaration, optimisation fiscale : 6 milliards de £ 2 © 2016 IBM Corporation Une solution existante insuffisante Modélisation basée sur les données d’historiques de déclaration en position du HMRC et les dossiers de fraudes avérées uniquement Modèles prédictifs incomplets et statiques Faible fiabilité (beaucoup de faux positifs). Les schémas de fraude sont plus complexes et nécessitent des données complémentaires 3 © 2016 IBM Corporation Une collaboration d’IBM avec le HMRC qui a permis : De constituer une plateforme Big Data pour : Accueillir les données d’historiques de déclarations et les dossiers de fraudes avérées avec argumentation. Accueillir des Open Data (cadastres, assurance, réseaux sociaux, etc …) pour enrichir la connaissance sur le profil du contribuable. Avoir la capacité de faire tourner des analyses sur toutes ces données de manière régulière afin de multiplier les modèles et s’adapter. 4 © 2016 IBM Corporation Architecture IBM Big Data Unstructured data Business data Claimant details e.g. Organisation, Fraud Score Risks Knowledge Discovery – Social Network Analytics External/ Third party sources Unsupervised Techniques Supervised Techniques Social Network visualization Claimant Case Packs Single view of a claimant Internal/ legacy sources Generation of rules Fraud Discovery – Social Scoring Rules Search Transactional data Tax filings e.g. Claim payment, Structured data 5 Monitoring and reporting (BI) © 2016 IBM Corporation Sizing / Technologies utilisées / Compétences Volumétrie − 1.5 million de dossiers / an déjà filtrés à compléter Technologies − InfoSphere Streams (Social Data) − Watson Explorer & Content Management (WEX) − Identity Insight − Personality Insight − I2 – Graph Visualization − SPSS Modeler − BigInsights for Apache Hadoop Compétences − Architectes Big Data (Streams, WEX, BigInsights) − Data Scientists − Plateforme dans le Cloud IBM en PAAS 6 © 2016 IBM Corporation Compétences Architectes Big Data (Streams, Watson Explorer, BigInsights) Data Scientists Plateforme dans le Cloud IBM en PAAS 7 © 2016 IBM Corporation Pourquoi IBM ? Collaboration historique Capacité d’hébergement, de sécurisation et d’analyses des données Efficacité des modèles : réduction du taux de faux-positifs de 10% la première année Réduction du délai de traitement des dossiers Modèle économique gagnant-gagnant Architecture dupliquée avec adaptation pour la fraude de prestations de santé (optique et dentaire en France) 8 © 2016 IBM Corporation 9 © 2016 IBM Corporation