Professeur Patrice Degoulet
Transcription
Professeur Patrice Degoulet
Réutilisation des données d’un Système d’Information Clinique (SIC) Professeur Patrice Degoulet Faculté Paris Descartes & HEGP Ecole d’Eté Systèmes d’Information en Santé Corte 15-19 juillet 2013 La réutilisation des données 1. 2. 3. 4. Contexte Principes Applications Conclusion Réutilisation des donnés Maturité IT Stage 1 Basic HIS • Patient Registration / Inpatient Admission Discharge & Transfer • Patient Billing and Accounts Receivable • HRIS / Payroll • General Ledger / Financial Reporting • Purchasing / Accounts Payable Stage 2 Advanced HIS • Electronic Claims Submission • Electronic Payment Processing • Inventory, Supply Requisitioning and Distribution • Basic Order Communications • Email • Internet Access • Intranet Réutilisation © IDC Health Industry Insights 2007 Stage 3 Advanced HIS Core Clinicals • Laboratory Information System • RIS/Radiology Results Reporting • PACS • Pharmacy • Operating Room Scheduling and Management Stage 4 Digital Hospital • Patient Appointment Scheduling • Computerized Physician Order Entry • Nursing Documentation • Emergency Department Management • Inpatient Electronic Medical Record (EMR) • Ambulatory EMR • Enterprise Master Patient Index • Location-based services • Physician Portal • Wireless Infrastructure • Patient Portal Stage 5 Digital Virtual Enterprise • Secure Email (Provider-Provider/ Provider-Patient) • Participation in Regionalized Patient CDR • Home Health Case Management • Remote Patient Monitoring/ Telemedicine • Clinical Data Repository/ Data Warehouse - Protocoles basés sur des questionnaires structurés - Prise en charge complète du circuit thérapeutique - PACS complet - Protocoles multimodaux - Aide à la décision (protocoles) - Transmissions, pancartes - Prescriptions bio, images, méd - Aide à la décision - Accès images hors radiologie - Dictionnaire deDIconcepts - Dossier patient (bio, CRH/CRO) - Alertes élémentaires Réutilisation Réutilisation United States EMR Adoption Model S M Stage Cumulative Capabilities 2008 Q4 2012 Q4 0,3% 1,9% 0,5% 8,2% Stage 5 Closed loop medication administration 2,5% 14,0% Stage 4 CPOE, Clinical Decision Support (clinical protocols) 2,5% 14,2% Stage 3 Nursing/clinical documentation (flow sheets), CDSS (error checking), PACS available outside Radiology 35,7% 38,3% Stage 2 CDR, Controlled Medical Vocabulary, CDS, may have Document Imaging; HIE capable 31,4% 10,7% Stage 1 Ancillaries - Lab, Rad, Pharmacy - All Installed 11,5% 4,3% Stage 0 All Three Ancillaries Not Installed 15,6% 8,4% N = 5319 N = 5458 Complete EMR; CCD transactions to share data; Data warehousing; Data continuity with ED, ambulatory, OP Physician documentation (structured templates), full Stage 6 CDSS (variance & compliance), full R-PACS Stage 7 Data from HIMSS Analytics® Database ©2012 La réutilisation des données 1. 2. 3. 4. Contexte Principes Applications Conclusion IT infrastructure for reuse Healthcare Professionals Patients R e s e a r c h 1 Dossier Dossier Electronic patient patient Health Record informatisé informatisé 6 2 Semantics Terminologies Ontologies Literature Articles Documentation Decision support systems 5 (EHR) Disease-oriented Databases Registries Clinical Trials Databases C a r e An IT Framework Clinical Data Warehouse (CDW) Heterogeneous data integration 3 Knowledge bases EBM sources 4 Diagnostic, predictive, therapeutic models Analytical processing (OLAP), Data Mining (OLAM) Infrastructure de réutilisation Environnement évaluation/ recherche Environnement de production SIC : Base opérationnelle Requêtes en temps réel Entrepôts de données cliniques Suite ETL SIC : Base miroir Entrepôt de données cliniques (EDC) Data Analysis Data Mining Bases de données externes CDW Platforms Infrastructure de réutilisation • Plateforme de support de la recherché translationnelle • Initiée en 2008 par Johnson & Johnson et Recombinant • “Open-source” depuis janvier 2012 -‐ tranSMART [Internet]. [cited 2013 Jan 16]. Available from: hBp://www.transmartproject.org/ -‐ Szalma S, Koka V, Khasanova T, Perakslis ED. EffecRve knowledge management in translaRonal medicine. J Transl Med. 2010; 8:68. CDW platforms “Omics” data integration http://www.transmartproject.org ! The TranSMART integration process http://www.transmartproject.org La réutilisation des données 1. Contexte 2. Principes 3. Applications • Environnement de l’HEGP • Alimentation des registres • Réutilisation pour les essais cliniques • Entrepôts de donnés 4. Conclusion Situation HEGP (T3 2013) Maturité IT Stage 1 Basic HIS • Patient Registration / Inpatient Admission Discharge & Transfer • Patient Billing and Accounts Receivable • HRIS / Payroll • General Ledger / Financial Reporting • Purchasing / Accounts Payable Stage 2 Advanced HIS • Electronic Claims Submission • Electronic Payment Processing • Inventory, Supply Requisitioning and Distribution • Basic Order Communications • Email • Internet Access • Intranet 2000-2011 2009-2013 © IDC Health Industry Insights 2007 Stage 3 Advanced HIS Core Clinicals • Laboratory Information System • RIS/Radiology Results Reporting • PACS • Pharmacy • Operating Room Scheduling and Management Stage 4 Digital Hospital • Patient Appointment Scheduling • Computerized Physician Order Entry • Nursing Documentation • Emergency Department Management • Inpatient Electronic Medical Record (EMR) • Ambulatory EMR • Enterprise Master Patient Index • Location-based services • Physician Portal • Wireless Infrastructure • Patient Portal Stage 5 Digital Virtual Enterprise • Secure Email (Provider-Provider/ Provider-Patient) • Participation in Regionalized Patient CDR • Home Health Case Management • Remote Patient Monitoring/ Telemedicine • Clinical Data Repository/ Data Warehouse HEGP AP-HP EDP Cognos Système de Pilotage - médico-économique - qualité Communication Système d’Information Logistique - gestion des ressources - approvisionnements Système d’Information Clinique - dossier patient - gestion des actes HEGP Entrepôt de données cliniques (2009-) Environnement évaluation/ recherche Environnement de production SIC : Base opérationnelle Suite ETL (Talend Open Studio) SIC : Base miroir Entrepôt de données cliniques (EDC) I2B2 DW Requêtes en temps réel Data Analysis Data Mining Bases de données externes R, SAS I2B2 Client Business Object IBM Ilog Rules HEGP BDW I2b2 + tranSMART data sources Health care Clinical Research Health Information System Browser and Analysis tools available for MD & Pharm DRG Biology Imaging Rx i2b2 CDW Structured data from research studies tranSMART +’omics ETL Pathology BDW ETL EHR reports ETL once a week EHR forms ‘omics data La réutilisation des données 1. Contexte 2. Principes 3. Applications • Environnement de l’HEGP • Alimentation des registres • Réutilisation pour les essais cliniques • Entrepôts de données 4. Conclusion IT infrastructure & bioclinical research Healthcare Professionals Patients 1 Electronic Health Record (EHR) 2 Disease-oriented Databases Registries Clinical Trials Databases Clinical Data Warehouse (CDW) Heterogeneous data integration External Registries 6 Decision support systems Semantics Terminologies Ontologies Literature Articles Documentation 3 5 Knowledge bases EBM sources 4 Diagnostic, predictive, therapeutic models Analytical processing (OLAP), Data Mining (OLAM) Registries DEBUG-IT : Detecting and Eliminating Bacteria UsinG Information Technology (2008-2011, 11 partners, 7 European Countries) La réutilisation des données 1. Contexte 2. Principes 3. Applications • Environnement de l’HEGP • Alimentation des registres • Réutilisation pour les essais cliniques • Entrepôts de données 4. Conclusion Clinical Research : Trials, evaluation studies IT infrastructure & bioclinical research Healthcare Professionals Patients 1 Electronic Health Record (EHR) 2 Disease-oriented Databases Registries Clinical Trials Databases Clinical Data Warehouse (CDW) Heterogeneous data integration 6 Decision support systems Semantics Terminologies Ontologies Literature Articles Documentation 3 5 Knowledge bases EBM sources 4 Diagnostic, predictive, therapeutic models Analytical processing (OLAP), Data Mining (OLAM) Clinical Research Integration Medasys CDISC Mediator (IHE/RIFD profile) ODM MetaData ODM Study Design DxPort EHR EDC system • Automatic data export • Input of missing information DxCare (Medasys ©) HL7 DxConnect • Data validation Marvin (XClinical©) CDISC Adapted from N.El Fadly, D.Ouagne & C.Daniel Clinical Research Integration eCRF & EHR : inclusion criteria Arcadia Project Clinical Research Integration eCRF & EHR : clinical data capture Essais cliniques et réutilisation Conclusions intermédiaires • Bénéfices d’une approche intégrée – Une seule saisie dans le dossier patient, des utilisations multiples (soins, recherche) – Garantie pour le patient de prise en charge de la totalité de ses problèmes (e.g., iatrogénie) – Intérêt pour l’industriel d’un accès aux données sources (ex. biologie, imagerie) • Limites – Résistance des médecins (changement des relations médecins/industriels vers médecins/hôpital/industriels) – Résistance des industriels ü adaptation des circuits de données à chaque environnement hospitalier ü adaptation des procédures de contrôle de qualité La réutilisation des données 1. Contexte 2. Principes 3. Applications • Environnement de l’HEGP • Alimentation des registres • Réutilisation pour les essais cliniques • Entrepôts de données 4. Conclusion IT infrastructure & bioclinical research Healthcare Professionals Patients 1 Electronic Health Record (EHR) 2 Disease-oriented Databases Registries Clinical Trials Databases Clinical Data Warehouse (CDW) Heterogeneous data integration EHR/CDW integration 6 Decision support systems Semantics Terminologies Ontologies Literature Articles Documentation 3 5 Knowledge bases EBM sources 4 Diagnostic, predictive, therapeutic models Analytical processing (OLAP), Data Mining (OLAM) IT infrastructure & bioclinical research DW Clinical CDW EHR/CDW integration EHR A subject-oriented, integrated, time-variant, and nonvolatile collection of data Patient-oriented from heterogeneous sources time-variant permanent in support of management decisions in support of management in support of decision & knowledge discovery individual decision [Inmon WH. Building a Data Warehouse. John Wiley & Sons, 1996 Patient from heterogeneous sources longitudinal permanent Structures HEGP hospital Biobank Translational research building Information system ADT, EHR, CPOE, Appoint. CDW (i2b2) CDW (i2b2+tranSMART) IT committees IT Governance/IT committee Ethical/research committee Institution Review Board (IRB) 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 HEGP Bio-banque (2008-) EDC HEGP Droits d’accès • Etudes niveau 1 : Données agrégées (e.g., recrutement potentiel dans les essais thérapeutiques) Ø Accès libre pour tous les professionnels de santé de l’HEGP • Etudes niveau 2 et 3 : Accès aux données individuelles des patients Ø Projet structure écrit Ø Evaluation/validation par le comité de la recherche d’HEGP (X. Jeunemaitre) Ø Transmission au comité IRB Ile de France (C. Hervé) Ø Niveau 2 : données patients anonymisées Ø Niveau 3 : données nominatives HEGP CDW EHR/CDW integration : concept dimension CIS Reference manager ETL tools I2B2 Concept dimension HEGP CDW Data sources mapping to CDW Zapletal E, Rodon E, Grabar N, Degoulet P. Methodology of integration of a clinical data warehouse with a clinical information system. Stud Health Technol Inform. 2010; 160 (Pt 1): 193-7. EHR/CDW integration : anonymization HEGP CDW (EHR) Talend Open Studio DEID Zapletal E, Rodon E, Grabar N, Degoulet P. Methodology of integration of a clinical data warehouse with a clinical information system. Stud Health Technol Inform. 2010; 160 (Pt 1): 193-7. (CDW) CDW content Dimensions i2b2 CDW content (December 2012) Categories Patient Concept dimension Numbers 606 524 ICD10 classification Laboratory results classification Drug classification (ATC) EHR forms concepts Observation facts ICD10 Diagnosis 21 356 8 272 33 612 5 950 2 626 792 Laboratory results 88 607 301 Drug prescriptions EHR forms items 2 612 742 Text reports 46 506 217 1 961 985 EDC Applications 1. Recherche guidée par les données patients (réutilisation des données des dossiers patients) – Sélection de patients pour les études de recherche clinique (e.g., EHR4CR) – Augmentation phénotypique (e.g., enrichissement d’une étude de recherche clinique avec les données du dossier patient) – Evaluation in-silico de règles de décision clinique – Fouille de données et génération d’hypothèses 2. Intégration Génotypes/Phénotypes – Recherche/validation de biomarqueurs – « Genome/Phenome Wide Association Studies » (GeWAS/PheWAS) – Médecine personnalisée Augmentation phénotypique - Kohane IS. Using electronic health records to drive discovery in disease genomics. Nature Reviews Genetics. 18 mai 2011;12(6): 417‑428. - Pates RD, Scully KW, Einbinder JS, Merkel RL, Stukenborg GJ, Spraggins TA, et al. Adding value to clinical data by linkage to a public death registry. Stud Health Technol Inform. 2001;84(Pt 2): 1384‑1388. Variables • Appariement entre : – Dossier patient informatisé – Etude de cohortes, essai cliniques, registres • Pour permettre un enrichissement des données : – Dans le temps – Nouvelles variables – Nouveaux patients s Temp Patient s Augmentation phénotypiques : cancers ORL Objectif : Evaluer la faisabilité de l’augmentation phénotypique d’une étude publiée à partir des données de dossiers patients informatisés de l’HEGP : • Etude sur 64 patients atteints de cancers ORL suivis entre 2004 et 2010 déjà publiée Allongement du temps de suivi • Description des variables disponibles pour l’enrichissement, puis sélection et intégration de celles pertinentes à intégrer Participation à l'étude Type de données Décès Statut vital Données cliniques Diagnostic Récidive loco-régionale Biologie Anatomopathologie Réintervention Traitement Dossier patient informatisé Visites de suivi Etude Cancers ORL [Fabien Joubert, Mémoire Master IBM 2013] Résultats – Description des variables dans l’EDC pour les patients de l’étude Période de l’étude Cancers ORL Avant Type de données Démographiques Données vitales (température, PA, poids,…) Codes diagnostiques (CIM10) Actes (codes CCAM) Données cliniques (questionnaires DxCare) Comptes rendus (consultation, hospitalisation, opératoires) Anatomopathologie (comptes rendus, codes ADICAP) Résultats de biologie Prescriptions (hors chimiothérapie) Patients uniques -‐ -‐ Patients uniques 64 2 249 7 41 Après 64 Patients uniques -‐ 18 696 5 697 53 151 64 64 3 151 3 818 12 36 290 464 32 1 658 63 21 240 29 6 289 51 109 64 1 991 41 334 2 15 64 1 086 11 118 55 3 745 64 30 422 25 5 378 1 51 8 71 5 198 Instances Instances Instances [Fabien Joubert, Mémoire Master IBM 2013] -‐ [Fabien Joubert, Mémoire Master IBM 2013] EDC Applications 1. Recherche guidée par les données patients (réutilisation des données des dossiers patients) – Sélection de patients pour les études de recherche clinique (e.g., EHR4CR) – Augmentation phénotypique (e.g., enrichissement d’une étude de recherche clinique avec les données du dossier patient) – Evaluation in-silico de règles de décision clinique – Fouille de données et génération d’hypothèses 2. Intégration Génotypes/Phénotypes – Recherche/validation de biomarqueurs – « Genome/Phenome Wide Association Studies » (GeWAS/PheWAS) – Médecine personnalisée CIS use In vivo evaluation of decision rules (EHR) Rate of inappropriate prescriptions 6 alternating 2-month phases: control vs. intervention (Aug. 2006- Aug. 2007) Physicians Junior Senior p Alerting off 21.5% 20.9% p=0.88 Total 21.3% Alerting on 16.3% 29.3% p=0.01 p 19.9% 0.63 (NS) Sellier E et al. Effect of alerts for drug dosage adjustments in inpatients with renal insufficiency. JAMIA 2009; 16:203-10. Applications des EDC Evaluation in-silico des règles de décision • Validation médicale/pharmaceutique des prescriptions de médicaments • Source de données cliniques (SIC) ü Prescriptions médicales (DxCare) ü Validation des prescriptions médicales (DxCare) – Concepts (SIC/EDC) = ü Classification ATC des médicaments (n= 33,000 concepts) ü Local classification locale des codes de validation des pharmaciens – Observations (EDC) = ü Prescriptions médicales et validations des pharmaciens CDW applications In-silico evaluation of decision rules Development and optimization of clinical decision rules for dosage adjustment of « renal function dependent » drugs Boussadi A, Caruba T, Zapletal E, Sabatier B, Durieux P, Degoulet P. A clinical data warehouse– based process for refining medication orders alerts. J Am Med Inform Assoc 2012; 19(5): 782-5 CDW applications In-silico evaluation of decision rules (CDW) Initial set (CPOE vn) Suppressed : 45 (16.1%) Final set (CPOE vn+1) 280 rules (10 drugs) Modified : 105 (37.5%) 371 rules (10 drugs) Added : 136 (48.2%) Boussadi A, Caruba T, Zapletal E, Sabatier B, Durieux P, Degoulet P. A clinical data warehouse– based process for refining medication orders alerts. J Am Med Inform Assoc 2012; 19(5): 782-5 EDC Applications 1. Recherche guidée par les données patients (réutilisation des données des dossiers patients) – Sélection de patients pour les études de recherche clinique (e.g., EHR4CR) – Augmentation phénotypique (e.g., enrichissement d’une étude de recherche clinique avec les données du dossier patient) – Evaluation in-silico de règles de décision clinique – Fouille de données et génération d’hypothèses 2. Intégration Génotypes/Phénotypes – Recherche/validation de biomarqueurs – « Genome/Phenome Wide Association Studies » (GeWAS/PheWAS) – Médecine personnalisée La prise simultanée de 2 médicaments entraîne-t-elle une insuffisance rénale aigüe lorsque la prise d’un seul de ces médicaments n’en entraîne pas ? Un exemple de Data Driven Research à partir des données de l’entrepôt de données cliniques de l’HEGP Dr Yannick Girardeau Encadrant : Dr Paul Avillach Co-encadrant : Dr Pierre Durieux - Biomedical informatics and public health department, University Hospital HEGP, AP-HP, Paris, France - INSERM UMR_S 872 team 22 : Information Sciences to support Personalized Medicine, Université Paris Descartes, Sorbonne Paris Cité, Faculté de médecine, Paris, France 49 Entrepôt de Données Cliniques de l’HEGP Activité de soins Anonymisation EDC Créatinine Exposition 50 Co-prescription et Insuffisance Rénale aigüe FOREST PLOT 45 couples classés par ORa décroissants. RIFLE = Risk ORa 52 EDC Applications 1. Recherche guidée par les données patients (réutilisation des données des dossiers patients) – Sélection de patients pour les études de recherche clinique (e.g., EHR4CR) – Augmentation phénotypique (e.g., enrichissement d’une étude de recherche clinique avec les données du dossier patient) – Evaluation in-silico de règles de décision clinique – Fouille de données et génération d’hypothèses 2. Intégration Génotypes/Phénotypes – Recherche/validation de biomarqueurs – « Genome/Phenome Wide Association Studies » (GeWAS/PheWAS) – Médecine personnalisée Adapted from [McCarthy et al, Nature Reviews Genetics, 2008 / Denny et al, Bioinformatics 2010] % Of Subjects Per 0.5 Units of Activity TPMT: activity distribution (genetically dependent trait) 298 Unrelated Adults TPMTH/TPMTH wild/wild 10 TPMTL/TPMTH mutant/wild 5 L/TPMTL TPMT mutant/mutant 0 0 5 10 15 20 TPMT Activity, Units/ml RBC Lennard, Therapeu-c drug monitoring of an-metabolic cytothoxic drugs, Bri-sh journal of Clinical Pharmacology 2001 Low TMTP value after thiopurine administration Neuraz A, Avillach P et al. HEGP CDW use i2b2 CDW queries (Jan. 2011-Dec. 2012) • 170 MD + Pharmacists trained • 1864 type 1 requests CDW use Type 2/3 project (Jan. 2011-Dec. 2012) • i2b2 projects – 39 submitted projects – 19 accepted projects • i2b2 + tranSMART – 3 submitted projects – 3 accepted projects La réutilisation des données 1. 2. 3. 4. Définitions Principes Applications Conclusion Réutilisation des données des SIC Conclusion (1) Etat actuel • Le développement des entrepôt de données (bio)cliniques est au cœur de la réutilisation des données • Les outils (open-source) existent pour construire rapidement les environnements techniques nécessaires – dictionnaires de concepts cliniques et omiques, – outils d’extraction/transformation – modèles de stockage « ouverts » – outils d’interrogation Réutilisation des données des SIC Conclusion (1) Bénéfices de l’approche • L’utilisation de modèles dédiés permet de s’affranchir de la complexité des modèles des systèmes de production • Le chaînage inhérent au SIC se retrouve dans les EDC • Les procédures d’anonymisation inhérentes aux outils des EDC deviennent transparentes • Granularité faible pour les données cliniques et/ou d’investigation • La disponibilité des données est à l’origine de cercles vertueux au niveau des professionnels (ex. Amélioration des questionnaires structures) Réutilisation des données des SIC Conclusion (3) Limites de l’approche • Biais de constitution des cohortes (hospitalières) • La couverture s’arrête aux frontières des dictionnaires de concepts et des structures concernées Perspectives • Extension phénotypique hors domaine hospitalier couvert (e.g., mortalité, réhospitalisations) • Intégration d’un coût de stockage des échantillons et des données secondaires qui seront générées • Développement d’outils d’intégration sémantique pour les données omiques Acknowledgments Informatics & Public Health Dept. Anita Burgun, MD-PhD Pierre Durieux, MD-MSc Eric Zapletal, PhD Pharmacy Pr. Patrice Prognon Brigitte Sabatier Students Vincent Canuel, MD Yannick Girardeaux, MD Fabien Joubert, MD Antoine Neuraz, MD Industrials www.medasys.com www.i2b2.org www.transmartproject.org www.recomdata.com Contact : [email protected]