Fiche Concept SOA
Transcription
Fiche Concept SOA
FICHE CONCEPT 04 DICTIONNAIRE DES METADONNEES BIEN GERER SES REFERENTIELS DE DONNEES : UN ENJEU POUR MIEUX PILOTER LA PERFORMANCE DE SON ETABLISSEMENT Version 1.0 octobre 2008 GMSIH – 44, Rue de Cambronne – 75015 Paris. Tel : 01 48 56 72 70. Fax : 01 48 56 07 70 Fiche concept 04 : dictionnaire des métadonnées Projet : Bien gérer ses référentiels de données : un enjeu pour mieux piloter la performance de son établissement Version 1.0 Copyright © 2008 GMSIH Permission vous est donnée de copier et distribuer ce document selon les termes de la Licence D-GMSIH, Version 2.0 ou ultérieure publiée par le GMSIH. Une copie de cette licence peut être consultée à l’adresse : http://www.gmsih.fr/fre/nos_publications/licences_gmsih Versions du document : Date Version Octobre 2008 1.0 08/10/08 Commentaires Publication de l’étude 2/12 Statut Validé P132_Fconcept04_Métadonnées_V1.0 Fiche concept 04 : dictionnaire des métadonnées Projet : Bien gérer ses référentiels de données : un enjeu pour mieux piloter la performance de son établissement Version 1.0 Sommaire 1. Description du concept et des outils associés .........................................................................5 1.1 Les métadonnées concrètement ...........................................................................................5 1.2 D’où viennent les métadonnées ? .........................................................................................5 1.3 Les logiciels du marché .........................................................................................................6 1.4 Développements spécifiques ................................................................................................6 1.5 La situation en établissement de santé ................................................................................7 2. Principaux enjeux pour les établissements de santé ...............................................................8 3. Mise en œuvre ..............................................................................................................................9 4. Illustrations ................................................................................................................................ 10 08/10/08 3/12 P132_Fconcept04_Métadonnées_V1.0 Projet : Bien gérer ses référentiels de données : un enjeu pour mieux piloter la performance de son établissement Fiche concept 04 : dictionnaire des métadonnées Définition Version 1.0 Fonctionnalités et enjeux associés Une métadonnée est une donnée qui sert à définir ou à décrire une autre donnée. Une métadonnée peut avoir une orientation fonctionnelle (définition d’un indicateur de pilotage par exemple), technique (liste des tables sources nécessaires au calcul de l’indicateur par exemple) ou qualité (nombre de dossiers patient en anomalie par exemple). Dans un système décisionnel, la mise en valeur de ces métadonnées permet de contribuer à la pertinence et à la qualité des données, à la cohérence de la solution et à sa facilité de maintenance. Un système d’information contient de nombreuses métadonnées. Elles peuvent être rassemblées dans un dictionnaire de métadonnées comprendra tout ou partie des métadonnées. Le dictionnaire des métadonnées vise à les valoriser. Il dispose des fonctionnalités suivantes : import et mise en cohérence de métadonnées contenues dans des systèmes multiples enrichissement par saisie d’informations complémentaires recherches et analyses d’impact publication sur un intranet Schéma explicatif Chaque étage de l’architecture du Système d’Information Décisionnel (SID) contient des métadonnées, qui pourront être collectées et valorisées dans le dictionnaire des métadonnées. Par exemple, le dictionnaire des métadonnées pourra récupérer : la définition des tables sources, les règles de transformation mises en œuvre dans l’ETL, la définition des axes d’analyse implémentés dans les bases de données cibles les indicateurs utilisés dans un tableau de bord à partir de l’outil de reporting les définitions métier des indicateurs dans un fichier tableur Exemples d’outils du marché Outils spécialisés: ASG Rochade, Synergy Meta Analysis, IBM Metadata Server, MetaIntegration MIMB, Business Objects Metadata Manager, SAS Metadata Management Coûts macroscopiques De 20 k€ à plus de 100 k€ État des lieux (2008) Souvent rencontré en établissement de santé Parfois rencontré en établissement de santé Rare en établissement de santé Outils non spécialisés mais avec des fonctionnalités: outils d’alimentation (voir fiche ETL), outils de modélisation de type Power AMC 08/10/08 4/12 P132_Fconcept04_Métadonnées_V1.0 Fiche concept 04 : dictionnaire des métadonnées Projet : Bien gérer ses référentiels de données : un enjeu pour mieux piloter la performance de son établissement Version 1.0 1. DESCRIPTION DU CONCEPT ET DES OUTILS ASSOCIES 1.1 LES METADONNEES CONCRETEMENT On peut distinguer plusieurs grandes catégories de métadonnées : Les métadonnées fonctionnelles : il peut s’agir par exemple des termes métier, de la définition des indicateurs, ou de la liste des tableaux de bord. Les métadonnées techniques : elles sont généralement directement fournies par les outils de modélisation, de stockage, d’alimentation ou de reporting. Elles recensent tous les composants du système (tables, colonnes, flux de données, indicateurs, axes, tableaux de bord, "univers" ou "catalogue", …) et dans la mesure du possible les dépendances entre ces composants. Ces métadonnées permettent les analyses d’impact (si je modifie cet indicateur, quels sont les tableaux de bord impactés ?) et de dépendances (quelles sont les applications opérationnelles utilisées comme sources de ce tableau de bord ?). Elles permettent de faciliter les maintenances et de garantir l’évolutivité du système Les métadonnées qualité : il peut s’agir de la date de dernière mise à jour, du nombre de lignes dans les tables, d’informations sur les rejets, de rapports d’alertes sur des anomalies qualité, du suivi d’utilisation, etc. Ces métadonnées permettent de s’intéresser à la qualité des données et aux usages des utilisateurs. Remarque : ces métadonnées sont parfois appelées "métadonnées d’exploitation". Voici quelques exemples de questions auxquelles les métadonnées permettent de répondre rapidement: Comment sont définis mes indicateurs ? Dans quels tableaux de bord mon indicateur apparaît-il ? Comment est-il calculé ? Quelles sont les tables utilisées par ce tableau de bord ? Quel est l’impact de cette évolution de format dans les données sources ? Quelles valeurs peut prendre le type d’UF ? Quand la table a t-elle été chargée ? Quels sont les tableaux de bord non consultés depuis plus d’un an ? Quel est l’impact d’une évolution dans le système source sur le SID ? 1.2 D’OU VIENNENT LES METADONNEES ? Beaucoup d’outils informatiques centralisent des métadonnées sous forme de base de données ou de fichiers. Voici quelques exemples de sources de métadonnées: ETL : liens entre données sources et cibles, règles de calcul, … Base de données : format des données, nombre de lignes, … Outil de modélisation : description des tables et colonnes, … Ordonnanceur et log d’exécution : date de mise à jour, nombre de lignes chargées, … Outil de reporting : liste des tableaux de bord, des indicateurs contenus dans ces tableaux de bord, liens entre les tableaux de bord et les tables de la base de données dans lesquelles les données sont puisées, … Base de données multidimensionnelle : liste des cubes, axes d’analyse et indicateurs, … Certaines métadonnées ne sont pas issues d’outils, mais sont produites par saisie, comme par exemple la définition des indicateurs de pilotage (et de nombreuses données fonctionnelles), et sont contenues dans des fichiers de type tableur (ou parfois traitement de texte), ou éventuellement dans une petite base de données dédiée. 08/10/08 5/12 Fiche concept 04 : dictionnaire des métadonnées Projet : Bien gérer ses référentiels de données : un enjeu pour mieux piloter la performance de son établissement Version 1.0 1.3 LES LOGICIELS DU MARCHE On distingue deux grandes catégories d’outils. Les fonctionnalités des outils peuvent varier en fonction du niveau de complexité des métadonnées gérées dans le dictionnaire de métadonnées. Les outils spécialisés dans la gestion des métadonnées : certains sont assez simples et proposent une orientation plutôt fonctionnelle alors que d’autres sont plus orientés sur les métadonnées techniques et de qualité. Ils proposent les fonctionnalités suivantes : o Services d’alimentation des métadonnées : import de métadonnées contenues dans des outils tiers (connecteurs) rapprochements automatiques entre métadonnées issues de sources différentes enrichissement par saisie ou import de documents gestion des versions o Services d’analyse : moteur de recherche analyses d’impacts et de dépendance présentation des métadonnées via un intranet gestion des habilitations Ils sont très peu déployés dans les établissements de santé et en cours de mise en œuvre dans d’autres secteurs d’activité. Les outils dont la finalité principale n’est pas la gestion des métadonnées mais qui offrent un premier niveau de fonctionnalités : la plupart des ETL permettent par exemple l’import des métadonnées contenues dans les SGBDR et un premier niveau d’analyse d’impact sur les traitements d’alimentation, lorsque des sources de données évoluent par exemple. De même, les outils de modélisations de bases de données peuvent récupérer des métadonnées des SGBDR (définition des tables ou nombre de lignes par exemple) et proposent des fonctionnalités de recherche (recherche des données qui ont un lien avec le terme "DMS" par exemple). L’Object Management Group (http://www.omg.org/technology/cwm/) a défini une norme d’échange de métadonnées : CWM (Common Warehouse Model). Certains éditeurs proposent des fonctionnalités d’export ou d’import dans ce format. Ainsi, si l’ETL est capable d’exporter ses métadonnées dans le format CWM, on pourra les importer dans un dictionnaire de métadonnées, si celui-ci dispose d’une interface d’import CWM. Bien que ce standard soit le plus avancé, l’interopérabilité entre les outils de différents éditeurs n’est pas encore totale. 1.4 DEVELOPPEMENTS SPECIFIQUES Sans se lancer dans la mise en œuvre d’une solution spécialisée complexe, et afin par exemple de compléter les fonctionnalités offertes par l’ETL ou d’initier un premier dictionnaire lors d’un projet de SID, on peut être amené à construire une solution spécifique. Il peut s’agir d’une petite base de données administrée manuellement et associée à un portail pour diffuser l’information. L’import de certaines métadonnées contenues dans l’ETL ou les SGBDR peut être automatisé. L’avantage de ce genre de solution est de démarrer sur une solution simple qu’on enrichira progressivement. 08/10/08 6/12 Fiche concept 04 : dictionnaire des métadonnées Projet : Bien gérer ses référentiels de données : un enjeu pour mieux piloter la performance de son établissement Version 1.0 1.5 LA SITUATION EN ETABLISSEMENT DE SANTE Dans les établissements de santé avec un SID ou des infocentres importants, on trouve souvent un premier niveau de dictionnaire de métadonnées orienté utilisateurs finaux, qui contient la définition des indicateurs et des tableaux de bord disponibles. Les informations qu’il contient sont mises à jour manuellement, par un administrateur. De son côté, la maîtrise d’œuvre dispose souvent de métadonnées disparates et rarement d’un système de rapprochement automatique de métadonnées issues de plusieurs sources. Parfois, de petits utilitaires ont été développés spécifiquement pour enrichir de façon plus industrielle ces métadonnées techniques. 08/10/08 7/12 Fiche concept 04 : dictionnaire des métadonnées Projet : Bien gérer ses référentiels de données : un enjeu pour mieux piloter la performance de son établissement Version 1.0 2. PRINCIPAUX ENJEUX POUR LES ETABLISSEMENTS DE SANTE Les principaux enjeux pour les établissements de santé sont les suivants : Faciliter la mise en œuvre du SID : par le partage MOE/MOA sur les définitions des indicateurs Améliorer la maturité de gestion : l’appropriation du SID est favorisée grâce à un portail d’informations fiables et partagées sur les données qu’il contient et grâce à l’analyse continue de l’usage qui en est fait. De plus, le dialogue entre maîtrise d’ouvrage et maîtrise d’œuvre est facilité. Améliorer la qualité des données : il est plus facile de garantir la cohérence du système d’information décisionnel au cours du temps et de surveiller la qualité des données au jour le jour lorsqu’on dispose d’un dictionnaire de métadonnées Réduire les coûts de mise en œuvre et de maintenance : lorsque les métadonnées sont organisées, fiables et faciles d’accès, les analyses fonctionnelles et d’impact sont facilitées. De plus, les risques d’effets de bord lors de nouveaux développements sont minimisés. 08/10/08 8/12 Fiche concept 04 : dictionnaire des métadonnées Projet : Bien gérer ses référentiels de données : un enjeu pour mieux piloter la performance de son établissement Version 1.0 3. MISE EN ŒUVRE La mise en place d’un outil de gestion des métadonnées est souvent progressive : Mise en place d’un dictionnaire orienté métier pour les utilisateurs finaux, sous forme de fichier tableur ou d’un intranet simple. Ce dictionnaire peut être mis en place relativement en amont d’un projet décisionnel et correspond à une partie des spécifications fonctionnelles. Il contient la définition des indicateurs et des axes d’analyse d’un point de vue métier. Il facilite le dialogue entre maîtrise d’ouvrage et maîtrise d’œuvre. On l’appelle souvent "dictionnaire de données" (voir illustration 1) Mise en place d’une documentation de référence technique facilement maintenable, souvent sous forme de fichiers tableur (voir Illustration 2). En parallèle, les fonctionnalités plus ou moins avancées de l’ETL en termes de métadonnées sont utilisées Mise en place d’une organisation dédiée à l’administration des données décisionnelles, qui aura une vision transverse du système et des projets Mise en place d’utilitaires afin d’automatiser une partie de la mise à jour de ces documents de référence Mise en place d’une solution plus avancée, de type intranet de métadonnées, avec moteur de recherche et récupération des métadonnées d’exploitation (voir Illustration 3) Avant d’aboutir à une solution évoluée, les équipes en charge du projet devront faire face à certaines difficultés, dont voici quelques exemples typiques : Nécessité de disposer d’une compréhension globale de l’architecture fonctionnelle et technique et d’une expertise des différents outils dont on souhaite connecter les métadonnées Difficultés dans l’extraction des métadonnées des différents outils sources, qui sont parfois stockées dans des formats difficilement exploitables et/ou non documentés Extraire des métadonnées de certaines briques du SID, comme des procédures stockées par exemple, est extrêmement complexe de façon automatique Des normes de développement devront parfois être définies et respectées pour pouvoir extraire et relier automatiquement les métadonnées Nécessité de mettre en place une organisation entre administrateurs du dictionnaire des métadonnées et équipes de développement/ maintenance du SID afin d’assurer la maintenance des métadonnées 08/10/08 9/12 Fiche concept 04 : dictionnaire des métadonnées Projet : Bien gérer ses référentiels de données : un enjeu pour mieux piloter la performance de son établissement Version 1.0 4. ILLUSTRATIONS Illustration 1 : Exemple de métadonnées fonctionnelles : 08/10/08 10/12 P132_Fconcept04_Métadonnées_V1.0 Fiche concept 04 : dictionnaire des métadonnées Projet : Bien gérer ses référentiels de données : un enjeu pour mieux piloter la performance de son établissement Version 1.0 Illustration 2 : Exemple de métadonnées techniques administrées sous Excel : Traitement JeDDENGAlimTableDtpltResttMarcRangAffc001 JeDDENGAlimTableDtpltResttMarcRangAffc001 JeDDENGAlimTableDtpltResttMarcRangAffc001 JeDDENGAlimTableDtpltResttMarcRangAffc001 JeDDENGAlimTableDtpltResttMarcRangAffc001 JeDDENGAlimTableDtpltResttMarcRangAffc001 JeDDENGAlimTableDtpltResttMarcRangAffc001 Table cible Table en sortie du traitement DTPLT_RESTT_MARC_RANG_AFFC DTPLT_RESTT_MARC_RANG_AFFC DTPLT_RESTT_MARC_RANG_AFFC DTPLT_RESTT_MARC_RANG_AFFC DTPLT_RESTT_MARC_RANG_AFFC DTPLT_RESTT_MARC_RANG_AFFC DTPLT_RESTT_MARC_RANG_AFFC Table en entrée du traitement DW_MARC DW_MARC DW_MARC DW_MARC DW_MARC DW_MARC DW_MARC M AR CODE_NATR_OPRT M AR CODE_ORGN_FINN DEFF_EDS M AR M ENG DEFF_HIER_PRDT_DECI M ENG DTPLT_RESTT_EDS_MARC DTPLT_RESTT_MARC_RANG_AFFC 08/10/08 DATE_DEBU_VALD_INFO DATE_FIN_VALD_INFO LIBL_CRT_MARC LIBL_CRT_REGR_MARC_N_1 LIBL_CRT_REGR_MARC_N_2 LIBL_CRT_REGR_MARC_N_3 LIBL_LONG_MARC Fréquence d'alimentation table Méthode d'historisation table cible cible CODE_EVNM_GEST DIM_TEMPS Colonnes en entrée du traitement M AR Initialisation ENG M ENG 11/12 Traitement TFID_M TJ01_Q TJ02_Q TJ03_H TJ04_Q TJ05_Q TJ06_Q TJ07_Q Périodicité M Q Q H Q Q Q Q Vient après TN01_Q TT02_Q TV24_Q TT02_Q TQ9V_Q TV03_Q TN21_Q TN43_Q P132_Fconcept04_Métadonnées_V1.0 Fiche concept 04 : dictionnaire des métadonnées Projet : Bien gérer ses référentiels de données : un enjeu pour mieux piloter la performance de son établissement Version 1.0 Illustration 3 : Exemple de portail de métadonnées relatif à la qualité: 08/10/08 12/12 P132_Fconcept04_Métadonnées_V1.0