Fiche Concept SOA

Transcription

Fiche Concept SOA
FICHE CONCEPT 04
DICTIONNAIRE DES METADONNEES
BIEN GERER SES REFERENTIELS DE DONNEES : UN ENJEU
POUR MIEUX PILOTER LA PERFORMANCE DE SON
ETABLISSEMENT
Version 1.0 octobre 2008
GMSIH – 44, Rue de Cambronne – 75015 Paris. Tel : 01 48 56 72 70. Fax : 01 48 56 07 70
Fiche concept 04 : dictionnaire des métadonnées
Projet : Bien gérer ses référentiels de données : un
enjeu pour mieux piloter la performance de son
établissement
Version 1.0
Copyright © 2008 GMSIH
Permission vous est donnée de copier et distribuer ce document selon les termes de la
Licence D-GMSIH, Version 2.0 ou ultérieure publiée par le GMSIH.
Une copie de cette licence peut être consultée à l’adresse :
http://www.gmsih.fr/fre/nos_publications/licences_gmsih
Versions du document :
Date
Version
Octobre 2008
1.0
08/10/08
Commentaires
Publication de l’étude
2/12
Statut
Validé
P132_Fconcept04_Métadonnées_V1.0
Fiche concept 04 : dictionnaire des métadonnées
Projet : Bien gérer ses référentiels de données : un
enjeu pour mieux piloter la performance de son
établissement
Version 1.0
Sommaire
1.
Description du concept et des outils associés .........................................................................5
1.1
Les métadonnées concrètement ...........................................................................................5
1.2
D’où viennent les métadonnées ? .........................................................................................5
1.3
Les logiciels du marché .........................................................................................................6
1.4
Développements spécifiques ................................................................................................6
1.5
La situation en établissement de santé ................................................................................7
2.
Principaux enjeux pour les établissements de santé ...............................................................8
3.
Mise en œuvre ..............................................................................................................................9
4.
Illustrations ................................................................................................................................ 10
08/10/08
3/12
P132_Fconcept04_Métadonnées_V1.0
Projet : Bien gérer ses référentiels de données : un
enjeu pour mieux piloter la performance de son
établissement
Fiche concept 04 : dictionnaire des métadonnées
Définition
Version 1.0
Fonctionnalités et enjeux associés
Une métadonnée est une donnée qui sert à définir ou à décrire une autre donnée.
Une métadonnée peut avoir une orientation fonctionnelle (définition d’un indicateur
de pilotage par exemple), technique (liste des tables sources nécessaires au
calcul de l’indicateur par exemple) ou qualité (nombre de dossiers patient en
anomalie par exemple).
Dans un système décisionnel, la mise en valeur de ces métadonnées permet de
contribuer à la pertinence et à la qualité des données, à la cohérence de la
solution et à sa facilité de maintenance.
Un système d’information contient de nombreuses métadonnées.
Elles peuvent être rassemblées dans un dictionnaire de métadonnées
comprendra tout ou partie des métadonnées.
Le dictionnaire des métadonnées vise à les valoriser. Il dispose des
fonctionnalités suivantes :
import et mise en cohérence de métadonnées contenues dans des systèmes
multiples
enrichissement par saisie d’informations complémentaires
recherches et analyses d’impact
publication sur un intranet
Schéma explicatif
Chaque étage de l’architecture du Système d’Information Décisionnel
(SID) contient des métadonnées, qui pourront être collectées et
valorisées dans le dictionnaire des métadonnées.
Par exemple, le dictionnaire des métadonnées pourra récupérer :
la définition des tables sources,
les règles de transformation mises en œuvre dans l’ETL,
la définition des axes d’analyse implémentés dans les bases de
données cibles
les indicateurs utilisés dans un tableau de bord à partir de l’outil de
reporting
les définitions métier des indicateurs dans un fichier tableur
Exemples d’outils du marché
Outils spécialisés: ASG Rochade, Synergy Meta
Analysis, IBM Metadata Server, MetaIntegration
MIMB, Business Objects Metadata Manager, SAS
Metadata Management
Coûts macroscopiques
De 20 k€ à plus de 100 k€
État des lieux (2008)
 Souvent rencontré en établissement de santé
 Parfois rencontré en établissement de santé
 Rare en établissement de santé
Outils non spécialisés mais avec des
fonctionnalités: outils d’alimentation (voir fiche ETL),
outils de modélisation de type Power AMC
08/10/08
4/12
P132_Fconcept04_Métadonnées_V1.0
Fiche concept 04 : dictionnaire des métadonnées
Projet : Bien gérer ses référentiels de données : un
enjeu pour mieux piloter la performance de son
établissement
Version 1.0
1. DESCRIPTION DU CONCEPT ET DES OUTILS ASSOCIES
1.1 LES METADONNEES CONCRETEMENT
On peut distinguer plusieurs grandes catégories de métadonnées :
Les métadonnées fonctionnelles : il peut s’agir par exemple des termes métier, de la définition
des indicateurs, ou de la liste des tableaux de bord.
Les métadonnées techniques : elles sont généralement directement fournies par les outils de
modélisation, de stockage, d’alimentation ou de reporting. Elles recensent tous les composants du
système (tables, colonnes, flux de données, indicateurs, axes, tableaux de bord, "univers" ou
"catalogue", …) et dans la mesure du possible les dépendances entre ces composants. Ces
métadonnées permettent les analyses d’impact (si je modifie cet indicateur, quels sont les
tableaux de bord impactés ?) et de dépendances (quelles sont les applications opérationnelles
utilisées comme sources de ce tableau de bord ?). Elles permettent de faciliter les maintenances
et de garantir l’évolutivité du système
Les métadonnées qualité : il peut s’agir de la date de dernière mise à jour, du nombre de lignes
dans les tables, d’informations sur les rejets, de rapports d’alertes sur des anomalies qualité, du
suivi d’utilisation, etc. Ces métadonnées permettent de s’intéresser à la qualité des données et
aux usages des utilisateurs. Remarque : ces métadonnées sont parfois appelées "métadonnées
d’exploitation".
Voici quelques exemples de questions auxquelles les métadonnées permettent de répondre
rapidement:
Comment sont définis mes indicateurs ?
Dans quels tableaux de bord mon indicateur apparaît-il ?
Comment est-il calculé ?
Quelles sont les tables utilisées par ce tableau de bord ?
Quel est l’impact de cette évolution de format dans les données sources ?
Quelles valeurs peut prendre le type d’UF ?
Quand la table a t-elle été chargée ?
Quels sont les tableaux de bord non consultés depuis plus d’un an ?
Quel est l’impact d’une évolution dans le système source sur le SID ?
1.2 D’OU VIENNENT LES METADONNEES ?
Beaucoup d’outils informatiques centralisent des métadonnées sous forme de base de données ou de
fichiers. Voici quelques exemples de sources de métadonnées:
ETL : liens entre données sources et cibles, règles de calcul, …
Base de données : format des données, nombre de lignes, …
Outil de modélisation : description des tables et colonnes, …
Ordonnanceur et log d’exécution : date de mise à jour, nombre de lignes chargées, …
Outil de reporting : liste des tableaux de bord, des indicateurs contenus dans ces tableaux de
bord, liens entre les tableaux de bord et les tables de la base de données dans lesquelles les
données sont puisées, …
Base de données multidimensionnelle : liste des cubes, axes d’analyse et indicateurs, …
Certaines métadonnées ne sont pas issues d’outils, mais sont produites par saisie, comme par
exemple la définition des indicateurs de pilotage (et de nombreuses données fonctionnelles), et sont
contenues dans des fichiers de type tableur (ou parfois traitement de texte), ou éventuellement dans
une petite base de données dédiée.
08/10/08
5/12
Fiche concept 04 : dictionnaire des métadonnées
Projet : Bien gérer ses référentiels de données : un
enjeu pour mieux piloter la performance de son
établissement
Version 1.0
1.3 LES LOGICIELS DU MARCHE
On distingue deux grandes catégories d’outils. Les fonctionnalités des outils peuvent varier en
fonction du niveau de complexité des métadonnées gérées dans le dictionnaire de métadonnées.
Les outils spécialisés dans la gestion des métadonnées : certains sont assez simples et
proposent une orientation plutôt fonctionnelle alors que d’autres sont plus orientés sur les
métadonnées techniques et de qualité. Ils proposent les fonctionnalités suivantes :
o Services d’alimentation des métadonnées :
 import de métadonnées contenues dans des outils tiers
(connecteurs)
 rapprochements automatiques entre métadonnées issues de
sources différentes
 enrichissement par saisie ou import de documents
 gestion des versions
o
Services d’analyse :
 moteur de recherche
 analyses d’impacts et de dépendance
 présentation des métadonnées via un intranet
 gestion des habilitations
Ils sont très peu déployés dans les établissements de santé et en cours de mise en œuvre dans
d’autres secteurs d’activité.
Les outils dont la finalité principale n’est pas la gestion des métadonnées mais qui offrent
un premier niveau de fonctionnalités : la plupart des ETL permettent par exemple l’import des
métadonnées contenues dans les SGBDR et un premier niveau d’analyse d’impact sur les
traitements d’alimentation, lorsque des sources de données évoluent par exemple. De même, les
outils de modélisations de bases de données peuvent récupérer des métadonnées des SGBDR
(définition des tables ou nombre de lignes par exemple) et proposent des fonctionnalités de
recherche (recherche des données qui ont un lien avec le terme "DMS" par exemple).
L’Object Management Group (http://www.omg.org/technology/cwm/) a défini une norme d’échange de
métadonnées : CWM (Common Warehouse Model). Certains éditeurs proposent des fonctionnalités
d’export ou d’import dans ce format. Ainsi, si l’ETL est capable d’exporter ses métadonnées dans le
format CWM, on pourra les importer dans un dictionnaire de métadonnées, si celui-ci dispose d’une
interface d’import CWM. Bien que ce standard soit le plus avancé, l’interopérabilité entre les outils de
différents éditeurs n’est pas encore totale.
1.4 DEVELOPPEMENTS SPECIFIQUES
Sans se lancer dans la mise en œuvre d’une solution spécialisée complexe, et afin par exemple de
compléter les fonctionnalités offertes par l’ETL ou d’initier un premier dictionnaire lors d’un projet de
SID, on peut être amené à construire une solution spécifique.
Il peut s’agir d’une petite base de données administrée manuellement et associée à un portail pour
diffuser l’information. L’import de certaines métadonnées contenues dans l’ETL ou les SGBDR peut
être automatisé. L’avantage de ce genre de solution est de démarrer sur une solution simple qu’on
enrichira progressivement.
08/10/08
6/12
Fiche concept 04 : dictionnaire des métadonnées
Projet : Bien gérer ses référentiels de données : un
enjeu pour mieux piloter la performance de son
établissement
Version 1.0
1.5 LA SITUATION EN ETABLISSEMENT DE SANTE
Dans les établissements de santé avec un SID ou des infocentres importants, on trouve souvent un
premier niveau de dictionnaire de métadonnées orienté utilisateurs finaux, qui contient la définition
des indicateurs et des tableaux de bord disponibles. Les informations qu’il contient sont mises à jour
manuellement, par un administrateur. De son côté, la maîtrise d’œuvre dispose souvent de
métadonnées disparates et rarement d’un système de rapprochement automatique de métadonnées
issues de plusieurs sources. Parfois, de petits utilitaires ont été développés spécifiquement pour
enrichir de façon plus industrielle ces métadonnées techniques.
08/10/08
7/12
Fiche concept 04 : dictionnaire des métadonnées
Projet : Bien gérer ses référentiels de données : un
enjeu pour mieux piloter la performance de son
établissement
Version 1.0
2. PRINCIPAUX ENJEUX POUR LES ETABLISSEMENTS DE SANTE
Les principaux enjeux pour les établissements de santé sont les suivants :
Faciliter la mise en œuvre du SID : par le partage MOE/MOA sur les définitions des indicateurs
Améliorer la maturité de gestion : l’appropriation du SID est favorisée grâce à un portail
d’informations fiables et partagées sur les données qu’il contient et grâce à l’analyse continue de
l’usage qui en est fait. De plus, le dialogue entre maîtrise d’ouvrage et maîtrise d’œuvre est
facilité.
Améliorer la qualité des données : il est plus facile de garantir la cohérence du système
d’information décisionnel au cours du temps et de surveiller la qualité des données au jour le jour
lorsqu’on dispose d’un dictionnaire de métadonnées
Réduire les coûts de mise en œuvre et de maintenance : lorsque les métadonnées sont
organisées, fiables et faciles d’accès, les analyses fonctionnelles et d’impact sont facilitées. De
plus, les risques d’effets de bord lors de nouveaux développements sont minimisés.
08/10/08
8/12
Fiche concept 04 : dictionnaire des métadonnées
Projet : Bien gérer ses référentiels de données : un
enjeu pour mieux piloter la performance de son
établissement
Version 1.0
3. MISE EN ŒUVRE
La mise en place d’un outil de gestion des métadonnées est souvent progressive :
Mise en place d’un dictionnaire orienté métier pour les utilisateurs finaux, sous forme de fichier
tableur ou d’un intranet simple. Ce dictionnaire peut être mis en place relativement en amont d’un
projet décisionnel et correspond à une partie des spécifications fonctionnelles. Il contient la
définition des indicateurs et des axes d’analyse d’un point de vue métier. Il facilite le dialogue
entre maîtrise d’ouvrage et maîtrise d’œuvre. On l’appelle souvent "dictionnaire de données" (voir
illustration 1)
Mise en place d’une documentation de référence technique facilement maintenable, souvent
sous forme de fichiers tableur (voir Illustration 2). En parallèle, les fonctionnalités plus ou moins
avancées de l’ETL en termes de métadonnées sont utilisées
Mise en place d’une organisation dédiée à l’administration des données décisionnelles, qui
aura une vision transverse du système et des projets
Mise en place d’utilitaires afin d’automatiser une partie de la mise à jour de ces documents de
référence
Mise en place d’une solution plus avancée, de type intranet de métadonnées, avec moteur de
recherche et récupération des métadonnées d’exploitation (voir Illustration 3)
Avant d’aboutir à une solution évoluée, les équipes en charge du projet devront faire face à certaines
difficultés, dont voici quelques exemples typiques :
Nécessité de disposer d’une compréhension globale de l’architecture fonctionnelle et technique et
d’une expertise des différents outils dont on souhaite connecter les métadonnées
Difficultés dans l’extraction des métadonnées des différents outils sources, qui sont parfois
stockées dans des formats difficilement exploitables et/ou non documentés
Extraire des métadonnées de certaines briques du SID, comme des procédures stockées par
exemple, est extrêmement complexe de façon automatique
Des normes de développement devront parfois être définies et respectées pour pouvoir extraire et
relier automatiquement les métadonnées
Nécessité de mettre en place une organisation entre administrateurs du dictionnaire des
métadonnées et équipes de développement/ maintenance du SID afin d’assurer la maintenance
des métadonnées
08/10/08
9/12
Fiche concept 04 : dictionnaire des métadonnées
Projet : Bien gérer ses référentiels de données : un enjeu pour mieux piloter la performance de son
établissement
Version 1.0
4. ILLUSTRATIONS
Illustration 1 : Exemple de métadonnées fonctionnelles :
08/10/08
10/12
P132_Fconcept04_Métadonnées_V1.0
Fiche concept 04 : dictionnaire des métadonnées
Projet : Bien gérer ses référentiels de données : un enjeu pour mieux piloter la performance de son
établissement
Version 1.0
Illustration 2 : Exemple de métadonnées techniques administrées sous Excel :
Traitement
JeDDENGAlimTableDtpltResttMarcRangAffc001
JeDDENGAlimTableDtpltResttMarcRangAffc001
JeDDENGAlimTableDtpltResttMarcRangAffc001
JeDDENGAlimTableDtpltResttMarcRangAffc001
JeDDENGAlimTableDtpltResttMarcRangAffc001
JeDDENGAlimTableDtpltResttMarcRangAffc001
JeDDENGAlimTableDtpltResttMarcRangAffc001
Table cible
Table en sortie du traitement
DTPLT_RESTT_MARC_RANG_AFFC
DTPLT_RESTT_MARC_RANG_AFFC
DTPLT_RESTT_MARC_RANG_AFFC
DTPLT_RESTT_MARC_RANG_AFFC
DTPLT_RESTT_MARC_RANG_AFFC
DTPLT_RESTT_MARC_RANG_AFFC
DTPLT_RESTT_MARC_RANG_AFFC
Table en entrée du
traitement
DW_MARC
DW_MARC
DW_MARC
DW_MARC
DW_MARC
DW_MARC
DW_MARC
M
AR
CODE_NATR_OPRT
M
AR
CODE_ORGN_FINN
DEFF_EDS
M
AR
M
ENG
DEFF_HIER_PRDT_DECI
M
ENG
DTPLT_RESTT_EDS_MARC
DTPLT_RESTT_MARC_RANG_AFFC
08/10/08
DATE_DEBU_VALD_INFO
DATE_FIN_VALD_INFO
LIBL_CRT_MARC
LIBL_CRT_REGR_MARC_N_1
LIBL_CRT_REGR_MARC_N_2
LIBL_CRT_REGR_MARC_N_3
LIBL_LONG_MARC
Fréquence d'alimentation table Méthode d'historisation table
cible
cible
CODE_EVNM_GEST
DIM_TEMPS
Colonnes en entrée du traitement
M
AR
Initialisation
ENG
M
ENG
11/12
Traitement
TFID_M
TJ01_Q
TJ02_Q
TJ03_H
TJ04_Q
TJ05_Q
TJ06_Q
TJ07_Q
Périodicité
M
Q
Q
H
Q
Q
Q
Q
Vient après
TN01_Q
TT02_Q
TV24_Q
TT02_Q
TQ9V_Q
TV03_Q
TN21_Q
TN43_Q
P132_Fconcept04_Métadonnées_V1.0
Fiche concept 04 : dictionnaire des métadonnées
Projet : Bien gérer ses référentiels de données : un enjeu pour mieux piloter la performance de son
établissement
Version 1.0
Illustration 3 : Exemple de portail de métadonnées relatif à la qualité:
08/10/08
12/12
P132_Fconcept04_Métadonnées_V1.0

Documents pareils