Bases de Données Hétérogènes

Transcription

Bases de Données Hétérogènes
Bases de Données
Hétérogènes
Didier DONSEZ
Université Joseph Fourier
IMA – IMAG/LSR/ADELE
'LGLHU'RQVH]#LPDJIU
Plan
'LGLHU'RQVH]
■ Introduction
■ Architecture de SGBD-D Hétérogènes
■ Distribution - Hétérogénéité - Autonomie
■ Problèmes à Résoudre
2
3
Rappel
■ BD Distribuée
• une collection de BDs logiquement reliées
et distribuées entre plusieurs sites
■ SGBD Distribué
• gère une BD-D et fournit les mécanismes d'accès
rendant la distribution transparente à l’utilisateur.
'LGLHU'RQVH]
Site 1
Site 2
Réseau de
Communication
Site 4
Site 3
4
Les Besoins des Applications
■ Applications traditionnelles (gestion)
•
•
•
•
types de données simples
données structurées
accès rapide par ensemble
partage et sécurité
• ÖBien supporté par les SGBDs relationnels
'LGLHU'RQVH]
■ Nouvelles Applications (SID, CAO, IA, Médical, …)
•
•
•
•
données complexes
manipulation complexe
règles
autre : schéma dynamique, multimédia, déclencheur, version
• ÖMal supporté par le relationnel
5
Les Développements Technologiques
■ Amélioration des communications
• Réseaux Locaux plus rapide
FDDI, Fiber Channel, Ethernet 100
• Réseaux longues distances plus rapides, plus surs, plus Etendus
Internet, lignes T1, RNIS, ATM
■ Amélioration des stations de travail
'LGLHU'RQVH]
• Meilleur prix/performance
• amélioration des possibilités - station multiprocesseur
6
Les Ilots d’Information de l’Entreprise
■ Développement des BDs indépendantes
• différentes machines : mainframes, minis, micros, stations de travail
• différents SGBDs : hiérarchique, relationnel, objet
• Besoins spécifiques des départements
■ Conséquences
'LGLHU'RQVH]
• Redondance des données et inconsistance
• difficulté de localiser les données “utiles” et de les intégrer rapidement
■ Données “Utiles”
= consistantes, à jour, et facilement accessibles
■ Ö Intégration logique des données
distribuées et hétérogènes de l’entreprise
7
L’Environnement Futur
• Relationnel ⇒ applications traditionnelles
• Modèles sophistiqués ⇒ applications avancées
• Héritage d’anciens systèmes (legacy systems)
• 45% des SGBDs sur Mainframe sont IMS (hiérarchique)
• De nombreuses applications utilisent encore des SGFs (VSAM)
• Intégration des systèmes "non-gestionnaires" de données
• Traitement de texte, Feuille de calcul, Traitement d’images.
'pFLVLRQQHO
'LGLHU'RQVH]
• Utilisation du Web pour simplifier le développement des
applications
'RQQpHV
)RXUQLVVHXU
'RQQpHV
&R€W
'RQQpHV
*HVWLRQ
&RQFHSWLRQ
3URGXFWLRQ
6*%'
5HODWLRQQHO
3DFNDJH
6WDWLVWLTXH
6*%'
+LpUDUFKLTXH
6*%'
2ULHQWp2EMHW
La Demande pour l’Interopérabilité entre
SGBDs
■ Conséquence de la Distribution, des Réseaux et des
SGBDs
• 3 développement de BDs indépendantes par différents groupes
d’utilisateurs
• 3 survivance des BDs existantes
• 3 accès aux BDs par différents outils
■ Difficultés
•
•
•
de connaître l'
utilité et la localisation d’une donnée
d'
intégrer rapidement des données hétérogènes
de combiner l'
activité d’outils hétérogènes
'LGLHU'RQVH]
■ Interopérabilité
• Ö interaction intelligente entre des systèmes hétérogènes
• ex : SGBD/feuille de calcul
• Ö combinaison des SGBDs, des systèmes répartis,
des traitements de textes, Ö
8
9
Les Objectifs des SGBDs Interopérables
• Interopérabilité des BDs existantes, distribuées
et hétérogènes au sien d’ un Multi-SGBD
• intégration de types de données conventionnels
ou non-conventionnels comme dans un SGBD-OO
• Interopérabilité avec des applications existantes
• Héritage de l’ existant
• Utilisation des composants logiciels existants
'LGLHU'RQVH]
• extensibilité par la définition de méthodes d’ objets
• Invoquer arbitrairement une application
et créer des combinaisons d’ invocation
10
L’architecture ANSI/SPARC
Utilisateurs
Schéma
Externe
'LGLHU'RQVH]
Schéma
Conceptuel
Schéma
Interne
Vue
Externe
Vue
Externe
Vue
Conceptuelle
Vue
Interne
Vue
Externe
11
L’architecture logique d’un SGBD-D
6( 6( 6( P
'LGLHU'RQVH]
6&*
6&/ 6&/ 6&/ Q
6,/ 6,/
6,/Q
12
L’architecture physique d’un SGBD-D
3URFHVVHXU8WLOLVDWHXU
6FKpPD
([WHUQH
3URFHVVHXUGH'RQQpHV
6FKpPD*OREDO
6FKpPD
&RQFHSWXHO GH'LVWULEXWLRQ
GHV'RQQpHV
*OREDO
6FKpPD
&RQFHSWXHO -RXUQDX[
6\VWqPHV
/RFDO
6FKpPD
,QWHUQH
/RFDO
'LGLHU'RQVH]
5pSRQVHV
3URFHVVHXU
G
([pFXWLRQ
5HSULVHVXU3DQQH
/RFDOH
3URFHVVHXU/RFDO
GH5HTXrWHV
0RQLWHXU*OREDO
G
([pFXWLRQ
2SWLPLVDWLRQ
*OREDOHGHV
5HTXrWHV
&RQWU{OH
6pPDWLTXH
,QWHUIDFH
8WLOLVDWHXU
8WLOLVDWHXU
5HTXrWHV
13
L’architecture logique de Multi-SGBD
'LGLHU'RQVH]
6(/ 6( 6( 6( P
6(/ N
6&*
6(/ Q
6(/ QN
6&/ 6&/ 6&/ Q
6,/ 6,/
6,/ Q
14
L’architecture physique d’un Multi-SGBD
8WLOLVDWHXU
'LGLHU'RQVH]
&RXFKH0XOWL6*%'
6*%'
6*%'
*HVWLRQGHV
7UDQVDFWLRQV
,QWHUIDFH
8WLOLVDWHXU
*HVWLRQGHV
7UDQVDFWLRQV
,QWHUIDFH
8WLOLVDWHXU
2UGRQQDQFHXU
3URFHVVHXUGH
5HTXrWHV
2UGRQQDQFHXU
3URFHVVHXUGH
5HTXrWHV
5HSULVH
VXU3DQQH
2SWLPLVHXU
GH5HTXrWHV
5HSULVH
VXU3DQQH
2SWLPLVHXU
GH5HTXrWHV
3URFHVVHXU
G
([pFXWLRQ
3URFHVVHXU
G
([pFXWLRQ
%DVHGH
'RQQpHV
%DVHGH
'RQQpHV
L’architecture logique de Multi-SGBD sans SCG
6( 'LGLHU'RQVH]
6(/ 6( P
6(/ N
6(/ Q
6&/ 6&/ 6&/ Q
6,/
6,/
6,/Q
6(/
15
16
L’architecture physique d’un Multi-SGBD
sans SCG
8WLOLVDWHXU
'LGLHU'RQVH]
0XOWL6*%' 8WLOLVDWHXU
0XOWL6*%' P
3URFHVVHXU
,QWHUIDFH
&RPSRVDQW
3URFHVVHXU
,QWHUIDFH
&RPSRVDQW
3URFHVVHXU
,QWHUIDFH
&RPSRVDQW
3URFHVVHXU
,QWHUIDFH
&RPSRVDQW
6*%' 6*%' Q
6*%' P
6*%' PN
17
Les Dimensions du problème
■ Distribution
• bien maîtrisé
■ Hétérogénéité
• Plusieurs degrés
■ Autonomie
'LGLHU'RQVH]
• Difficile
18
Les différents degrés d'
Hétérogénéité
■ chaque BD est gérée par le même SGBD sur des
systèmes différents
• ex: ORACLE sur UNIX, VMS, DOS
■ chaque BD est gérée par un SGBD différent mais avec le
même modèle
'LGLHU'RQVH]
• ex: ORACLE, DB2, INGRES
■ chaque BD est gérée par un SGBD différent avec un
modèle de données différent
• ex: DB2 et IMS (problème pratique pour IBM)
■ chaque BD est une source de données structurées ou non
19
Les différentes Formes d’Autonomie
■ Autonomie de Conception
• un SGBD décide d’ une conception reliée ‡ ses propre besoins
• données, représentation, interprétation, implantation, Ö
• appelé Autonomie physique
■ Autonomie de Communication
'LGLHU'RQVH]
• un SGBD décide de comment et avec quel autre SGBD il doit
communiquer
■ Autonomie d’Exécution
• un SGBD peut exécuter des opérations localement de la manière qu’ il veut
• appelé Autonomie de Site
Les problèmes à Résoudre
■ Intégration de Bases de Données
■ Calcul des Requêtes
'LGLHU'RQVH]
■ Gestion des Transactions
20
21
intégration de Bases de données
• c'
est le processus d'
intégration conceptuelle
des informations provenant des différentes bases composantes
6&*
,QWpJUDWLRQ
GHV6FKpPDV
,QWHUPpGLDLUHV
'LGLHU'RQVH]
7UDGXFWLRQ
GHV6FKpPDV
/RFDX[
,QWpJUDWHXU
7UDGXFWHXU
7UDGXFWHXU
7UDGXFWHXUQ
%DVHGH
'RQQpHV
%DVHGH
'RQQpHV
%DVHGH
'RQQpHV
Q
22
intégration de schéma
■ Pré-intégration
• identification des éléments reliées
• ex: domaines Equivalents
• spécification des règles de conversion
• ex: 1 pouce = 2,54 cm
• ex: salaire en $ <-> DM <-> £ <-> FF
■ Comparaison
• conflits de nommage
• synonymes, homonymes
• conflits structurels
'LGLHU'RQVH]
• types, clés, dépendances
■ Conformité
• résolution des conflits de noms et structurels
■ Fusion et Restructuration
• fusion des schémas intermédiaires
• fournir le “meilleur” schéma intègre
23
Calcul des requêtes
■ La complexité du calcul des Requêtes est élevée
• variations d'
un SGBD ‡ l'
autre
• pour les possibilités
• pour les coûts
• pour l'
optimisation
'LGLHU'RQVH]
• difficulté de déplacer les données entre SGBDs
24
Gestion de Transactions
• plusieurs transactions ‡ coordonner
• Terminaison des transactions, contrôle de Concurrences
■ Moniteurs Transactionnels
'LGLHU'RQVH]
• OSI/TP, X/Open, OMG, ...
• Tuxedo, ...