Bases de Données Hétérogènes
Transcription
Bases de Données Hétérogènes
Bases de Données Hétérogènes Didier DONSEZ Université Joseph Fourier IMA – IMAG/LSR/ADELE 'LGLHU'RQVH]#LPDJIU Plan 'LGLHU'RQVH] ■ Introduction ■ Architecture de SGBD-D Hétérogènes ■ Distribution - Hétérogénéité - Autonomie ■ Problèmes à Résoudre 2 3 Rappel ■ BD Distribuée • une collection de BDs logiquement reliées et distribuées entre plusieurs sites ■ SGBD Distribué • gère une BD-D et fournit les mécanismes d'accès rendant la distribution transparente à l’utilisateur. 'LGLHU'RQVH] Site 1 Site 2 Réseau de Communication Site 4 Site 3 4 Les Besoins des Applications ■ Applications traditionnelles (gestion) • • • • types de données simples données structurées accès rapide par ensemble partage et sécurité • ÖBien supporté par les SGBDs relationnels 'LGLHU'RQVH] ■ Nouvelles Applications (SID, CAO, IA, Médical, …) • • • • données complexes manipulation complexe règles autre : schéma dynamique, multimédia, déclencheur, version • ÖMal supporté par le relationnel 5 Les Développements Technologiques ■ Amélioration des communications • Réseaux Locaux plus rapide FDDI, Fiber Channel, Ethernet 100 • Réseaux longues distances plus rapides, plus surs, plus Etendus Internet, lignes T1, RNIS, ATM ■ Amélioration des stations de travail 'LGLHU'RQVH] • Meilleur prix/performance • amélioration des possibilités - station multiprocesseur 6 Les Ilots d’Information de l’Entreprise ■ Développement des BDs indépendantes • différentes machines : mainframes, minis, micros, stations de travail • différents SGBDs : hiérarchique, relationnel, objet • Besoins spécifiques des départements ■ Conséquences 'LGLHU'RQVH] • Redondance des données et inconsistance • difficulté de localiser les données “utiles” et de les intégrer rapidement ■ Données “Utiles” = consistantes, à jour, et facilement accessibles ■ Ö Intégration logique des données distribuées et hétérogènes de l’entreprise 7 L’Environnement Futur • Relationnel ⇒ applications traditionnelles • Modèles sophistiqués ⇒ applications avancées • Héritage d’anciens systèmes (legacy systems) • 45% des SGBDs sur Mainframe sont IMS (hiérarchique) • De nombreuses applications utilisent encore des SGFs (VSAM) • Intégration des systèmes "non-gestionnaires" de données • Traitement de texte, Feuille de calcul, Traitement d’images. 'pFLVLRQQHO 'LGLHU'RQVH] • Utilisation du Web pour simplifier le développement des applications 'RQQpHV )RXUQLVVHXU 'RQQpHV &RW 'RQQpHV *HVWLRQ &RQFHSWLRQ 3URGXFWLRQ 6*%' 5HODWLRQQHO 3DFNDJH 6WDWLVWLTXH 6*%' +LpUDUFKLTXH 6*%' 2ULHQWp2EMHW La Demande pour l’Interopérabilité entre SGBDs ■ Conséquence de la Distribution, des Réseaux et des SGBDs • 3 développement de BDs indépendantes par différents groupes d’utilisateurs • 3 survivance des BDs existantes • 3 accès aux BDs par différents outils ■ Difficultés • • • de connaître l' utilité et la localisation d’une donnée d' intégrer rapidement des données hétérogènes de combiner l' activité d’outils hétérogènes 'LGLHU'RQVH] ■ Interopérabilité • Ö interaction intelligente entre des systèmes hétérogènes • ex : SGBD/feuille de calcul • Ö combinaison des SGBDs, des systèmes répartis, des traitements de textes, Ö 8 9 Les Objectifs des SGBDs Interopérables • Interopérabilité des BDs existantes, distribuées et hétérogènes au sien d’ un Multi-SGBD • intégration de types de données conventionnels ou non-conventionnels comme dans un SGBD-OO • Interopérabilité avec des applications existantes • Héritage de l’ existant • Utilisation des composants logiciels existants 'LGLHU'RQVH] • extensibilité par la définition de méthodes d’ objets • Invoquer arbitrairement une application et créer des combinaisons d’ invocation 10 L’architecture ANSI/SPARC Utilisateurs Schéma Externe 'LGLHU'RQVH] Schéma Conceptuel Schéma Interne Vue Externe Vue Externe Vue Conceptuelle Vue Interne Vue Externe 11 L’architecture logique d’un SGBD-D 6( 6( 6( P 'LGLHU'RQVH] 6&* 6&/ 6&/ 6&/ Q 6,/ 6,/ 6,/Q 12 L’architecture physique d’un SGBD-D 3URFHVVHXU8WLOLVDWHXU 6FKpPD ([WHUQH 3URFHVVHXUGH'RQQpHV 6FKpPD*OREDO 6FKpPD &RQFHSWXHO GH'LVWULEXWLRQ GHV'RQQpHV *OREDO 6FKpPD &RQFHSWXHO -RXUQDX[ 6\VWqPHV /RFDO 6FKpPD ,QWHUQH /RFDO 'LGLHU'RQVH] 5pSRQVHV 3URFHVVHXU G ([pFXWLRQ 5HSULVHVXU3DQQH /RFDOH 3URFHVVHXU/RFDO GH5HTXrWHV 0RQLWHXU*OREDO G ([pFXWLRQ 2SWLPLVDWLRQ *OREDOHGHV 5HTXrWHV &RQWU{OH 6pPDWLTXH ,QWHUIDFH 8WLOLVDWHXU 8WLOLVDWHXU 5HTXrWHV 13 L’architecture logique de Multi-SGBD 'LGLHU'RQVH] 6(/ 6( 6( 6( P 6(/ N 6&* 6(/ Q 6(/ QN 6&/ 6&/ 6&/ Q 6,/ 6,/ 6,/ Q 14 L’architecture physique d’un Multi-SGBD 8WLOLVDWHXU 'LGLHU'RQVH] &RXFKH0XOWL6*%' 6*%' 6*%' *HVWLRQGHV 7UDQVDFWLRQV ,QWHUIDFH 8WLOLVDWHXU *HVWLRQGHV 7UDQVDFWLRQV ,QWHUIDFH 8WLOLVDWHXU 2UGRQQDQFHXU 3URFHVVHXUGH 5HTXrWHV 2UGRQQDQFHXU 3URFHVVHXUGH 5HTXrWHV 5HSULVH VXU3DQQH 2SWLPLVHXU GH5HTXrWHV 5HSULVH VXU3DQQH 2SWLPLVHXU GH5HTXrWHV 3URFHVVHXU G ([pFXWLRQ 3URFHVVHXU G ([pFXWLRQ %DVHGH 'RQQpHV %DVHGH 'RQQpHV L’architecture logique de Multi-SGBD sans SCG 6( 'LGLHU'RQVH] 6(/ 6( P 6(/ N 6(/ Q 6&/ 6&/ 6&/ Q 6,/ 6,/ 6,/Q 6(/ 15 16 L’architecture physique d’un Multi-SGBD sans SCG 8WLOLVDWHXU 'LGLHU'RQVH] 0XOWL6*%' 8WLOLVDWHXU 0XOWL6*%' P 3URFHVVHXU ,QWHUIDFH &RPSRVDQW 3URFHVVHXU ,QWHUIDFH &RPSRVDQW 3URFHVVHXU ,QWHUIDFH &RPSRVDQW 3URFHVVHXU ,QWHUIDFH &RPSRVDQW 6*%' 6*%' Q 6*%' P 6*%' PN 17 Les Dimensions du problème ■ Distribution • bien maîtrisé ■ Hétérogénéité • Plusieurs degrés ■ Autonomie 'LGLHU'RQVH] • Difficile 18 Les différents degrés d' Hétérogénéité ■ chaque BD est gérée par le même SGBD sur des systèmes différents • ex: ORACLE sur UNIX, VMS, DOS ■ chaque BD est gérée par un SGBD différent mais avec le même modèle 'LGLHU'RQVH] • ex: ORACLE, DB2, INGRES ■ chaque BD est gérée par un SGBD différent avec un modèle de données différent • ex: DB2 et IMS (problème pratique pour IBM) ■ chaque BD est une source de données structurées ou non 19 Les différentes Formes d’Autonomie ■ Autonomie de Conception • un SGBD décide d’ une conception reliée ‡ ses propre besoins • données, représentation, interprétation, implantation, Ö • appelé Autonomie physique ■ Autonomie de Communication 'LGLHU'RQVH] • un SGBD décide de comment et avec quel autre SGBD il doit communiquer ■ Autonomie d’Exécution • un SGBD peut exécuter des opérations localement de la manière qu’ il veut • appelé Autonomie de Site Les problèmes à Résoudre ■ Intégration de Bases de Données ■ Calcul des Requêtes 'LGLHU'RQVH] ■ Gestion des Transactions 20 21 intégration de Bases de données • c' est le processus d' intégration conceptuelle des informations provenant des différentes bases composantes 6&* ,QWpJUDWLRQ GHV6FKpPDV ,QWHUPpGLDLUHV 'LGLHU'RQVH] 7UDGXFWLRQ GHV6FKpPDV /RFDX[ ,QWpJUDWHXU 7UDGXFWHXU 7UDGXFWHXU 7UDGXFWHXUQ %DVHGH 'RQQpHV %DVHGH 'RQQpHV %DVHGH 'RQQpHV Q 22 intégration de schéma ■ Pré-intégration • identification des éléments reliées • ex: domaines Equivalents • spécification des règles de conversion • ex: 1 pouce = 2,54 cm • ex: salaire en $ <-> DM <-> £ <-> FF ■ Comparaison • conflits de nommage • synonymes, homonymes • conflits structurels 'LGLHU'RQVH] • types, clés, dépendances ■ Conformité • résolution des conflits de noms et structurels ■ Fusion et Restructuration • fusion des schémas intermédiaires • fournir le “meilleur” schéma intègre 23 Calcul des requêtes ■ La complexité du calcul des Requêtes est élevée • variations d' un SGBD ‡ l' autre • pour les possibilités • pour les coûts • pour l' optimisation 'LGLHU'RQVH] • difficulté de déplacer les données entre SGBDs 24 Gestion de Transactions • plusieurs transactions ‡ coordonner • Terminaison des transactions, contrôle de Concurrences ■ Moniteurs Transactionnels 'LGLHU'RQVH] • OSI/TP, X/Open, OMG, ... • Tuxedo, ...