emc greenplum data computing appliance
Transcription
emc greenplum data computing appliance
EMC GREENPLUM DATA COMPUTING APPLIANCE Accompagner l’évolution des entrepôts décisionnels AVANTAGES CLÉS • Appliance dédiée pour l’entrepôt de données décisionnel, hautement évolutive, qui intègre dans une solution de haut niveau et facile à mettre en oeuvre, le Système de Base de Données Greenplum, le moteur HADOOP Greenplum (HD), ainsi que les composants tiers tel que les serveurs (CPU et RAM), le stockage physique et le réseau. • Optimisée pour un chargement des données imbattable, une exécution rapide des requêtes et une évolutivité linéaire. • Solution d’analyse « Tout en un » et modulaire, conçue pour gérer les données structurées et non structurées, ainsi que l’exécution de traitements ETL ou bien des processus décisionnels. • Plate-forme unique pour l’entrepôt de données décisionnel, les data marts, les traitements d’exploration de textes et les analyses statistiques. • Permet une meilleure connaissance et une meilleure mise en valeur des données au travers des solutions d’analyse avancées et un accès unifié aux données. • Utilisation des solutions EMC existantes pour optimiser la disponibilité et garantir l’efficacité du stockage et de la reprise après sinistre. RELEVER LES DÉFIS D’UN MONDE AXÉ SUR LES DONNÉES Pour relever les défis liés à l’augmentation des coûts informatiques, à l’explosion des volumes de données et à la concurrence exacerbée, les solutions analytiques doivent être repensées pour être plus efficaces. Ces changements engendrent des évolutions radicales des technologies de Base de Données et amènent une nouvelle approche d’exploitation des données. Le type d’architecture existant depuis des dizaines d’années pour la gestion et l’analyse des données est par nature inadapté aux volumes considérables de données traités aujourd’hui. EMC® Greenplum® Data Computing Appliance (DCA) apporte la puissance d’une architecture de traitement massivement parallèle (MPP), tout en garantissant une vitesse de chargement des données extrêmement rapide et le meilleur rapport prix/performances du marché. Et ce, sans la complexité et les contraintes liées au matériel propriétaire. Il s’agit d’une appliance d’analyse parallèle, intégrant un moteur massivement parallèle, hautement évolutive et spécialisée, dont l’architecture intègre le Système De Gestion de Base de données, les serveurs (CPU et RAM), le stockage physique, et le réseau, au sein d’un système facile à mettre en oeuvre. Greenplum DCA est une appliance unifiée conçue pour l’analyse des Big Data. Cette solution modulaire intègre la gestion des données structurées et non structurées, et offre une intégration native vers les solutions de reporting et d’analyse du marché et des solutions de traitement de la donnée (ETL, extract, transform and load) du marché. Les entreprises peuvent utiliser d’abord un seul rack principal, comprenant un module Greenplum Base de données (Standard ou Haute Capacité). Ensuite et à mesure que leurs besoins en capacité de traitement augmentent, elles peuvent ajouter des quarts de rack via les modules Greenplum Base de données Standard, Greenplum Base de données Haute Capacité, Greenplum Hadoop (HD) ou Greenplum Accélérateur d’intégration de donnée (DIA), dans l’ordre qu’elles souhaitent et jusqu’à six racks au total. Tous les modules sont reliés par une interconnexion à haut débit, hautement performante et à faible latence. Grâce à Greenplum DCA, vous pouvez rapidement et facilement mettre en oeuvre les applications Big Data. Vous obtiendrez plus rapidement de meilleurs résultats en utilisant cette appliance intégrée, facile à déployer, qui offre des performances optimales et la meilleure capacité de surveillance et de gestion du système tout en limitant l’encombrement. Les modules Greenplum DCA simplifient considérablement l’extension des capacités et des performances de Greenplum Base de données (fonctions d’analyse) et de Greenplum Hadoop (HD). Cette appliance de gestion des données offre une flexibilité et une évolutivité maximales aux entreprises qui cherchent à évoluer du téraoctet vers le pétaoctet. FONCTIONS DE L’APPLIANCE DATA COMPUTING APPLIANCE PERFORMANCES EXCEPTIONNELLES ET PRÉVISIBLES, ÉVOLUTIVITÉ OPTIMALE Au coeur de Greenplum Data Computing Appliance se trouve la Base de données Greenplum, une architecture de traitement massivement parallèle (MPP) sans partage, conçue pour le décisionnel et les traitements analytiques. Le principe fondateur de la base de données Greenplum est de rapprocher au maximum les traitements ou utilisateurs consommateurs d’informations et les données. Cela permet réellement aux ressources informatiques de traiter chaque requête en parallèle, d’utiliser simultanément toutes les connexions FICHE PRODUIT disponibles et de transférer efficacement les données entre les ressources. Ces opérations sont menées par le Cerveau du moteur de base de données. Ainsi, de nombreux traitements complexes peuvent être réalisés au plus près de la donnée, afin d’obtenir une efficacité maximale et des fonctions performantes. RÉPARTITION DISPERSER/COLLECTER POUR LE CHARGEMENT DES DONNÉES Greenplum DCA gère le flux de données dans tous les noeuds de l’appliance grâce à la technologie MPP Scatter/Gather Streaming™ (SG Streaming) d’EMC Greenplum. Le système utilise une approche « parallèle partout » pour le chargement, dans laquelle les données sont transférées depuis une ou plusieurs sources vers chaque noeud de la base de données, évitant les désavantages du traitement séquentiel. Greenplum DCA offre des vitesses de chargement égales à plus de 10 téraoctets par heure, soit deux à cinq fois plus rapides que les autres Appliances du marché. CONFIGURATION, SERVEURS MAÎTRES ET SERVEURS DE SEGMENTS Il est possible d’étendre la grappe de données Greenplum DCA en connectant jusqu’à six Appliances, ce qui garantit la distribution des données automatique et de meilleures performances pour les requêtes d’analystes. Chaque rack principal comprend deux Serveurs Maîtres et quatre serveurs de segments. Dans une configuration multirack, les racks d’extension ne possèdent pas de Serveurs Maîtres. Dans Greenplum Base de données, les Serveurs Maîtres effectuent les opérations suivantes : authentification, optimisation des requêtes, équilibrage de la charge de travail entre les différents serveurs de segments, ainsi que la gestion du mécanisme de tolérance aux pannes. Extrêmement flexible, la gamme EMC Greenplum DCA offre un rapport prix/performances inégalé et permet aux entreprises d’éviter tout retard de déploiement de leurs applications à forte valeur ajoutée dans le cadre des analyses Big Data. HAUTE DISPONIBILITÉ POUR L’ENTREPRISE Le système Greenplum DCA répond aux exigences de fiabilité des applications critiques des entreprises, grâce à sa tolérance aux pannes multiniveau avec autoréparation, incluant notamment un basculement sur incident automatisé et une resynchronisation autoréparatrice entièrement en ligne, ainsi que plusieurs niveaux de redondance et de contrôle d’intégrité. La disponibilité des données comprend une protection RAID matérielle au niveau du disque, ainsi qu’une mise en miroir des données entre les différents serveurs de segments. Grâce à la fiabilité du système, toutes les données sont conservées en cas de perte d’un disque ou d’un serveur. DÉPLOIEMENT RAPIDE ET PERFORMANCES PRÉVISIBLES Greenplum Data Computing Appliance est une appliance dédiée, entièrement ouverte dont l’architecture intègre le Système De Gestion de Base de données, les serveurs (CPU et RAM), le stockage physique, et le réseau, au sein d’un système facile à mettre en oeuvre et extensible. Cette évolution s’effectue dans une durée de l’ordre de la journée et non de la semaine ou du mois. Vous pouvez étendre le système par modules jusqu’à une configuration multirack. L’intégration et la préconfiguration de l’appliance garantissent des performances prévisibles, tout en simplifiant radicalement votre infrastructure d’entrepôt décisionnel et d’analyse de données, ce qui vous permet de réduire les coûts d’administration de manière drastique. SAUVEGARDE FIABLE ET REPRISE APRÈS SINISTRE Greenplum DCA utilise les technologies EMC Data Domain® et EMC Symmetrix® pour protéger les données à distance de manière efficace et fiable pour l’ensemble de l’environnement d’analyse DCA. Grâce à la technologie de déduplication et de sauvegarde d’EMC Data Domain, le système Greenplum DCA assure une restauration des données extrêmement fiable et rapide, avec des débits de sauvegarde pouvant atteindre 14 To/h. La capacité de réplication étendue de Data Domain a également été validée pour la réplication d’une base de données Greenplum. La solution de mise en miroir du SAN de Greenplum DCA utilise EMC Symmetrix VMAX™, EMC TimeFinder®/Snap et Symmetrix Remote Data Facility (SRDF®) pour prendre en charge les fonctionnalités de stockage et de réplication de données avancées entre deux sites en mode synchrone. MODULE SYSTÈME DE GESTION DE BASE DE DONNÉES GREENPLUM STANDARD • Meilleur rapport prix/performances du marché • Évolutivité linéaire MODULE SYSTÈME DE GESTION DE BASE DE DONNÉES GREENPLUM HAUTE CAPACITÉ • Module capable d’héberger plusieurs pétaoctets de données, avec un encombrement au sol, une consommation électrique et un coût réduit • Meilleur prix par unité du marché des Appliances d’entrepôt de données décisionnel MODULE GREENPLUM HADOOP (HD) • La première appliance professionnelle Hadoop hautement performante proposant des traitements parallèles des données STRUCTURE DE SUPPORT PROACTIF D’EMC ONE Le Support Clients d’EMC fournit des ressources et des services pour répondre aux questions des clients et résoudre rapidement et de manière proactive leurs problèmes liés aux solutions. L’objectif est de garantir la continuité d’activité et la disponibilité totale de l’environnement de données. Les services de maintenance et de support EMC sont disponibles 24x7 dans le monde entier par le biais d’outils de support en ligne, notamment le Chat en direct et la gestion des demandes de service en ligne, l’assistance téléphonique en direct, mais également sur site via le Service Clients, cité comme le plus performant du secteur. En outre, la solution Data Computing Appliance est dotée de la fonction d’appel à distance sécurisée, qui permet un dépannage à distance et préventif 24 h/24 en alertant automatiquement le Support EMC en cas d’erreurs critiques relatives au matériel ou aux logiciels. Le Support EMC diagnostique ainsi le problème à distance afin d’éviter ou de réduire les interruptions de service. Il se charge également d’envoyer automatiquement des experts sur site pour accélérer la résolution des problèmes matériels. MODULES DE DATA COMPUTING APPLIANCE Greenplum Data Computing Appliance (DCA) comprend les modules suivants : • Permet le traitement parallèle des données structurées et non structurées MODULE GREENPLUM ACCÉLÉRATEUR D’INTÉGRATION DE DONNÉE (DATA INTEGRATION ACCELERATOR, DIA) • Pour héberger et fournir une intégration rapide des applications analytiques proposées par des partenaires avec l’Appliance Greenplum • Module Greenplum Base de données Standard : appliance d’analyse hautement évolutive et spécialisée, dont l’architecture intègre le Système De Gestion de Base de données, les serveurs (CPU et RAM), le stockage physique, et le réseau, au sein d’un système facile à mettre en oeuvre. Ce module est leader du secteur en termes de rapport prix/performance. • Module Greenplum Base de données Haute Capacité : conçu pour héberger plusieurs pétaoctets de données, avec un encombrement au sol, une consommation électrique et un coût réduit. Pour les entreprises qui ont besoin de conduire des analyses détaillées sur de très gros volumes de données ou qui recherchent un système d’archivage à plus long terme, ce modèle représente la solution d’entrepôt décisionnel la plus économique. • Module Greenplum HADOOP (HD) : la première appliance Hadoop offrant des traitements parallèles et hautement performants pour accéder aux données. En intégrant Hadoop et Greenplum Base de données, le système DCA permet le cotraitement des données structurées et non structurées dans une solution unique et facile d’utilisation. • Module Greenplum Accélérateur d’intégration de donnée (DIA) : un module conçu pour héberger et fournir une intégration rapide des applications analytiques proposées par des partenaires avec l’Appliance Greenplum. Ce module est utilisé par exemple pour résoudre les problèmes de chargement des données au travers d’un modèle parallèle et évolutif, mais également pour réduire le temps de chargement des lots ou pour mettre en oeuvre un chargement par microlots. Le tableau ci-dessous présente les détails techniques des quatre modules de Greenplum DCA : Type de module Module Greenplum Base de données Standard Module Greenplum Base de données Haute Capacité Module Greenplum HADOOP (HD) Module Greenplum Accélérateur d’intégration de donnée (DIA) Logiciels Greenplum Base de données Greenplum Base de données Greenplum Hadoop Version Communautaire (HD CE) Logiciel partenaire certifié Serveur de segments 2 sockets/12 coeurs Mémoire totale Type de stockage 192 Go 600 Go 2 To Nombre total de disques de stockage 2 To 2 To 48 Capacité utile (non compressée) 9 To 31 To 28 To 70 To Capacité utile (compressée) 36 To 124 To 112 To Sans objet Exemples de configuration de la grappe Greenplum DCA avec les modules Greenplum Base de données et Greenplum Base de données Haute Capacité : Type de module Module GP BD Standard Module GP BD Haute Capacité Nombre de modules 4 24 4 24 Nombre de racks 1 6 1 6 Capacité utile (non compressée) 36 To 216 To 124 To 744 To Capacité utile (compressée) 144 To 864 To 496 To 2 976 To Vitesse de lecture des données 24 Go/s 144 Go/s 14 Go/s 84 Go/s Vitesse de chargement des données 10 To/h 60 To/h 10 To/h 60 To/h OPTIMISER LES AVANTAGES D’EMC GREENPLUM DCA AVEC EMC GLOBAL SERVICES EMC offre une gamme complète de services et de support pour le matériel et les logiciels EMC Greenplum. Ils garantissent que votre système fonctionne comme prévu dans votre environnement, tout en minimisant les risques sur vos activités et votre budget. Les services de planification, de conception et de mise en oeuvre vous aident à tirer le meilleur parti des matériels et des logiciels de votre environnement, que ce dernier soit simple ou complexe. Une fois l’implémentation terminée, les services de migration des données EMC peuvent vous aider à planifier, concevoir et migrer en toute sécurité vos données critiques vers votre nouveau système, quelle que soit la distance. EMC vous aide également à intégrer votre nouveau système dans votre Système d’Information avec, notamment vos solutions applicatives décisionnelles et analytiques (telles que SAS, Informatica, Micro Strategy, Business Objects et Tableau). Une fois votre environnement entièrement configuré, nous vous aiderons également à le gérer. Nos équipes de gestion de projet et nos experts Produits et Services utilisent les bonnes pratiques de déploiement des applications d’entrepôt de données décisionnel et les méthodologies éprouvées d’EMC pour vous offrir rapidement les résultats dont vous avez besoin sans mobiliser excessivement vos ressources. EMC GREENPLUM – DIVISION PRODUIT DATA COMPUTING NOUS CONTACTER Pour savoir comment les produits, services et solutions d’EMC peuvent vous aider à relever vos défis informatiques et métiers, contactez un responsable de compte EMC ou un revendeur agréé, ou consultez notre site Web à l’adresse www.emc2.fr. La division Produit EMC Data Computing Products innove sur le marché des entrepôts décisionnels et de l’analyse Big Data grâce à des produits parfaitement fiables tels qu’EMC Greenplum Hadoop (HD), EMC Greenplum Data Computing Appliance, EMC Greenplum Base de données et EMC Greenplum Chorus, la première plate-forme de type cloud pour les données d’entreprise. Les produits de la division combinent la puissance des systèmes ouverts, de l’informatique dans le nuage, de la virtualisation et de la collaboration sociale, permettant ainsi aux entreprises d’améliorer significativement la connaissance et la valeur de leurs données. EMC2, EMC, Data Domain, EMC Greenplum, EMC Greenplum MPP Scatter/Gather Streaming, SRDF, Symmetrix, TimeFinder, VMAX et le logo EMC sont des marques commerciales ou déposées d’EMC Corporation aux États-Unis et dans d’autres pays. Toutes les autres marques citées dans le présent document sont la propriété de leurs détenteurs respectifs. © Copyright 2011 EMC Corporation. Tous droits réservés. 9/11 Présentation de solution H7419.5 EMC Computer Systems France River Ouest 80 quai Voltaire CS 21002 95876 Bezons Cedex Tél. : +33 1 39 96 90 00 Fax : +33 1 39 96 99 99 www.emc2.fr