emc greenplum data computing appliance

Transcription

emc greenplum data computing appliance
EMC GREENPLUM DATA COMPUTING APPLIANCE
Accompagner l’évolution des entrepôts décisionnels
AVANTAGES CLÉS
• Appliance dédiée pour l’entrepôt de
données décisionnel, hautement évolutive,
qui intègre dans une solution de haut
niveau et facile à mettre en oeuvre, le
Système de Base de Données Greenplum,
le moteur HADOOP Greenplum (HD), ainsi
que les composants tiers tel que les
serveurs (CPU et RAM), le stockage
physique et le réseau.
• Optimisée pour un chargement des
données imbattable, une exécution rapide
des requêtes et une évolutivité linéaire.
• Solution d’analyse « Tout en un » et
modulaire, conçue pour gérer les données
structurées et non structurées, ainsi que
l’exécution de traitements ETL ou bien des
processus décisionnels.
• Plate-forme unique pour l’entrepôt de
données décisionnel, les data marts,
les traitements d’exploration de textes
et les analyses statistiques.
• Permet une meilleure connaissance et une
meilleure mise en valeur des données au
travers des solutions d’analyse avancées
et un accès unifié aux données.
• Utilisation des solutions EMC existantes
pour optimiser la disponibilité et garantir
l’efficacité du stockage et de la reprise
après sinistre.
RELEVER LES DÉFIS D’UN MONDE AXÉ SUR LES DONNÉES
Pour relever les défis liés à l’augmentation des coûts informatiques, à l’explosion des volumes
de données et à la concurrence exacerbée, les solutions analytiques doivent être repensées
pour être plus efficaces. Ces changements engendrent des évolutions radicales des technologies
de Base de Données et amènent une nouvelle approche d’exploitation des données.
Le type d’architecture existant depuis des dizaines d’années pour la gestion et l’analyse des
données est par nature inadapté aux volumes considérables de données traités aujourd’hui.
EMC® Greenplum® Data Computing Appliance (DCA) apporte la puissance d’une architecture
de traitement massivement parallèle (MPP), tout en garantissant une vitesse de chargement
des données extrêmement rapide et le meilleur rapport prix/performances du marché. Et ce,
sans la complexité et les contraintes liées au matériel propriétaire. Il s’agit d’une appliance
d’analyse parallèle, intégrant un moteur massivement parallèle, hautement évolutive et
spécialisée, dont l’architecture intègre le Système De Gestion de Base de données, les
serveurs (CPU et RAM), le stockage physique, et le réseau, au sein d’un système facile
à mettre en oeuvre.
Greenplum DCA est une appliance unifiée conçue pour l’analyse des Big Data. Cette solution
modulaire intègre la gestion des données structurées et non structurées, et offre une
intégration native vers les solutions de reporting et d’analyse du marché et des solutions de
traitement de la donnée (ETL, extract, transform and load) du marché. Les entreprises peuvent
utiliser d’abord un seul rack principal, comprenant un module Greenplum Base de données
(Standard ou Haute Capacité). Ensuite et à mesure que leurs besoins en capacité de traitement
augmentent, elles peuvent ajouter des quarts de rack via les modules Greenplum Base de
données Standard, Greenplum Base de données Haute Capacité, Greenplum Hadoop (HD)
ou Greenplum Accélérateur d’intégration de donnée (DIA), dans l’ordre qu’elles souhaitent et
jusqu’à six racks au total. Tous les modules sont reliés par une interconnexion à haut débit,
hautement performante et à faible latence.
Grâce à Greenplum DCA, vous pouvez rapidement et facilement mettre en oeuvre les
applications Big Data. Vous obtiendrez plus rapidement de meilleurs résultats en utilisant
cette appliance intégrée, facile à déployer, qui offre des performances optimales et la meilleure
capacité de surveillance et de gestion du système tout en limitant l’encombrement. Les
modules Greenplum DCA simplifient considérablement l’extension des capacités et des
performances de Greenplum Base de données (fonctions d’analyse) et de Greenplum Hadoop
(HD). Cette appliance de gestion des données offre une flexibilité et une évolutivité maximales
aux entreprises qui cherchent à évoluer du téraoctet vers le pétaoctet.
FONCTIONS DE L’APPLIANCE DATA COMPUTING APPLIANCE
PERFORMANCES EXCEPTIONNELLES ET PRÉVISIBLES, ÉVOLUTIVITÉ OPTIMALE
Au coeur de Greenplum Data Computing Appliance se trouve la Base de données Greenplum,
une architecture de traitement massivement parallèle (MPP) sans partage, conçue pour le
décisionnel et les traitements analytiques. Le principe fondateur de la base de données
Greenplum est de rapprocher au maximum les traitements ou utilisateurs consommateurs
d’informations et les données. Cela permet réellement aux ressources informatiques de
traiter chaque requête en parallèle, d’utiliser simultanément toutes les connexions
FICHE PRODUIT
disponibles et de transférer efficacement les données entre les ressources. Ces opérations
sont menées par le Cerveau du moteur de base de données. Ainsi, de nombreux traitements
complexes peuvent être réalisés au plus près de la donnée, afin d’obtenir une efficacité
maximale et des fonctions performantes.
RÉPARTITION DISPERSER/COLLECTER POUR LE CHARGEMENT DES DONNÉES
Greenplum DCA gère le flux de données dans tous les noeuds de l’appliance grâce à la
technologie MPP Scatter/Gather Streaming™ (SG Streaming) d’EMC Greenplum. Le système
utilise une approche « parallèle partout » pour le chargement, dans laquelle les données sont
transférées depuis une ou plusieurs sources vers chaque noeud de la base de données, évitant
les désavantages du traitement séquentiel. Greenplum DCA offre des vitesses de chargement
égales à plus de 10 téraoctets par heure, soit deux à cinq fois plus rapides que les autres
Appliances du marché.
CONFIGURATION, SERVEURS MAÎTRES ET SERVEURS DE SEGMENTS
Il est possible d’étendre la grappe de données Greenplum DCA en connectant jusqu’à
six Appliances, ce qui garantit la distribution des données automatique et de meilleures
performances pour les requêtes d’analystes. Chaque rack principal comprend deux Serveurs
Maîtres et quatre serveurs de segments. Dans une configuration multirack, les racks
d’extension ne possèdent pas de Serveurs Maîtres. Dans Greenplum Base de données,
les Serveurs Maîtres effectuent les opérations suivantes : authentification, optimisation
des requêtes, équilibrage de la charge de travail entre les différents serveurs de segments,
ainsi que la gestion du mécanisme de tolérance aux pannes.
Extrêmement flexible, la gamme EMC Greenplum
DCA offre un rapport prix/performances inégalé
et permet aux entreprises d’éviter tout retard de
déploiement de leurs applications à forte valeur
ajoutée dans le cadre des analyses Big Data.
HAUTE DISPONIBILITÉ POUR L’ENTREPRISE
Le système Greenplum DCA répond aux exigences de fiabilité des applications critiques
des entreprises, grâce à sa tolérance aux pannes multiniveau avec autoréparation, incluant
notamment un basculement sur incident automatisé et une resynchronisation autoréparatrice
entièrement en ligne, ainsi que plusieurs niveaux de redondance et de contrôle d’intégrité. La
disponibilité des données comprend une protection RAID matérielle au niveau du disque, ainsi
qu’une mise en miroir des données entre les différents serveurs de segments. Grâce à la fiabilité
du système, toutes les données sont conservées en cas de perte d’un disque ou d’un serveur.
DÉPLOIEMENT RAPIDE ET PERFORMANCES PRÉVISIBLES
Greenplum Data Computing Appliance est une appliance dédiée, entièrement ouverte dont
l’architecture intègre le Système De Gestion de Base de données, les serveurs (CPU et RAM),
le stockage physique, et le réseau, au sein d’un système facile à mettre en oeuvre et extensible.
Cette évolution s’effectue dans une durée de l’ordre de la journée et non de la semaine ou
du mois. Vous pouvez étendre le système par modules jusqu’à une configuration multirack.
L’intégration et la préconfiguration de l’appliance garantissent des performances prévisibles,
tout en simplifiant radicalement votre infrastructure d’entrepôt décisionnel et d’analyse de
données, ce qui vous permet de réduire les coûts d’administration de manière drastique.
SAUVEGARDE FIABLE ET REPRISE APRÈS SINISTRE
Greenplum DCA utilise les technologies EMC Data Domain® et EMC Symmetrix® pour
protéger les données à distance de manière efficace et fiable pour l’ensemble de
l’environnement d’analyse DCA. Grâce à la technologie de déduplication et de sauvegarde
d’EMC Data Domain, le système Greenplum DCA assure une restauration des données
extrêmement fiable et rapide, avec des débits de sauvegarde pouvant atteindre 14 To/h. La
capacité de réplication étendue de Data Domain a également été validée pour la réplication
d’une base de données Greenplum. La solution de mise en miroir du SAN de Greenplum DCA
utilise EMC Symmetrix VMAX™, EMC TimeFinder®/Snap et Symmetrix Remote Data Facility
(SRDF®) pour prendre en charge les fonctionnalités de stockage et de réplication de données
avancées entre deux sites en mode synchrone.
MODULE SYSTÈME DE GESTION DE BASE
DE DONNÉES GREENPLUM STANDARD
• Meilleur rapport prix/performances du marché
• Évolutivité linéaire
MODULE SYSTÈME DE GESTION DE BASE DE
DONNÉES GREENPLUM HAUTE CAPACITÉ
• Module capable d’héberger plusieurs
pétaoctets de données, avec un encombrement
au sol, une consommation électrique et un
coût réduit
• Meilleur prix par unité du marché des
Appliances d’entrepôt de données décisionnel
MODULE GREENPLUM HADOOP (HD)
• La première appliance professionnelle Hadoop
hautement performante proposant des
traitements parallèles des données
STRUCTURE DE SUPPORT PROACTIF D’EMC ONE
Le Support Clients d’EMC fournit des ressources et des services pour répondre aux questions
des clients et résoudre rapidement et de manière proactive leurs problèmes liés aux solutions.
L’objectif est de garantir la continuité d’activité et la disponibilité totale de l’environnement
de données. Les services de maintenance et de support EMC sont disponibles 24x7 dans
le monde entier par le biais d’outils de support en ligne, notamment le Chat en direct et
la gestion des demandes de service en ligne, l’assistance téléphonique en direct, mais
également sur site via le Service Clients, cité comme le plus performant du secteur.
En outre, la solution Data Computing Appliance est dotée de la fonction d’appel à
distance sécurisée, qui permet un dépannage à distance et préventif 24 h/24 en alertant
automatiquement le Support EMC en cas d’erreurs critiques relatives au matériel ou aux
logiciels. Le Support EMC diagnostique ainsi le problème à distance afin d’éviter ou de
réduire les interruptions de service. Il se charge également d’envoyer automatiquement
des experts sur site pour accélérer la résolution des problèmes matériels.
MODULES DE DATA COMPUTING APPLIANCE
Greenplum Data Computing Appliance (DCA) comprend les modules suivants :
• Permet le traitement parallèle des données
structurées et non structurées
MODULE GREENPLUM ACCÉLÉRATEUR
D’INTÉGRATION DE DONNÉE (DATA
INTEGRATION ACCELERATOR, DIA)
• Pour héberger et fournir une intégration rapide
des applications analytiques proposées par des
partenaires avec l’Appliance Greenplum
• Module Greenplum Base de données Standard : appliance d’analyse hautement évolutive
et spécialisée, dont l’architecture intègre le Système De Gestion de Base de données, les
serveurs (CPU et RAM), le stockage physique, et le réseau, au sein d’un système facile à
mettre en oeuvre. Ce module est leader du secteur en termes de rapport prix/performance.
• Module Greenplum Base de données Haute Capacité : conçu pour héberger plusieurs
pétaoctets de données, avec un encombrement au sol, une consommation électrique et
un coût réduit. Pour les entreprises qui ont besoin de conduire des analyses détaillées
sur de très gros volumes de données ou qui recherchent un système d’archivage à plus
long terme, ce modèle représente la solution d’entrepôt décisionnel la plus économique.
• Module Greenplum HADOOP (HD) : la première appliance Hadoop offrant des traitements
parallèles et hautement performants pour accéder aux données. En intégrant Hadoop
et Greenplum Base de données, le système DCA permet le cotraitement des données
structurées et non structurées dans une solution unique et facile d’utilisation.
• Module Greenplum Accélérateur d’intégration de donnée (DIA) : un module conçu pour
héberger et fournir une intégration rapide des applications analytiques proposées par des
partenaires avec l’Appliance Greenplum. Ce module est utilisé par exemple pour résoudre
les problèmes de chargement des données au travers d’un modèle parallèle et évolutif,
mais également pour réduire le temps de chargement des lots ou pour mettre en oeuvre
un chargement par microlots.
Le tableau ci-dessous présente les détails techniques des quatre modules de Greenplum DCA :
Type de module
Module Greenplum
Base de données
Standard
Module Greenplum
Base de données
Haute Capacité
Module Greenplum
HADOOP (HD)
Module Greenplum
Accélérateur
d’intégration
de donnée (DIA)
Logiciels
Greenplum Base
de données
Greenplum Base
de données
Greenplum Hadoop
Version Communautaire
(HD CE)
Logiciel partenaire
certifié
Serveur de
segments
2 sockets/12 coeurs
Mémoire totale
Type de stockage
192 Go
600 Go
2 To
Nombre total de
disques de stockage
2 To
2 To
48
Capacité utile (non
compressée)
9 To
31 To
28 To
70 To
Capacité utile
(compressée)
36 To
124 To
112 To
Sans objet
Exemples de configuration de la grappe Greenplum DCA avec les modules Greenplum Base
de données et Greenplum Base de données Haute Capacité :
Type de module
Module GP BD Standard
Module GP BD Haute Capacité
Nombre de modules
4
24
4
24
Nombre de racks
1
6
1
6
Capacité utile
(non compressée)
36 To
216 To
124 To
744 To
Capacité utile
(compressée)
144 To
864 To
496 To
2 976 To
Vitesse de lecture
des données
24 Go/s
144 Go/s
14 Go/s
84 Go/s
Vitesse de
chargement
des données
10 To/h
60 To/h
10 To/h
60 To/h
OPTIMISER LES AVANTAGES D’EMC GREENPLUM DCA
AVEC EMC GLOBAL SERVICES
EMC offre une gamme complète de services et de support pour le matériel et les logiciels
EMC Greenplum. Ils garantissent que votre système fonctionne comme prévu dans votre
environnement, tout en minimisant les risques sur vos activités et votre budget. Les services
de planification, de conception et de mise en oeuvre vous aident à tirer le meilleur parti des
matériels et des logiciels de votre environnement, que ce dernier soit simple ou complexe. Une
fois l’implémentation terminée, les services de migration des données EMC peuvent vous aider à
planifier, concevoir et migrer en toute sécurité vos données critiques vers votre nouveau système,
quelle que soit la distance. EMC vous aide également à intégrer votre nouveau système dans
votre Système d’Information avec, notamment vos solutions applicatives décisionnelles
et analytiques (telles que SAS, Informatica, Micro Strategy, Business Objects et Tableau).
Une fois votre environnement entièrement configuré, nous vous aiderons également à le gérer.
Nos équipes de gestion de projet et nos experts Produits et Services utilisent les bonnes
pratiques de déploiement des applications d’entrepôt de données décisionnel et les
méthodologies éprouvées d’EMC pour vous offrir rapidement les résultats dont vous
avez besoin sans mobiliser excessivement vos ressources.
EMC GREENPLUM – DIVISION PRODUIT DATA COMPUTING
NOUS CONTACTER
Pour savoir comment les produits, services
et solutions d’EMC peuvent vous aider à
relever vos défis informatiques et métiers,
contactez un responsable de compte EMC ou
un revendeur agréé, ou consultez notre site
Web à l’adresse www.emc2.fr.
La division Produit EMC Data Computing Products innove sur le marché des entrepôts
décisionnels et de l’analyse Big Data grâce à des produits parfaitement fiables tels qu’EMC
Greenplum Hadoop (HD), EMC Greenplum Data Computing Appliance, EMC Greenplum Base
de données et EMC Greenplum Chorus, la première plate-forme de type cloud pour les
données d’entreprise. Les produits de la division combinent la puissance des systèmes
ouverts, de l’informatique dans le nuage, de la virtualisation et de la collaboration sociale,
permettant ainsi aux entreprises d’améliorer significativement la connaissance et la valeur
de leurs données.
EMC2, EMC, Data Domain, EMC Greenplum, EMC Greenplum MPP Scatter/Gather Streaming, SRDF, Symmetrix, TimeFinder, VMAX et
le logo EMC sont des marques commerciales ou déposées d’EMC Corporation aux États-Unis et dans d’autres pays. Toutes les autres
marques citées dans le présent document sont la propriété de leurs détenteurs respectifs. © Copyright 2011 EMC Corporation.
Tous droits réservés. 9/11 Présentation de solution H7419.5
EMC Computer Systems France
River Ouest
80 quai Voltaire
CS 21002
95876 Bezons Cedex
Tél. : +33 1 39 96 90 00
Fax : +33 1 39 96 99 99
www.emc2.fr

Documents pareils