Gérer des Po de données avec le stockage d`objets Guide des

Transcription

Gérer des Po de données avec le stockage d`objets Guide des
Guide des meilleures pratiques :
Gérer des Po de données
avec le stockage d'objets
Meilleures pratiques pour le data center moderne
Guide des meilleures pratiques :
Page 2
Le département IT doit être capable de stocker les données efficacement et d'accéder
instantanément aux données requises. Or, les solutions de stockage traditionnelles (fichiers/
blocs) ne sont plus adaptées à la croissance explosive des données que nous connaissons
aujourd'hui. Avec les nouvelles sources de données (médias sociaux, Internet des objets,
applis mobiles, etc.), les réseaux de stockage existants atteignent leurs limites. Cette
croissance des volumes de données s'accompagne de la complexité et du coût de stockage
et de gestion de ces données.
On estime qu'au cours des cinq
prochaines années, plus de mille milliards
d'applications échangeront 58 Zo de
données sur plus de 100 milliards de
terminaux.1
Dans la nouvelle économie des idées, le potentiel de croissance de l'entreprise est
directement lié à sa capacité de stocker, gérer et exploiter les données. Faire face à cette
explosion de données n'est plus la préoccupation exclusive des administrateurs du stockage
ou des DSI : elle doit s'imposer comme priorité essentielle à chaque dirigeant.
Les sous-systèmes de stockage les plus performants ont été conçus pour répondre
aux besoins des transactions stratégiques à une échelle comprise entre le To et le Po.
Et cependant, il n'est pas rare que les sources de données non structurées atteignent
ou dépassent rapidement plusieurs dizaines (ou même centaines) de Po. L'approche
traditionnelle à base d'unités de stockage SAN sera généralement incapable de répondre
à ces besoins de manière efficace et avec un rapport performances/prix satisfaisant. Le
déploiement d'une solution de stockage SAN traditionnelle est devenu trop coûteux et trop
complexe, et ce type de solution ne permet plus de gérer des données à l'échelle du Po. Les
nouveaux types de données et les nouvelles sources de données exigent une approche
actualisée et tirant parti des technologies de stockage les plus avancées.
Stockage d'objets
D'ici à 2019, la capacité des solutions
fichiers/objets à évolution scale-out va
connaître un taux de croissance annuel
moyen (TCAM/CAGR) composé de 40 %.
1
Recherche interne HP (aujourd'hui Hewlett Packard
Enterprise/HPE), 2014 hpematter.com/issue-no1-june-2014/why-open-open-cloud-matters
Jusqu'à présent, nous avions l'habitude de visualiser les données sous forme de de
fichiers ou de blocs (les systèmes de stockage SAN sont structurés selon ces modes).
Avec le « stockage d'objets », les données sont considérées comme des objets, avec des
métadonnées et un identifiant qui permettent d'identifier et de caractériser chaque objet
de données de manière unique. Ce mode de stockage permet d'éliminer les restrictions des
systèmes traditionnels (limites imposées à la taille de bloc ou de fichier et au nombre de
blocs ou de fichiers pouvant être stockés).
Contrairement à la technologie SAN (en particulier les baies SAN à support Flash), les
solutions de stockage d'objets ne sont pas conçues pour des performances stratégiques au
niveau des IOPS ou des temps de latence. Par contraste, le stockage d'objet est conçu pour
garantir une fiabilité uniforme des données à l'échelle du Po et pour supporter une bande
passante élevée et des charges de travail parallèles avec latence tolérable et valeur adéquate
d'IOPS. Quelle est la fiabilité du stockage d'objets ? Les fournisseurs de cette solution
déclarent une fiabilité pouvant atteindre les « quinze 9 » grâce à des techniques telles que
les codes à effacement, qui permettent de reconstruire rapidement les données qui seraient
altérées ou perdues.
Guide des meilleures pratiques :
Page 3
Le stockage d'objets est un stockage local sur serveur, ce qui permet au département IT
de le faire évoluer très facilement jusqu'à plusieurs centaines de Po dès aujourd'hui tout en
offrant un chemin facile et peu coûteux vers l'échelle Eo ou Zo à l'avenir.
La gestion du stockage des contenus correspondant à un tsunami incessant de données
structurées ou semi-structurées exige une solution évolutive scale-out à base de fichiers et
d'objets. Les solutions de stockage d'objets offrent des capacités révolutionnaires définies
par logiciel et qui sont peu coûteuses, simples, évolutives et déployées rapidement.
Meilleures pratiques du stockage d'objets
Le stockage d'objets offre aux entreprises une nouvelle solution pour stocker des données
structurées et non structurées à l'échelle du péta-octet (Po). Cette nouvelle technologie doit
être déployée et utilisée en suivant les meilleures pratiques applicables.
Cas d'usage du stockage d'objets
Le stockage d'objets peut être la meilleure option pour certaines conditions et certains cas
d'usage ; dans d'autres cas, les solutions traditionnelles de stockage en réseau (NAS) seront
mieux adaptées.
Le stockage d'objets est particulièrement adapté aux cas suivants :
•Téléchargements de fichiers et de contenus Web.
•Données consultées au niveau des fichiers ou des objets (vidéos, imagerie médicale, etc.).
•Données consultées plus rarement (archives, stockage hors site).
•Environnements de stockage de données de grande envergure à évolution scale-out
(plusieurs dizaines ou centaines de Po).
•Contenus statiques (données rarement modifiées) : données de capteurs, photos, fichiers
vidéo à latence réduite.
Les applications sont de plus en plus nombreuses à proposer le support natif
du stockage d'objets.
Guide des meilleures pratiques :
Page 4
Principaux cas d'usage du stockage d'objets :
•Sauvegarde et archivage en remplacement des bandes magnétiques, avec des temps de
latence inférieurs pour les accès aux données et aucune maintenance à long terme des
unités à bandes.
•Archives actives de conformité, d'analyse ou de surveillance et autres données sous forme
de fichiers et d'objets avec des contenus à échelles du Po.
•Livraison de contenus (communication, multimédia, divertissement), y compris applications
telles que la vidéo à la demande.
•Solutions de stockage hébergées (« as-a-service ») pour entreprises et consommateurs :
sauvegarde, archivage, reprise sur incident majeur, synchronisation/partage.
•Nouveaux services natifs (Web/cloud) pour déploiements de cloud public et de cloud privé
sur site qui exigent des architectures de stockage distribué.
•Nouvelles applications qui exploitent l'Internet des objets et dont les données (données
non structurées ou données de capteurs) exigent un référentiel capable d'évoluer jusqu'à
plusieurs milliards ou même milliers de milliards d'objets.
Les solutions de stockage d'objets ne sont pas adaptées aux cas d'usage suivants :
•Données d'applications transactionnelles qui sont modifiées très souvent (bases de
données et disque racine). Une solution de stockage en mode bloc à faible latence et
capacité de mise en miroir synchrone des données est mieux adaptée à ces charges
de travail.
•Environnements de fichiers partagés qui peuvent se contenter d'une seule vue à jour
des fichiers pour toute personne disposant d'un accès et appliquant des mécanismes de
partage des fichiers et de verrouillage au niveau des fichiers (développement de contenus,
CFAO, documents mis à jour régulièrement, etc.). Une solution de stockage NAS ou
ou certains systèmes de fichiers en cluster avec capacité d'évolution scale-out sont mieux
adaptés à ces charges de travail.
Guide des meilleures pratiques :
Page 5
Déployer une solution de stockage définie par logiciel et
indépendante de la technologie
La chaîne de télévision allemande RTL
II multiplie x10 ses vitesses de transfert
vidéo – RTL II était à la recherche d'une
solution en support de son archive vidéo,
qui connaissait une croissance rapide
(plus de 200 To par an !). Grâce aux
serveurs HPE, la chaîne est désormais en
mesure de proposer les services suivants
: livraison des dernières informations
diffusées, augmentation du volume de
contenus vidéo proposés en streaming
en ligne, simplification du support
technique grâce au déploiement de
matériel standard et réduction des temps
de transfert des films (40 Mo, hier 60-70
minutes, aujourd'hui 6,5 minutes !).
Les solutions de stockage définies par logiciel proposent des qualités très élevées de
disponibilité, de fiabilité, de facilité d'utilisation et d'évolution à moindre coût. Il existe de
nombreuses architectures de stockage d'objets et de nombreuses solutions de gestion de
stockage définies par logiciel (par exemple, plates-formes Scality RING, Cleversafe dsNet,
Ceph ou OpenStack® Swift). Les solutions de stockage définies par logiciel dissocient
le stockage logique des ressources matérielles, ce qui permet au département IT de
sélectionner le matériel en fonction de son efficacité et de son rapport performances/prix
plutôt que d'avoir à supporter des architectures propriétaires. Pour répondre efficacement à
des besoins de stockage d'objets, une solution de stockage définie par logiciel doit présenter
les caractéristiques suivantes :
•Tourner dans un environnement de serveurs x86 standard et indépendants
de la technologie.
•Permettre une consolidation de stockage supportant toutes les combinaisons de charges
de travail et d'applications.
•Proposer un accès par différents modes d'interface (fichiers, objets et OpenStack) actifs en
simultané.
•Garantir la disponibilité et la durabilité des données à travers différents mécanismes
de protection des données et la capacité de construire des infrastructures de stockage
réparties sur différents sites.
•Proposer un TCO plus faible et un ROI plus élevé que les offres en cloud public telles
que Amazon S3.
Scality RING.est une des solutions qui répond à tous ces critères. Scality RING peut évoluer
très facilement jusqu'à plusieurs centaines de Po de capacité, gérer plusieurs milliers de
milliards d'objets et supporter plusieurs millions d'utilisateurs tout en assurant la protection
intégrale des données et leur durabilité. Vous pouvez implémenter différentes interfaces
(fichiers natifs, objets ou OpenStack), mais Scality RING propose les fonctionnalités
nécessaires en assurant le service, la gestion et la protection de tous les types de données
sous forme d'objets. Par ailleurs, Scality RING supporte l'application de politiques globales
(réplication, codes à effacement, géo-réplication), le résultat étant une solution de stockage
incroyablement efficace et durable.
Guide des meilleures pratiques :
BIGLOBE l'un des plus grands
prestataires japonais de services
Internet/cloud a adopté les serveurs
HPE pour construire à moindre coût un
environnement de stockage de grande
capacité (2 Po). BIGLOBE a déployé
88 To de capacité disque et 192 Go de
mémoire par nœud de serveur tout en
réduisant sensiblement ses coûts de
fonctionnement et de maintenance.
Page 6
Les déploiements Scality RING supportent la plupart des cas d'usage, y compris le
stockage Web et cloud, la distribution de contenus, le traitement distribué, les clouds
privés d'entreprise et l'archivage actif. Hewlett Packard Enterprise et Scality ont établi un
partenariat très actif pour améliorer l'expérience client et la valeur des activités, et pour
accélérer l'adoption des solutions de stockage des données non structurées et
semi-structurées sous forme d'objets et à l'échelle du Po en associant Scality RING et
les serveurs HPE.
Utiliser des serveurs optimisés pour les
architectures à évolutivité scale-out
Le changement de paradigme du stockage traditionnel au stockage d'objets exige un
nouveau type d'infrastructures dans lesquelles les solutions rack traditionnelles sont
remplacées par des nœuds ultra denses capables de stocker plus de données dans
un espace physique plus faible et avec un moindre coût par Go que les plates-formes
polyvalentes actuelles. Les entreprises devront donc déployer des serveurs haute densité
conçus spécifiquement pour l'implémentation de solutions de stockage d'objets très
évolutives, très efficaces et à coût très modéré. Dans l'infrastructure idéale, ces nœuds de
stockage d'objets optimisés devraient proposer les caractéristiques suivantes :
•Capacité de stockage à densité plus élevée.
•Augmentation de la bande passante des E/S et de la capacité de mémoire.
•Réduction des besoins en énergie et en refroidissement.
•Conception modulaire.
•Options de configuration très souples.
•Capacité illimitée d’évolution scale-out.
•Support de la plupart des plates-formes de stockage d'objets telles que Scality RING,
Cleversafe dsNet, Ceph ou OpenStack Swift.
Les serveurs HPE Apollo ont été conçus pour répondre aux besoins spécifiques des
solutions de stockage d'objets. Ils sont parfaitement adaptés aux applications partenaires
de Scality, Cleversafe et d'autres prestataires open source. Les serveurs HPE Apollo
4200 et HPE Apollo 4510 ont été conçus à la fois pour proposer les qualités requises de
performances, de fiabilité et d'évolutivité et pour répondre aux défis des data centers en
matière d'espace, d'énergie et de temps.
Guide des meilleures pratiques :
Page 7
Quel type de cloud ?
Un grand nombre d'entreprises ont répondu à l'envahissement des données en migrant
celles ci immédiatement vers le cloud.
Selon votre secteur d'activité et les types de données stockées, un cloud public peut être
ou peut ne pas être une solution adaptée. Pour les secteurs tels que les services financiers,
la santé et la plupart des applications administratives/gouvernementales, un cloud public
est même exclu compte tenu des risques et des règles en matière de confidentialité et de
conformité des données. D'autres secteurs peuvent être plus ouverts au déploiement de
solutions en cloud public, mais ce type de cloud s'accompagne généralement d'un certain
niveau de risque :
•Risques de sécurité et de conformité résultant de la gestion d'une partie des données
hors site.
•Perte de contrôle sur les données sensibles de l'entreprise.
•Viabilité à long terme des opérateurs de clouds publics.
•Les coûts peuvent augmenter très rapidement avec l'accroissement des volumes
de données.
Gartner prédit que plus de la moitié
des sociétés du Global 1000 vont stocker
des données sensibles de leurs clients
dans un cloud public d'ici à la fin de
l'année 2016.2
2
« Hybrid Cloud Storage Can Be an Antidote to
Rapid Data Growth » (Gartner, julllet 2013)
•Dépenses imprévues pour récupérer de gros volumes de données d'archive stockées
hors site.
Les départements IT font face à des demandes internes formulées par des utilisateurs
qui souhaitent disposer d'un service de stockage qui serait proposé selon le modèle de
prestataires cloud tels que Amazon. Certains départements IT ont même vu des utilisateurs
internes définir leurs propres solutions en migrant des données vers le cloud sans
aucune autorisation.
Les solutions de stockage d'objets permettent au département IT de proposer des solutions
cloud en interne et de livrer aux utilisateurs une expérience de type « cloud public » mais
avec la sécurité du data center de l'entreprise. Avec un dépôt de contenus en cloud privé
sur site, les utilisateurs bénéficient de la même disponibilité et de la même agilité qu'ils
pourraient obtenir auprès de prestataires de cloud public. Le stockage d'objets constitue
une solution peu coûteuse et efficace, et qui entraîne une baisse des coûts grâce à
l'utilisation de matériel standard. Les outils logiciels qui offrent à la fois facilité d'utilisation
et implémentation avancée de fonctionnalités de fiabilité telles que les codes à effacement
peuvent proposer aux utilisateurs internes le niveau de disponibilité et de durabilité des
données qu'ils recherchent dans un environnement sur site sécurisé.
Guide des meilleures pratiques :
Conclusion
L'existence des architectures traditionnelles de stockage (au niveau des fichiers ou des
blocs) est menacée par la croissance explosive des données non structurées et statiques.
Des architectures de stockage émergentes (au niveau des objets) peuvent aider les
entreprises à relever ce défi en leur proposant des solutions de stockage peu coûteuses et
prêtes à faire face à la multiplication des demandes internes en capacité de stockage.
Hewlett Packard Enterprise et le stockage d'objets
Une solution largement adoptée fait tourner le produit Scality RING sur un système
spécialisé associant un serveur Apollo et une solution de stockage d'objets, Cette
solution est disponible à l'échelle du Po et elle assure une fiabilité très élevée à prix modéré
– d'où un TCO moins élevé et un ROI plus rapide que les solutions de stockage sur site
traditionnelles ou que les options des clouds publics.
L'architecture de référence HPE Helion Content Depot définit l'environnement nécessaire
pour une solution de cloud privé sur site composée d'une infrastructure spécialisée (serveur
+ réseau) et d'un ensemble de services d'installation et de support technique. Cette solution
propose un TCO moins élevé et un ROI plus rapide.
HPE Consulting vous propose des détails sur les solutions de stockage d'objets HPE et
vous explique comment aborder le stockage d'objets et le stockage défini par logiciel.
Plus de détails :
hpe.com/info/Apollo
Abonnez-vous sur
© Copyright 2016 Hewlett Packard Enterprise Development LP. Les informations figurant dans le présent document peuvent être
modifiées à tout moment et sans préavis. Les seules garanties relatives aux produits et services Hewlett Packard Enterprise sont
stipulées dans les déclarations de garantie expresses accompagnant ces produits et services. Aucune information contenue dans le
présent document ne saurait être considérée comme constituant une garantie complémentaire. Hewlett Packard Enterprise décline
toute responsabilité quant aux éventuelles erreurs ou omissions techniques ou rédactionnelles qui pourraient être constatées dans
le présent document.
Aux États-Unis et dans d'autres pays, le logo OpenStack en forme de « O carré » est une marque/une marque de service déposée
ou une marque/une marque de service reconnue comme appartenant à la OpenStack Foundation. Dans le présent document, ce
nom est utilisé avec l'autorisation de la OpenStack Foundation. HPE n'a aucune affiliation avec la OpenStack Foundation ou avec la
communauté de l'OpenStack Foundation, et nous ne sommes ni cautionnés ni sponsorisés par ces entités. Aux États-Unis
et/ou dans d’autres pays, les noms « Pivotal » et « Cloud Foundry » sont des marques et/ou des marques déposées reconnues comme
appartenant à la société Pivotal Software, Inc.
4AA6-3933FRE, mars 2016