Gérer des Po de données avec le stockage d`objets Guide des
Transcription
Gérer des Po de données avec le stockage d`objets Guide des
Guide des meilleures pratiques : Gérer des Po de données avec le stockage d'objets Meilleures pratiques pour le data center moderne Guide des meilleures pratiques : Page 2 Le département IT doit être capable de stocker les données efficacement et d'accéder instantanément aux données requises. Or, les solutions de stockage traditionnelles (fichiers/ blocs) ne sont plus adaptées à la croissance explosive des données que nous connaissons aujourd'hui. Avec les nouvelles sources de données (médias sociaux, Internet des objets, applis mobiles, etc.), les réseaux de stockage existants atteignent leurs limites. Cette croissance des volumes de données s'accompagne de la complexité et du coût de stockage et de gestion de ces données. On estime qu'au cours des cinq prochaines années, plus de mille milliards d'applications échangeront 58 Zo de données sur plus de 100 milliards de terminaux.1 Dans la nouvelle économie des idées, le potentiel de croissance de l'entreprise est directement lié à sa capacité de stocker, gérer et exploiter les données. Faire face à cette explosion de données n'est plus la préoccupation exclusive des administrateurs du stockage ou des DSI : elle doit s'imposer comme priorité essentielle à chaque dirigeant. Les sous-systèmes de stockage les plus performants ont été conçus pour répondre aux besoins des transactions stratégiques à une échelle comprise entre le To et le Po. Et cependant, il n'est pas rare que les sources de données non structurées atteignent ou dépassent rapidement plusieurs dizaines (ou même centaines) de Po. L'approche traditionnelle à base d'unités de stockage SAN sera généralement incapable de répondre à ces besoins de manière efficace et avec un rapport performances/prix satisfaisant. Le déploiement d'une solution de stockage SAN traditionnelle est devenu trop coûteux et trop complexe, et ce type de solution ne permet plus de gérer des données à l'échelle du Po. Les nouveaux types de données et les nouvelles sources de données exigent une approche actualisée et tirant parti des technologies de stockage les plus avancées. Stockage d'objets D'ici à 2019, la capacité des solutions fichiers/objets à évolution scale-out va connaître un taux de croissance annuel moyen (TCAM/CAGR) composé de 40 %. 1 Recherche interne HP (aujourd'hui Hewlett Packard Enterprise/HPE), 2014 hpematter.com/issue-no1-june-2014/why-open-open-cloud-matters Jusqu'à présent, nous avions l'habitude de visualiser les données sous forme de de fichiers ou de blocs (les systèmes de stockage SAN sont structurés selon ces modes). Avec le « stockage d'objets », les données sont considérées comme des objets, avec des métadonnées et un identifiant qui permettent d'identifier et de caractériser chaque objet de données de manière unique. Ce mode de stockage permet d'éliminer les restrictions des systèmes traditionnels (limites imposées à la taille de bloc ou de fichier et au nombre de blocs ou de fichiers pouvant être stockés). Contrairement à la technologie SAN (en particulier les baies SAN à support Flash), les solutions de stockage d'objets ne sont pas conçues pour des performances stratégiques au niveau des IOPS ou des temps de latence. Par contraste, le stockage d'objet est conçu pour garantir une fiabilité uniforme des données à l'échelle du Po et pour supporter une bande passante élevée et des charges de travail parallèles avec latence tolérable et valeur adéquate d'IOPS. Quelle est la fiabilité du stockage d'objets ? Les fournisseurs de cette solution déclarent une fiabilité pouvant atteindre les « quinze 9 » grâce à des techniques telles que les codes à effacement, qui permettent de reconstruire rapidement les données qui seraient altérées ou perdues. Guide des meilleures pratiques : Page 3 Le stockage d'objets est un stockage local sur serveur, ce qui permet au département IT de le faire évoluer très facilement jusqu'à plusieurs centaines de Po dès aujourd'hui tout en offrant un chemin facile et peu coûteux vers l'échelle Eo ou Zo à l'avenir. La gestion du stockage des contenus correspondant à un tsunami incessant de données structurées ou semi-structurées exige une solution évolutive scale-out à base de fichiers et d'objets. Les solutions de stockage d'objets offrent des capacités révolutionnaires définies par logiciel et qui sont peu coûteuses, simples, évolutives et déployées rapidement. Meilleures pratiques du stockage d'objets Le stockage d'objets offre aux entreprises une nouvelle solution pour stocker des données structurées et non structurées à l'échelle du péta-octet (Po). Cette nouvelle technologie doit être déployée et utilisée en suivant les meilleures pratiques applicables. Cas d'usage du stockage d'objets Le stockage d'objets peut être la meilleure option pour certaines conditions et certains cas d'usage ; dans d'autres cas, les solutions traditionnelles de stockage en réseau (NAS) seront mieux adaptées. Le stockage d'objets est particulièrement adapté aux cas suivants : •Téléchargements de fichiers et de contenus Web. •Données consultées au niveau des fichiers ou des objets (vidéos, imagerie médicale, etc.). •Données consultées plus rarement (archives, stockage hors site). •Environnements de stockage de données de grande envergure à évolution scale-out (plusieurs dizaines ou centaines de Po). •Contenus statiques (données rarement modifiées) : données de capteurs, photos, fichiers vidéo à latence réduite. Les applications sont de plus en plus nombreuses à proposer le support natif du stockage d'objets. Guide des meilleures pratiques : Page 4 Principaux cas d'usage du stockage d'objets : •Sauvegarde et archivage en remplacement des bandes magnétiques, avec des temps de latence inférieurs pour les accès aux données et aucune maintenance à long terme des unités à bandes. •Archives actives de conformité, d'analyse ou de surveillance et autres données sous forme de fichiers et d'objets avec des contenus à échelles du Po. •Livraison de contenus (communication, multimédia, divertissement), y compris applications telles que la vidéo à la demande. •Solutions de stockage hébergées (« as-a-service ») pour entreprises et consommateurs : sauvegarde, archivage, reprise sur incident majeur, synchronisation/partage. •Nouveaux services natifs (Web/cloud) pour déploiements de cloud public et de cloud privé sur site qui exigent des architectures de stockage distribué. •Nouvelles applications qui exploitent l'Internet des objets et dont les données (données non structurées ou données de capteurs) exigent un référentiel capable d'évoluer jusqu'à plusieurs milliards ou même milliers de milliards d'objets. Les solutions de stockage d'objets ne sont pas adaptées aux cas d'usage suivants : •Données d'applications transactionnelles qui sont modifiées très souvent (bases de données et disque racine). Une solution de stockage en mode bloc à faible latence et capacité de mise en miroir synchrone des données est mieux adaptée à ces charges de travail. •Environnements de fichiers partagés qui peuvent se contenter d'une seule vue à jour des fichiers pour toute personne disposant d'un accès et appliquant des mécanismes de partage des fichiers et de verrouillage au niveau des fichiers (développement de contenus, CFAO, documents mis à jour régulièrement, etc.). Une solution de stockage NAS ou ou certains systèmes de fichiers en cluster avec capacité d'évolution scale-out sont mieux adaptés à ces charges de travail. Guide des meilleures pratiques : Page 5 Déployer une solution de stockage définie par logiciel et indépendante de la technologie La chaîne de télévision allemande RTL II multiplie x10 ses vitesses de transfert vidéo – RTL II était à la recherche d'une solution en support de son archive vidéo, qui connaissait une croissance rapide (plus de 200 To par an !). Grâce aux serveurs HPE, la chaîne est désormais en mesure de proposer les services suivants : livraison des dernières informations diffusées, augmentation du volume de contenus vidéo proposés en streaming en ligne, simplification du support technique grâce au déploiement de matériel standard et réduction des temps de transfert des films (40 Mo, hier 60-70 minutes, aujourd'hui 6,5 minutes !). Les solutions de stockage définies par logiciel proposent des qualités très élevées de disponibilité, de fiabilité, de facilité d'utilisation et d'évolution à moindre coût. Il existe de nombreuses architectures de stockage d'objets et de nombreuses solutions de gestion de stockage définies par logiciel (par exemple, plates-formes Scality RING, Cleversafe dsNet, Ceph ou OpenStack® Swift). Les solutions de stockage définies par logiciel dissocient le stockage logique des ressources matérielles, ce qui permet au département IT de sélectionner le matériel en fonction de son efficacité et de son rapport performances/prix plutôt que d'avoir à supporter des architectures propriétaires. Pour répondre efficacement à des besoins de stockage d'objets, une solution de stockage définie par logiciel doit présenter les caractéristiques suivantes : •Tourner dans un environnement de serveurs x86 standard et indépendants de la technologie. •Permettre une consolidation de stockage supportant toutes les combinaisons de charges de travail et d'applications. •Proposer un accès par différents modes d'interface (fichiers, objets et OpenStack) actifs en simultané. •Garantir la disponibilité et la durabilité des données à travers différents mécanismes de protection des données et la capacité de construire des infrastructures de stockage réparties sur différents sites. •Proposer un TCO plus faible et un ROI plus élevé que les offres en cloud public telles que Amazon S3. Scality RING.est une des solutions qui répond à tous ces critères. Scality RING peut évoluer très facilement jusqu'à plusieurs centaines de Po de capacité, gérer plusieurs milliers de milliards d'objets et supporter plusieurs millions d'utilisateurs tout en assurant la protection intégrale des données et leur durabilité. Vous pouvez implémenter différentes interfaces (fichiers natifs, objets ou OpenStack), mais Scality RING propose les fonctionnalités nécessaires en assurant le service, la gestion et la protection de tous les types de données sous forme d'objets. Par ailleurs, Scality RING supporte l'application de politiques globales (réplication, codes à effacement, géo-réplication), le résultat étant une solution de stockage incroyablement efficace et durable. Guide des meilleures pratiques : BIGLOBE l'un des plus grands prestataires japonais de services Internet/cloud a adopté les serveurs HPE pour construire à moindre coût un environnement de stockage de grande capacité (2 Po). BIGLOBE a déployé 88 To de capacité disque et 192 Go de mémoire par nœud de serveur tout en réduisant sensiblement ses coûts de fonctionnement et de maintenance. Page 6 Les déploiements Scality RING supportent la plupart des cas d'usage, y compris le stockage Web et cloud, la distribution de contenus, le traitement distribué, les clouds privés d'entreprise et l'archivage actif. Hewlett Packard Enterprise et Scality ont établi un partenariat très actif pour améliorer l'expérience client et la valeur des activités, et pour accélérer l'adoption des solutions de stockage des données non structurées et semi-structurées sous forme d'objets et à l'échelle du Po en associant Scality RING et les serveurs HPE. Utiliser des serveurs optimisés pour les architectures à évolutivité scale-out Le changement de paradigme du stockage traditionnel au stockage d'objets exige un nouveau type d'infrastructures dans lesquelles les solutions rack traditionnelles sont remplacées par des nœuds ultra denses capables de stocker plus de données dans un espace physique plus faible et avec un moindre coût par Go que les plates-formes polyvalentes actuelles. Les entreprises devront donc déployer des serveurs haute densité conçus spécifiquement pour l'implémentation de solutions de stockage d'objets très évolutives, très efficaces et à coût très modéré. Dans l'infrastructure idéale, ces nœuds de stockage d'objets optimisés devraient proposer les caractéristiques suivantes : •Capacité de stockage à densité plus élevée. •Augmentation de la bande passante des E/S et de la capacité de mémoire. •Réduction des besoins en énergie et en refroidissement. •Conception modulaire. •Options de configuration très souples. •Capacité illimitée d’évolution scale-out. •Support de la plupart des plates-formes de stockage d'objets telles que Scality RING, Cleversafe dsNet, Ceph ou OpenStack Swift. Les serveurs HPE Apollo ont été conçus pour répondre aux besoins spécifiques des solutions de stockage d'objets. Ils sont parfaitement adaptés aux applications partenaires de Scality, Cleversafe et d'autres prestataires open source. Les serveurs HPE Apollo 4200 et HPE Apollo 4510 ont été conçus à la fois pour proposer les qualités requises de performances, de fiabilité et d'évolutivité et pour répondre aux défis des data centers en matière d'espace, d'énergie et de temps. Guide des meilleures pratiques : Page 7 Quel type de cloud ? Un grand nombre d'entreprises ont répondu à l'envahissement des données en migrant celles ci immédiatement vers le cloud. Selon votre secteur d'activité et les types de données stockées, un cloud public peut être ou peut ne pas être une solution adaptée. Pour les secteurs tels que les services financiers, la santé et la plupart des applications administratives/gouvernementales, un cloud public est même exclu compte tenu des risques et des règles en matière de confidentialité et de conformité des données. D'autres secteurs peuvent être plus ouverts au déploiement de solutions en cloud public, mais ce type de cloud s'accompagne généralement d'un certain niveau de risque : •Risques de sécurité et de conformité résultant de la gestion d'une partie des données hors site. •Perte de contrôle sur les données sensibles de l'entreprise. •Viabilité à long terme des opérateurs de clouds publics. •Les coûts peuvent augmenter très rapidement avec l'accroissement des volumes de données. Gartner prédit que plus de la moitié des sociétés du Global 1000 vont stocker des données sensibles de leurs clients dans un cloud public d'ici à la fin de l'année 2016.2 2 « Hybrid Cloud Storage Can Be an Antidote to Rapid Data Growth » (Gartner, julllet 2013) •Dépenses imprévues pour récupérer de gros volumes de données d'archive stockées hors site. Les départements IT font face à des demandes internes formulées par des utilisateurs qui souhaitent disposer d'un service de stockage qui serait proposé selon le modèle de prestataires cloud tels que Amazon. Certains départements IT ont même vu des utilisateurs internes définir leurs propres solutions en migrant des données vers le cloud sans aucune autorisation. Les solutions de stockage d'objets permettent au département IT de proposer des solutions cloud en interne et de livrer aux utilisateurs une expérience de type « cloud public » mais avec la sécurité du data center de l'entreprise. Avec un dépôt de contenus en cloud privé sur site, les utilisateurs bénéficient de la même disponibilité et de la même agilité qu'ils pourraient obtenir auprès de prestataires de cloud public. Le stockage d'objets constitue une solution peu coûteuse et efficace, et qui entraîne une baisse des coûts grâce à l'utilisation de matériel standard. Les outils logiciels qui offrent à la fois facilité d'utilisation et implémentation avancée de fonctionnalités de fiabilité telles que les codes à effacement peuvent proposer aux utilisateurs internes le niveau de disponibilité et de durabilité des données qu'ils recherchent dans un environnement sur site sécurisé. Guide des meilleures pratiques : Conclusion L'existence des architectures traditionnelles de stockage (au niveau des fichiers ou des blocs) est menacée par la croissance explosive des données non structurées et statiques. Des architectures de stockage émergentes (au niveau des objets) peuvent aider les entreprises à relever ce défi en leur proposant des solutions de stockage peu coûteuses et prêtes à faire face à la multiplication des demandes internes en capacité de stockage. Hewlett Packard Enterprise et le stockage d'objets Une solution largement adoptée fait tourner le produit Scality RING sur un système spécialisé associant un serveur Apollo et une solution de stockage d'objets, Cette solution est disponible à l'échelle du Po et elle assure une fiabilité très élevée à prix modéré – d'où un TCO moins élevé et un ROI plus rapide que les solutions de stockage sur site traditionnelles ou que les options des clouds publics. L'architecture de référence HPE Helion Content Depot définit l'environnement nécessaire pour une solution de cloud privé sur site composée d'une infrastructure spécialisée (serveur + réseau) et d'un ensemble de services d'installation et de support technique. Cette solution propose un TCO moins élevé et un ROI plus rapide. HPE Consulting vous propose des détails sur les solutions de stockage d'objets HPE et vous explique comment aborder le stockage d'objets et le stockage défini par logiciel. Plus de détails : hpe.com/info/Apollo Abonnez-vous sur © Copyright 2016 Hewlett Packard Enterprise Development LP. Les informations figurant dans le présent document peuvent être modifiées à tout moment et sans préavis. Les seules garanties relatives aux produits et services Hewlett Packard Enterprise sont stipulées dans les déclarations de garantie expresses accompagnant ces produits et services. Aucune information contenue dans le présent document ne saurait être considérée comme constituant une garantie complémentaire. Hewlett Packard Enterprise décline toute responsabilité quant aux éventuelles erreurs ou omissions techniques ou rédactionnelles qui pourraient être constatées dans le présent document. Aux États-Unis et dans d'autres pays, le logo OpenStack en forme de « O carré » est une marque/une marque de service déposée ou une marque/une marque de service reconnue comme appartenant à la OpenStack Foundation. Dans le présent document, ce nom est utilisé avec l'autorisation de la OpenStack Foundation. HPE n'a aucune affiliation avec la OpenStack Foundation ou avec la communauté de l'OpenStack Foundation, et nous ne sommes ni cautionnés ni sponsorisés par ces entités. Aux États-Unis et/ou dans d’autres pays, les noms « Pivotal » et « Cloud Foundry » sont des marques et/ou des marques déposées reconnues comme appartenant à la société Pivotal Software, Inc. 4AA6-3933FRE, mars 2016