Logiciel de déduplication HP StoreOnce

Transcription

Logiciel de déduplication HP StoreOnce
Livre
blanc
Logiciel de déduplication
HP StoreOnce
Technologie préparant la phase suivante d'optimisation du stockage
Par Lauren Whitehouse
Juin 2010
Ce livre blanc ESG a été commandé par Hewlett-Packard
et est distribué sous licence par ESG.
© 2010, Enterprise Strategy Group, Inc. Tous droits réservés
Livre blanc : Logiciel de déplication HP StoreOnce
2
Table des matières
Introduction ............................................................................................................................................ 3
Vue d'ensemble ...................................................................................................................................... 3
Déduplication des données .................................................................................................................... 4
Vision et solutions de déduplication par HP........................................................................................... 5
HP StoreOnce...................................................................................................................................................... 6
Systèmes de sauvegarde HP D2D ....................................................................................................................... 7
Critère d'achat de déduplication ............................................................................................................ 8
Infrastructure convergente HP et HP StoreOnce ................................................................................. 10
La grande vérité .................................................................................................................................... 11
Tous les noms de marques commerciales sont la propriété de leurs détenteurs respectifs. Les informations contenues dans cette publication
ont été obtenues par des sources que le groupe ESG (The Enterprise Strategy Group) considère fiables, mais qu' ESG ne garantit toutefois
pas. Cette publication peut contenir des opinions d'ESG, pouvant évoluer dans le temps. Cette publication fait l'objet de droits d'auteurs
détenus par The Enterprise Strategy Group, Inc. Toute reproduction ou redistribution de cette publication, entièrement ou partiellement, que
ce soit dans un format imprimé, électronique, ou autre, à des personnes non autorisées de la recevoir, sans l'autorisation expresse du groupe
ESG est en violation de la loi de droits d'auteur des États-Unis et peut faire l'objet d'une poursuite pour dommages civils et, si applicable,
d'une poursuite au criminel. Si vous avez des questions, veuillez contacter le service des relations avec la clientèle d'ESG au (508) 482-0188.
© 2010, Enterprise Strategy Group, Inc. Tous droits réservés.
Livre blanc : Logiciel de déplication HP StoreOnce
3
Introduction
Les organisations informatiques doivent faire face à divers problèmes de croissance de données, à des
exigences de plus en plus contraignantes en matière d'objectifs RTO et RPO, et à une réduction du personnel
opérationnel pour gérer tous ces problèmes. La protection de données sur disque permet d'accélérer les
performances de sauvegarde et de récupération, et la déduplication des données rend plus réalistes les
conditions économiques des sauvegardes disques à disques. Cependant, aujourd'hui la plupart des cibles de
stockage de sauvegarde largement répandues utilisant la déduplication ne règlent pas les problèmes
opérationnels à long terme qui surviendront certainement en raison de l'extension des environnements de
stockage secondaire : à savoir, évolutivité, performances, robustesse, flexibilité et facilité de gestion. La division
HP StorageWorks propose aujourd'hui la déduplication dans sa gamme de systèmes de sauvegarde D2D avec
une vision et une stratégie de livraison permettant de répondre aux futures demandes des organisations
informatiques. Ce document examine les tendances et les besoins des clients en matière de stockage et de
déduplication des données, et indique également de façon détaillée pourquoi HP est le mieux positionné pour
proposer des solutions de déduplication très efficaces basées sur sa technologie de déduplication StoreOnce.
Vue d'ensemble
Plusieurs forces convergent pour favoriser l'adoption de la technologie de déduplication pour la protection des
données : croissance sans précédent des données, inefficacité des applications de protection des données et
utilisation accrue des disques pour le stockage secondaire. Une recherche d'ESG a conclu que la plupart (58 %)
des organisations présentent des taux de croissance annuelle compris entre 11 % et 30 %. Cependant, comme le
montre la figure 1, les organisations utilisant plus de 100 serveurs affichent des taux de croissance allant audelà de ces chiffres : ainsi 30 % de celles utilisant plus de 100 serveurs affichent une croissance annuelle de 40 %
ou plus.1
Figure 1. Taux de croissance des données, en fonction de la quantité de serveurs de production
Source : Enterprise Strategy Group, 2010.
La redondance les données dans un stockage secondaire résulte de l'inefficacité des applications de protection
des données. La plupart des solutions de sauvegarde effectuent plusieurs copies du même fichier malgré qu'une
toute petite quantité de données du fichier ait été modifiée. Plusieurs copies de données sont créées pour les
processus de récupération (au moins une fois par jour, mais parfois plusieurs fois quotidiennement). Des copies
des copies sont envoyées à un emplacement hors site à des fins de récupération après sinistre (DR). Des
douzaines de copies des mêmes données pourraient être stockées pour des périodes prolongées, selon les
stratégies de conservation.
1
*Source : Rapport d'ESG Research, Tendances du marché de la protection des données, avril 2010. Sauf indication contraire, toutes les
statistiques citées proviennent de ce rapport.
© 2010, Enterprise Strategy Group, Inc. Tous droits réservés.
Livre blanc : Logiciel de déplication HP StoreOnce
4
Au cours des dernières années, le disque est devenu de plus en plus utilisé comme emplacement initial ou final
des copies de sauvegarde, améliorant les performances et la fiabilité des opérations de sauvegarde et de
récupération. Aujourd'hui, 80 % des répondants ESG citent l'utilisation de disques dans les processus de
sauvegarde. Comme le montre la figure 2, au cours des deux dernières années, les sauvegardes disque à disque
ont augmenté de 15 %, les sauvegardes disque à disque à bande ont progressé de 22 % tandis que les
sauvegardes disque à bande ont diminué de 65%.
Figure 2. Utilisation des bandes et des disques dans les processus de sauvegarde – 2008 et 2010
Source : Enterprise Strategy Group, 2010.
Alors que la protection des données sur disque peut contribuer à réduire les dépenses opérationnelles et à
améliorer les contrats de niveau de service de sauvegarde et de récupération, elle peut également augmenter
les dépenses en investissements. Les organisations cherchent toutefois à contrôler la situation. L'afflux massif
de données a entraîné une augmentation des coûts des systèmes de stockage ; difficulté accrue à fournir les
niveaux adéquats de protection des données ; et plus grandes contraintes sur l'alimentation, le refroidissement
et l'espace au sol des centres de données. De nombreuses organisations informatiques s'intéressent à des
technologies de réduction de capacités, par exemple la déduplication des données, pour résoudre ces
problèmes. En fait, 38 % des répondants de la recherche ESG utilisent actuellement la déduplication et un autre
40 % envisagent de le faire dans les 12 à 24 mois à venir.
Déduplication des données
La déduplication identifie et élimine la redondance en écrivant uniquement des données uniques en stockage.
Lorsque des fichiers, des blocs ou des séquences d'octets en double sont détectés, un seul pointeur lié à
l'élément de données unique est stocké. Ce pointeur utilise considérablement moins de capacité que le
stockage répété de l'élément complet.
Lorsqu'elle est utilisée dans la sauvegarde et la récupération, la déduplication change les paramètres
économiques de la protection des données basée sur disque. L'élimination de la redondance minimise les
besoins en capacité de stockage, ce qui permet de juguler ou de ralentir l'achat de capacité de disque. Par
exemple, un taux de réduction de 10:1 signifie que 10 fois plus de données sont protégées que l'espace
physique requis pour les stocker et un taux de 20:1 signifie que 20 fois plus de données peuvent être protégées.
En tenant compte des facteurs de croissance de données et de conservation, et en supposant des taux de
déduplication de l'ordre de 20:1, 2 To de capacité de stockage peuvent protéger jusqu'à 40 To de données de
sauvegarde conservées.
© 2010, Enterprise Strategy Group, Inc. Tous droits réservés.
Livre blanc : Logiciel de déplication HP StoreOnce
5
Les économies ne s'arrêtent pas là. La déduplication optimise également la bande passante réseau, permettant
une réplication avec de plus faibles besoins de bande passante. La réduction du volume de données transféré
sur une connexion de réseau étendu rend plus réaliste la consolidation de sauvegarde à partir d'emplacements
distants. De même, le transfert électronique de données hors site à des fins de récupération après sinistre rend
la protection électronique automatisée plus rapide et moins coûteuse.
L'impact de la déduplication ne concerne pas uniquement l'optimisation de la capacité et du réseau. La
déduplication permet des niveaux de services plus élevés et peut favoriser une augmentation du volume de
données pouvant être sauvegardées et récupérées à partir d'un disque, ce qui permet de respecter les fenêtres
de sauvegarde préconisées et d'atteindre des objectifs RTO plus ambitieux. Le raccourcissement de la durée de
sauvegarde permet des copies de sauvegarde plus fréquentes sur disque, ce qui peut à terme améliorer les
objectifs RPO. Il permet également aux organisations d'amplifier les stratégies de conservation des données sur
disque. Aujourd'hui, 68 % des répondants de l'étude disent conserver les données sur disque dans des
stratégies disque à disque à bande pendant un mois ou plus, tandis que le 66 % des répondants en 2008 disaient
conserver les données sur disque seulement une semaine.
Les organisations sont également susceptibles de constater des améliorations opérationnelles ; la déduplication
contribue à gagner du temps en permettant de récupérer plus de données d'un disque par rapport à un
processus sur bande long et fastidieux pour l'opérateur. Elle réduit également l'encombrement des disques —
diminuant d'autant les coûts d'alimentation et de refroidissement tout en minimisant l'encombrement au sol
dans le centre de données.
Vision et solutions de déduplication par HP
HP fournit de la technologie de déduplication des données depuis quelques années par le biais de son
portefeuille de sauvegarde sur disque. Avec son moteur de déduplication StoreOnce,2 HP entame le
déploiement multiphase d'une nouvelle génération de technologies de déduplication pour résoudre les
imperfections des offres de déduplication « solution ponctuelle » aujourd'hui disponibles : coûts élevés,
complexité, charges de gestion élevées, piles de solutions rigides, restrictions d'évolutivité, et stockages de
déduplication hétérogènes cloisonnés.
Les revendications de fragmentation élevée et de solutions ponctuelles par HP ne sont pas infondées. Outre les
solutions de sauvegarde, la déduplication des données est mise en œuvre dans un stockage principal et
d'archive, ainsi que dans des solutions d'optimisation sur réseau étendu. Pour la protection des données, la
déduplication est proposée comme un regroupement d'offres logicielles et matérielles. La recherche d'ESG a
révélé que les clients qui ont adopté la déduplication ont sélectionné un mélange de matériels et de logiciels
(voir la figure 3) ; un tel déploiement fragmenté augmente la complexité de gestion de l'infrastructure, des
cloisonnements de déduplication, et potentiellement des coûts plus élevés.
Figure 3. Mise en œuvre de la déduplication
Comment la technologie de déduplication des données est-elle mise en œuvre dans
votre environnement informatique ?
Mise en œuvre dans
les deux, 0.34
Mise en œuvre dans
le logiciel de
sauvegarde, 0.4
Mise en œuvre dans
le matériel (appliance
ou système de
stockage sur disque),
0.26
Source : Enterprise Strategy Group, 2010.
2
Annoncé en juin 2010.
© 2010, Enterprise Strategy Group, Inc. Tous droits réservés.
Livre blanc : Logiciel de déplication HP StoreOnce
6
Dans le logiciel, les données peuvent être dédupliquées au niveau du système de production source par une
technologie d'agent client. Dans ce cas, le logiciel client s'exécutant sur un serveur d'application identifie et
transfère des données uniques au serveur de support de sauvegarde et à l'appareil de stockage cible, pour une
plus grande efficacité réseau. D'autres solutions logicielles dédupliquent le flux de sauvegarde au niveau du
serveur de sauvegarde, supprimant la surcharge potentielle de performances des serveurs d'applications en
production. Le domaine de déduplication est limité aux données protégées par l'application de sauvegarde ; de
multiples applications de sauvegarde dans le même environnement créent des cloisonnements de
déduplication.
La déduplication côté cible tire généralement parti d'appareils de stockage dédiés et puissants pour assurer le
traitement de toute la charge de sauvegarde (non-dédupliquée) en pré ou post-ingestion. L'interface de ces
systèmes varie (iSCSI ou FC VTL, NAS, ou Symantec OpenStorage). Souvent, l'architecture sous-jacente n'est pas
basée sur des composants standard. Un système cible de déduplication classique est implémenté et
étroitement intégré comme partie intégrante du système de fichiers propriétaire du fournisseur et d'une pile
logicielle RAID, une implémentation rigide qui permet difficilement de tirer avantage de nouvelles plateformes
et possibilités matérielles, ou de procéder à un déploiement dans des systèmes d'exploitation différents.
Le logiciel de déduplication StoreOnce de HP a été conçu comme un composant modulaire dans l'architecture
des produits. Il s'exécute comme une application/service dans un système d'exploitation Linux standard, réside
dans un système de fichiers standard et utilise une pile RAID standard pour le stockage de données. Cette
approche fournit plus de flexibilité architecturale pour étendre la technologie à différents déploiements de
produits. Elle permet au logiciel d'être facilement intégré avec d'autres composants dans le portefeuille HP,
notamment le système de fichiers scale-out HP et le logiciel de sauvegarde HP Data Protector. Cela signifie
également que HP peut utiliser ces technologies comme composant dans une pile de logiciels de stockage
commune pour l'infrastructure convergente HP.
HP StoreOnce
Le logiciel de déduplication HP StoreOnce simplifie le déploiement d'une technologie de déduplication sur une
infrastructure informatique. Non concédé sous licence comme logiciel autonome, il est un moteur portable
pouvant être facilement incorporé dans plusieurs composants d'infrastructure, éliminant la complexité
observée dans la génération précédente de déduplication. HP StoreOnce utilise l'innovation et les fonctions
conçues par HP Labs pour optimiser les performances de sauvegarde et de récupération tout en minimisant les
frais de gestion et de matériel.
Le logiciel de déduplication HP StoreOnce identifie les données de réplication en entrée avec son approche de
déduplication basée sur un index léger. Cette méthode s'exécute en deux phases :
1. Les algorithmes HP StoreOnce échantillonnent de larges séquences de données (environ 10 Mo) pour
identifier les doublons éventuels et un routage rapide livre chaque séquence au meilleur nœud pour
déduplication.
2. StoreOnce utilise un algorithme de hachage SHA-1 sur des blocs de longueur variable d'environ 4 Ko. En
utilisant un sous-ensemble de valeurs clés stockées en mémoire, StoreOnce détermine un petit nombre
de séquences déjà stockées sur disque similaires à une séquence d'entrée donnée. Ensuite, chaque
séquence d'entrée est dédupliquée uniquement en fonction de ces quelques séquences. Cela minimise
l'E/S disque et utilise moins de disque et peu de mémoire, pour plus d'efficacité et pour une ingestion et
une restauration de données plus rapides.
Comme nous l'avons déjà mentionné, la déduplication implique le remplacement des données en double par
des pointeurs vers des données existantes (uniques). Si les données uniques sont réparties dans un système de
stockage (c'est-à-dire, « fragmentées »), la restauration pourrait être plus longue car la reconstitution
imposerait de nombreuses et lentes recherches aléatoires. StoreOnce évite ce problème en ne remplaçant pas
de petites quantités de données en double par des pointeurs vers des emplacements lointains ne contenant
aucune donnée associées. Cette approche améliore considérablement la vitesse de restauration avec un très
faible volume de données supplémentaires stockées.
© 2010, Enterprise Strategy Group, Inc. Tous droits réservés.
Livre blanc : Logiciel de déplication HP StoreOnce
7
L'approche de HP a des implications d'une portée considérable. L'architecture et la conception du logiciel de
déduplication le rendent portable, évolutif et capable d'assurer une déduplication globale (dans et entre
plusieurs noeuds indépendants avec un espace de noms unique). La déduplication HP StoreOnce peut ainsi être
déployée dans de nombreuses itérations ; par exemple, en tant qu'instance de machine virtuelle, intégrée avec
le logiciel de sauvegarde et de récupération HP Data Protector, et avec le stockage NAS évolutif HP X9000. La
standardisation de l'architecture signifie également que ces déploiements peuvent se prolonger dans le réseau
étendu et dans des environnements ROBO sans imposer de multiples réhydratations et déduplications des
données.
Systèmes de sauvegarde HP D2D
Initialement, le logiciel de déduplication HP StoreOnce 64 bits est mis en œuvre dans la famille de solutions de
stockage cible de sauvegarde HP D2D, construit à partir de composants standard, et adapté à des bureaux
distants et des succursales (ROBO) jusqu'au centre de données de taille moyenne avec une capacité utile
maximale de 36 To :

D2D2500 (1U) : Petits environnements et ROBO d'une capacité utile maximale de 3 To.

D2D4106 (2U) : ROBO et centres de données de taille petite à moyenne d'une capacité utile maximale
de 9 To.

D2D4112 (2U) : ROBO et centres de données de taille petite à moyenne d'une capacité utile maximale
de 18 To.

D2D4312 (4U ): ROBO et centres de données de taille moyenne d'une capacité utile maximale de 36 To.3
Les systèmes de sauvegarde HP D2D offrent des interfaces NAS, VTL et Symantec OpenStorage (OST) au logiciel
de sauvegarde. Pour NAS, un ou plusieurs partages de fichiers peuvent être créés sur chaque système et utilisés
par l'application de sauvegarde comme cibles CIFS ou NFS pour la sauvegarde. L'interface iSCSI ou FC VTL émule
des chargeurs automatiques et des bibliothèques de bandes LTO que l'application de sauvegarde voit comme
un ou plusieurs lecteurs de bandes cibles. Pour les utilisateurs de Symantec NetBackup et de Backup Exec, une
interface OST peut être utilisée pour l'appliance D2D configurée comme une cible CIFS. Au lieu de diriger les
sauvegardes directement dans des partages CIFS sur le système D2D, le serveur de médias est configuré pour
utiliser le complément OST (qui réside sur le serveur de médias NetBackup ou Backup Exec). L'interface active le
suivi du catalogue de sauvegarde des données dupliquées entre les unités D2D.
Pour les copies de disques hors site, la réplication unité à unité HP D2D au niveau cartouche (VTL) ou au niveau
partage (NAS) dans une configuration 1:1 ou plusieurs:1 (jusqu'à 50:1) fournit un transfert efficace sur le réseau
entre unités. La limitation de bande passante restreint la quantité de bande passante utilisée pendant la
réplication pour une meilleure efficacité du réseau. Les blocs de données uniques (en double ou sans
correspondance) sont compressés avant d'être stockés sur disque. Le logiciel HP D2D Replication Manager est
également disponible pour simplifier la gestion d'un grand nombre d'unités répliquées sur un site central.
L'unité D2D permet une plus longue conservation sur disque et une réplication unité à unité pour les copies DR,
afin que les données soient moins susceptibles de devoir être copiées sur bande physique. Cependant,
lorsqu'un transfert périodique sur bande physique s'impose pour des raisons de conformité ou pour une
conservation à long terme, les meilleures pratiques suggèrent les opérations suivantes :
3

Mode VTL : Utilisez l'application de sauvegarde pour sauvegarder les données sources sur bande
physique en tant qu'activité distincte ou utilisez l'application de sauvegarde pour copier des cartouches
de bande virtuelle (les données sont réhydratées) sur cartouches de bande physique dans une unité
physique sur le réseau SAN ou directement raccordées au serveur de médias.

Mode NAS : Utilisez l'application de sauvegarde pour sauvegarder les données sources sur bande
physique en tant qu'activité séparée.
Avec un taux de réduction de 20:1 et une période de conservation de plus de 12 semaines, la capacité logique de l'unité est de 720 To.
© 2010, Enterprise Strategy Group, Inc. Tous droits réservés.
Livre blanc : Logiciel de déplication HP StoreOnce
8
Critère d'achat de déduplication
Les répondants de la recherche ESG ont classé les critères d'achat de déduplication (voir la figure 4). L'examen
du logiciel de déduplication HP StoreOnce en regard de ces facteurs d'évaluation démontre plusieurs avantages
de l'approche de HP.
Coût. Bien que la déduplication puisse diminuer le coût total de possession dans la sauvegarde, le coût
représente toujours la principale préoccupation lors de l'évaluation de solutions. La pondération du
coût doit être équilibrée avec la capacité qu'offre la solution d'atténuer les risques et d'améliorer
l'efficacité du personnel opérationnel assurant la gestion des opérations de sauvegarde et de
récupération. La déduplication offre d'énormes réductions en termes de consommation, ce qui pourrait
réduire l'impact et les coûts de la croissance des données (matériel, bande passante et personnel
opérationnel). HP revendique le meilleur rapport prix/performances avec son architecture ;
L'infrastructure convergente HP permet des économies en volume et lorsque comparé aux solutions de
déduplication les plus utilisées, HP D2D offre de meilleures performances avec moins de disques durs.
Facilité de mise en œuvre et d'utilisation. La recherche ESG a démontré que la capacité d'intégration
avec les processus de sauvegarde existants et la facilité globale d'utilisation constitue pour les
utilisateurs des facteurs plus importants que les aspects techniques plus spécifiques tels que le taux de
déduplication ou la granularité de la déduplication. La déduplication HP StoreOnce est portable,
modulaire et peut être incorporée dans des solutions matérielles et logicielles. Cette livraison de la
déduplication plus universelle et standardisée (plusieurs applications et types de données, avec une
grande simplicité de gestion) apporte beaucoup de flexibilité et la conception indépendante des
applications de HP élimine les besoins de personnalisation et atténue la complexité. En outre, la
possibilité d'incorporer la déduplication StoreOnce en tant qu'appliance virtuelle rationalise le
déploiement et se prête mieux à des charges de travail éclatées.
Performances. L'emplacement et le moment d'utilisation de la déduplication peut avoir des incidences
sur les performances. La déduplication peut intervenir sur le client/source ou le serveur de médias dans
les approches logicielles, et sur l'unité cible pour des approches matérielles. Elle peut se produire en
entrée (avant ou pendant l'ingestion) ou en post-traitement (après l'écriture partielle ou totale des
données sur disque). Les performances en entrée améliorées de HP proviennent de la technologie
d'index léger très efficace qui assortit les données à de hautes vitesses avec de faibles besoins de
mémoire et de l'optimisation qui réduit le nombre d'accès disque requis pour traiter les données.
© 2010, Enterprise Strategy Group, Inc. Tous droits réservés.
Livre blanc : Logiciel de déplication HP StoreOnce
9
Figure 4. Critère d'achat de la déduplication
Which of the following considerations would you say were most important in your
organization’s evaluation and selection of data deduplication technology?
(Percent of respondents, N=140, five responses accepted)
0.45
Cost of solution
0.37
Ease of implementation/use
0.33
Impact on backup/recovery performance
0.28
Integration with existing backup processes
0.25
Scalability of solution
0.24
Vendor service and support
0.23
Ability to replicate deduplicated data off-site
0.18
Existing relationship with vendor
Deduplication ratio
0.17
Ability to deduplicate across systems/data sets as opposed to
just within a system/data set
0.17
Experience of vendor in backup implementation
0.16
Where deduplication occurs
0.16
0.11
Granularity of deduplication
0.09
When deduplication occurs
0%
10%
20%
30%
40%
50%
Source : Enterprise Strategy Group, 2010.
Intégration avec une solution de sauvegarde existante. Les solutions de déduplication basées sur du
matériel sont largement répandues car elles sont faciles à déployer et souvent optimisées pour
améliorer les performances. Les approches logicielles sont répandues car elles sont plus étroitement
intégrées aux processus de sauvegarde (reconnaissance du contenu) et offrent de la flexibilité dans la
sélection du stockage sur disque. Les solutions qui favorisent une intégration plus étroite du matériel et
du logiciel peuvent tirer parti des deux mondes.
Évolutivité. La possibilité d'évolutivité des performances et de la capacité avec simplicité et sans
interruption constitue un facteur clé. La technologie HP StoreOnce s'appuie sur des composants
standard, garantissant un maximum de flexibilité dans la livraison et l'intégration des produits. Elle
permet le déploiement du logiciel sous forme de machine virtuelle, intégrée directement aux logiciels
de sauvegarde, ou jointe à d'autres actifs logiciels de stockage. Elle peut également être conçue pour
prendre en charge un déploiement distribué dans le futur comme partie intégrante d'un système de
stockage multinœud évolutif.
Capacité de transférer des copies hors site. Les approches les plus répandues consistent à répliquer les
données dédupliquées entre des unités locales ou distantes sur IP, et de créer des copies de données
« rétablies » sur des supports de bande physique. Bien que la recommandation consiste à créer des
bandes sous la connaissance et le contrôle du logiciel de sauvegarde, HP propose les deux méthodes en
plus de prendre en charge Symantec OST pour une duplication intelligente. HP Data Protector
reconnaîtra les copies répliquées par les unités HP D2D.
© 2010, Enterprise Strategy Group, Inc. Tous droits réservés.
Livre blanc : Logiciel de déplication HP StoreOnce
10
Domaine de déduplication. Avec une déduplication locale, les données de sauvegarde sont uniquement
dédupliquées par rapport à d'autres données traitées dans le même domaine (ce qui donne une
approche de stockage cloisonnée pour la sauvegarde). La déduplication globale permet de dédupliquer
les données de sauvegarde par rapport à toutes les autres données de sauvegarde (à l'intérieur et entre
les systèmes recevant les données). L'un des avantages de la déduplication HP StoreOnce est qu'elle
s'appuie sur une architecture ouverte et qu'en raison de sa portabilité HP pourra à l'avenir l'associer aux
possibilités éclatées des systèmes de fichiers X9000 HP pour créer des appliances de sauvegarde
évolutives pour le centre de données. HP pourra tirer parti de l'espace de noms unique du X9000 pour
dédupliquer entre systèmes physiques.
Infrastructure convergente HP et HP StoreOnce
HP propose à ses clients l'infrastructure convergente HP, une architecture globale et un modèle de livraison où
la livraison dynamique des ressources et des services est disponible. Ce concept tire parti du regroupement des
ressources informatiques, d'un provisionnement transparent et dynamique, et d'une facilité d'intégration pour
assurer une livraison sur demande de services informatiques. Les avantages sont notamment une plus grande
automatisation, une utilisation dynamique des ressources, une facilité de planification, une efficacité
opérationnelle et une grande agilité dans l'entreprise. La livraison de l'infrastructure convergente HP inclut des
principes de conception s'appuyant sur le regroupement de ressources virtuelles et de composants standard
modulaires, concepts correspondant à l'approche décrite dans ce document relatif à HP StoreOnce.
La déduplication de HP StoreOnce utilise l'infrastructure convergente HP basée sur un portefeuille
technologique étendu de serveurs, de réseau, de stockage et de logiciels. Au lieu de faire appel à des piles
cloisonnées et indépendantes de serveurs, de stockage et de ressources réseau, celles-ci sont intégrées.
L'infrastructure convergente HP permet aux organisations informatiques de se concentrer sur la valeur métier
de leurs activités et non sur les opérations de gestion d'infrastructure.
© 2010, Enterprise Strategy Group, Inc. Tous droits réservés.
Livre blanc : Logiciel de déplication HP StoreOnce
11
La grande vérité
La croissance des données se poursuit. Les premières mises en œuvre de déduplication de données se sont
avérées précieuses pour contrer les effets négatifs de la croissance des données. Cependant, la précipitation
des fournisseurs de proposer des solutions de déduplication et la hâte des utilisateurs de les adopter ont
conduit à une certaine inefficacité : les limitations de l'éclatement scale-out, la réduction et le rétablissement
pour le transfert des données, et les cloisonnements de déduplication (notamment entre le stockage principal
et secondaire, les solutions matérielles et logicielles). La nature fragmentée de la déduplication de première
génération n'a que peu contribué à éliminer les coûts de gestion lui étant associés.
La vision de HP est que les données doivent être créées, partagées et protégées sans imposer l'alternance de la
déduplication et de l'annulation de la déduplication tout au long du processus. Sur la base de ces principes, HP a
développé la déduplication StoreOnce. La conception indépendante des applications de la technologie de
déduplication de StoreOnce élimine les besoins de personnalisation et atténue la complexité du système. Elle
est portable pour des charges de travail de sauvegarde dans des machines virtuelles, des appliances simples,
des logiciels de protection des données, et des solutions de stockage évolutives, et est extensible aux charges
de travail éclatées principales. Conçue par HP Labs et s'appuyant sur l'infrastructure convergente HP,
StoreOnce offre de hautes performances, une grande efficacité et exploite les économies d'échelle de volume,
la cohérence entre les flux de travail de données et la gestion dans un espace de noms élargi.
Bien que les problèmes liés à la croissance des données puissent imposer la mise en œuvre de solutions de
déduplication présentant certaines imperfections, les organisations informatiques devraient évaluer les
solutions en gardant à l'esprit l'impact à long terme pour la prochaine phase de croissance. Le logiciel de
déduplication HP StoreOnce répond dès aujourd'hui à de nombreux critères d'achat clés et devrait redéfinir les
conditions d'utilisation à court terme. Alors que les organisations mettent en œuvre la déduplication pour
résoudre les problèmes de croissance des données, la stratégie et la gamme de solutions de déduplication de
HP méritent un examen attentif.
© 2010, Enterprise Strategy Group, Inc. Tous droits réservés.
Livre blanc : Logiciel de déplication HP StoreOnce
20 Asylum Street | Milford, MA 01757 | Tél :508.482.0188 Fax : 508.482.0128 | www.enterprisestrategygroup.com
4AA2-1223FRE
© 2010, Enterprise Strategy Group, Inc. Tous droits réservés.
12

Documents pareils