Les méthodes de sauvegarde en environnement virtuel

Transcription

Les méthodes de sauvegarde en environnement virtuel
Les méthodes de sauvegarde en environnement virtuel Il existe plusieurs méthodes pour faire des sauvegardes dans un environnement virtuel : Méthodes traditionnelles
1) Sauvegarde avec agent dans le Guest OS. 2) Sauvegarde avec agent dans le Service console. Méthodes dédiées aux environnements virtuels VMware
3) Utilisation du Framework appelé VBC (VMware Consolidated Backup) couplé à une solution de sauvegarde. 4) Utilisation de VMware vStorage API For DataProtection. 5) Utilisation de logiciels dédiés. Voyons en détail le fonctionnement de ces cinq méthodes avec leurs avantages et leurs inconvénients. 1. Agent de sauvegarde dans le Guest OS Fonctionnement : l’agent de sauvegarde est installé dans chaque Guest OS de chaque VM. Le fonctionnement reste identique à un environnement physique traditionnel. Les données sauvegardées sont envoyées par le réseau. Avantages
Dans le cas où l’entreprise possède déjà une solution de sauvegarde en place, cela ne modifie en rien les méthodes utilisées en production. Il est possible d’utiliser des agents applicatifs pour avoir des sauvegardes permettant de garantir l’intégrité d’une base de données par exemple. Il sera possible d’avoir de la granularité et de faire de la restauration au niveau fichier. Inconvénients
Cette méthode consomme des ressources physiques : du temps CPU, des E/S disque. Les performances nécessaires pour la sauvegarde ne vont pas permettre d’atteindre un taux de consolidation important. Cette méthode n’est pas adaptée aux environnements virtuels sauf si le taux de consolidation est très faible (2 ou 3 VM n’utilisant qu’un faible pourcentage des ressources du host CPU­disque­réseau) ou si l’applicatif nécessite un agent : cas précédemment cité d’une messagerie pour pouvoir restaurer au niveau du mail. 2. Agent de sauvegarde dans le service console © ENI Editions - All rigths reserved - Guillaume DUBOIS
- 1-
Fonctionnement : l’agent de sauvegarde est installé au niveau du service console. Le fonctionnement est exactement le même que précédemment à savoir que l’agent de sauvegarde communique avec le serveur et lui envoie les fichiers en les compressant par le réseau. La différence réside sur la nature des données sauvegardées : ce sont les fichiers encapsulés vmdk. Avantage
●
●
●
Cela permet de faire de la restauration au niveau de l’image. Il est possible d’utiliser des outils traditionnels du marché (il faut cependant un agent qui tourne sous VMware). Le niveau de service est amélioré par rapport à un environnement traditionnel car il est possible de restaurer très rapidement l’environnement de production en cas de crash système. Inconvénients
●
Il faut installer un agent dans le service console, cela n’est pas conseillé car cela peut alourdir la charge de travail et pénaliser les performances du serveur. ●
Il faut scripter la sauvegarde afin de garantir un état d’application­consistent (voir paragraphe ci­dessous). ●
Le snapshot peut être employé mais ne garantit qu’un état de crash­consistent (voir tableau ci­dessous). ●
Pas de restauration au niveau du fichier. 3. Méthodes dédiées aux environnements virtuels VMware a. Les différentes solutions Afin de résoudre les différentes problématiques liées à la sauvegarde traditionnelle et les adapter à un environnement virtuel, VMware et les partenaires proposent différentes solutions s’intégrant parfaitement à cet environnement. Les solutions fonctionnent directement par le réseau ou en accédant directement au SAN. Voici les différentes solutions proposées : - 2-
© ENI Editions - All rigths reserved - Guillaume DUBOIS
VCB : c’est un Framework qui s’installe sur un serveur de sauvegarde physique rattaché au SAN (appelé proxy) et qui favorise la sauvegarde en proposant des commandes de base (pour le snapshot, pour le mount…). De nombreux partenaires ont développé des solutions qui s’appuient sur VCB, mais les clients peuvent également scripter leur backup/restore. VCB n’évoluera plus en terme de fonctionnalités proposées et deviendra un jour complètement obsolète. vStorage API : nouvelle fonctionnalité de vSphere 4. Ce n’est pas un Framework mais des API de développement directement intégrées dans vSphere 4. vStorage API fonctionne par le réseau ou directement connecté au SAN Logiciels dédiés qui permettent de sauvegarder à chaud des VM directement par le réseau et certains logiciels se basent sur les vStorage API. Ces solutions proposent une véritable solution de sauvegarde/restauration avec une interface graphique, planification, durée de rétention… Citons les logiciels les plus connus à ce jour : VMware Data Recovery, Veeam Backup, vRanger Pro, Esxpress. b. Processus utilisé lors de la sauvegarde Les différents états d’une VM après un snapshot
Pour faire des sauvegardes, VMware utilise la technologie des snapshots. Pour bien comprendre le processus de sauvegarde utilisé par VMware, il est nécessaire de savoir quelles sont les conséquences d’un snapshot pour une VM. Il faut savoir qu’un snapshot est crash­consistent c’est­à­dire que cela équivaut à retirer sauvagement le câble secteur d’un serveur en production puis redémarrer le serveur (appelé hard reboot). Pourquoi cela peut­il poser un problème ? En fonctionnement, les OS et les applications stockent leurs informations dans la mémoire, dans les différents caches et disques du serveur. Il est donc important avant d’arrêter un OS ou une application de récupérer toutes ces données. Les systèmes d’exploitation Windows 2003 Serveur, 2008 ou Redhat supporteront sans problème ce genre d’incident et il sera possible de redémarrer le serveur sans avoir à tout réinstaller. Pour les applications de type base de données, cela peut poser des problèmes. Il existe différents niveaux de consistance :
Crash-consistent (équivalent d’un hard reboot) :
En théorie :
Au niveau du Guest OS : pas d’impact.
Au niveau des fichiers : il peut y avoir une altération des
fichiers qui n’auraient pas été écrits sur le disque (en mémoire
cache au moment du snapshot).
Au niveau applicatif : possible altération de l’intégrité de
l’application (en général une base de données).
© ENI Editions - All rigths reserved - Guillaume DUBOIS
- 3-
File system-consistent :
En théorie :
Au niveau de l’OS : pas d’impact.
Au niveau des fichiers : pas d’impact. Toutes les données dans les
différents caches sont regroupées et sauvegardées sur le disque.
Pas d’altération au niveau des fichiers.
Au niveau applicatif : possible altération de l’intégrité de
l’application (en général une base de données).
Application-consistent :
En théorie :
Au niveau de l’OS : pas d’impact.
Au niveau des fichiers : pas d’impact. Toutes les données dans
les différents caches sont regroupées et sauvegardées sur le
disque. Pas d’altération au niveau des fichiers.
Au niveau applicatif : pas d’impact. Toutes les données sont
sauvegardées et l’application est proprement suspendue
garantissant son intégrité.
En environnement de production, il est préférable de se prémunir d’un crash­consistent. Les snapshots étant crash­
consistent, il est nécessaire d’utiliser des techniques pour garantir un état de File system­consistent ou Application­consistent. Quiescing
C’est le mécanisme de Quiescing qui permet de geler (freeze) la VM : toutes les E/S sont retenues et toutes les données existantes dans les différents caches sont écrites sur le disque. Le Quiescing est réalisé soit avec le Sync driver installé avec les VMware Tools soit avec Microsoft Shadow Copy appelé VSS (Volume Snapshot Service) qui est un composant de sauvegarde intégré dans certains OS Microsoft. Pour en savoir plus, allez sur la technet de Microsoft : How Volume Shadow Copy Service Work. ●
●
Le SYNC driver garantit un File system­consistent. Les données dans les différents caches sont écrites sur le disque. VSS permet de mettre l’application dans un état d’application­consistent garantissant une intégrité de celle­
ci lors de la restauration des données. Il faut pour bénéficier de cette fonctionnalité que l’application que vous sauvegardez supporte VSS ; par exemple MS SQL Server ou MS Exchange. VSS est supporté pour des VM avec les Guest OS suivants : Windows Server 2003 (32 et 64 bits), Windows Vista (32 et 64 bits), Windows Server 2008 (32 et 64 bits). Pour résumer : ●
Le snapshot engendre un état de crash­consistent. ●
Le Sync driver engendre un état de file system­consistent. ●
VSS engendre un état d’Application­consistent ou File system­consistent en fonction de l’application et du Guest OS. Changed Block Tracking
Auparavant, lors d’une sauvegarde incrémentale ou différentielle, ESX scannait l’intégralité du snapshot pour identifier les blocs modifiés à sauvegarder. Sous vSphere 4, le serveur ESX est équipé d’une journalisation des blocs permettant d’indiquer l’emplacement des blocs modifiés depuis le dernier passage. Ainsi, il n’est plus nécessaire de scanner l’intégralité du snapshot pour les identifier. Cette technique permet de traiter les opérations de sauvegarde incrémentale beaucoup plus rapidement (jusqu’à 10x plus rapide) et réduit par la même les fenêtres de sauvegarde. c. Le Framework VCB VCB (VMware Consolidated Backup) n’est pas un logiciel de sauvegarde mais un Framework, c’est­à­dire un processus qui va préparer les VM afin de les sauvegarder dans de bonnes conditions. VCB travaille en relation avec - 4-
© ENI Editions - All rigths reserved - Guillaume DUBOIS
un logiciel de sauvegarde tiers du marché. Une architecture avec stockage centralisée est nécessaire : Architecture : le serveur de sauvegarde (appelé proxy qui doit être un serveur physique) accède directement au stockage où seront déposées les données à sauvegarder. Cela permet de décharger le trafic réseau ainsi que la charge du serveur hôte ESX. Les différentes étapes du processus utilisé par VCB sont les suivantes : 1) Le logiciel de sauvegarde envoie la requête à VCB. 2) VCB force la machine virtuelle à passer en mode Quiescing grâce aux techniques expliquées précédemment. 3) Le snapshot est déclenché. Durant ce snapshot tous les changements effectués au niveau de la VM à savoir le disque, la mémoire, les E/S sont écrits dans un fichier appelé REDO. 4) Une fois le snapshot terminé, la VM est retirée du mode Quiescing, les fichiers REDO sont remis dans la VM qui reprend son activité normale. 5) Les snapshots créés sont disponibles pour l’agent de sauvegarde qui les récupère au travers du SAN en les compressant. Les données récupérées par le serveur de sauvegarde sont ensuite envoyées sur un média de type bande ou disque. 6) Une fois la sauvegarde terminée, VCB démonte les snapshots utilisés lors du processus. Avantages
●
●
VCB élimine le trafic réseau lié à la sauvegarde car le serveur proxy accède directement au LUN du SAN et décharge le serveur hôte du travail de sauvegarde. Cela permet d’éliminer les fenêtres de sauvegarde car les snapshots peuvent en théorie être utilisés à tout moment (cependant, il est préférable de le faire lorsque la VM n’est pas très active). ●
Il n’y a pas d’arrêt de service des applications. ●
Il n’y a pas d’agent à installer au niveau du Service console ou du Guest OS. ●
La sauvegarde peut se faire lorsque les VM sont en fonctionnement pour garantir une continuité de service ou également machine éteinte. © ENI Editions - All rigths reserved - Guillaume DUBOIS
- 5-
Inconvénients
●
Le coût. ●
Les phases de tests peuvent être longues. ●
L’implémentation avec un outil de sauvegarde peut être complexe. d. vStorage API For Data Protection Cette fonctionnalité sert de levier pour vSphere 4 en proposant des API de développement pour les partenaires qui peuvent développer leurs solutions en utilisant les vStorage API. vStorage API For Data Protection est disponible avec toutes les versions de VMware vSphere 4. Toutes les fonctions proposées par VCB y ont été incorporées et vStorage API en propose de nouvelles : ●
●
●
●
●
Intégration native avec les outils de sauvegarde du marché tels que Veeam Backup ou vRanger Pro. Centralisation de la sauvegarde. vStorage APIs For Data Protection peut être centralisé sur un serveur proxy déchargeant ainsi le serveur ESX du travail de sauvegarde. Possibilité de faire de la sauvegarde et restauration de façon incrémentale, différentielle et totale au travers du réseau ou directement sur le SAN. Les sauvegardes réalisées avec les vStorage API garantissent une consistance au niveau applicatif (application­consistent) en environnement Windows. Tous les types de stockage sont supportés à savoir FibreChannel, iSCSI, NAS ou stockage local. e. Logiciels dédiés VDR (VMware Data Recovery)
VDR est un nouveau produit de VMware vSphere 4 dédié pour la sauvegarde et la restauration. Contrairement à VCB qui est un Framework c’est­à­dire un processus qui va permettre à des outils tiers de sauvegarder les VM, VDR franchit une étape de plus dans le processus de sauvegarde car il s’occupe également de la sauvegarde des VM. VDR se base sur vStorage API For Data Protection pour préparer la VM et le moteur VDR s’occupe de faire la sauvegarde. VDR est composé d’une Appliance de sauvegarde et d’un Plug­in client pour gérer les sauvegardes et les restaurations. Cette appliance est fournie au format OVF (Open Virtualization Format). VDR ne nécessite pas l’ajout d’agent de sauvegarde ni dans le Guest OS ni dans le Service console et fonctionne avec une architecture de stockage centralisée ou locale. Ce qu’il faut savoir sur VMware Data Recovery
●
Chaque Appliance peut sauvegarder jusqu’à 100 VM. ●
VDR ne supporte que l’utilisation de disque dur comme média. Aucun autre média n’est supporté à ce jour. ●
●
- 6-
VDR supervise les VM qui sont migrées avec VMotion pour garantir que les sauvegardes continueront à tourner malgré le changement d’emplacement des VM. VDR fonctionne sous ESX4 et ESXi4 ou supérieur. Il n’y a pas de compatibilité avec les anciennes versions de VMware ESX (version 3.5 et inférieur). ●
VDR peut faire tourner un maximum de 8 jobs de sauvegarde ou 8 jobs de restauration simultanément. ●
Il est possible de ne sauvegarder qu’un disque spécifique d’une VM. © ENI Editions - All rigths reserved - Guillaume DUBOIS
●
Pour démarrer une sauvegarde, l’utilisation du CPU doit être inférieure à 90 %. ●
VDR utilise le port 22024 pour communiquer avec l’Appliance de sauvegarde. ●
VDR fait une première sauvegarde complète puis ensuite ce sont des sauvegardes incrémentales. Les logiciels du marché
VDR est la solution de VMware qui aujourd’hui propose des fonctionnalités basiques : il n’est pas possible avec VDR de sauvegarder sur un site déporté, de sauvegarder sur des médias autres qu’un disque dur ou de faire la restauration de fichier sous Linux. Pour exploiter des fonctionnalités plus évoluées, des éditeurs se sont lancés sur ce créneau. Les logiciels les plus connus sont Veeam Backup de Veeam Software, Vranger Pro de Vizioncore (racheté par Quest Software) et Esxpress de Phd Virtual. L’intérêt de ces solutions est qu’elles s’intègrent très facilement dans l’environnement virtuel et sont dédiées à ces environnements. Ces logiciels sont non intrusifs, ils ne nécessitent pas d’ajout d’agents (agent less) et ne consomment donc pas de ressources du serveur hôte. Les solutions Veeam et Vranger Pro s’installent sur un serveur Windows alors qu’Esxpress est basé comme VDR sur une Appliance de sauvegarde. Avantages
●
Pas d’agents à installer dans le Service console ou le Guest OS. ●
Simple d’utilisation et d’intégration dans l’environnement virtuel. ●
Sauvegardes à chaud de VM utilisant les mêmes processus que Data Recovery à savoir le quiescing + le snapshot. ●
Possibilité de faire de la restauration au niveau fichier. ●
Déduplication possible réduisant considérablement l’espace disque. ●
Les taux de compression sont importants. Inconvénient
●
Gestion difficile s’il y a plusieurs centaines de VM. Comparatif
Voici le tableau comparant les fonctionnalités de Veeam, Vranger Pro, Esxpress et Data Recovery : Veeam Vranger Pro Esxpress Data Recovery Sauvegarde complète et incrémentale OUI OUI OUI OUI Compression OUI OUI OUI OUI VSS OUI OUI OUI OUI NON Utilise les nouvelles API vStorage qui reprennent les fonctions de VCB VCB integration OUI OUI via plug­in © ENI Editions - All rigths reserved - Guillaume DUBOIS
- 7-
File level restore OUI quasi instantanée OUI via plug­in pas instantanée OUI pas instantanée OUI support expérimental Block level Backup OUI NON OUI OUI Encryptions NON OUI OUI (256 Bits) NON P2V Disaster Recovery NON OUI NON NON Déduplication OUI Nécessite une solution externe exagrid OUI OUI Récupération au niveau fichier sous Linux OUI NON OUI OUI (support expérimental) VSS pour Windows 2008 OUI NON OUI OUI Exclusion de disk OUI OUI OUI OUI Scheduling OUI OUI OUI OUI Réplication OUI NON disponible avec Vranger Replicator OUI NON Copie de fichier SCP OUI OUI NON NON Envoi des rapports par e­mail OUI par VM OUI par VM OUI par hôte NON Sauvegarde sur deux destinations différentes NON OUI OUI NON * Ce tableau est donné à titre indicatif et ces logiciels évoluant rapidement, il faut se renseigner auprès des éditeurs pour connaître les améliorations avec les nouvelles versions. Veeam Backup ●
Possibilité de faire nativement de la déduplication. ●
Interface unique pour gérer les copies, les sauvegardes et la réplication. Ce qui en fait un produit 3 en 1. ●
Veeam permet de faire de la récupération de fichier sous Linux. ●
Veeam ne propose pas d’encryption. vRangerPro ●
Propose de l’encryption nativement. ●
Propose P2V DR permettant de sauvegarder un environnement physique en virtuel. ●
Vranger pro ne propose pas de déduplication il faut passer par une solution externe Exagrid. Esxpress propose la déduplication, l’encryption, la réplication mais ne supporte pas VCB. Data Recovery - 8-
●
VDR ne supporte pas l’utilisation de deux destinations de sauvegarde différentes. ●
VDR ne fonctionne qu’avec vCenter Server (pas compatible avec vCenter Server Linked Mode). © ENI Editions - All rigths reserved - Guillaume DUBOIS
●
●
La restauration se fait au niveau de la VM complète. Il est possible de faire de la restauration au niveau fichier appelé File Level Restore pour des VM sous Windows (XP, Vista, 2003 et 2008) en rajoutant un utilitaire dans la VM appelé File Restore Utility (pas encore complètement supporté par VMware). VMware Data Recovery utilise la déduplication à chaque opération de sauvegarde afin de réduire l’espace disque nécessaire. Il n’est pas possible de désactiver cette fonctionnalité. Elle est réalisée au niveau blocs. 4. Bonnes pratiques ●
●
●
●
●
●
S’assurer de pouvoir récupérer les données le plus rapidement possible. Vous devez pouvoir accéder directement à vos données sauvegardées, sans perte de temps en raison du transport (pas de camion, ni d’entrepôt). Vos restaurations doivent seulement durer quelques minutes. Investir dans une architecture de protection des données qui s’adapte à la croissance de votre activité. Faire des tests de restauration de données assez fréquemment pour éprouver vos méthodes de travail et vérifier l’intégrité des données sauvegardées. Utiliser des solutions simples et surtout adaptées à un environnement virtuel, sans quoi vous ne bénéficierez pas pleinement des avantages qu’offre la virtualisation. La solution de sauvegarde doit s’adapter à votre environnement et non le contraire. Pour accroître les taux de déduplication, mettez des VM de même nature (exemple, Windows 2008 Server) sur le même emplacement de destination. 5. Conclusion Les solutions de type Data Recovery, Veeam, Vranger Pro ou Esxpress s’intègrent facilement aux environnements virtuels. Elles sont très simples à installer et leur utilisation ne nécessite pas de scripts à développer. Ces produits évoluent rapidement avec les demandes des clients. Elles peuvent être idéales pour des environnements de production jusqu’à 70 à 100 VM. Au­delà, la fenêtre de sauvegarde devient trop importante. Une nuit ne suffit plus. Pour des grands environnements de production, il est préférable de passer à des solutions de type Data Protection avec des logiciels de sauvegarde. © ENI Editions - All rigths reserved - Guillaume DUBOIS
- 9-