Etude d`un Plan de Reprise d`Activité (PRA) Réseau Informatique
Transcription
Etude d`un Plan de Reprise d`Activité (PRA) Réseau Informatique
Etude d’un Plan de Reprise d’Activité (PRA) Réseau Informatique Entreprise Polygone SA – Aurillac Etude commencé le : 05/01/2015 Par Guilhem CALAS, 2ième année BTS SISR (Titre TP) CONTENU I. Note d’information ...................................................................................... 2 II. Introduction ................................................................................................ 2 1. Qu’est-ce qu’un PCA ? PRA ? .......................................................................... 2 2. difference entre PCA et PRA ............................................................................ 2 III. Démarche a suivre ..................................................................................... 3 1. Objectif des PCA/PRA :.................................................................................... 3 2. Définir le périmètre PCA/PRA : de quel risque je souhaite me prémunir ?...... 3 3. Etudier, valider et mettre en œuvre .................................................................. 4 4. Les outils à disposition… .................................................................................. 5 5. Vocabulaire technique du PRA : ....................................................................... 5 6. Solutions qui vont me permettre d’assurer une reprise d’activité ...................... 6 7. Scénario de déploiement .................................................................................. 6 8. Topologie de deploiement ................................................................................ 7 IV. Question au fur et à mesure des recherches : ........................................... 8 1 (Titre TP) NOTE D’INFORMATION I. Suite à la demande du DSI de Polygone et des activités réalisables pour un stagiaire de niveau BTS 2ième année en SISR, nous avons trouvé une entente sur un sujet exploitable au sein de l’organisation. Il a été réfléchi avant ma venue à un PRA en cas d’incident majeure du SI. De ce fait, ce projet étant en attente dans l’organisation, ma venue à accélérer les choses et je me suis donc fait confié cette tâche d’analyse et mise en place d’un PRA du SI pour la société Polygone à Aurillac, en collaboration avec Mr FAYEL, DSI de la société. Ce document d’étude n’est qu’informatif et ne permet donc pas d’élaborer un PRA. Chemin PRA officiel : « CléUSB/Guilhem/Stage2015/Doc PRA/Réalisation PRA » II. INTRODUCTION 1. QU’EST-CE QU’UN PCA ? PRA ? Le PCA est un Plan de Continuité d’Activité qui permet en cas de problème majeur dans une entreprise de continuer l’activité sans perte de service ou avec une légère dégradation acceptable (étudié par le ResponsablePCA). Exemple : télétravail en cas de grève. Le PRA est un Plan de Reprise d’Activité en cas de sinistre ou tout ce qui pourrai nuire totalement à une activité primordiale de l’entreprise, de pouvoir reconstruire ou de basculer sur un système identique permettant de réaliser la même activité que l’élément endommagé sur une durée déterminé. Exemple : basculement d’un Datacenter sur un site de secours en cas d’incendie – Site de Polygone à Aurillac possédant deux établissements distant d’une centaine de mètres. 2. DIFFERENCE ENTRE PCA ET PRA Ces plans sont pensés en vue d'un sinistre important sur le système 2 PCA PRA (Titre TP) informatique. Si ce dernier est touché, il est nécessaire d'assurer la sauvegarde et l'archivage des données. La société anticipe les risques encourus en analysant l’impact d'un sinistre sur son SI. Le PRA et le PCA sont tous deux destinés à prendre en compte la possibilité d’un incident sur un service de l’entreprise et à employer des mesures nécessaires pour pallier à celle-ci le temps de la remise en place habituelle. A la différence du PCA qui consiste à assurer la continuité de l’activité sans subir aucune interruption de service, le PRA assure, quant à lui, la reconstruction de l’infrastructure ainsi que la remise en route des applications stratégiques d’une entreprise suite à une coupure soudaine. III. DEMARCHE A SUIVRE 1. OBJECTIF DES PCA/PRA : Prendre en compte le matériel informatique ainsi que les utilisateurs, ne pas investir dans des moyens si les utilisateurs ne peuvent pas se connecter après l’incident, prendre en compte l’ensemble de l’organisation. Mettre en œuvre des moyens techniques permettant de garantir une reprise de l’ensemble des briques du système d’information en limitant la perte de données et le temps d’indisponibilité. Il faut parler de serveur, de virtualisation, d’ordinateur mais il faut prendre en compte le réseau qui va jusqu’aux utilisateurs, le réseau pour accéder à internet. 2. DEFINIR LE PERIMETRE SOUHAITE ME PREMUNIR ? PCA/PRA : DE QUEL RISQUE JE Définir les services fonctionnels qui vont être pris en compte, c’est-àdire des services ou des fonctions qui vont être les plus critiques pour faire fonctionner l’entreprise, celle n’étant pas prioritaire n’ont pas besoin d’être concerné. 3 (Titre TP) !! Ne pas oublier qu’il faut trancher qu’il faut arbitrer financièrement car il faut prendre en compte tous les éléments de l’entreprise et adopter les décisions les plus justes afin de garantir sécurité et coût financier abordable !! Valider les objectifs à atteindre avec la direction. Dans 99 % des cas une entreprise se retrouve dans 3 des cas qui vont suivre et donc adapter la reprise d’activité en fonction de ces cas : - Problème ne touchant qu’un seul système / données / application / utilisateur Problème touchant plusieurs systèmes / données / applications / utilisateurs Problème touchant tous les systèmes et/ou le site. Il suffit de mettre en place des solutions en fonction de ces trois cas pour couvrir n’importe quel sinistre. 3. ETUDIER, VALIDER ET METTRE EN ŒUVRE Quels sont les objectifs ? Quels sont les moyens à mettre en œuvre pour atteindre ce résultat la? Etudier les scénarios de reprise et estimer la faisabilité technique et humaine de leurs mises en œuvre. Valider par des tests les choix techniques retenus. Définir le coût de mise en place. Planifier, mettre en œuvre et documenter. Pérenniser le PCA/PRA par des tests et des mises à jour régulières. Un PRA est un plan qui est en permanence d’actualité, il faut se rendre compte que dès qu’un élément du réseau informatique est changé ou mis à jour, cela a un impact sur d’autres éléments du réseau et par conséquent, peut modifier les résultats attendus qui été prévu par le PRA avant l’intervention sur le réseau du technicien. Il faut aussi se rendre compte que dès qu’un élément ne peux plus exercer sa fonction et qui est considérer critique dans le PRA il faut assurer le minimum vital pour continuer à faire tourner l’entreprise. 4 (Titre TP) 4. LES OUTILS A DISPOSITION… La virtualisation de serveur en ferme ou unitaire Le stockage central type SAN physique ou virtuel Le cloud de proximité pour les PRA Des outils de sauvegardes adaptés et performants Les outils de clustering Les outils qui sont intéressant d’exploiter sont à réfléchir par l’entreprise si elle décide de s’occuper de son propre PRA. Les sauvegardes des données serveur sont ultra importante pour une organisation, perdre de la donnée = perdre de l’économie, de l’argent. Cela peut entrainer des effets que l’on ne maitrise pas. Le clustering géo localiser est financièrement couteux pour les PME et qui demande des compétences techniques ainsi que du temps. 5. VOCABULAIRE TECHNIQUE DU PRA : Recovery Point Objective (RPO) : durée maximum d’enregistrement des données qu’il est acceptable de perdre (perte de données max admissible) lors d’une interruption majeure de service. Recovery Time Objective (RTO) : durée maximale d’interruption acceptable pendant lequel une ressource informatique (serveur, réseau, application) peut ne pas être opérationnelle suite à une interruption majeure de service. Objectif défini à l’avance en fonction des besoins de l’entreprise et ce qu’il faut savoir c’est que plus la ressource est critique plus le RTO est faible. RTO faible = €€€ 5 (Titre TP) 6. SOLUTIONS QUI REPRISE D’ACTIVITE VONT ME PERMETTRE D’ASSURER UNE La copie des fichiers : données utilisées par une application, on va pouvoir répliquer ces données sur un autre serveur ou sur une autre application et faire en sorte de pouvoir récupérer ce service. Outils de sauvegarde à chaud de l’environnement sans interruption de service alors que la copie de fichier pour avoir un état consistant au niveau de la machine virtuelle et l’on va devoir arrêter le service pour réaliser la copie de fichier. 7. 6 SCENARIO DE DEPLOIEMENT (Titre TP) Solution retenu pour Polygone Aurillac Solution ou il y a 2 datacenter, ou le datacenter du site secondaire venant répliqués et venant assurer le PRA de certaines machines virtuelles du datacenter du site principal et réciproquement d’avoir le Datacenter du site principal qui assure le PRA de certaines machines virtuelle se situant sur le datacenter du site secondaire, il n’y a pas forcément un site actif et un autre site complètement passif on peut très bien avoir dans la solution les deux sites qui sont actifs et qui assure le PRA mutuel des ressources qui sont hébergées sur l’autre site, ce qui va permettre de pouvoir répartir ma charge, au niveau de ma solution. 8. 7 TOPOLOGIE DE DEPLOIEMENT (Titre TP) Solution retenu pour Polygone Aurillac Faire attention au nombre de virtual CPU d’une machine virtuelle dépend du nombre de processeur logique que l’on a dans un serveur. Comment on calcule les processeurs logiques dans un serveur = socket physique * le nombre de cœur * 2 sa fait du hyperthreading. Si par exemple on a une machine virtuelle avec 64 virtual CPU et si l’on bascule sur un site secondaire pour pouvoir le démarrer il faudra que l’hôte de virtualisation et au moins 64 processeurs logiques sur le poste pour pouvoir le démarrer. IV. QUESTION AU FUR ET A MESURE DES RECHERCHES : Si un incendie ne permet plus l’accès au site informatique doit-on envisager une reprise d’activité dans les plus brefs délais ? Puisque le personnel de l’entreprise devra évacuer les locaux et peut être ne reprendre leur activité que quelques jours plus tard, le temps de remettre en place le service informatique réseau. Justement le PRA veut que l’on réfléchisse à tous les événements inimaginables……. 8 (Titre TP) Quels sont les données, applications, logiciels et autres éléments qui faut absolument retrouver au plus rapide en cas d’incident majeur dans le PRA ? En cas de cyber attaque du réseau de la société, le site principal est donc atteint mais si tel est le cas est-ce que le site secondaire n’est pas aussi atteint puisqu’il est en lien direct avec le site principal ? Le PRA serait donc inutile ? Un hacker qui attaque un système essayera de le faire passer en PRA parce que souvent le site de replie peut être plus attaquable que le site primaire, notion de sécurité ? Dois-je privilégié la continuité d’activité au dépend de la sécurité ou est-ce que je dois empêcher qu’une application ne redémarre tant qu’elle n’est pas suffisamment sécurisé. ? Dans certains cas un PCA-PRA ne marche pas comme l’on voudrait que cela marche, exemple : le facteur humain dans cette vidéo du « clusif » : https://www.clusif.asso.fr/fr/production/videos/video.asp?id=157 9