Gestion des évènements ITIL dans le cloud
Transcription
Gestion des évènements ITIL dans le cloud
Gestion des évènements ITIL dans le cloud Un addenda sur l'infrastructure d'adoption du cloud AWS Juillet 2015 Amazon Web Services – Gestion des évènements ITIL dans le cloud Juin 2015 © 2015, Amazon Web Services, Inc. ou ses affilié s. Tous droits ré servé s. Mentions légales Ce document est fourni àtitre informatif uniquement. Il pré sente l'offre de produits et les pratiques actuelles d'AWS àla date de publication de ce document, des informations qui sont susceptibles d'ê tre modifié es sans avis pré alable. Il incombe aux clients de procé der àleur propre é valuation indé pendante des informations contenues dans ce document et chaque client est responsable de son utilisation des produits ou services AWS, chacun é tant fourni «en l'é tat », sans garantie d'aucune sorte, qu'elle soit explicite ou implicite. Ce document ne cré e pas de garanties, repré sentations, engagements contractuels, conditions ou assurances àl'encontre d'AWS, de ses affilié s, fournisseurs ou donneurs de licence. Les responsabilité s et obligations d'AWS vis-à-vis de ses clients sont ré gies par les contrats AWS. Le pré sent document ne fait partie d'aucun et ne modifie aucun contrat entre AWS et ses clients. Page 2 sur 15 Amazon Web Services – Gestion des évènements ITIL dans le cloud Juin 2015 Table des matières Ré sumé 4 Introduction 4 En quoi consiste l'ITIL? Page 3 sur 15 4 En quoi consiste l'infrastructure d'adoption du cloud AWS ? 5 Gestion des é vè nements dans l'ITIL 6 Gestion des é vè nements et infrastructure d'adoption du cloud (CAF) 8 Bonnes pratiques de gestion des é vè nements propres au cloud pour les responsables des services informatiques 9 Supervision, dé tection et communication des é vè nements de cloud grâce àAmazon CloudWatch 9 Conclusion 15 Collaborateurs 15 Remarques 15 Amazon Web Services – Gestion des évènements ITIL dans le cloud Juin 2015 Résumé Beaucoup d'entreprises ont migréavec succè s certaines charges de travail informatiques sur site vers le cloud. Une entreprise peut é galement dé ployer une infrastructure de gestion des services informatiques (ITSM) afin que l'utilisation des fonctionnalité s IT soit plus efficace. Le pré sent livre blanc dé crit les bonnes pratiques pour la gestion des é vè nements dans un environnement de cloud hybride grâce àAmazon Web Services (AWS). Introduction Le pré sent livre blanc s'adresse aux professionnels de la gestion des services informatiques (ITSM) qui prennent en charge un environnement de cloud hybride qui utilise AWS. L'accent est mis sur la gestion des é vè nements, un chapitre clédu volume des opé rations de service de la bibliothè que pour l'infrastructure des technologies de l'information (ITIL). De nombreux clients professionnels AWS ont inté gréavec succè s leur straté gie cloud àleurs pratiques de gestion des services informatiques basé es sur l'ITIL. Le pré sent livre blanc vous fournit du contexte dans les domaines suivants : Gestion des é vè nements dans l'ITIL Infrastructure d'adoption du cloud AWS Bonnes pratiques de gestion des é vè nements propres au cloud En quoi consiste l'ITIL? La bibliothè que pour l'infrastructure des technologies de l'information (ITIL), gé ré e par AXELOS Limited, dé finit une approche couramment utilisé e des bonnes pratiques de gestion des services informatiques (ITSM). Elle s'appuie sur le protocole ISO/IEC 20000, qui fournit une «norme formelle et universelle pour les organisations cherchant àauditer et certifier leurs fonctionnalité s 1 ITSM. »Toutefois, l'ITIL va plus loin en proposant des processus opé rationnels né cessaires pour respecter la norme. L'ITIL se compose de cinq volumes qui dé crivent l'inté gralitédu cycle de vie ITSM conformé ment àla dé finition d'AXELOS. Pour explorer ces volumes en dé tail, consultez https://www.axelos.com/ Page 4 sur 15 Amazon Web Services – Gestion des évènements ITIL dans le cloud Juin 2015 Le tableau suivant vous donne un bref aperç u de chacun des cinq volumes : Volume ITIL Description Stratégie des services Décrit comment concevoir, développer et implémenter la gestion des services en tant qu'actif stratégique Conception des services Décrit comment concevoir et développer des services et des processus de gestion des services Transformation des services Décrit le développement et l'amélioration des capacités pour transformer les services nouveaux et modifiés en opérations Fonctionnement des services Décrit les pratiques de gestion du fonctionnement des services Amélioration continue des services Dirige la création et la préservation des valeurs pour les clients En quoi consiste l'infrastructure d'adoption du cloud AWS ? L'infrastructure d'adoption du cloud (CAF) propose des directives complè tes pour é tablir, dé velopper et exé cuter des fonctionnalité s informatiques basé es sur le cloud. AWS utilise la CAF pour aider les entreprises àmoderniser leurs pratiques ITSM afin qu'elles profitent des avantages en matiè re d'agilité , de sé curitéet de coût permis par le cloud. A l'instar de l'ITIL, la CAF organise et dé crit les activité s et processus impliqué s dans la planification, la cré ation, la gestion et la prise en charge des services informatiques modernes. L'ITIL et la CAF sont compatibles. En ré alité , la CAF fournit aux entreprises des conseils opé rationnels pratiques sur la faç on d'implé menter et d'utiliser l'ITSM dans une infrastructure informatique basé e sur le cloud. Les dé tails de la CAF AWS dé passe le champ d'application du pré sent livre blanc, mais si vous souhaitez en savoir plus, vous pouvez lire le livre blanc de la CAF àl'adresse http://d0.awsstatic.com/whitepapers/aws_cloud_adoption_framework.pdf. La CAF examine la gestion informatique dans le cloud sous sept angles principaux, comme illustrédans le tableau suivant : Page 5 sur 15 Amazon Web Services – Gestion des évènements ITIL dans le cloud Juin 2015 Angles de la CAF Description Personnes Sélection et formation du personnel informatique avec les compétences appropriées, définition et stimulation des équipes de livraison avec responsabilités et accords de niveau de service Processus Gestion des programmes et projets pour garantir leur ponctualité, leur objectif et leur respect du budget, tout en conservant les risques à des niveaux acceptables Sécurité Application d'une méthode exhaustive et rigoureuse décrivant une structure et un comportement pour les processus, les systèmes et le personnel de sécurité d'une organisation Stratégie et valeur Identification, analyse et mesure de l'efficacité des investissements informatiques qui génèrent la meilleure valeur commerciale Maturité Analyse, définition et anticipation de la demande et acceptation des fonctionnalités et services informatiques envisagés Plateforme Définition et description des principes architecturaux majeurs, et des modèles exigés pour de meilleurs fonctionnalités et services informatiques Opération Transformation, fonctionnement et optimisation de l'environnement informatique hybride, permettant une gestion efficace et automatisée des services informatiques Gestion des évènements dans l'ITIL La spé cification ITIL dé finit un é vè nement comme «toute occurrence dé tectable ou discernable ayant une importance pour la gestion de l'infrastructure informatique ou la prestation de services informatiques. »En d'autres termes, un é vè nement se produit dans un systè me informatique àl'impact commercial. Une occurrence peut prendre n'importe quelle forme pourvu qu'elle ait un impact maté riel sur l'entreprise comme les conditions environnementales, les intrusions dans la sé curité , les avertissements, les erreurs, les dé clencheurs ou mê me un fonctionnement normal. Les occurrences sont indispensables à l'entreprise pour superviser, de pré fé rence de maniè re automatisé e, en vous donnant la visibiliténé cessaire pour exé cuter vos systè mes plus efficacement au fil du temps avec le minimum de temps d'arrê t. L'objectif de la gestion d'é vè nements est de les dé tecter, les hié rarchiser et les classer, et de trouver une maniè re de les traiter. En pratique, la gestion d'é vè nements est utilisé e avec un outil de supervision centrale, qui enregistre les é vè nements provenant des services ou d'autres outils tels que les outils de configuration, de gestion de la disponibilitéet de la capacité ou de supervision spé cialisé e. La gestion d'é vè nements agit comme un parapluie au-dessus des autres processus ITIL, tels que la gestion d'incidents, des changements, des problè mes ou des niveaux de service, et ré partit le travail en fonction du type d'é vè nement ou de sa dureté . Page 6 sur 15 Amazon Web Services – Gestion des évènements ITIL dans le cloud Juin 2015 AXELOS fournit l'organigramme suivant pour dé crire le processus de gestion des é vè nements d'une entreprise : Figure 1 : gestion des évènements dans l'ITIL AXELOS observe que tous les é vè nements sont, ou doivent ê tre, dé tecté s ou enregistré s. Le fait de dé finir les é vè nements àgé rer est une dé cision de gestion explicite et importante. Aprè s que la direction a choisi les é vè nements pertinents, les composants des services doivent pouvoir publier les é vè nements ou ces derniers doivent ê tre interrogé s par un outil de supervision. Les é vè nements doivent é galement ê tre concrets. Le processus de gestion des é vè nements, qu'il soit automatique ou manuel, doit pouvoir dé terminer l'action àexé cuter pour n'importe quel é vè nement. Cette dé termination peut prendre de nombreuses formes comme l'ignorance, la journalisation ou la remonté e de l'é vè nement. Enfin, le processus de gestion des é vè nements doit pouvoir é tudier et é ventuellement clore les é vè nements. Page 7 sur 15 Amazon Web Services – Gestion des évènements ITIL dans le cloud Juin 2015 Gestion des évènements et infrastructure d'adoption du cloud (CAF) A l'instar des spé cifications couvertes dans le volume des opé rations de service de l'ITIL, la gestion des é vè nements relè ve de la fonction de gestion du service cloud du domaine de fonctionnement de la CAF AWS. A l'é vidence, les initiatives cloud ont besoin de plus que la technologie adapté e. Elles doivent é galement ê tre soutenues par des changements organisationnels (personnes et processus). De tels changements doivent ê tre pris en charge par un forum de gouvernance cloud ou un centre d'excellence dont le rôle est de gé rer la transition grâce àla CAF. Du point de vue de l'ITSM, vos opé rations doivent certainement ê tre prises en compte. La figure 2 illustre la faç on dont la CAF gè re les é vè nements et les actions dans un environnement hybride. Les é tudes et les actions se basent sur les informations qui proviennent de l'environnement sur site ou un nombre illimité de fournisseurs cloud (privé s ou publics). Figure 2 : intégration de la CAF Page 8 sur 15 Amazon Web Services – Gestion des évènements ITIL dans le cloud Juin 2015 Bonnes pratiques de gestion des évènements propres au cloud pour les responsables des services informatiques AWS fournit la piè ce maî tresse pour que votre entreprise cré e sa propre infrastructure de gestion des é vè nements. Cette piè ce maî tresse facilite l'inté gration des services cloud avec des environnements sur site ou plus traditionnels. AWS fournit notamment une prise en charge totale pour la section 4.1.10 de l'ITIL : conception de la gestion des é vè nements. AWS ne fournit pas de gestion des é vè nements en tant que service. Les entreprises qui activent la gestion des é vè nements devront dé ployer et gé rer leur propre infrastructure. Supervision, détection et communication des évènements de cloud grâce à Amazon CloudWatch AWS prend en charge l'instrumentation en fournissant des outils pour publier et interroger les é vè nements. Vous pouvez notamment utiliser l'API Amazon CloudWatch pour la gestion et l'inté gration automatisé es dans votre infrastructure de gestion des é vè nements. Amazon CloudWatch supervise vos ressources AWS et les applications que vous exé cutez sur AWS en temps ré el2. Vous pouvez utiliser Amazon CloudWatch pour ré cupé rer et suivre les mé triques, qui sont les variables que vous souhaitez mesurer pour vos ressources et applications. De plus, les alarmes Amazon CloudWatch (ou scripts de supervision) peuvent envoyer des notifications ou modifier automatiquement les ressources que vous supervisez en fonction des rè gles que vous dé finissez. Pour plus d'informations sur la tarification CloudWatch, consultez la page de tarification Amazon CloudWatch. http://aws.amazon.com/cloudwatch/pricing/ Vous pouvez utiliser CloudWatch pour superviser l'utilisation du processeur ainsi que les lectures et é critures sur le disque de vos instances Amazon Elastic Compute Cloud (Amazon EC2). Ensuite, vous pouvez utiliser ces donné es pour dé terminer si vous devez lancer des instances supplé mentaires pour gé rer l'augmentation de charge. Vous pouvez é galement utiliser ces donné es pour arrê ter les instances sous-utilisé es et faire des é conomies. Page 9 sur 15 Amazon Web Services – Gestion des évènements ITIL dans le cloud Juin 2015 Outre la supervision des mé triques inté gré es qui accompagnent AWS, vous pouvez superviser vos propres mé triques personnalisé es. Vous pouvez publier et superviser des mé triques provenant de vos applications pour reflé ter vos besoins mé tier. Avec Amazon CloudWatch, vous augmentez votre visibilitéàl'é chelle du systè me sur l'utilisation des ressources, les applications, les performances et l'é tat 3 opé rationnel. Par dé faut, les mé triques et les statistiques calculé es sont pré senté es sous forme de graphique dans la console Amazon CloudWatch. Vous pouvez aussi ré cupé rer ces mé triques àl'aide de l'API ou des outils de ligne de commande. Lorsque vous utilisez la mise àl'é chelle automatique, vous pouvez configurer des actions d'alarme pour arrê ter, dé marrer ou mettre fin àune instance Amazon EC2 quand certaines conditions sont satisfaites. De plus, vous pouvez cré er des alarmes qui initient la mise àl'é chelle automatique et des actions Amazon Simple Notification Service (Amazon SNS) en votre nom. 4 Supervision des détails Amazon EC2 Pour plus d'informations sur la supervision Amazon EC2 dans la documentation AWS, consultez http://docs.aws.amazon.co m/AWSEC2/latest/UserGui de/monitoring_ec2.html Une entreprise ne possé dant pas sa propre infrastructure de gestion des é vè nements peut implé menter une gestion des é vè nements ITIL de base grâce àAmazon CloudWatch. Toutefois, la plupart des grandes entreprises, notamment celles qui exé cutent des conceptions de cloud hybride, maintiennent leur propre infrastructure de gestion des é vè nements àl'aide de produits tels que BMC Remedy, Microsoft System Center ou HP Open View. De nombreux outils de gestion des é vè nements sont inté gré s àAmazon Web Services. Pour obtenir des exemples, consultez le tableau suivant. Page 10 sur 15 Outil Référence MS System Center http://aws.amazon.com/windows/system-center/ BMC Remedy http://media.cms.bmc.com/documents/439126_BMC_Managing_AWS_SWP. pdf IBM Tivoli https://aws.amazon.com/marketplace/pp/B007P7MEK0 CA APM https://aws.amazon.com/marketplace/pp/B00GGX0N0W/ref=portal_asin_url Amazon Web Services – Gestion des évènements ITIL dans le cloud Juin 2015 Outil Référence CA Nimsoft http://www.ca.com/~/media/Files/DataSheets/ca-nimsoft-monitor-foramazon-web-services.pdf HP Sitescope http://h30499.www3.hp.com/t5/Business-Service-ManagementBAC/HP-SiteScope-integration-with-Amazon-CloudWatch-Auto-ScalingAWS/ba- p/2408860#.VCzWTPmSzTY Ce type de conception est entiè rement compatible avec AWS. Toutefois, les entreprises doivent dé ployer SNMP, AWS SNS ou d'autres interfaces qui se situent entre Amazon CloudWatch et leur outil professionnel de gestion des é vè nements / centre de services. Cela permet de veiller àce que les é vè nements gé né ré s par AWS passent par Amazon CloudWatch et dans le gestionnaire d'é vè nements professionnel. Les professionnels de gestion des é vè nements qui intè grent Amazon CloudWatch àleur infrastructure professionnelle de gestion des é vè nements doivent ré pondre aux questions suivantes : Les é vè nements approprié s sont-ils propagé s? Les é vè nements sont-ils suivis au niveau de granularitéadapté? Existe-t-il un mé canisme pour examiner et mettre àjour des dé clencheurs, des limites et des rè gles de gestion des é vè nements ? BONNES PRATIQUES POUR LA SUPERVISION DANS AWS Faites de la supervision une prioritépour ré soudre les petits problè mes avant qu'ils n'empirent. Automatisez les tâches de supervision autant que possible. Vé rifiez les fichiers journaux de vos services (Amazon EC2, Amazon S3, Amazon RDS, etc.). Page 11 sur 15 Amazon Web Services – Gestion des évènements ITIL dans le cloud Juin 2015 Cré ez et implé mentez un plan de supervision qui collecte les donné es de supervision de toutes les parties de vos solutions AWS de telle sorte que vous puissiez dé boguer plus facilement une é ventuelle dé faillance àplusieurs points. Votre plan de supervision doit, au moins, traiter les questions suivantes : Quels sont les objectifs de la supervision ? Quelles sont les ressources àsuperviser ? A quelle fré quence les ressources doivent-elles ê tre supervisé es ? Quels outils de supervision utiliser ? Qui exé cute les tâches de supervision ? Qui doit ê tre informéen cas de problè me ? Gestion des incidents Des é vè nements caté gorisé s comme avertissements ou exceptions peuvent dé clencher des processus de gestion des incidents. Ces processus restaurent le fonctionnement normal des services aussi rapidement que possible et minimisent les impacts né gatifs sur les opé rations mé tier. Dans le processus ITIL, essayez tout d'abord de ré soudre les avertissements et exceptions en consultant une base de donné es des erreurs connues ou de gestion des configurations (CMDB). Si l'avertissement ou l'exception ne se trouve pas dans la base de donné es, caté gorisez l'incident et transfé rez-le au service de gestion des incidents. Le service de gestion des incidents est composéde spé cialistes du support de premier niveau capables de ré soudre la plupart des incidents courants. Lorsqu'ils ne parviennent pas àré soudre un incident, ils remontent le problè me àl'é quipe de support de second niveau, et le processus continue jusqu'àce que l'incident soit ré solu. Le service de gestion des incidents essaie de ré soudre rapidement les problè mes afin que la dé gradation du service ou le temps d'arrê t soit minime.1 Page 12 sur 15 Amazon Web Services – Gestion des évènements ITIL dans le cloud Juin 2015 Figure 3 : gestion des incidents dans l'ITIL Il est important de noter qu'une infrastructure cloud bien conç ue peut ê tre bien plus ré sistante aux pannes. La probabilitéde gé né rer des incidents de production diminue lorsque les pannes sont capables de basculer facilement. Les problè mes sous-jacents peuvent ê tre ré solus grâ ce au processus de gestion des problè mes. BONNES PRATIQUES DE GESTION DES INCIDENTS Dans le cadre de la gestion des incidents inté gré e au cloud, les entreprises doivent dé finir plusieurs paramè tres : Page 13 sur 15 Veillez àce que le personnel et les employé s compé tents identifient les services gé ré s par AWS et ceux gé ré s par l'entreprise (par exemple, une instance Amazon EC2 et une application mé tier s'exé cutant sur cette instance). Veillez àce que le personnel et les processus compé tents aient connaissance des contrats SLA associé s aux services gé ré s par AWS et intè grent ces contrats SLA dans l'infrastructure existante de gestion professionnelle des incidents. Dé finissez des contrats SLA explicites (notamment la ré solution des é chelles de temps) pour les services gé ré s par l'entreprise, mais s'exé cutant sur l'infrastructure AWS. Amazon Web Services – Gestion des évènements ITIL dans le cloud Juin 2015 Dé finissez des niveaux de gravitédes incidents et des priorité s pour tous les services s'exé cutant sur l'infrastructure. Abonnez-vous au support d'entreprise et mettez-vous d'accord sur le rôle du responsable technique de compte (TAM) Amazon lors des ré ponses aux incidents. Par exemple, pour des incidents de gravité1, le TAM doit-il faire partie de la chaî ne de ré solution d'urgence / de l'é quipe d'intervention d'urgence ? Garantissez une inté gration complè te du ticket. Veillez àce que l'ouverture et la fermeture du ticket soient transparentes sur les systè mes sur site et cloud. Dé finissez des recettes de runbook pour la ré cupé ration (modè le d'incidents) qui incluent les é tapes de ré cupé ration dans l'ordre chronologique, les responsabilité s individuelles, les rè gles de remonté e, les é chelles de temps et les seuils de SLA, les rôles des communications/ mé dias et les post-mortem. Notez que dans un environnement cloud, dans lequel l'infrastructure est dé finie en tant que code, l'arrê t et le redé marrage peuvent ê tre plus rapides pour ré cupé rer d'un incident que l'utilisation des approches standard de dé bogage. Le service peur ê tre immé diatement restauréet les problè mes fondamentaux peuvent ê tre ré solus hors ligne dans le cadre de la gestion des problè mes. Le cas é ché ant, la correction des incidents doit se faire automatiquement, sans intervention humaine. Toutefois, lorsqu'une intervention humaine est né cessaire, cette derniè re doit ê tre simple, avec une majoritéd'é tapes de runbook automatisé es. Gestion des problèmes La gestion des problè mes est le processus qui consiste àgé rer le cycle de vie de tous les problè mes afin de pré venir les incidents ré pé té s. Alors que l'objectif de la gestion des incidents est de ré cupé rer, la gestion des problè mes a pour but de ré soudre les causes fondamentales des incidents pour que ces derniers ne se ré pè tent pas, et de conserver les informations sur les problè mes et les solutions connexes afin que les organisations ré duisent l'impact des incidents. Les entreprises qui gè rent un environnement hybride disposeront probablement de leur propre infrastructure de gestion des problè mes. L'objectif de l'inté gration doit ê tre d'incorporer en toute transparence le processus pour ré soudre les problè mes lié s àAWS dans l'infrastructure existante de gestion des problè mes. Page 14 sur 15 Amazon Web Services – Gestion des évènements ITIL dans le cloud Juin 2015 Les entreprises ont la possibilitéd'acheter AWS Enterprise Support, dans lequel elles peuvent se mettre d'accord sur le rôle du responsable technique de compte (TAM) Amazon lors de la gestion des problè mes. Par exemple, lorsque le problè me inclut explicitement une partie de l'infrastructure AWS, le TAM peut ê tre impliquédans la dé tection formelle des problè mes, la hié rarchisation, ainsi que les ateliers et discussions sur les diagnostics, ou devoir consigner les problè mes AWS avec la plateforme de journalisation des problè mes / la base de donné es des erreurs connues de l'entreprise. Si l'infrastructure AWS n'est pas àl'origine des problè mes, elle peut jouer un rôle en prenant en charge le diagnostic. Dans ce cas, le TAM peut prendre en charge la collecte d'informations. Conclusion Les entreprises qui migrent vers le cloud peuvent ê tre assuré es que leurs investissements existants dans l'ITIL, et notamment la gestion des é vè nements, peuvent ê tre exploité s dans le futur. Le modè le de fonctionnement du cloud est compatible avec la discipline traditionnelle de la gestion des services informatiques. Le pré sent livre blanc vous donne une sé rie de bonnes pratiques pour vous aider àfaciliter la transition et àgarantir une conformitédurable. Collaborateurs Les personnes suivantes ont contribuéàce document : Eric Tachibana, services professionnels AWS Remarques 1 ITIL Service Operation Publication, Office of Government Commerce, 2007, Page 5 2 Jusqu'à2 semaines ! 3 What Is Amazon CloudWatch? (http://docs.aws.amazon.com/AmazonCloudWatch/latest/DeveloperGuide/W hatIsCloudWatch.html) 4 Pour plus d'informations sur la cré ation d'alarmes, consultez Creating Amazon CloudWatch Alarms dans la documentation CloudWatch (http://docs.aws.amazon.com/AmazonCloudWatch/latest/DeveloperGuide/ AlarmThatSendsEmail.html). Page 15 sur 15