version PDF - Flash informatique
Transcription
version PDF - Flash informatique
Microsoft Operations Manager 2005 Machine de surveillance Sergio Monaco, [email protected] & [email protected], Domaine IT L’équipe Windows du DIT, ci-après WinTeam gère une trentaine de serveurs dont certains sont critiques: contrôleurs de domaine Active Directory, services collaboratifs Exchange, bases de données, etc. Jusqu’à récemment, ces serveurs étaient gérés avec les méthodes et les outils propres à leur responsable. Afin que les administrateurs de la WinTeam puissent assurer les remplacements en cas d’absence (maladie, vacances, service militaire,...), mais surtout d’offrir le meilleur service possible via des actions proactives, la surveillance des serveurs devait être homogène, systématique et propre à chaque service. C’est la mission que la WinTeam a confiée à un stagiaire ORP (Office Régional de Placement), Sergio Monaco dont les compétences en la matière ont permis des résultats probants et rapides. Ce travail a été rédigé en collaboration avec la Winteam sous la supervision de Thomas Becker. Approche Les composants MOM Comment peut-on contrôler la performance et l’état de santé des serveurs ? Normalement on utilise des outils qui font partie du système d’exploitation comme Windows Performance Counter, Event Viewer et Windows Task Manager ou, dans les systèmes Linux, l’outil syslog. Ces outils donnent une vue immédiate et précise de la machine et ses composants. Moyennant que l’on Cost USD approximative (30 servers 5 users) HP OpenView IBM Tivoli sache utiliser ces outils, on parvient rapidement à résoudre bon nombre de problèmes. Dans une infrastructure plutôt complexe avec des dizaines, voire des centaines de serveurs, il est important non pas seulement de réagir aux problèmes, mais d’avoir une approche proactive de la gestion de l’infrastructure. La surveillance devient nécessaire, et le temps consacré à l’installation de logiciels et à la configuration des automatismes nécessaires s’avérera certainement bien investi. Après un processus de sélection parmi une liste de quinze produits (fig. 1) le DIT-SB a choisi Microsoft Operations Manager 2005 (MOM) pour la surveillance d’une trentaine de serveurs. MOM a été choisi surtout pour ses fonctionnalités très avancées, sa facilité d’utilisation et de personnalisation de la surveillance de systèmes Windows et la possibilité optionnelle de superviser des systèmes Linux, Unix ainsi que des dispositifs réseau. MOM peut surveiller les serveurs grâce à l’installation d’un agent qui rassemble l’information et l’envoie au serveur MOM. Cet agent ne consomme pas beaucoup de ressources; environ 0.2 % d’utilisation du processeur et 12 Mo de mémoire. Il est cependant possible de surveiller jusqu’à dix serveurs sans agent. Avec ce type de surveillance, c’est le CPU Disk RAM monitor Event Log Monitor Windows Services Monitor Network Monitor Performance Monitors Counter Customisation Monitor Run Task on Alert $$ $$ Mercury SiteScope 25000 X X X X X X X MS MOM 600 x y X X X X X X X ManageEngine Opmanager 3065 X EventSentry 1039 X IPSentry 465 ServersCheck 400 Alchemy Eye 400 JFFNMS Free X X X X X X X X X X X X X X X X X X X X X disk X X X plug-in $50 Wavex Monx Free Dell OpenManage Free Quest BigBrother 2700 X Nagios Free X Big Sister Free X X X X X X X X X X fig. 1 – Tableau d’évaluation (raccourci) FI 1 – 24 janvier 2006 – page 11 Microsoft Operations Manager 2005 – Machine de Surveillance serveur MOM qui va chercher l’information, avec manifestement une hausse du trafic réseau. MOM utilise des Management Packs (MP), propres à chaque produit. Ainsi, pour surveiller SQL 2000 ou Exchange 2003 il faut télécharger du site Microsoft les MP appropriés et les installer sur le serveur MOM. Chaque MP a des dizaines d’alertes et déclencheurs prédéfinis prêts pour l’utilisation, appelés règles. Les règles contenues dans chaque MP vont être appliquées automatiquement selon le type de serveur. Si un service d’un serveur est supprimé ou ajouté, par exemple DNS, les règles qui surveillent DNS seront supprimées ou ajoutées automatiquement à l’agent MOM sur ce serveur. Toutes les règles peuvent être modifiées ou supprimées manuellement, le cas échéant. Les règles utilisent les compteurs Performance Counter, Windows Management Instrumentation et Event Log pour chercher des conditions spécifiques et, si nécessaire, envoyer une alerte par email, SMS ou même exécuter une tâche prédéfinie, par exemple démarrer un script ou essayer de résoudre un problème. MOM utilise une base de données SQL pour stocker toutes les alertes, configurations, et même des données historiques de performance de quelques jours. La base de données peut être stockée sur le serveur MOM ou un serveur SQL dédié, ce que nous avons choisi. En cas de panne du serveur MOM, cette configuration permettra de restaurer le serveur MOM (ou d’en installer un nouveau) très rapidement, car la nouvelle installation prendrait toute sa configuration du serveur SQL, y compris la configuration des règles et les MP. chacun des serveurs sur la console, par exemple: la console Computer Management ou Ping. De la console opérateur, pour chaque alerte, on peut avoir plus d’information concernant le problème et même des solutions possibles proposées par Microsoft (fig. 3). Lorsque tel n’est pas le cas, mais que l’on a trouvé soi-même une solution pour une erreur spécifique, on peut écrire l’information dans la partie Company Knowledge; ce qui permettra de résoudre le problème plus vite la prochaine fois qu’une telle erreur survient. Des centaines de statistiques peuvent être montrées sous forme graphique pour une période de quelques heures à une semaine, qui peuvent être utilisées soit pour la résolution des problèmes soit pour la gestion de la capacité (dimensionnement d’une machine de remplacement). Des périodes fig. 2 – Console Opérateur Consoles de gestion Il y a trois types de consoles. La console d’administration permet de configurer le serveur MOM, les règles et d’installer les agents. La console opérateur (fig. 2) permet d’identifier, comprendre et résoudre les alertes et, rapidement voir l’état des serveurs. La console Web est semblable à la console opérateur, mais elle offre moins de fonctionnalités. À droite de la console opérateur, voir ci-dessus, il y des tâches que l’on peut démarrer pour FI 1 – 24 janvier 2006 – page 12 fig. 3 – Informations concernant une alerte Microsoft Operations Manager 2005 – Machine de Surveillance plus longues sont techniquement possibles, mais cela augmenterait significativement la taille de la base de données. On emploie l’écran Diagram pour montrer une vue graphique des ordinateurs et les rapports de rôle qui existent entre les serveurs. Les diagrammes dynamiques d’Active Directory et d’Exchange sont particulièrement intéressants parce qu’ils donnent une image complète de l’infrastructure de chaque application (fig. 5). Utilisation de MOM par la WinTeam fig. 4 – Performance Le DIT-SB utilise plusieurs MP pour surveiller les différents types des serveurs comme SQL, Exchange et Internet Information Services. En plus, le MP de Dell permet de surveiller les composants hardware des serveurs Dell, comme l’alimentation et les cartes réseau. Pour les alertes critiques, MOM envoie un email aux personnes concernées. Par exemple, s’il y a un problème sur un serveur de bases de données, la notification ne sera envoyée qu’au groupe de notification SQL. L’adhésion à n’importe quel groupe peut être facilement modifiée par la console d’administration. Afin que l’utilisation de MOM n’expose pas davantage les machines à des attaques virales ou malveillantes, tout le projet a été réalisé avec une optique least privilege. Cela a compliqué le déploiement, car il a fallu paramétrer très finement certains aspects du système d’exploitation et des applications afin de permettre à MOM de faire son travail. Le compte sous lequel MOM s’exécute sur les serveurs n’est administrateur que dans des cas exceptionnels et temporaires (anciennes plates-formes). n fig. 5 – Diagramme AD FI 1 – 24 janvier 2006 – page 13