version PDF - Flash informatique

Transcription

version PDF - Flash informatique
Microsoft Operations Manager 2005
Machine de surveillance
Sergio Monaco, [email protected] & [email protected], Domaine IT
L’équipe Windows du DIT, ci-après WinTeam gère une
trentaine de serveurs dont certains sont critiques: contrôleurs de domaine Active Directory, services collaboratifs
Exchange, bases de données, etc. Jusqu’à récemment, ces
serveurs étaient gérés avec les méthodes et les outils propres
à leur responsable. Afin que les administrateurs de la WinTeam puissent assurer les remplacements en cas d’absence
(maladie, vacances, service militaire,...), mais surtout d’offrir le meilleur service possible via des actions proactives,
la surveillance des serveurs devait être homogène, systématique et propre à chaque service. C’est la mission que
la WinTeam a confiée à un stagiaire ORP (Office Régional
de Placement), Sergio Monaco dont les compétences en
la matière ont permis des résultats probants et rapides. Ce
travail a été rédigé en collaboration avec la Winteam sous
la supervision de Thomas Becker.
Approche
Les composants MOM
Comment peut-on contrôler la performance et l’état de
santé des serveurs ?
Normalement on utilise des outils qui font partie du système d’exploitation comme Windows Performance Counter,
Event Viewer et Windows Task Manager ou, dans les systèmes
Linux, l’outil syslog. Ces outils donnent une vue immédiate et
précise de la machine et ses composants. Moyennant que l’on
Cost USD
approximative
(30 servers 5 users)
HP OpenView
IBM Tivoli
sache utiliser ces outils, on parvient rapidement à résoudre
bon nombre de problèmes.
Dans une infrastructure plutôt complexe avec des dizaines, voire des centaines de serveurs, il est important non pas
seulement de réagir aux problèmes, mais d’avoir une approche proactive de la gestion de l’infrastructure. La surveillance
devient nécessaire, et le temps consacré à l’installation de
logiciels et à la configuration des automatismes nécessaires
s’avérera certainement bien investi.
Après un processus de sélection parmi une liste de quinze
produits (fig. 1) le DIT-SB a choisi Microsoft Operations Manager 2005 (MOM) pour la surveillance d’une trentaine de
serveurs. MOM a été choisi surtout pour ses fonctionnalités
très avancées, sa facilité d’utilisation et de personnalisation
de la surveillance de systèmes Windows et la possibilité optionnelle de superviser des systèmes Linux, Unix ainsi que
des dispositifs réseau.
MOM peut surveiller les serveurs grâce à l’installation
d’un agent qui rassemble l’information et l’envoie au serveur
MOM. Cet agent ne consomme pas beaucoup de ressources; environ 0.2 % d’utilisation du processeur et 12 Mo de
mémoire. Il est cependant possible de surveiller jusqu’à dix
serveurs sans agent. Avec ce type de surveillance, c’est le
CPU
Disk
RAM
monitor
Event
Log
Monitor
Windows
Services
Monitor
Network
Monitor
Performance
Monitors
Counter
Customisation
Monitor
Run Task
on Alert
$$
$$
Mercury SiteScope
25000
X
X
X
X
X
X
X
MS MOM
600 x y
X
X
X
X
X
X
X
ManageEngine Opmanager
3065
X
EventSentry
1039
X
IPSentry
465
ServersCheck
400
Alchemy Eye
400
JFFNMS
Free
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
disk
X
X
X
plug-in $50
Wavex Monx
Free
Dell OpenManage
Free
Quest BigBrother
2700
X
Nagios
Free
X
Big Sister
Free
X
X
X
X
X
X
X
X
X
X
fig. 1 – Tableau d’évaluation (raccourci)
FI 1 – 24 janvier 2006 – page 11
Microsoft Operations Manager 2005 – Machine de Surveillance
serveur MOM qui va chercher l’information, avec manifestement une hausse du trafic réseau.
MOM utilise des Management Packs (MP), propres à
chaque produit. Ainsi, pour surveiller SQL 2000 ou Exchange 2003 il faut télécharger du site Microsoft les MP
appropriés et les installer sur le serveur MOM. Chaque MP
a des dizaines d’alertes et déclencheurs prédéfinis prêts pour
l’utilisation, appelés règles. Les règles contenues dans chaque
MP vont être appliquées automatiquement selon le type de
serveur. Si un service d’un serveur est supprimé ou ajouté,
par exemple DNS, les règles qui surveillent DNS seront
supprimées ou ajoutées automatiquement à l’agent MOM
sur ce serveur. Toutes les règles peuvent être modifiées ou
supprimées manuellement, le cas échéant.
Les règles utilisent les compteurs Performance Counter,
Windows Management Instrumentation et Event Log pour chercher
des conditions spécifiques et, si
nécessaire, envoyer une alerte par
email, SMS ou même exécuter
une tâche prédéfinie, par exemple
démarrer un script ou essayer de
résoudre un problème.
MOM utilise une base de
données SQL pour stocker toutes les alertes, configurations, et
même des données historiques
de performance de quelques
jours. La base de données peut
être stockée sur le serveur MOM
ou un serveur SQL dédié, ce
que nous avons choisi. En cas
de panne du serveur MOM,
cette configuration permettra
de restaurer le serveur MOM
(ou d’en installer un nouveau)
très rapidement, car la nouvelle
installation prendrait toute sa
configuration du serveur SQL,
y compris la configuration des
règles et les MP.
chacun des serveurs sur la console, par exemple: la console
Computer Management ou Ping.
De la console opérateur, pour chaque alerte, on peut
avoir plus d’information concernant le problème et même
des solutions possibles proposées par Microsoft (fig. 3).
Lorsque tel n’est pas le cas, mais que l’on a trouvé soi-même
une solution pour une erreur spécifique, on peut écrire
l’information dans la partie Company Knowledge; ce qui
permettra de résoudre le problème plus vite la prochaine fois
qu’une telle erreur survient.
Des centaines de statistiques peuvent être montrées sous
forme graphique pour une période de quelques heures à une
semaine, qui peuvent être utilisées soit pour la résolution
des problèmes soit pour la gestion de la capacité (dimensionnement d’une machine de remplacement). Des périodes
fig. 2 – Console Opérateur
Consoles de
gestion
Il y a trois types de consoles.
La console d’administration
permet de configurer le serveur
MOM, les règles et d’installer
les agents. La console opérateur
(fig. 2) permet d’identifier, comprendre et résoudre les alertes
et, rapidement voir l’état des
serveurs. La console Web est
semblable à la console opérateur,
mais elle offre moins de fonctionnalités.
À droite de la console opérateur, voir ci-dessus, il y des
tâches que l’on peut démarrer pour
FI 1 – 24 janvier 2006 – page 12
fig. 3 – Informations concernant une alerte
Microsoft Operations Manager 2005 – Machine de Surveillance
plus longues sont techniquement
possibles, mais cela augmenterait
significativement la taille de la
base de données.
On emploie l’écran Diagram
pour montrer une vue graphique
des ordinateurs et les rapports de
rôle qui existent entre les serveurs.
Les diagrammes dynamiques
d’Active Directory et d’Exchange
sont particulièrement intéressants
parce qu’ils donnent une image
complète de l’infrastructure de
chaque application (fig. 5).
Utilisation de MOM
par la WinTeam
fig. 4 – Performance
Le DIT-SB utilise plusieurs
MP pour surveiller les différents
types des serveurs comme SQL,
Exchange et Internet Information
Services. En plus, le MP de Dell
permet de surveiller les composants hardware des serveurs Dell,
comme l’alimentation et les cartes
réseau.
Pour les alertes critiques,
MOM envoie un email aux
personnes concernées. Par exemple, s’il y a un problème sur un
serveur de bases de données, la
notification ne sera envoyée qu’au
groupe de notification SQL. L’adhésion à n’importe quel groupe
peut être facilement modifiée par
la console d’administration.
Afin que l’utilisation de
MOM n’expose pas davantage
les machines à des attaques virales
ou malveillantes, tout le projet
a été réalisé avec une optique
least privilege. Cela a compliqué
le déploiement, car il a fallu paramétrer très finement certains
aspects du système d’exploitation et des applications afin de
permettre à MOM de faire son
travail. Le compte sous lequel
MOM s’exécute sur les serveurs
n’est administrateur que dans des
cas exceptionnels et temporaires
(anciennes plates-formes). n
fig. 5 – Diagramme AD
FI 1 – 24 janvier 2006 – page 13