itm lisi automotive

Transcription

itm lisi automotive
Surveillance du SI
LISI AUTOMOTIVE
par IBM TIVOLI MONITORING
Ghislain Gauthier
Responsable Systèmes et Infrastructure
LISI AUTOMOTIVE
Expert de la fixation et des composants de liaison mécaniques dans
l'industrie automobile
3000 Collaborateurs, 21 sites, 385 M€ CA 2008
Système d’informations LISI AUTOMOTIVE
120 Serveurs Physiques ou virtuels
6 baies de stockages EMC, IBM avec SVC
1300 PCs
110 stations de CAO
Equipe Technique
800 Téléphones
1 Administrateur réseau
15 PABX
1 Téléphoniste
85 switchs
1 Administrateur OS400
…
1 Administrateur UNIX /
AIX, LINUX, OS400, Windows
DBA Oracle
CITRIX, VMWARE,
1 Administrateur Windows
CISCO, HP, CHECKPOINT, TREND,
3 Techniciens bureautiques
ORACLE, SQL SERVER
MOVEX, BO
NETWORKER, ARCSERVE…
2007 : Pourquoi un outil de supervision ?
- 0,5 ETP pour surveiller l’architecture (300 points de
contrôle quotidien)
- Surveillance semi automatisée et incomplète
- Faible réactivité dans un flot d’alertes
- Pas de pro activité
- Difficulté à connaitre l’état de santé du SI
Comment s’assurer que le système d’informations
LISI AUTOMOTIVE est bien disponible ?
2008 : Choix de IBM TIVOLI Monitoring
Consultation des outils de supervision du marché
MOM, HP OPEN VIEW, IBM TIVOLI, NAGIOS
Obligations du produit :
- Pas de spécifique par rapport à l’architecture
- Pas de développement interne
- Prise en compte complète des serveurs OS400
- Facilité de communication (Ecran d’affichage, SMS)
- Visualisation simple et rapide de l’état de santé du SI
2008 : Choix de IBM TIVOLI Monitoring
Principaux critères du choix ITM :
- Prise en charge totale des serveurs OS400
- Gestion intelligente des licences pour les serveurs
virtuels et les bases de données
- Très peu de prestation extérieure
2009 : Déploiement de ITM
chez LISI AUTOMOTIVE
Installation de l’architecture des serveurs physiques
avec PRA préconisé par IBM
Définition du standard de supervision basé sur l’expérience
Déploiement de 120 agents
Définition des vues
Ajustement des agents universels
MeO SMS, Ecrans de supervision
Formations pour l’équipe d’exploitation
2009 : Déploiement de ITM
chez LISI AUTOMOTIVE
La supervision remonte toutes les informations. Fini le
bricolage !!!
Il faut intégrer dans le plan projet le nettoyage de son
infrastructure
Taux de fragmentation et d’occupation des tablespaces
Taux d’occupation des disques
Gestion des changements
Fausses erreurs dans les logs
Etat des services Windows
…
Bénéfices immédiats
- Vision immédiate de l’état du SI. Plus besoin de vérifier
ce qui fonctionne. => Economie directe de 0,5 ETP.
- Vision complète des Datacenter (Software, système,
hardware, onduleur, T°, humidité). => 24/24 7/7
Que s’est-il passé ce WE qui a généré une erreur ?
- Information en temps réel (Affichage, SMS) => Réactivité,
pro-activité = Augmentation immédiate du taux de
disponibilité.
- Amélioration de la polyvalence => L’arrêt d’une application
UNIX peut être réalisé en un clic depuis ITM.
Cas concret :
Alerte du taux d’occupation d’un file système à 91%
L’analyse rapide de l’historique du taux d’occupation a
permis de déceler une augmentation anormale du taux
d’occupation du file système. => Passage de 52% à 91% en
72 heures.
Cause : Procédure qui bouclait
En temps normal nous aurions simplement augmenter
l’espace disque !!! Ensuite nous aurions du gérer la
saturation du file système (Batchs en erreur, éditions
impossibles, etc…)
Cas concret :
Vendredi 7/05/2010 : Coupure électrique furtive au
passage de relais des climatisations (maître / esclave).
Toutes les climatisations en stand by.
Alerte SMS le 08/05/10 pour défaut de température
(+15°C en 5 heures)
Grace au SMS ITM nous avons éviter le pire
(Arrêt électrique brutal, incendie ???)
Exemple de vue ITM :
Supervision des salles informatiques
Exemple de vue ITM :
Vue logique de l’ERP
Exemple de vue ITM :
Etat de santé de l’ERP : Agir avant que
les utilisateurs soient impactés.