itm lisi automotive
Transcription
itm lisi automotive
Surveillance du SI LISI AUTOMOTIVE par IBM TIVOLI MONITORING Ghislain Gauthier Responsable Systèmes et Infrastructure LISI AUTOMOTIVE Expert de la fixation et des composants de liaison mécaniques dans l'industrie automobile 3000 Collaborateurs, 21 sites, 385 M€ CA 2008 Système d’informations LISI AUTOMOTIVE 120 Serveurs Physiques ou virtuels 6 baies de stockages EMC, IBM avec SVC 1300 PCs 110 stations de CAO Equipe Technique 800 Téléphones 1 Administrateur réseau 15 PABX 1 Téléphoniste 85 switchs 1 Administrateur OS400 … 1 Administrateur UNIX / AIX, LINUX, OS400, Windows DBA Oracle CITRIX, VMWARE, 1 Administrateur Windows CISCO, HP, CHECKPOINT, TREND, 3 Techniciens bureautiques ORACLE, SQL SERVER MOVEX, BO NETWORKER, ARCSERVE… 2007 : Pourquoi un outil de supervision ? - 0,5 ETP pour surveiller l’architecture (300 points de contrôle quotidien) - Surveillance semi automatisée et incomplète - Faible réactivité dans un flot d’alertes - Pas de pro activité - Difficulté à connaitre l’état de santé du SI Comment s’assurer que le système d’informations LISI AUTOMOTIVE est bien disponible ? 2008 : Choix de IBM TIVOLI Monitoring Consultation des outils de supervision du marché MOM, HP OPEN VIEW, IBM TIVOLI, NAGIOS Obligations du produit : - Pas de spécifique par rapport à l’architecture - Pas de développement interne - Prise en compte complète des serveurs OS400 - Facilité de communication (Ecran d’affichage, SMS) - Visualisation simple et rapide de l’état de santé du SI 2008 : Choix de IBM TIVOLI Monitoring Principaux critères du choix ITM : - Prise en charge totale des serveurs OS400 - Gestion intelligente des licences pour les serveurs virtuels et les bases de données - Très peu de prestation extérieure 2009 : Déploiement de ITM chez LISI AUTOMOTIVE Installation de l’architecture des serveurs physiques avec PRA préconisé par IBM Définition du standard de supervision basé sur l’expérience Déploiement de 120 agents Définition des vues Ajustement des agents universels MeO SMS, Ecrans de supervision Formations pour l’équipe d’exploitation 2009 : Déploiement de ITM chez LISI AUTOMOTIVE La supervision remonte toutes les informations. Fini le bricolage !!! Il faut intégrer dans le plan projet le nettoyage de son infrastructure Taux de fragmentation et d’occupation des tablespaces Taux d’occupation des disques Gestion des changements Fausses erreurs dans les logs Etat des services Windows … Bénéfices immédiats - Vision immédiate de l’état du SI. Plus besoin de vérifier ce qui fonctionne. => Economie directe de 0,5 ETP. - Vision complète des Datacenter (Software, système, hardware, onduleur, T°, humidité). => 24/24 7/7 Que s’est-il passé ce WE qui a généré une erreur ? - Information en temps réel (Affichage, SMS) => Réactivité, pro-activité = Augmentation immédiate du taux de disponibilité. - Amélioration de la polyvalence => L’arrêt d’une application UNIX peut être réalisé en un clic depuis ITM. Cas concret : Alerte du taux d’occupation d’un file système à 91% L’analyse rapide de l’historique du taux d’occupation a permis de déceler une augmentation anormale du taux d’occupation du file système. => Passage de 52% à 91% en 72 heures. Cause : Procédure qui bouclait En temps normal nous aurions simplement augmenter l’espace disque !!! Ensuite nous aurions du gérer la saturation du file système (Batchs en erreur, éditions impossibles, etc…) Cas concret : Vendredi 7/05/2010 : Coupure électrique furtive au passage de relais des climatisations (maître / esclave). Toutes les climatisations en stand by. Alerte SMS le 08/05/10 pour défaut de température (+15°C en 5 heures) Grace au SMS ITM nous avons éviter le pire (Arrêt électrique brutal, incendie ???) Exemple de vue ITM : Supervision des salles informatiques Exemple de vue ITM : Vue logique de l’ERP Exemple de vue ITM : Etat de santé de l’ERP : Agir avant que les utilisateurs soient impactés.