Procédure lors d`une coupure de lien
Transcription
Procédure lors d`une coupure de lien
Procédure lors d’une coupure de lien Une fois déployé, les liens des clients sont mis sous surveillance. Un système de supervision basé sur Nagios nous alerte en cas d’une anomalie en nous remontant une information sur notre interface web ou bien par mail. Exemple mail d’alerte : Exemple d’alerte sur l’interface web : Lorsqu’une alerte nous est remontée, nous prenons immédiatement le problème en charge et nous réalisons des tests de diagnostic tout en suivant la procédure adéquate afin de résoudre l’incident dans les meilleurs délais. Procédure : Lorsqu’il s’agit d’une coupure de lien, le système de supervision nous remonte une alerte sur notre interface web. Voyants d’alerte (Rouge = incident) Type de lien (ADSL, SDSL, FO) Site du client impacté Nom de l’entreprise Equipement affecté Pour traiter les incidents et appliquer si besoin les actions correctrices nécessaires nous devons suivre les étapes suivantes : 1) Il faut constamment surveiller la page de la supervision afin de pouvoir traiter les problèmes dès qu'ils apparaissent. Si l'alerte à disparu au bout de 5 minutes, nous devons abandonner le traitement de l’incident. 2) Si l’alerte, n’a pas disparu au bout de 5 minutes, il faut réaliser les actions suivantes : 1) Effectuer un PING du routeur en se connectant sur le serveur de supervision via l’outil Putty Si le routeur répond au Ping, abandonner le traitement. Si le routeur ne répond pas au ping, passé à l’étape n°3. 3) Si le routeur ne répond pas, réalisé les actions suivantes : a) Créer un ticket d'incident via la page de supervision des liens Cliquer sur l’icône d’alerte Remplir le ticket avec les informations adéquates Indiquer les actions réalisées et les résultats qui en découlent Une fois créer, le ticket d’incident sera enregistrer sur notre base de donnée et accessible via notre interface web. Service impacté Récapitulatif de l’incident Affectation de l’incident (Niveau 1, 2 ou 3) Etat du ticket (En cours ou terminé) b) Appeler le contact sur site ou le référent technique du client afin de vérifier si l'alerte n'est pas générée par le client (coupure électrique, maintenance etc.) ou une autre cause. Pour chaque client, nous avons une page contenant les coordonnées des personnes à contacter en cas d’un incident. c) Effectuer des tests avec le client. Une fois en relation avec le client, il faut faire redémarrer les équipements (Modem + Routeur). Si ce dernier refuse, il faudra impérativement l’indiquer dans le ticket d’incident. En revanche, s’il procède au redémarrage des équipements il faut attendre environ 2 à 3 minutes puis, vérifier si le routeur est de nouveau joignable en faisant un test de ping. Si le routeur n’est toujours pas joignable, il faudra faire avec le client une vérification du câblage (cf. schémas de raccordement). Si le câblage est correcte, vérifier avec le client si il y’a de la synchronisation sur son lien. Pour ce faire il suffit de vérifier l’état du voyant de synchro sur le modem ADSL ou SDSL. Lien ADSL : Voyant DSL fixe = Synchronisation ok Voyant DSL clignotant ou éteint = Pas de synchronisation Lien SDSL SFR : Voyant UPLINK fixe = Synchronisation ok Voyant UPLINK clignotant, rouge ou éteint = Pas de synchronisation Lien SDSL Orange : Voyant WAN fixe = Synchronisation ok Voyant WAN clignotant, rouge ou éteint = Pas de synchronisation Si le lien en question est synchronisé demander au client de redémarrer le routeur. Ensuite vérifier avec lui si le routeur est joignable depuis le LAN en effectuant via un invité de commande un ping de la passerelle du poste. Si le routeur n’est pas joignable, faudra escalader le ticket d’incident en Niveau 2 afin de remplacer l’équipement obsolète. En revanche, si le routeur est joignable et qu’il n y a pas de synchronisation sur le modem, passer à l’étape 4. 4) Ouvrir une signalisation auprès de la boucle locale (SFR, FT…) Lorsqu’un lien ne récupère pas la synchronisation une fois le redémarrage des équipements effectué, il faut ouvrir un ticket d’incident auprès de la boucle locale afin qu’il traite et corrige l’incident. Indiquer ensuite, le Numéro de ticket au client et lui indiquer que nous allons procéder à d'autres tests et que nous le recontacterons dans les meilleurs délais. Si le client n'est pas joignable, envoyer un mail de Détection d'Incident, et tenter de le rappeler à intervalles réguliers (toutes les 30 minutes). Effectuer ensuite diverses actions au niveau opérateur (Reset du port DSLAM, Test de synchronisation, Test Selt etc.) et ouvrir ou relancer le ticket d’incident correspondant à la liaison. 5) Indiquer sur le ticket d’incident en interne toutes les actions qui ont été réalisées ainsi que leurs résultats. OBLIGATOIRE : Récapitulatif à copier coller dans le ticket Clevernetwork avec les réponses Redémarrage modem : oui / non Synchro modem côté client : oui / non Synchro modem côté DSLAM : oui / non Ping routeur : oui / non Vérification câblage : oui / non Reset de port DSLAM : oui / non N° Ticket opérateur : Envoyer ensuite, un compte rendu par mail au client en lui indiquant les actions réalisées et à venir.