Procédure lors d`une coupure de lien

Transcription

Procédure lors d`une coupure de lien
Procédure lors d’une coupure de lien
Une fois déployé, les liens des clients sont mis sous surveillance. Un système de
supervision basé sur Nagios nous alerte en cas d’une anomalie en nous remontant une
information sur notre interface web ou bien par mail.
Exemple mail d’alerte :
Exemple d’alerte sur l’interface web :
Lorsqu’une alerte nous est remontée, nous prenons immédiatement le problème en
charge et nous réalisons des tests de diagnostic tout en suivant la procédure adéquate
afin de résoudre l’incident dans les meilleurs délais.
Procédure :
Lorsqu’il s’agit d’une coupure de lien, le système de supervision nous remonte une alerte
sur notre interface web.
Voyants d’alerte
(Rouge = incident)
Type de lien
(ADSL, SDSL, FO)
Site du client
impacté
Nom de
l’entreprise
Equipement
affecté
Pour traiter les incidents et appliquer si besoin les actions correctrices nécessaires nous
devons suivre les étapes suivantes :
1) Il faut constamment surveiller la page de la supervision afin de pouvoir traiter les problèmes
dès qu'ils apparaissent.
Si l'alerte à disparu au bout de 5 minutes, nous devons abandonner le traitement
de l’incident.
2) Si l’alerte, n’a pas disparu au bout de 5 minutes, il faut réaliser les actions suivantes :
1) Effectuer un PING du routeur en se connectant sur le serveur de supervision via l’outil
Putty
Si le routeur répond au Ping, abandonner le traitement.
Si le routeur ne répond pas au ping, passé à l’étape n°3.
3) Si le routeur ne répond pas, réalisé les actions suivantes :
a) Créer un ticket d'incident via la page de supervision des liens
Cliquer sur
l’icône d’alerte
Remplir le ticket avec
les informations
adéquates
Indiquer les actions réalisées et
les résultats qui en découlent
Une fois créer, le ticket d’incident sera enregistrer sur notre base de donnée et accessible via
notre interface web.
Service impacté
Récapitulatif
de l’incident
Affectation de l’incident
(Niveau 1, 2 ou 3)
Etat du ticket (En
cours ou terminé)
b) Appeler le contact sur site ou le référent technique du client afin de vérifier si l'alerte n'est
pas générée par le client (coupure électrique, maintenance etc.) ou une autre cause.
Pour chaque client, nous avons une page contenant les
coordonnées des personnes à contacter en cas d’un incident.
c) Effectuer des tests avec le client.
Une fois en relation avec le client, il faut faire redémarrer les équipements (Modem + Routeur).
Si ce dernier refuse, il faudra impérativement l’indiquer dans le ticket d’incident.
En revanche, s’il procède au redémarrage des équipements il faut attendre environ 2 à 3
minutes puis, vérifier si le routeur est de nouveau joignable en faisant un test de ping.
Si le routeur n’est toujours pas joignable, il faudra faire avec le client une vérification du
câblage (cf. schémas de raccordement).
Si le câblage est correcte, vérifier avec le client si il y’a de la synchronisation sur son lien. Pour
ce faire il suffit de vérifier l’état du voyant de synchro sur le modem ADSL ou SDSL.
Lien ADSL :
Voyant DSL fixe = Synchronisation ok
Voyant DSL clignotant ou éteint = Pas de synchronisation
Lien SDSL SFR :
Voyant UPLINK fixe = Synchronisation ok
Voyant UPLINK clignotant, rouge ou éteint = Pas de synchronisation
Lien SDSL Orange :
Voyant WAN fixe = Synchronisation ok
Voyant WAN clignotant, rouge ou éteint = Pas de synchronisation
Si le lien en question est synchronisé demander au client de redémarrer le routeur. Ensuite
vérifier avec lui si le routeur est joignable depuis le LAN en effectuant via un invité de
commande un ping de la passerelle du poste.
Si le routeur n’est pas joignable, faudra escalader le ticket d’incident en Niveau 2 afin de
remplacer l’équipement obsolète.
En revanche, si le routeur est joignable et qu’il n y a pas de synchronisation sur le modem,
passer à l’étape 4.
4) Ouvrir une signalisation auprès de la boucle locale (SFR, FT…)
Lorsqu’un lien ne récupère pas la synchronisation une fois le redémarrage des équipements
effectué, il faut ouvrir un ticket d’incident auprès de la boucle locale afin qu’il traite et corrige
l’incident.
Indiquer ensuite, le Numéro de ticket au client et lui indiquer que nous allons procéder à
d'autres tests et que nous le recontacterons dans les meilleurs délais.
Si le client n'est pas joignable, envoyer un mail de Détection d'Incident, et tenter de le rappeler
à intervalles réguliers (toutes les 30 minutes).
Effectuer ensuite diverses actions au niveau opérateur (Reset du port DSLAM, Test de
synchronisation, Test Selt etc.) et ouvrir ou relancer le ticket d’incident correspondant à la
liaison.
5) Indiquer sur le ticket d’incident en interne toutes les actions qui ont été réalisées ainsi que
leurs résultats.
OBLIGATOIRE : Récapitulatif à copier coller dans le ticket Clevernetwork avec les réponses
Redémarrage modem : oui / non
Synchro modem côté client : oui / non
Synchro modem côté DSLAM : oui / non
Ping routeur : oui / non
Vérification câblage : oui / non
Reset de port DSLAM : oui / non
N° Ticket opérateur :
Envoyer ensuite, un compte rendu par mail au client en lui indiquant les actions réalisées et à
venir.