Process sans job et problèmes de ménage à la fin du job
Transcription
Process sans job et problèmes de ménage à la fin du job
Process sans job et problèmes de ménage à la fin du job Les problèmes du monitoring des jobs et certaines solutions Plan Qu'est-ce que le monitoring des process d'un job par un scheduler de batch ? Les problèmes typiques Discussions Julien Devémy / Process des jobs 22/03/07 2 Monitoring des process ? Buts : – comptabiliser la consommation des différentes ressources (CPU, mémoire...) par job – pouvoir tuer le job Méthode : – ps ou parcours du /proc à intervalle régulier Julien Devémy / Process des jobs 22/03/07 3 Problème 1 Process trop courts qui passent entre le gouttes – Ex : process durant 3 minutes si période de monitoring de 5 minutes ►Comptabilité incorrecte ! Julien Devémy / Process des jobs 22/03/07 4 Problème 1 Solution : – Diminuer au maximum la période de monitoring Dans BQS : – 2 périodes différentes : • monitoring period • report period ►Monitoring précis sans charge supplémentaire Julien Devémy / Process des jobs 22/03/07 5 Problème 2 Processus orphelins en cours de job – Ex : fils de 1 après double fork ►Comptabilité incorrecte et risque de laisser des processus après la fin du job ! Julien Devémy / Process des jobs 22/03/07 6 Problème 2 Solution : – Ne pas se fier uniquement à la hiérarchie des process – Gérer les concepts de PGID et SID Dans BQS : – Prise en compte de ces concepts pour le monitoring des jobs Julien Devémy / Process des jobs 22/03/07 7 Problème 3 Processus changeant de SID/PGID ►Comptabilité incorrecte et risque de laisser des processus après la fin du job ! Julien Devémy / Process des jobs 22/03/07 8 Problème 3 Solution 1: – N'autoriser qu'un seul job par utilisateur par worker-node ►Très limitatif Solution 2: – Effectuer un ménage asynchrone (cron...) : tuer tous les process sans job de l'utilisateur ►Précautions à prendre Julien Devémy / Process des jobs 22/03/07 9 Problème 4 Le job s'est apparemment bien terminé mais a laissé des processus orphelins ►Utilisation « pirate » possible de la ferme (consciemment ou non) Julien Devémy / Process des jobs 22/03/07 10 Problème 4 Solution 1: – Faire le ménage « total » à la fin de tous les jobs ►Pourquoi pas ? Solution 2: – Ménage asynchrone (cf Problème 3) Julien Devémy / Process des jobs 22/03/07 11 Questions et discussions ? Julien Devémy / Process des jobs 22/03/07 12