Process sans job et problèmes de ménage à la fin du job

Transcription

Process sans job et problèmes de ménage à la fin du job
Process sans job et problèmes de
ménage à la fin du job
Les problèmes du monitoring des jobs
et certaines solutions
Plan
 Qu'est-ce
que le monitoring des process
d'un job par un scheduler de batch ?
 Les
problèmes typiques
 Discussions
Julien Devémy / Process des jobs
22/03/07
2
Monitoring des process ?
 Buts
:
– comptabiliser la consommation des différentes
ressources (CPU, mémoire...) par job
– pouvoir tuer le job
 Méthode
:
– ps ou parcours du /proc à intervalle régulier
Julien Devémy / Process des jobs
22/03/07
3
Problème 1
 Process
trop courts qui passent entre le
gouttes
– Ex : process durant 3 minutes si période de
monitoring de 5 minutes
►Comptabilité incorrecte !
Julien Devémy / Process des jobs
22/03/07
4
Problème 1
 Solution
:
– Diminuer au maximum la période de monitoring
 Dans
BQS :
– 2 périodes différentes :
• monitoring period
• report period
►Monitoring précis sans charge supplémentaire
Julien Devémy / Process des jobs
22/03/07
5
Problème 2
 Processus
orphelins en cours de job
– Ex : fils de 1 après double fork
►Comptabilité incorrecte et risque de laisser
des processus après la fin du job !
Julien Devémy / Process des jobs
22/03/07
6
Problème 2
 Solution
:
– Ne pas se fier uniquement à la hiérarchie des
process
– Gérer les concepts de PGID et SID
 Dans
BQS :
– Prise en compte de ces concepts pour le
monitoring des jobs
Julien Devémy / Process des jobs
22/03/07
7
Problème 3
 Processus
changeant de SID/PGID
►Comptabilité incorrecte et risque de laisser
des processus après la fin du job !
Julien Devémy / Process des jobs
22/03/07
8
Problème 3
 Solution
1:
– N'autoriser qu'un seul job par utilisateur par
worker-node
►Très limitatif
 Solution
2:
– Effectuer un ménage asynchrone (cron...) : tuer
tous les process sans job de l'utilisateur
►Précautions à prendre
Julien Devémy / Process des jobs
22/03/07
9
Problème 4
 Le
job s'est apparemment bien terminé mais
a laissé des processus orphelins
►Utilisation « pirate » possible de la ferme
(consciemment ou non)
Julien Devémy / Process des jobs
22/03/07
10
Problème 4
 Solution
1:
– Faire le ménage « total » à la fin de tous les jobs
►Pourquoi pas ?
 Solution
2:
– Ménage asynchrone (cf Problème 3)
Julien Devémy / Process des jobs
22/03/07
11
Questions et discussions
?
Julien Devémy / Process des jobs
22/03/07
12

Documents pareils