Etude et conception de mécanismes de contrôle pour la
Transcription
Etude et conception de mécanismes de contrôle pour la
Étude et conception de mécanismes de contrôle pour la gestion de workflows autonomiques en environnement Cloud Eddy Caron (ENS-Lyon. MCF HDR) et Eric Rutten (CR Inria) Octobre 2016 1 Contexte Il existe de nombreux moteurs de workflow, tel que pegasus[6], qui permettent une gestion statique. Ces mécanismes ne permettent cependant pas d’atteindre le niveau de performance et de flexibilité attendu, c’est pourquoi une approche dynamique [5] est nécessaire. Le calcul autonomique [2] est une approche visant à automatiser l’administration de systèmes au moyen de boucles de contrôle qui, sur la base de mesures et événements captés dans le système, mettent à jour un modèle représentation la connaissance qu’on a du système, et disposent de fonctions de décision qui déterminent des actions de reconfiguration ou adaptation à appliquer sur le système via son API, de façon à appliquer une politique ou stratégie de gestion définie. Les modèles et fonctions de décision peuvent être conçus selon les méthodes et outils de l’automatique [4] pour avoir des assurances de bon comportement du systèmes contrôlé. Le caractère dynamique doit être envisagé à différents niveaux, que ce soit dans la paramétrisation et le déploiement des tâches elles-mêmes que dans la gestion des ressources et des communications. Selon Lee et al. [3], la gestion dynamique des workflows peut se décomposer en deux mécanismes, le placement (mapping) et l’ordonnancement (scheduling). Un des défis de stage de M2 sera de proposer, les fondations d’une approche à base de contrôle afin de répondre aux problématiques de ce contexte et cela dans un environnement de type Cloud. 2 2.1 Objectif Résultats attendus Le travail du stagiaire sera la mise en œuvre d’un système de contrôle dédié aux workflows autonomiques. Nous avons distingué plusieurs facteurs à prendre en considération dans le processus de contrôle : Ordonnancement et gestion de données : l’ordonnancement est un sujet complexe dans le cadre des workflows. Nous étudierons comment la boucle de contrôle peut aider aux décisions d’ordonnancement. On pourra exprimer des contraintes liées au placement des données transitant dans le workflow. La moldabilité : Une des propriétés des workflows que nous étudions est la moldabilité des tâches (leur capacité à modifier leur taille (le nombre de processeurs) avant le début de l’exécution). La malléabilité : Dans le cas de résultats probants avec les tâches moldables nous pourrons pousser l’étude jusqu’à la prise en compte des tâches malléables (le nombre de processeur peut varier pendant l’exécution). 1 La gestion du budget : Le placement (mapping) des différentes tâches dans un environnement Cloud s’accompagne du coût de la location des instances. Un budget pourra être associé à un workflow ou à un ensemble de workflows et devra par conséquent être pris en compte dans la boucle de contrôle. La résilience : Le contrôle mis en œuvre devra être capable de gérer les pannes des nœuds. Le terme panne s’entend au sens large, c’est-à-dire qu’il peut également s’agir de la perte de réservation dans un environnement Cloud ou d’un budget arrivé à échéance. Le travail consistera, graduellement selon cet ensemble de facteurs, à les analyser en termes des observations et actions disponibles dans le système pour les gérer, avec formulation des objectifs de contrôle dans ces métriques, puis à concevoir des contrôleurs à base de modèles qui défininissent les fonctions de décision, et à les mettre en /oeuvre. Notons que si nos avancées nous permettent d’aller jusqu’à une validation expérimentale nous pourrons disposer du moteur de workflow disponible au sein de l’intergiciel Diet 1 [1] proposant une solution efficace et fiable au déploiement d’applications HPC (High Performance Computing) au travers d’environnement hétérogènes allant du simple PC aux infrastructures Cloud en passant par les machines parallèles. La maı̂trise de ce logiciel par l’équipe accueillant le stagiaire en fait un choix privilégié mais non exclusif. Références [1] Eddy Caron and Frédéric Desprez. DIET : A scalable toolbox to build network enabled servers on the grid. International Journal of High Performance Computing Applications, 20(3) :335–352, 2006. [2] J. O. Kephart and D. M. Chess. The vision of autonomic computing. IEEE Computer, 36(1) :41–50, January 2003. [3] Kevin Lee, Rizos Sakellariou, Norman W Paton, and Alvaro AA Fernandes. Workflow adaptation as an autonomic computing problem. In Proceedings of the 2nd workshop on Workflows in support of large-scale science, pages 29–34. ACM, 2007. [4] Marin Litoiu, Mary Shaw, Gabriel Tamura, Norha M. Villegas, Hausi A. Müller, Holger Giese, and Eric Rutten. What can control theory teach us about assurances in self-adaptive software systems ? In Rogério de Lemos, David Garlan, Carlo Ghezzi, and Holger Giese, editors, Software Engineering for Self-Adaptive Systems, Lecture Notes in Computer Science. Springer Berlin Heidelberg, 2016. [5] Mustafizur Rahman. Autonomic Workflow Management System for Grid Computing. PhD thesis, Department of Computer Science and Software Engineering. The University of Melbourne., Australia, August 2010. [6] Gurmeet Singh, Ewa Deelman, Gaurang Mehta, Karan Vahi, Mei-Hui Su, G. Bruce Berriman, John Good, Joseph C. Jacob, Daniel S. Katz, Albert Lazzarini, Kent Blackburn, and Scott Koranda. The pegasus portal : web based grid computing. In SAC ’05 : Proc. of the 2005 ACM symposium on Applied computing, pages 680–686, New York, NY, USA, 2005. ACM Press. 1. http ://graal.ens-lyon.fr/DIET 2