Sujet détaillé - Maison de la Simulation

Transcription

Sujet détaillé - Maison de la Simulation
 Formulaire de proposition de sujet de thèse
Titre :
Méthodes parallèles et reparties intelligentes utilisant un paradigme de programmation multiniveaux pour le calcul exascale
Intelligent Distributed and Parallel Methods using a multilevel programming paradigm for
exascale computing
Mots clés :
Exascale, calcul parallèle et réparti, algèbre linéaire, YML, XMP, méthodes hybrides
Exascale, parallel and distributed computing, linear algebra, YML, XMP, hybrid methods
Description du sujet :
La barrière des 10 petaflops fut franchie en novembre 2011 et celle des 100 petaflops est en
vue. A la fin de cette thèse les premières machines exascale devraient être annoncées. Le prix
« Gordon Bell » de la dernière conférence « supercomputing » fut attribué à une équipe pour
une application ayant obtenu plusieurs petaflops soutenus. Nous sommes donc actuellement
déjà bien engagés dans l’ère du petaflop pour de réelles applications et nous menons des
recherches sur la programmation des machines exaflopiques à venir. Il est désormais admis
que la programmation de ces futures machines va devoir évoluer fortement. En particulier, nous
avons montré qu’une programmation à plusieurs niveaux est une voie efficace pour la
programmation de telles machines, mixant plusieurs langages de hauts niveaux. Une
programmation utilisant le langage YML, proposé dès 2000, pour décrire des graphes de
composants utilisant des langages PGAS chacun a montré son intérêts sur plusieurs machines,
comme GRID5000 en France, Hooper aux USA et « K » et T2K au Japon. Plusieurs
expérimentations de programmation YML-XMP furent menées (XMP est le langage choisi par le
Japon pour son projet Exascale) et on montré une accélération en utilisant YML-XMP comparé
à XMP seul ; en particulier en prenant des méthodes de Krylov hybrides comme exemple.
Le sujet de doctorat que nous proposons s’inscrit dans ce contexte et concerne donc les
méthodes de Krylov Hybrides intelligente pour le calcul exascale. L’objectif principal est de
mixer plusieurs auto-tunings et de proposer une stratégie intelligente pour que les paramètres
soient changés lors de l’exécution pour minimiser le nombre d’itération, le temps des itérations
et l’énergie consommée. Pour cela nous proposerons alors une méthode ERAM intelligente,
que nous généraliserons en proposant une méthode MERAM intelligente.
Nous proposons alors d’étudier d’autres méthodes de Krylov Hybrides Asynchrones autoparamétrées pour les machines post-petascales et les futures machines exascales ; Nous
étudierons ainsi la méthode hybride GMRES/MERAM/LS permettant de résoudre un système
linéaire de très grande taille en le préconditionnant en utilisant une approximation des valeurs
propres dominantes calculées en parallèle. Ces méthodes hybrides permettent de limiter la
taille des communications et possèdent des propriétés de tolérance aux pannes. Il sera possible
d’utiliser un réseau de superordinateurs qui se met en place à travers le monde dans le cadre
d’une collaboration qui devrait être finalisée d’ici peu avec le laboratoire A*star de Singapour.
En particulier, il devra être :



étudié les aspects mathématiques de ces méthodes pour essayer de proposer de
nouveaux paramètres à modifier lors de l’exécution, et surtout de nouvelles manières
d’évaluer l’évolution des paramètres à modifier dynamiquement. De nouvelles stratégies
d’auto-paramétrage pourront alors être proposées. Le mixage de l’auto-tunning de
plusieurs paramètres sera étudié expérimentalement et il sera proposé une heuristique.
Dans le cas des méthodes hybrides, l’heuristique proposée devra être adaptée et il sera
proposé une méthode ou les choix seront fait à l’aide de calculs asynchrones
supplémentaires permettant d’obtenir une méthode de Krylov « intelligente » pouvant
prendre des décisions lors des calculs ; et possédant un apprentissage selon les
exécutions et expérimentations précédentes.
Des expérimentations sur plusieurs machines seront réalisées ; dans le cadre de nos
collaborations et aussi en faisant, si nécessaire, une demande auprès de PRACE pour
avoir accès au plus puissantes machines du moment.
PhD subject description:
The 10 petaflops barrier was crossed on November 2011 and the 100 petaflops one is close
ahead. At the end of this PhD, the first exascale computers would be announced.
The “Gordon Bell” award of the last « supercomputing » conference was awarded to an
application performing several sustained petaflops. Indeed, we are now really on the petascale
area for end-user applications and our researches targeted future exascale programming and
computing. Nevertheless, it is now accepted that the programming of those future machines
would have to involve significantly in the next years. In particular, we have to develop a
multilevel programming paradigm, which would be an efficient programming model for such
machines, mixing several high level languages. A programming paradigm using YML,
introduced as soon as 2000, to describe graphs of components using PGAS languages, already
proves its efficiency on several machines worldwide (such as GRID5000 in France, Hopper in
USA, “K” and “T2K” in Japan). Several YML-XMP experiments were evaluated (XMP is the
PGAS languages selected by Japan for its exascale project) and demonstrated good speedups
using YML_XMP compared to XMP alone; especially with hybrid Krylov methods as example.
The PhD subject we proposed fits within this research context and it concerns smart hybrid
Krylov methods for exascale computing. The aim of this PhD is to mix several auto-tuning
strategies to optimize parameters at runtime. The goal is to minimize the number of iterations,
the duration of each iteration and the consumed energy. To reach this goal, we will propose an
intelligent ERAM method, and we will generalize with an intelligent MERAM method.
We will propose to study others auto-tuned asynchronous hybrid Krylov methods for postpetascale and future exascale computers. Then, we will study, as an example, the hybrid
GMRES/MERAM/LS method, allowing to solve a large non-Hermitian linear system,
preconditonned using approximated dominant eigenvalues computed in parallel. These hybrid
methods allow limiting the size of the communications and have fault tolerant properties. We
would target a worldwide network of supercomputers, which is developing between A*star
supercomputing in Singapore, the Tokyo Institute of Technologies in Japan and supercomputing
centres in USA and Europe.
The following researches would be developed:



Analysis of mathematical aspects of these Krylov methods, to propose new
parameters to modify at runtime, and new evaluations of evolution of the parameters
we want to dynamically modified. Several auto-tuning strategies would be
introduced. Mixing auto-tuning of several parameters will be experimentally studied
and heuristics would be proposed.
In the case of hybrid methods, the proposed heuristics would be adapted and it
would be introduced a method which may generate extra asynchronous computing
to build intelligent methods; and developing learning strategies with respect to the
runs and the former experiments.
Experiments on several computers will be developed, using accelerators such as
GPU and/or MIC; including probably a worldwide network of supercomputers.
Encadrant :
Nom, prénom : PETITON, Serge
Organisme : CNRS/ USR 3441-Maison de la simulation et Université de Lille 1
Adresse : Bâtiment DIGITEO/565, 91191 Gif-sur-Yvette cedex
Téléphone : +33 1 69 08 58 45
Mél : [email protected]
Etes-vous titulaire d’une HDR ou d’un doctorat d’Etat (oui, non, en cours) ? OUI
Nombre de doctorants qui seront encadrés au cours de la prochaine année ? 1,5 novembre
2015
Nombre de thèses déjà encadrées ? 20 à ce jour, 21 en novembre 2015 (et 3 HDR)
Etablissement d’inscription potentiel ? U. de Lille 1, Sciences et Technologies
Ecole doctorale potentielle ? Lille 1, Informatique
Ce sujet est-il susceptible de faire l’objet d’un co-financement entre la Maison de la
Simulation et un autre établissement : Oui - Non (à l’étude) Le cas échant, établissement partenaire : CNRS (à confirmer)

Documents pareils