présentation

Transcription

présentation
Énergie pour le HPC
Collaboration UVSQ - Université de Strasbourg
Sommaire
●
L'énergie à l'UVSQ
●
Énergie et HPC
●
Collaboration avec Strasbourg
2
L'énergie à l'UVSQ
3
L'énergie à l'UVSQ
●
Débuts dans le lab Exascale (ECR)
–
●
J. C. Beyler, W. Jalby, ...
Désormais au PRiSM, projet PerfCloud
–
3 post-docs
–
1 doctorant
–
3 ingénieurs de recherche
4
L'énergie à l'UVSQ
●
●
Optimisations logicielles
–
Pour l'énergie
–
Complémentarité avec l'optimisation de performance
–
Liens naturels avec Exascale Computing Research
HPC : cible privilégiée
5
L'énergie à l'UVSQ
●
Contrôleur DVFS (FoREST)
●
Mesure du potentiel du DVFS (UtoPeak)
●
Consolidation de charge extrême
–
●
Contexte cloud
Contrôle du refroidissement
6
Énergie et HPC
7
Énergie et HPC
●
Actuellement en France, 1 W.an ~= 1 €
●
Tianhe-2 = 17,8 MW (#1 top500)
8
Énergie et HPC
●
Actuellement en France, 1 W.an ~= 1 €
●
Tianhe-2 = 17,8 MW (#1 top500)
–
●
+ de 10M€ par an pour l'électricité
Intérêt de l'optimisation énergétique
9
Solutions matérielles
●
●
Optimisation du PUE (eTot / eIT)
–
Refroidissement à eau chaude
–
Nouvelles générations de processeurs
–
...
Technologies futures
–
3D-chips
–
Futures RAM
–
Near-threshold computing
–
...
10
Solutions matérielles
●
Solutions matérielles efficaces
–
●
SuperMUC (PUE = 1,15)
Solutions futures très prometteuses
–
Disponibilité incertaine
–
Investissement initial important
11
Nouveau != + efficace
Savings of AVX over SSE
35
30
25
20
%
15
Time
Energy
10
5
0
gcc
namd
gromacs
omnetpp
sjeng
hmmer
astar
h264ref
gobmk
zeusmp
povray
tonto
xalancbmk
soplex
-5
-10
-15
12
Solutions logicielles
●
Éliminer les pertes d'énergie inutiles
–
●
Changer l'ampoule vs éteindre la lumière en sortant
Niveau logiciel
–
Investissement initial = 0€
–
Disponible aujourd'hui
13
Solutions logicielles
●
e=Pxt
–
Énergie et performance sont liées
1. Optimisez pour la performance (t)
(Nous pouvons vous aider)
2. Considérez les optimisations spécifiques (P)
(Nous pouvons vous aider)
14
Coût de l'optimisation énergétique
●
Échange performance contre énergie
–
●
La fin de la performance à tout prix ?
Perdre 5 % de performance, est-ce grave ?
15
Coût de l'optimisation énergétique
●
Échange performance contre énergie
–
●
La fin de la performance à tout prix ?
Perdre 5 % de performance, est-ce grave ?
–
1 H 03 vs. 1 H 00
–
Tianhe-2 : 10 % énergie = + de 1M€ par an
●
= 10 % de serveurs en plus ?
16
Collaboration avec Unistra
17
DVFS
●
Dynamic Voltage and Frequency Scaling (DVFS)
–
Changement de fréquence CPU
●
Estimation du potentiel (UtoPeak)
●
Contrôle pour l'énergie (FoREST)
18
FoREST
●
Hyp : P(fi) / P(fj) indépendant du programme
●
Mesure des P(fi) offline
●
Évaluation périodique des fréquences (runtime)
–
●
Impact sur IPS
Déduction de la fréquence idéale
–
Économie d'énergie maximale
19
FoREST
●
Fréquence réduite pour les phases mémoire
●
Slowdown maximal paramétrable
●
Économie au niveau du nœud
●
Compatible avec x86_64 récents (>= SandyBridge)
–
●
+ Xeon Phi
Open source !
http://code.google.com/p/forest-dvfs
20
Collaboration avec Strasbourg
●
Strasbourg = centre pilote
–
●
Nouveau super calculateur SandyBridge
But de la collaboration
–
Extension de FoREST
–
Déploiement expérimental
–
Validation
21
Économies CPU – 5% slowdown
110%
Relative energy consumption
100%
90%
ondemand
beta adaptive
80%
FoREST
70%
60%
50%
bt.C
cg.C
ep.C
ft.C
is.C
lu.C
mg.C
sp.C
22
Système – 5% slowdown
110%
Relative energy consumption
100%
90%
ondemand
beta adaptive
80%
FoREST
70%
60%
50%
bt.C
cg.C
ep.C
ft.C
is.C
lu.C
mg.C
sp.C
23
Temps d'exécution
110%
Relative execution time
105%
ondemand
beta adaptive
100%
FoREST
95%
90%
bt.C
cg.C
ep.C
ft.C
is.C
lu.C
mg.C
sp.C
24
Économies CPU – 100% slowdown
110%
Relative energy consumption
100%
90%
ondemand
powersave
80%
beta adaptive
FoREST
70%
60%
50%
bt.C
cg.C
ep.C
ft.C
is.C
lu.C
mg.C
sp.C
25
Système – 100% slowdown
150%
140%
Relative energy consumption
130%
120%
110%
ondemand
powersave
100%
beta adaptive
FoREST
90%
80%
70%
60%
50%
bt.C
cg.C
ep.C
ft.C
is.C
lu.C
mg.C
sp.C
26
FoREST aujourd'hui
●
Économies d'énergie
●
Ralentissement paramétrable
●
Support des CPU >= SandyBridge + Xeon Phi
●
Prototype fonctionnel
27
FoREST demain
●
Exploitation du load imbalance MPI
–
●
Stratégie en cours de conception
Déploiement et évaluation
–
Strasbourg = site pilote
–
Ouvert à d'autres sites ensuite
–
Chaque site est spécifique
28
Merci pour votre attention
Questions ?
http://code.google.com/p/forest-dvfs
29