présentation
Transcription
présentation
Énergie pour le HPC Collaboration UVSQ - Université de Strasbourg Sommaire ● L'énergie à l'UVSQ ● Énergie et HPC ● Collaboration avec Strasbourg 2 L'énergie à l'UVSQ 3 L'énergie à l'UVSQ ● Débuts dans le lab Exascale (ECR) – ● J. C. Beyler, W. Jalby, ... Désormais au PRiSM, projet PerfCloud – 3 post-docs – 1 doctorant – 3 ingénieurs de recherche 4 L'énergie à l'UVSQ ● ● Optimisations logicielles – Pour l'énergie – Complémentarité avec l'optimisation de performance – Liens naturels avec Exascale Computing Research HPC : cible privilégiée 5 L'énergie à l'UVSQ ● Contrôleur DVFS (FoREST) ● Mesure du potentiel du DVFS (UtoPeak) ● Consolidation de charge extrême – ● Contexte cloud Contrôle du refroidissement 6 Énergie et HPC 7 Énergie et HPC ● Actuellement en France, 1 W.an ~= 1 € ● Tianhe-2 = 17,8 MW (#1 top500) 8 Énergie et HPC ● Actuellement en France, 1 W.an ~= 1 € ● Tianhe-2 = 17,8 MW (#1 top500) – ● + de 10M€ par an pour l'électricité Intérêt de l'optimisation énergétique 9 Solutions matérielles ● ● Optimisation du PUE (eTot / eIT) – Refroidissement à eau chaude – Nouvelles générations de processeurs – ... Technologies futures – 3D-chips – Futures RAM – Near-threshold computing – ... 10 Solutions matérielles ● Solutions matérielles efficaces – ● SuperMUC (PUE = 1,15) Solutions futures très prometteuses – Disponibilité incertaine – Investissement initial important 11 Nouveau != + efficace Savings of AVX over SSE 35 30 25 20 % 15 Time Energy 10 5 0 gcc namd gromacs omnetpp sjeng hmmer astar h264ref gobmk zeusmp povray tonto xalancbmk soplex -5 -10 -15 12 Solutions logicielles ● Éliminer les pertes d'énergie inutiles – ● Changer l'ampoule vs éteindre la lumière en sortant Niveau logiciel – Investissement initial = 0€ – Disponible aujourd'hui 13 Solutions logicielles ● e=Pxt – Énergie et performance sont liées 1. Optimisez pour la performance (t) (Nous pouvons vous aider) 2. Considérez les optimisations spécifiques (P) (Nous pouvons vous aider) 14 Coût de l'optimisation énergétique ● Échange performance contre énergie – ● La fin de la performance à tout prix ? Perdre 5 % de performance, est-ce grave ? 15 Coût de l'optimisation énergétique ● Échange performance contre énergie – ● La fin de la performance à tout prix ? Perdre 5 % de performance, est-ce grave ? – 1 H 03 vs. 1 H 00 – Tianhe-2 : 10 % énergie = + de 1M€ par an ● = 10 % de serveurs en plus ? 16 Collaboration avec Unistra 17 DVFS ● Dynamic Voltage and Frequency Scaling (DVFS) – Changement de fréquence CPU ● Estimation du potentiel (UtoPeak) ● Contrôle pour l'énergie (FoREST) 18 FoREST ● Hyp : P(fi) / P(fj) indépendant du programme ● Mesure des P(fi) offline ● Évaluation périodique des fréquences (runtime) – ● Impact sur IPS Déduction de la fréquence idéale – Économie d'énergie maximale 19 FoREST ● Fréquence réduite pour les phases mémoire ● Slowdown maximal paramétrable ● Économie au niveau du nœud ● Compatible avec x86_64 récents (>= SandyBridge) – ● + Xeon Phi Open source ! http://code.google.com/p/forest-dvfs 20 Collaboration avec Strasbourg ● Strasbourg = centre pilote – ● Nouveau super calculateur SandyBridge But de la collaboration – Extension de FoREST – Déploiement expérimental – Validation 21 Économies CPU – 5% slowdown 110% Relative energy consumption 100% 90% ondemand beta adaptive 80% FoREST 70% 60% 50% bt.C cg.C ep.C ft.C is.C lu.C mg.C sp.C 22 Système – 5% slowdown 110% Relative energy consumption 100% 90% ondemand beta adaptive 80% FoREST 70% 60% 50% bt.C cg.C ep.C ft.C is.C lu.C mg.C sp.C 23 Temps d'exécution 110% Relative execution time 105% ondemand beta adaptive 100% FoREST 95% 90% bt.C cg.C ep.C ft.C is.C lu.C mg.C sp.C 24 Économies CPU – 100% slowdown 110% Relative energy consumption 100% 90% ondemand powersave 80% beta adaptive FoREST 70% 60% 50% bt.C cg.C ep.C ft.C is.C lu.C mg.C sp.C 25 Système – 100% slowdown 150% 140% Relative energy consumption 130% 120% 110% ondemand powersave 100% beta adaptive FoREST 90% 80% 70% 60% 50% bt.C cg.C ep.C ft.C is.C lu.C mg.C sp.C 26 FoREST aujourd'hui ● Économies d'énergie ● Ralentissement paramétrable ● Support des CPU >= SandyBridge + Xeon Phi ● Prototype fonctionnel 27 FoREST demain ● Exploitation du load imbalance MPI – ● Stratégie en cours de conception Déploiement et évaluation – Strasbourg = site pilote – Ouvert à d'autres sites ensuite – Chaque site est spécifique 28 Merci pour votre attention Questions ? http://code.google.com/p/forest-dvfs 29