Effiziente numerische Simulation
Transcription
Effiziente numerische Simulation
Seminar über Effiziente numerische Simulation auf multicoremulticoreProzessoren: The seven dwarfs of HPC Sommersemester S t 2010 Prof. Gerhard Wellein, Dr. Georg Hager HPC Services,, Regionales g Rechenzentrum Erlangen g ((RRZE)) Department für Informatik Effiziente numerische Simulation auf multicore-Proz.. Hintergrund HPC Services des RRZE: Zahlreiche wissenschaftliche Arbeiten in den Bereichen Parallelisierung, Optimierung p g und Perfomancemodellierung für multicore-Prozessoren lti P und d multicore-Prozessor-basierte Cluster GPUs Æ nVIDIA IBM Cell …Betrieb, Benutzerbetreuung, Softwarewartung und Pflege Arbeitsgruppe: A b it 4 wiss. Mitarbeiter: RRZE-Kern 2 wiss. Mitarbeiter auf Projektstellen (KONWIHR-II) (KONWIHR II) 2 Doktoranden auf Projektstellen (BMBF) 1 Master-Student 20.04.2010 [email protected] 2 Effiziente numerische Simulation auf multicore-Proz.. Hintergrund HPC Services des RRZE: Testcluster mit vielen interessanten multicore-Architekturen Octo-Core (SUN T2, Intel Nehalem EX) g ) Hexa-Core ((AMD Istanbul, Intel Westmere/Dunnington) Quad-core (Intel Nehalem,…) nVIDIA GPU (GTX280) Cluster mit 8 Knoten a 2 Tesla M1060 + mögl. Fermi Upgrade Parallele Produktionssysteme: 220+ K Knoten t W Woodcrest-Cluster d t Cl t 84 Knoten Nehalem-Cluster Istanbul Cluster 16 Knoten Istanbul-Cluster Æ ~ 900 K Kerne Æ 672 Kerne Æ 192 Kerne Zugang zu vielen externen Rechnern IBM BlueGene/P ((Jülich)) 290.000+ Kerne ((1 PFLOP/s)) CRAY XT4 38.000 Kerne+ …. 20.04.2010 [email protected] 3 MuCoSim: Die sieben Zwerge… Reports studies the impact of multicore chips on (parallel) software and hardware What happens pp if we go g beyond y 8or 16-core chips, e.g. 100’s of cores on chip? How should appropriate programming models and languages look like? Seven basic arithmetic kernels/operations from HPC have been chosen to address th these questions ti 20.04.2010 [email protected] 4 MuCoSim: Die sieben Zwerge… 20.04.2010 [email protected] 5 MuCoSim: Die sieben Zwerge… 20.04.2010 [email protected] 6 MuCoSim: Program http://moodle.rrze.uni-erlangen.de/moodle/course/view.php?id=113 27.04.2010: Basics of modern multicore processors 04.05.2010: Basic Optimization Techniques (e.g. spatial / temporal blocking) 11.05.2010: Parallel Performance modeling 18.05.2010: GPU programming 25.05.2010: 25 05 2010 berg b 01.06.2010: Dwarf(1) 08.06.2010: 08 06 2010: Dwarf(2) 15.06.2010: Dwarf(3) 22.06.2010: 22 06 2010: Dwarf(4) 29.06.2010: Dwarf(5) 06.07.2010: 06 07 2010: Dwarf(6) 13.07.2010: Dwarf(7) 20.07.2010: 20 07 2010: Summary - outlook 20.04.2010 [email protected] 7