version PDF - Flash informatique

Transcription

version PDF - Flash informatique
Actualités
Boomerang astral
Jean-Claude.Leballeur@epfl.ch
EPFL – Domaine IT – Cellule HPC-Grid
The missions of Alcor and Mizar terminated in last
February. These computers were active for, respectively,
three and four years. These two machines now belong
to the park of our prestigious retired computing
servers.
Depuis février, Alcor et Mizar ont terminé leur mission.
En activité depuis quatre et cinq ans respectivement,
ces deux machines ont rejoint le parc des retraités
prestigieux de nos serveurs de calcul.
Faisons un petit retour en arrière dans le temps, ne serait-ce que
de dix ans, là où régnait encore le dernier des CRAY: Merope, un
J90se avec ses 8 cpu, ses 4 GB de mémoire et sa capacité disque
de 180 GB, en bonne compagnie d’Orion, un Origin 2000 (SGI),
premier système à mémoire distribuée et partagée. À cette époque
fut installé également le Swiss-T1, consideré peut-être comme la
première machine de type cluster du centre de calcul. Suivirent
Eridan, un Origin 3800, version plus étoffée d’Orion, puis Janus
(HP), en remplacement du Swiss-T1, composé de 25 nœuds indépendants quadri-processeurs, et dernièrement, Altix (SGI), de
type SMP (Symmetric MultiProcessor, architecture homogène,
mémoire partagée). Aujourd’hui, ce sont donc ces deux clusters
généralistes, Mizar et Alcor, qui vont rejoindre tous ces grands serveurs. Quant à leur succession, elle est assurée, actuellement par:
Callisto
z Cluster IBM Intel Harpertown, mis en service en septembre
2008,
z comporte 2 frontales, 128 blades avec chacune deux processeurs quad-core Intel Harpertown à 3.0 GHz et 32 GB de mémoire,
z interconnexion InfiniBand 20 Gb/s et un système de fichiers
GPFS de 18 TB.
Antares
z Cluster IBM Intel Nehalem, mis en service en janvier 2010,
z comporte 56 blades avec chacune deux processeurs quadcore Intel Nehalem à 2.66GHz et 24GB de mémoire,
z interconnexion InfiniBand. Le système de fichiers est partagé
avec Callisto.
Vega
z Cluster Dell Intel Xeon, mis en service en janvier 2010,
z comporte 24 nœuds avec chacun 2 processeurs quad-core à
2.66 GHz et 16 GB de RAM,
z connectivité Gigabit ethernet. Home et scratch se trouvent
sur le NAS du DIT.
10 flash informatique
Note de l’auteur: merci à Jacques Charon pour le dessin
Caractéristiques de ces nouveaux retraités
Alcor (DALCO)
z 24 nœuds de calcul (196 cpus ); un nœud = 2 Intel Woodcrest
dual-core de 3GHz, 16 GB de mémoire;
z nœuds interconnectés par un réseau GigaEthernet et un réseau rapide Myrinet (2Gb/s);
z système Linux, batch PBSPro.
Mizar (DALCO)
z 224 nœuds de calcul ( 448 cpus ); un nœud = 2 AMD Opteron
de 2.4 GHz, 4 GB de mémoire;
z nœuds interconnectés par deux réseaux GigaEthernet et un
réseau rapide Myrinet (2 Gb/s);
z sytème Linux, batch PBSPro.
Quelques chiffres
Alcor: plus de 260000 jobs pour un total de 1’754694 heures de
calcul cumulé, avec un taux de disponibilité de 99,8 %.
Mizar: plus de 250000 jobs pour un total de 6’476048 heures de
calcul cumulé avec un taux de disponibilité de 98,2 %.
Depuis plus de 15 ans, les serveurs de calcul de l’EPFL ont pris
des noms d’objets célestes: Mérope est une étoile des Pléiades,
Janus une lune de Saturne, Callisto un satellite de Jupiter,
Orion et Eridan des constellations, et la tradition continue …
Antares est une étoile de la constellation du Scorpion et Véga
de la constellation de la Lyre, Mizar et Alcor sont une étoiledouble située au milieu dans la série des trois qui forment le
manche de la casserole de la Grande Ourse. Pouvoir les distinguer était d’ailleurs un défi traditionnel d’acuité de vision dans
plusieurs cultures, Gengis Khan en aurait fait l’un des critères
de sélection de ses archers. n