version PDF - Flash informatique
Transcription
version PDF - Flash informatique
Architecture de Mizar Jacques.Menu@epfl.ch, Domaine IT L’article du FI10/04 accessible à l’URL http:// dit.epfl.ch/publications-spip/article. php3?id_article=808 annonçait le choix du matériel dans le cadre du projet Mizar, visant à remplacer la machine SGI 3800 par un système mixte comportant une machine SMP et un cluster de nœuds partageant des frontales communes. La solution choisie a été celle proposée par la maison Dalco AG, illustrée à la fig. 1 et comportant: ❚ une machine SMP (mémoire partagée) SGI Altix 350 à 16 processeurs Itanium (1.6 GHz, cache de 9 MB) et 64 GB de mémoire vive; ❚ un cluster Dalco de 160 noeuds biprocesseur Opteron 250 à 2.4 GHz, chaque noeud disposant de 4 GB de mémoire; ❚ quatre réseaux de communications privés; ❚ six frontales, accessibles publiquement; les nœuds de calcul étant sur des réseaux privés. Des délais de livraison plus longs que prévus ont fait que le système n’est finalement arrivé sur le site que courant février dernier. Un point particulier à cet ensemble est le panachage de deux architectures matérielles 64 bits, soit des Opteron d’AMD et des Itanium d’Intel. Nous en décrivons les grandes lignes dans le présent article, les détails techniques plus fins étant accessibles par l’utilitaire infos directement sur le système. Frontales Il y en a six, toutes biprocesseur, de type Opteron sauf ict. Elles sont listées ci-dessous par leur nom privé avec leur rôle: ❚ nfs1 et nfs2 sont deux serveurs de fichiers NFS hébergeant les dossiers racine des utilisateurs des nœuds Opteron, un volume accessible par tous les nœuds Opteron et un espace de type scratch, non sauvegardé, à disposition des utilisateurs; ❚ login1 et login2 sont dédiées au travail interactif des utilisateurs; ❚ ict (Itanium Compile & Test) est une frontale Itanium permettant de compiler et de tester les applications devant être exécutées sur l’Altix; ❚ iplb (IP Load Balancer) tourne IPVS (IP Virtual Server): c’est elle qui est connue par l’alias mizar.epfl.ch. Elle ventile les connexions SSH entrantes alternativement sur login1 et login2. fig. 1– vue synoptique de Mizar fi 6 – 28 juin 2005 – page 17 Architecture de Mizar iplb root - ~ > module avail ----------------------------------- /usr/local/Modules/versions ---------------------------------3.1.6 ------------------------------- /usr/local/Modules/3.1.6/modulefiles -----------------------------dot module-cvs module-info modules null use.own ---------------------------------- /usr/local/Modules/modulefiles --------------------------------acml_generic_pgi/2.5.0 goto/0.96-2(default) pathscale/2.0(default) acml_pathscale/2.5.1 intel-cc/8.1.024 pgi/5.2(default) acml_scalapack_generic_pgi/2.5.0 intel-fc/8.1.021 iplb root - ~ > module whatis acml_pathscale acml_pathscale : loads the ACML for Pathscale 2.5.1 64-bit library environment fig. 2: modules installés sur Opteron ict root - ~ > module avail ----------------------------------- /usr/local/Modules/versions ---------------------------------3.1.6 ------------------------------- /usr/local/Modules/3.1.6/modulefiles -----------------------------dot module-cvs module-info modules null use.own ---------------------------------- /usr/local/Modules/modulefiles --------------------------------SunJava2/1.4.2 intel-fc/8.1.020 intel-cc/8.1.023 intel-idb/8.1.036 intel-compilers-7.1/C_C++_7.1.042_F90_7.1.044 intel-mkl/7.0.016 fig. 3: modules installés sur Itanium Les dossiers racine des utilisateurs du SMP sont quant à eux répartis sur ict et l’Altix, et rendus accessibles à ces deux machines par NFS. La frontale à utiliser pour travailler est ict dans ce cas. Comme iplb est une machine a priori peu chargée, il a été décidé d’y faire tourner différents services, dont le serveur Web Apache accessible à l’URL mizar.epfl.ch. Réseaux privés Il sont au nombre de quatre, soit: ❚ un réseau haute performance à faible latence Myrinet pour la communication entre les processeurs Opteron avec MPI; ❚ un réseau à 1 Gbit/s pour l’accès aux serveurs de fichiers NFS; ❚ un réseau d’administration à 100 Mbit/s; ❚ un réseau d’accès aux consoles des différentes machines, accessibles via IP. L’accès à Internet depuis les réseaux privés est réalisé par un NAT (Network Address Translation) tournant sur iplb. Logiciels Les machines Opteron tournent SuSE 9.2, tandis que les Itanium dont le SGI Altix tournent SLES (SeSE Linux Enterprise Server) 9. L’outil retenu pour le batch est PBSPro, en version 5.4.2 actuellement. Les différents compilateurs et les librairies d’usage courant sont accessibles au moyen de l’utilitaire modules, qui permet à l’utilisateur de choisir parmi ce qui est disponible selon ses besoins. fi 6 – 28 juin 2005 – page 18 Les modules installés sont distincts sur Opteron et Itanium, comme on le voit aux figures 2 et 3. Sur la partie Opteron, Dalco recommande l’utilisation des librairies optimisées ACML et GOTO. Le jeu des modules à disposition sera affiné et complété selon les besoins des utilisateurs. Nous remercions Trach-Minh Tran du CRPP pour sa contribution dans le domaine des benchmarks et du choix des compilateurs Intel. Authentification des utilisateurs Elle se fait via le serveur LDAP de l’EPFL. Les personnes extérieures qui ont besoin de travailler sur Mizar dans le cadre de collaborations avec des laboratoires de l’Ecole doivent être enregistrées dans LDAP par les responsables de ces laboratoires. Actuellement, il n’y a pas de quotas de ressources. Le CoPIL HPC (comité de pilotage HPC/MPC) définira qui a droit à quoi dans ce domaine. Sauvegarde Elle se fait en deux phases: ❚ dans un premier temps, les fichiers à sauvegarder sont recopiés sur un espace disque intermédiaire de 3 TB connecté à ict; ❚ sur ict tourne un client Veritas qui sauvegarde les informations sur le robot STK du DIT. Cette solution a l’avantage de donner un accès rapide à un fichier sur le disque intermédiaire sans devoir toujours aller le rechercher sur le robot, tout en ne nécessitant qu’une licence Veritas. Architecture de Mizar Tolérance aux pannes La perte d’un nœud de calcul Opteron dégrade simplement la puissance totale à disposition et interrompt le job en cours sur ce nœud. En revanche, la perte d’une frontale est beaucoup plus problématique: la seule forme de fail-over sur Mizar est que si l’une des frontales de login, login1 ou login2, tombe, l’autre prend en charge toutes les connexions SSH entrantes jusqu’à ce la machine fautive soit de nouveau active. Situation actuelle par Dalco et SGI lors de l’appel d’offres; ❚ diverses corrections et améliorations sont en cours sur l’ensemble du système; ❚ Mizar est ouverte depuis deux semaines aux utilisateurs en mode pré-production, soit sans sauvegarde des dossiers utilisateurs et avec le risque de redémarrages avec un court préavis; ❚ nous travaillons à finaliser l’environnement logiciel, en liaison avec Dalco et les utilisateurs qui nous soumettent leurs problèmes. La mise en production normale de la machine devrait intervenir sous peu.■ Au moment de l’écriture de ces lignes: ❚ les benchmarks contractuels ont tourné avec des performances au moins aussi bonnes que les valeurs annoncées La guerre des standards 1er épisode David.Petraitis@epfl.ch,Domaine IT Depuis toujours, les standards sont liés à l’activité humaine: pas d’innovation ou d’échanges commerciaux sans standard. Les tout premiers standards concernaient les mesures de longueur, de poids et de pureté. A l’époque moderne ils font l’objet de nombreuses discussions mais chaque standard repose sur le besoin de décrire la mise en œuvre et la manière de tester si les résultats sont satisfaisants. Les outils de mesure et les standards associés sont créés simultanément. Les standards sont nécessaires pour partager à peu près tout. On pense bien sûr aux standards monétaires (et aux taux de change) ou aux standards électriques et l’alimentation de nos PC. On est gêné quand ces standards font défaut, ou qu’il y en a plusieurs (par exemple les multiples modèles de prises électriques en Europe). Mais ils permettent aussi de partager des idées. Dans le domaine de l’informatique, ils servent surtout à partager des spécifications, qui sont des idées structurées. Histoire de standards: SDOs et Consortiums Il y a bien longtemps, ce sont les rois qui définissaient les standards, puis ce furent les états. A présent, il y a de nombreux organismes nationaux de standardisation comme l’AFNOR en France et le British Standard Institute au Royaume-Uni. Au 20ème siècle, les standards se sont internationalisés et sont régis par trois organisations de développement des standards (SDOs) - ITU, IEC et ISO, toutes basées à Genève. En parallèle, des standards sont aussi issus du marché. A la fin des années 80, la perception dans le monde de l’industrie informatique était que les SDOs traditionnelles étaient trop lentes dans la création des standards par rapport à la vitesse de développement de la technologie. Voici les commentaires d’Andrew Updegove à ce sujet: «En 1988, le processus moyen par l’IEC était de 8 ans Dans le cas d’un pas de vis (sujet de l’ISO TC1, premier comité technique ISO) une telle période de gestations était acceptable.»[1] Une soupe à l’alphabet La réponse du marché à cette lenteur fut la création de consortiums. Des industries, des universités et des gouvernements s’associent pour créer un standard, généralement dans un domaine précis de la technologie. Internet lui-même fut fondé par un consortium qui a démarré dans le milieu universitaire en 1969 et fut ensuite repris par l’IETF en 1986.[2] Aujourd’hui, des centaines de ces organisations existent [3] et les standards dont elles font la promotion ont parfois des domaines de recouvrement. Par exemple, dans le domaine du XML (XML est lui-même un standard du W3C): ebXML a été créé pour étendre la sémantique de XML aux besoins du e-business par OASIS et UNECE/CEFACT, et Xbrl eXtensible Business Reporting Language est supporté par le consortium Xbrl largement composé de sociétés de comptabilité. J’ai été directement impliqué dans OASIS et à l’occasion d’un prochain article je décrirai quelques uns des standards qui proviennent d’OASIS. La plupart des acronymes de plus de 3 lettres qu’on entend ces jours sont les noms de standards existant ou émergeant ou bien des consortiums qui les produisent: UML, UBL, WS*, SOAP. Logiciel ouvert, standard ouvert, logiciel libre La communauté des standards est en ce moment agitée par un débat sur le sens exact du mot ouvert. Plusieurs organifi 6 – 28 juin 2005 – page 19