Meilleures pratiques
Transcription
Meilleures pratiques
KINGSTON.COM Meilleures pratiques pour serveur : Tests de référence de performance Fréquences et performances des mémoires Les bases de données jouent un rôle clé dans votre entreprise. Afin d’optimiser la fiabilité et la rapidité du traitement de données, vous devez bénéficier de mémoires hautes performances. Aujourd’hui nous faisons appel aux bases de données à tout moment de la journée. Qu’il s’agisse d’un appel de notre opérateur téléphonique, d’un achat en ligne… Cela nécessite performance fiabilité et rapidité dans le seul but de répondre à nos demandes. Garantir un accès fiable et une intégrité des données demande un suivi quotidien. Les bases de données se doivent donc d’être stockées en mémoire afin d’apporter fiabilité et rapidité à chaque utilisateurs. Les bases de données résidentes en mémoire (IMDB) dépendent principalement de l’utilisation des mémoires DRAM (Dynamic Random Access Memory) à hautes capacités, mais surtout à hautes performances. Une telle base de données est nettement plus rapide, qu’une utilisation sur un disque dur classique, dans le traitement des flux. Cela en fait un élément clé dans la gestion des big data. Les modules de mémoire DIMM DDR3 sont disponibles en différentes capacités et fréquences. La vitesse d’un module mémoire est généralement exprimée par une fréquence en MégaHertz (MHz). La fréquence d’une mémoire détermine directement sa performance. Plus la fréquence est élevée, plus la performance est grande. Mais les modules DRAM ne sont qu’un des éléments qui soutiennent la performance des sous-systèmes de mémoire. Un contrôleur mémoire est nécessaire dans la gestion du sous-système. Les règles d’installation des modules mémoires (DIMM) ont un impact direct sur la vitesse et/ou fréquence ainsi que la latence. Les contrôleurs mémoire de nouvelle génération sont intégrés aux processeurs pour assurer de meilleures performances. Néanmoins, il est important de noter que certains contrôleurs ne gèrent qu’une bande passante ne pouvant pas dépasser 800MHz. Meilleures pratiques pour serveur : Tests de référence de performance Grâce au logiciel de benchmarking SiSoft Sandra 2012 incluant STREAM, nous pouvons mesurer la bande passante élevée dans différentes configurations : différentes fréquences d’horloge et différentes populations de channel de mémoire variées. Exemple avec les 24 slots mémoires disponibles sur une carte Intel® Romley rattachés à un sous-système Intel Xeon E5. La famille des processeurs Intel Xeon E5 apporte de deux améliorations à la différence de la précédente génération de processeurs Xeon 5500 et Xeon 5600 Server. Elles incluent deux améliorations importantes (que nous évoquons dans ce livre blanc : 1. Une meilleure gestion de la mémoire quad channel, 2. Le support des vitesses 1600MHz sur DDR3 avec une micro-architecture QuickPath Interconnect (QPI) plus rapide à 8GT/s (GigaTransferts par seconde). Ces nouveautés améliorent la bande passante et réduisent la latence. Optimisation d’utilisation des canaux Figure 1. Illustration en fonction de la population des canaux, mesurée par SiSoft Sandra 2012 La configuration testée inclut le logiciel de benchmarking mémoire SiSoftware Sandra 2012 sur une plate-forme Romley Intel S2600GZ avec deux processeurs Xeon E5-2665 2,40GHz et 64Go de mémoire (2 x KVR16R11D4K4/32 @1600 MHz) installés. Les fonctions d’hyperthreading et d’économie d’énergie du processeur sont désactivées. Comme indiqué Figure 1, la performance du sous-système progresse presque de manière linéaire de la configuration la plus lente (un module DDR3 1600 MHz de 8Go installé sur Meilleures pratiques pour serveur : Tests de référence de performance un canal simple d’un des deux processeurs Xeon du contrôleur mémoire) à la plus rapide, utilisant un quadruple canal (aussi appelé 1 DIMM par canal – DPC) avec quatre modules de 8Go à 1600MHz sur chaque socket de la première banque de mémoire disponible des deux processeurs. Même avec la charge électrique accrue d’une configuration quatre canaux (1 DPC), la vitesse du sous-système est presque multipliée par quatre (~70Go/s) par rapport à une configuration simple canal. Nous avons donc une configuration idéale pour les applications exigeant des performances de haut niveau, telles que les bases de données résidentes en mémoire, qui sont grandes consommatrices de ressources. Fréquence mémoire Figure 2. Illustration des fréquences mémoires, mesurées par SiSoft Sandra 2012 La configuration testée inclut le logiciel de benchmarking mémoire SiSoftware Sandra 2012 sur une plate-forme Intel Romley S2600GZ avec deux processeurs Xeon E5-2665 2,40GHz et 64Go de mémoire (2 x KVR16R11D4K4/32). Les fonctions d’hyperthreading et d’économie d’énergie du processeur sont désactivées. Comme le montre la Figure 2, nous utilisons huit slots mémoire DDR3 8Go à quatre fréquences différentes (MHz) installés à l’identique sur les deux sous-systèmes Intel Xeon E5 pour obtenir une configuration équilibrée et une meilleure performance à toutes fréquences. Meilleures pratiques pour serveur : Tests de référence de performance Avec les modules à 800MHz, nous observons la plus faible performance. SiSoft Sandra 2012 incluant STREAM indique des débits soutenus de ~40Go/s. Lorsque la fréquence augmente, la performance observée progresse presque de manière linéaire pour atteindre le niveau maximal de ~70Go/s à 1600MHz. Une telle performance est idéale lorsque les ressources écrites en mémoire exigent les plus hauts niveaux possibles pour préserver l’efficacité du système. Performance selon les fréquences et les capacités des mémoires Figure 3. Illustration des performances en comparant les capacités et les fréquences des mémoires, avec SiSoft Sandra 2012. La configuration testée inclut le logiciel de benchmarking mémoire SiSoftware Sandra 2012 sur une plate-forme Intel Romley S2600GZ avec deux processeurs Xeon E5-2665 2,40GHz et 192Go de mémoire (KVR16R11D4K4/32). Les fonctions d’hyperthreading et d’économie d’énergie du processeur sont désactivées. Pour conclure notre étude de la performance des mémoires, nous avons évalué les trois configurations suivantes : 192Go à 1066MHz, 128Go à 1600MHz et 64Go à 1600MHz (Figure 3). En augmentant la capacité mémoire tout en conservant une fréquence de 1600MHz et une répartition symétrique 128Go (16x 8Go) ou 64Go (8x 8Go) sur les deux sous-systèmes, la performance est soutenue, approximativement à 70Go/s. Avec une capacité mémoire montée à 192Go (24x 8Go) et une fréquence de 1066MHz, l’étude montre une baisse d’environ 17Go /s tout en ayant une capacité mémoire supérieure. Meilleures pratiques pour serveur : Tests de référence de performance Conclusion En respectant les règles de population des canaux applicables au processeur serveur et au contrôleur mémoire, nous pouvons atteindre un équilibre qui optimise et génère de meilleures performances, telles que la population complète des quatre canaux. Cette approche permet de multiplier par quatre la performance mémoire, d’améliorer le retour sur investissement et de réduire le coût total de possession pendant la durée de vie du serveur. Références [1] illustration des choix de films des utilisateurs dans la base de données NetFlix, Department of Electrical and Computer Engineering, Carnegie Mellon University http://users.ece.cmu.edu/~dbatra/publications/assets/goel_batra_netflix.pdf [2] Questions et réponses SiSoft Sandra – Logiciel de benchmarking SiSoftware http://www.sisoftware.co.uk/?d=qa&f=ben_mem&l=en&a= [3] Fiche technique de la famille des processeurs Intel E5-2600 Xeon® http://download.intel.com/newsroom/kits/xeon/e5/pdfs/Intel_Xeon_E5_Factsheet.pdf © 2013 Kingston Technology Europe Ltd et Kingston Digital Europe Ltd, Kingston Court, Brooklands Close, Sunbury-on-Thames, Middlesex, TW16 7EP, Angleterre. Tél: +44 (0) 1932 738888 Fax: +44 (0) 1932 785469 Tous droits réservés. Toutes les marques commerciales et les marques déposées sont la propriété de leurs détenteurs respectifs. MKF-549