Meilleures pratiques

Transcription

Meilleures pratiques
KINGSTON.COM
Meilleures pratiques
pour serveur : Tests de référence de performance
Fréquences et performances des mémoires
Les bases de données jouent un rôle clé dans votre entreprise.
Afin d’optimiser la fiabilité et la rapidité du traitement de données, vous devez
bénéficier de mémoires hautes performances.
Aujourd’hui nous faisons appel aux bases de données à tout moment de la journée.
Qu’il s’agisse d’un appel de notre opérateur téléphonique, d’un achat en ligne…
Cela nécessite performance fiabilité et rapidité dans le seul but de répondre à nos
demandes.
Garantir un accès fiable et une intégrité des données demande un suivi quotidien.
Les bases de données se doivent donc d’être stockées en mémoire afin d’apporter
fiabilité et rapidité à chaque utilisateurs.
Les bases de données résidentes en mémoire (IMDB) dépendent principalement
de l’utilisation des mémoires DRAM (Dynamic Random Access Memory) à hautes
capacités, mais surtout à hautes performances.
Une telle base de données est nettement plus rapide, qu’une utilisation sur un disque
dur classique, dans le traitement des flux. Cela en fait un élément clé dans la gestion
des big data.
Les modules de mémoire DIMM DDR3 sont disponibles en différentes capacités et
fréquences.
La vitesse d’un module mémoire est généralement exprimée par une fréquence en
MégaHertz (MHz).
La fréquence d’une mémoire détermine directement sa performance. Plus la fréquence
est élevée, plus la performance est grande.
Mais les modules DRAM ne sont qu’un des éléments qui soutiennent la performance
des sous-systèmes de mémoire.
Un contrôleur mémoire est nécessaire dans la gestion du sous-système. Les règles
d’installation des modules mémoires (DIMM) ont un impact direct sur la vitesse et/ou
fréquence ainsi que la latence.
Les contrôleurs mémoire de nouvelle génération sont intégrés aux processeurs pour
assurer de meilleures performances. Néanmoins, il est important de noter que certains
contrôleurs ne gèrent qu’une bande passante ne pouvant pas dépasser 800MHz.
Meilleures pratiques pour serveur : Tests de référence de performance
Grâce au logiciel de benchmarking SiSoft Sandra 2012 incluant STREAM, nous pouvons
mesurer la bande passante élevée dans différentes configurations : différentes fréquences
d’horloge et différentes populations de channel de mémoire variées. Exemple avec les 24
slots mémoires disponibles sur une carte Intel® Romley rattachés à un sous-système Intel
Xeon E5.
La famille des processeurs Intel Xeon E5 apporte de deux améliorations à la différence de
la précédente génération de processeurs Xeon 5500 et Xeon 5600 Server.
Elles incluent deux améliorations importantes (que nous évoquons dans ce livre blanc :
1. Une meilleure gestion de la mémoire quad channel,
2. Le support des vitesses 1600MHz sur DDR3 avec une micro-architecture
QuickPath Interconnect (QPI) plus rapide à 8GT/s (GigaTransferts par seconde).
Ces nouveautés améliorent la bande passante et réduisent la latence.
Optimisation d’utilisation des canaux
Figure 1. Illustration en fonction de la population des canaux, mesurée par SiSoft Sandra 2012
La configuration testée inclut le logiciel de benchmarking mémoire SiSoftware Sandra 2012 sur une plate-forme Romley Intel
S2600GZ avec deux processeurs Xeon E5-2665 2,40GHz et 64Go de mémoire (2 x KVR16R11D4K4/32 @1600 MHz) installés. Les
fonctions d’hyperthreading et d’économie d’énergie du processeur sont désactivées.
Comme indiqué Figure 1, la performance du sous-système progresse presque de manière
linéaire de la configuration la plus lente (un module DDR3 1600 MHz de 8Go installé sur
Meilleures pratiques pour serveur : Tests de référence de performance
un canal simple d’un des deux processeurs Xeon du contrôleur mémoire) à la plus rapide,
utilisant un quadruple canal (aussi appelé 1 DIMM par canal – DPC) avec quatre modules
de 8Go à 1600MHz sur chaque socket de la première banque de mémoire disponible des
deux processeurs.
Même avec la charge électrique accrue d’une configuration quatre canaux (1 DPC), la
vitesse du sous-système est presque multipliée par quatre (~70Go/s) par rapport à une
configuration simple canal. Nous avons donc une configuration idéale pour les applications
exigeant des performances de haut niveau, telles que les bases de données résidentes en
mémoire, qui sont grandes consommatrices de ressources.
Fréquence mémoire
Figure 2. Illustration des fréquences mémoires, mesurées par SiSoft Sandra 2012
La configuration testée inclut le logiciel de benchmarking mémoire SiSoftware Sandra 2012 sur une plate-forme Intel Romley
S2600GZ avec deux processeurs Xeon E5-2665 2,40GHz et 64Go de mémoire (2 x KVR16R11D4K4/32). Les fonctions d’hyperthreading
et d’économie d’énergie du processeur sont désactivées.
Comme le montre la Figure 2, nous utilisons huit slots mémoire DDR3 8Go à quatre
fréquences différentes (MHz) installés à l’identique sur les deux sous-systèmes Intel Xeon
E5 pour obtenir une configuration équilibrée et une meilleure performance à toutes
fréquences.
Meilleures pratiques pour serveur : Tests de référence de performance
Avec les modules à 800MHz, nous observons la plus faible performance. SiSoft Sandra
2012 incluant STREAM indique des débits soutenus de ~40Go/s.
Lorsque la fréquence augmente, la performance observée progresse presque de manière
linéaire pour atteindre le niveau maximal de ~70Go/s à 1600MHz. Une telle performance
est idéale lorsque les ressources écrites en mémoire exigent les plus hauts niveaux
possibles pour préserver l’efficacité du système.
Performance selon les fréquences et les capacités des mémoires
Figure 3. Illustration des performances en comparant les capacités et les fréquences des
mémoires, avec SiSoft Sandra 2012.
La configuration testée inclut le logiciel de benchmarking mémoire SiSoftware Sandra 2012 sur une plate-forme Intel Romley
S2600GZ avec deux processeurs Xeon E5-2665 2,40GHz et 192Go de mémoire (KVR16R11D4K4/32). Les fonctions d’hyperthreading
et d’économie d’énergie du processeur sont désactivées.
Pour conclure notre étude de la performance des mémoires, nous avons évalué les trois
configurations suivantes : 192Go à 1066MHz, 128Go à 1600MHz et 64Go à 1600MHz
(Figure 3).
En augmentant la capacité mémoire tout en conservant une fréquence de 1600MHz et
une répartition symétrique 128Go (16x 8Go) ou 64Go (8x 8Go) sur les deux sous-systèmes,
la performance est soutenue, approximativement à 70Go/s.
Avec une capacité mémoire montée à 192Go (24x 8Go) et une fréquence de 1066MHz,
l’étude montre une baisse d’environ 17Go /s tout en ayant une capacité mémoire
supérieure.
Meilleures pratiques pour serveur : Tests de référence de performance
Conclusion
En respectant les règles de population des canaux applicables au processeur serveur et
au contrôleur mémoire, nous pouvons atteindre un équilibre qui optimise et génère de
meilleures performances, telles que la population complète des quatre canaux. Cette
approche permet de multiplier par quatre la performance mémoire, d’améliorer le retour
sur investissement et de réduire le coût total de possession pendant la durée de vie du
serveur.
Références
[1] illustration des choix de films des utilisateurs dans la base de données NetFlix,
Department of Electrical and Computer Engineering, Carnegie Mellon University
http://users.ece.cmu.edu/~dbatra/publications/assets/goel_batra_netflix.pdf
[2] Questions et réponses SiSoft Sandra – Logiciel de benchmarking SiSoftware
http://www.sisoftware.co.uk/?d=qa&f=ben_mem&l=en&a=
[3] Fiche technique de la famille des processeurs Intel E5-2600 Xeon®
http://download.intel.com/newsroom/kits/xeon/e5/pdfs/Intel_Xeon_E5_Factsheet.pdf
© 2013 Kingston Technology Europe Ltd et Kingston Digital Europe Ltd, Kingston Court, Brooklands Close, Sunbury-on-Thames, Middlesex,
TW16 7EP, Angleterre. Tél: +44 (0) 1932 738888 Fax: +44 (0) 1932 785469 Tous droits réservés. Toutes les marques commerciales et les marques
déposées sont la propriété de leurs détenteurs respectifs. MKF-549