Amélioration des contrôleurs réseau Ethernet pour la virtualisation

Transcription

Amélioration des contrôleurs réseau Ethernet pour la virtualisation
Mise en réseau
Amélioration des contrôleurs
réseau Ethernet pour la
virtualisation des serveurs
Par Dhiraj Sehgal, Abhijit Aswath et Srinivas Thodati
Broadcom et Dell travaillent avec un ensemble de fournisseurs de
virtualisation pour améliorer les contrôleurs réseau Broadcom® au
sein des serveurs Dell™ PowerEdge™, afin de réduire les goulots
d'étranglement et la surcharge qui peuvent altérer les performances
dans les environnements virtualisés.
D
ans les environnements informatiques
professionnels, la virtualisation offre de
nombreux avantages qui permettent aux
entreprises de consolider et de partager
les ressources informatiques, d'augmenter
le contrôle et l'efficacité et de faire fonctionner leurs
datacenters de manière économique. Toutefois, tirer
pleinement parti d'un environnement virtualisé exige plus
que le simple déploiement de machines virtuelles. Il est
indispensable d'avoir une infrastructure réseau efficace.
Comme les autres ressources matérielles au sein
des systèmes Dell, les adaptateurs réseau Broadcom
sont virtualisés dans la machine virtuelle. Les plateformes
de virtualisation utilisent une architecture basée sur un
hyperviseur, également appelée architecture d'écran de
machine virtuelle (VMM), qui cache les caractéristiques
physiques de la plateforme informatique et permet aux
machines virtuelles non modifiées d'être exécutées
simultanément sur des plateformes d'hôtes.
Cette conception signifie que la virtualisation se
fait aux dépens des performances. Les architectures de
virtualisation d'aujourd'hui comprennent des machines
virtuelles avec des pilotes de périphérique, des piles
d'E/S et des applications exécutées au sommet d'une
couche de virtualisation. Cette dernière inclut l'émulation
des périphériques, des piles d'E/S et des pilotes de
périphériques physiques qui gèrent les contrôleurs réseau
Ethernet. Cette couche de virtualisation engendre une
charge supplémentaire et réduit les performances des
systèmes, en augmentant l'utilisation du processeur et en
diminuant la bande passante disponible.
Broadcom, leader de la mise en réseau dans le
domaine des contrôleurs réseau Gigabit Ethernet
(GbE) et 10 Gigabit Ethernet (10GbE), travaille en étroite
collaboration avec de nombreux fournisseurs de
virtualisation, comme VMware, Microsoft, Citrix et Dell,
68
Troisième édition 2010 | dell.com/powersolutions
afin de résoudre ce type de problèmes. Les contrôleurs
Broadcom sont inclus sur toute une série de serveurs
Dell PowerEdge en tant que cartes réseau intégrées
LOM (LAN on Motherboard), cartes mezzanine et cartes
d'interface réseau standard, et font également partie des
solutions de virtualisation globales Dell. Broadcom travaille
actuellement sur un projet en deux phases afin d'améliorer
l'utilisation de ses contrôleurs dans les environnements
virtualisés. La société aide ainsi les entreprises utilisatrices
de systèmes Dell à optimiser les avantages de leurs
initiatives de virtualisation.
Phase 1 : suppression des goulots d'étranglement
et accroissement des performances
Pendant la première phase de son projet d'amélioration,
Broadcom a cherché à supprimer les goulots
d'étranglement liés à la virtualisation et à augmenter les
performances du système grâce à un certain nombre
de fonctionnalités supplémentaires. Par exemple,
les contrôleurs réseau Ethernet Broadcom prennent
maintenant en charge les déchargements sans état,
tels que le déchargement des sommes de contrôle
TCP, qui permet aux adaptateurs réseau de calculer les
sommes de contrôle TCP à la transmission/réception, et
le déchargement matériel (LSO, Large Send Offload) TCP,
qui permet à la couche TCP de créer un message TCP
jusqu'à 64 Ko et de l'envoyer en un seul appel en bas de
la pile via IP et le pilote de périphérique Ethernet. Ainsi,
le processeur hôte n'a plus à calculer les sommes de
contrôle dans un environnement virtualisé.
De plus, la prise en charge des trames Jumbo
par Broadcom dans les environnements virtualisés
est conçue pour réduire l'utilisation du processeur en
diminuant les interruptions, et pour accroître le débit
en permettant au système de se concentrer sur les
données des trames, plutôt que sur les trames autour
Reproduction de Dell Power Solutions , troisième édition 2010. Copyright © 2010 Dell Inc. Tous droits réservés.
des données. Cependant, à cause de la
nature monothread de l'hyperviseur dans
le traitement des E/S et des copies d'E/S
dupliquées dans la couche de virtualisation,
les performances restent limitées avec cette
approche. Broadcom prend également en
charge les fonctionnalités VMware® NetQueue
et Microsoft® Hyper-V™ VM Queue (VMQ),
qui permettent de supprimer ces goulots
d'étranglement à file d'attente unique et d'éviter
d'avoir à effectuer des déchargements sans
état, tels que le déchargement TCP. En outre,
le mode adaptateur de bus hôte (HBA) Internet
SCSI (iSCSI) dans les contrôleurs Broadcom,
pris en charge dans le cadre des solutions
de virtualisation Dell, peut offrir d'excellentes
performances dans les environnements
virtualisés.
Utilisation de files d'attente multiples
La tendance à l'augmentation de la densité des
cœurs de processeur donne lieu à l'utilisation
d'un nombre croissant de machines virtuelles,
qui nécessitent des cycles de processeur
supplémentaires pour diriger les paquets vers
les machines virtuelles. À l'aide des files d'attente
matérielles fournies par le contrôleur réseau,
les fournisseurs de virtualisation ont évité
de se limiter au thread unique d'un système
d'exploitation traditionnel et ont optimisé
l'hyperviseur pour bénéficier de plusieurs
threads matériels.
Sur les plateformes VMware et Microsoft
Hyper-V, les paquets doivent traverser la
partition parente et de l'hyperviseur, car il n'y
a pas de chemin direct disponible entre le
contrôleur et les machines virtuelles. À leur
sortie, les paquets sont d'abord copiés depuis
la machine virtuelle source pour être traités
dans le commutateur virtuel. Leur adresse MAC
(Media Access Control) de destination et leur
ID de LAN virtuel (VLAN) sont examinés pour
déterminer le chemin. Le paquet est ensuite
copié dans la file d'attente de réception des
autres machines virtuelles et/ou soumis au
pilote réseau pour être transmis. À leur entrée,
les paquets sont signalés au commutateur, qui
utilise l'adresse MAC de destination et l'ID de
VLAN pour déterminer dans quelle machine
virtuelle ou quel groupe de machines virtuelles
les paquets pourront être copiés.
Les tâches de recherche de chemin, de
copie des données et de filtrage représentent
une latence et une charge de processeur
supplémentaires, absentes dans les
environnements non virtualisés. La surcharge
associée peut avoir un impact considérable sur
les performances réseau, surtout à 10 Gbit/s.
Pour résoudre ce problème, ces tâches sont
déchargées vers un adaptateur réseau, où le
gestionnaire de file d'attente de transport peut
transmettre les paquets à partir de plusieurs
files d'attente et diriger les paquets en réception
vers plusieurs files d'attente. Les fonctionnalités
VMware NetQueue et Microsoft Hyper-V VMQ
permettent aux contrôleurs Broadcom
d'effectuer ces tâches, afin de mieux répondre
aux demandes des applications gourmandes
en bande passante, qui nécessitent des niveaux
élevés de performance et de débit de réseau
dans les environnements virtualisés.
Déchargement du stockage
Le stockage en réseau est capital dans les
environnements virtualisés, car il permet le
basculement et la migration sans heurt d'une
machine virtuelle d'un serveur physique à l'autre.
De nombreux déploiements de virtualisation
utilisent maintenant la technologie iSCSI, une
technologie de stockage en réseau accessible
et hautes performances. La fonctionnalité HBA
iSCSI NetXtreme II® de Broadcom, qui prend en
charge la virtualisation avec VMware, Microsoft
Hyper-V et Citrix® Xen®, offre la fonction de
convergence requise dans les environnements
virtualisés en fournissant un traitement sur la
puce pour libérer les ressources de processeur
et augmenter les performances et la bande
passante, tel que le montre la figure 1. La
fonctionnalité HBA iSCSI 10GbE et GbE de
Broadcom, telle qu'elle est décrite dans cette
figure, est activée par défaut sur la plateforme
VMware vSphere™ 4.1 au sein des serveurs
Dell PowerEdge.
La fonctionnalité HBA iSCSI de Broadcom
permet le traitement sur la puce du protocole
iSCSI (et des protocoles TCP et IP), ce qui
permet de libérer les ressources du processeur
hôte à un débit linéaire de 10 Gbit/s sur
un seul port Ethernet. Cette fonctionnalité
offre de meilleurs avantages en termes de
performances. Cela permet de répondre aux
demandes des applications gourmandes en
bande passante, qui nécessitent des E/S de
stockage par blocs hautes performances pour
l'hyperviseur, et d'alimenter toutes les instances
de la machine virtuelle.
Démarrage iSCSI
Le démarrage iSCSI permet à un serveur de
démarrer un système d'exploitation sur un
réseau de stockage SAN. Ainsi, il n'est plus
nécessaire de recourir au stockage sur disque
local, à l'origine d'un grand nombre de pannes
informatiques. En plus d'améliorer la fiabilité du
système, l'utilisation de serveurs sans disque
permet de simplifier la charge de travail de
l'administrateur informatique en centralisant la
création, la distribution et la maintenance des
images de serveur. Le besoin global en capacité
de stockage est ainsi réduit grâce à une plus
grande utilisation de la capacité de disque,
et la redondance des données augmente
grâce à l'utilisation de la mise en miroir et de la
réplication des données.
Alors que les réseaux SAN sont de plus
en plus utilisés dans les environnements
virtualisés et que les administrateurs continuent
à reconnaître les avantages de la migration du
stockage local des serveurs individuels vers des
baies de stockage gérées de façon centralisée,
les options de démarrage réseau, telles que
le démarrage iSCSI, sont appelées à devenir
des fonctionnalités de plus en plus courantes
au sein du datacenter et dans l'ensemble
Significantly reduced iSCSI processing in OS stack
benefits the guest OS and virtualization platform
VM 1
VM 2
VM n
OS SCSI
stack
OS SCSI
stack
OS SCSI
stack
VMware iSCSI stack
Broadcom iSCSI
Hypervisor
or VMM
Existing iSCSI
and
network stack
Figure 1. Mode
Broadcom HBA
iSCSI dans un
environnement
virtualisé
On-chip iSCSI
Broadcom GbE/10GbE NIC
Third-party GbE/10GbE NIC
On-chip iSCSI processing frees processor cycles, helping
to reduce power consumption and increase performance
Reproduction de Dell Power Solutions , troisième édition 2010. Copyright © 2010 Dell Inc. Tous droits réservés.
dell.com/powersolutions | Troisième édition 2010
69
Networking
de l'entreprise. Broadcom, VMware, Microsoft et Citrix
collaborent pour créer des options de démarrage iSCSI
simples et complètes qui utilisent la technologie iSCSI pour
remplacer le stockage local dans les environnements
virtualisés. La fonctionnalité de démarrage iSCSI GbE et
10GbE de Broadcom est activée par défaut dans VMware
vSphere 4.1 sur les serveurs Dell PowerEdge, et le mode
HBA iSCSI ainsi que le démarrage iSCSI de Broadcom
pour les contrôleurs 10GbE dans les hyperviseurs sont
tous deux pris en charge sur les plateformes Dell.1
Phase 2 : intégration des
améliorations SR-IOV
La deuxième phase du projet de virtualisation améliorée
de Broadcom est en cours. Elle se concentre sur la
virtualisation des E/S à racine unique (SR-IOV). Ces
améliorations seront probablement disponibles sur
les systèmes Dell utilisant des contrôleurs Broadcom
NetXtreme II 57712. Les contrôleurs réseau Ethernet qui
prennent an charge la virtualisation SR-IOV sont conçus
pour augmenter le débit d'E/S et pour réduire l'utilisation
du processeur, tout en améliorant l'évolutivité et les
fonctions de partage des périphériques. La virtualisation
SR-IOV permet d'affecter directement les
E/S d'un contrôleur réseau Ethernet à plusieurs machines
virtuelles, afin d'optimiser le potentiel de bande passante
de l'adaptateur réseau.
La spécification SR-IOV PCI Express (PCIe) pour les
technologies de partage et de virtualisation d'E/S PCI
constitue la base pour implémenter la virtualisation SR-IOV
dans les contrôleurs Broadcom compatibles SR-IOV. Cette
spécification définit une extension à la spécification PCIe
qui permet à plusieurs images systèmes ou machines
virtuelles de partager des ressources matérielles PCIe (voir
figure 2). Le périphérique SR-IOV Broadcom présente
une fonction physique qui comprend plusieurs fonctions
virtuelles. Une fonction virtuelle est une fonction PCIe
légère, et les ressources associées au transfert de données
principal de la fonction sont à la disposition de la machine
virtuelle. La fonction virtuelle peut être partagée en série
Figure 2. Contrôleur Broadcom prenant
en charge la virtualisation SR-IOV dans un
environnement virtualisé.
entre différentes machines virtuelles (elle est affectée
à une machine virtuelle, puis reconfigurée et affectée
à une autre). En outre, une fonction virtuelle peut être
transformée en fonction physique.
La prise en charge complète de la virtualisation SRIOV PCIe implique d'améliorer à la fois les fonctionnalités
existantes et d'en ajouter de nouvelles à la plateforme et
au système d'exploitation. Les pilotes de périphériques de
contrôleur réseau prenant en charge la virtualisation SRIOV doivent également être remodelés pour prendre en
charge des chemins de communication supplémentaires
entre les fonctions physiques et virtuelles.
VMware VMDirectPath
Il est particulièrement important de bénéficier d'un débit
élevé et d'une faible latence dans un système distribué, où
les latences d'E/S des nœuds affectent les performances
du cluster et de l'application dans son ensemble. Une
faible latence est nécessaire pour préserver la cohérence
des données dans les clusters de base de données de
grande taille lors de l'implémentation d'adaptateurs réseau
SR-IOV évolutifs.
Grâce à l'architecture du plug-in réseau VMware
VMDirectPath et à un périphérique Broadcom compatible
SR-IOV, une fonction virtuelle peut être directement
affectée à une machine virtuelle. Vous obtenez ainsi
des performances proches de performances natives
sans copier d'E/S supplémentaires dans l'hyperviseur,
ainsi qu'une gamme complète de fonctionnalités de
virtualisation, telles que la technologie VMware vMotion™
et la migration dynamique Microsoft Hyper-V (voir
figure 3). L'affectation directe des périphériques PCI aux
machines virtuelles est nécessaire pour les appliances
d'E/S et les machines virtuelles hautes performances.
Avec la fonction VMDirectPath dynamique ou
Uniform Pass-Through version 2 (UPTv2), l'interface
du périphérique est divisée en deux, pour pouvoir faire
passer les opérations stratégiques (registres d'index
producteur TX/RX, registres de masque d'interruption et
opérations émulées peu fréquentes, par exemple) vers
VM 1
VM 2
VM n
Virtual
NIC
VF device
driver
VF device
driver
PF device
driver
Hypervisor
or VMM
PF
VF
VF
SR-IOV-capable Broadcom controller
1Pour
plus d'informations sur la fonctionnalité iSCSI des adaptateurs Broadcom pour les systèmes Dell, consultez l'article « Une approche réseau unifiée du
stockage iSCSI avec les contrôleurs Broadcom » de Dhiraj Sehgal, Abhijit Aswath et Srinivas Thodati, disponible dans la deuxième édition 2010 de Dell Power
Solutions, dell.com/downloads/global/power/ps2q10-20100411-broadcom.pdf.
70
Troisième édition 2010 | dell.com/powersolutions
Reproduction de Dell Power Solutions , troisième édition 2010. Copyright © 2010 Dell Inc. Tous droits réservés.
VM 1
VM 2
VM n
Virtual
NIC
VF device
driver
VF device
driver
PF device
driver
Hypervisor
or VMM
VF
Figure 3. Fonction VMDirectPath VMware
avec un contrôleur Broadcom prenant en
charge la virtualisation SR-IOV
VF
PF
NIC embedded switch
SR-IOV-capable Broadcom controller
le pilote de gestion exécuté dans VMware ESX. Pour
implémenter la migration dynamique, la fonction virtuelle
est acceptée et passe du mode passerelle au mode
émulation, pour que l'état minimal du périphérique soit
contrôlé ou restauré. La plus grande partie de l'état se
trouve dans la mémoire d'une machine virtuelle, et les
systèmes d'exploitation invités ne sont pas au courant de
la migration.
La prise en charge de la fonction VMDirectPath
dynamique nécessite de remodeler la plateforme du
système d'exploitation et le pilote de périphérique réseau.
La plateforme VMware implémente une architecture de
plug-in réseau qui permet de faire passer les opérations
stratégiques en partitionnant le pilote vmxnet pour inclure
un interpréteur de commandes spécifique aux machines
virtuelles et un module ou un pilote de plug-in réseau
spécifique au matériel. L'interpréteur de commandes
spécifique aux machines virtuelles implémente l'interface
sur la pile réseau du système d'exploitation et interagit
avec l'hyperviseur pour la configuration. Le pilote de
plug-in réseau spécifique au matériel interagit avec le
matériel dans le chemin de données et utilise l'interface
de l'interpréteur de commandes de machine virtuelle
pour les appels spécifiques au système d'exploitation.
VMware ESX contrôle le plug-in réseau utilisé par
l'interpréteur de commandes pour charger le plug-in dans
la machine virtuelle basée sur la fonction virtuelle et pour
mapper la fonction virtuelle dans un espace d'adressage
de machine virtuelle.
Commutateur intégré à la carte d'interface réseau
La virtualisation et le partage des E/S sont également
requis pour les configurations point à point et basées sur
le commutateur, afin d'assurer l'interopérabilité entre les
machines virtuelles, les fonctions virtuelles, les puces, les
commutateurs, les points de terminaison et les ponts.
Un commutateur Broadcom intégré à la carte d'interface
réseau permet la commutation Ethernet entre machines
virtuelles, d'une fonction virtuelle à l'autre, et à partir ou
vers des ports externes.
Virtualisation efficace
Le réseau est un élément clé des environnements
virtualisés, et les contrôleurs réseau qui sont optimisés
pour répondre aux demandes de la virtualisation peuvent
contribuer à maximiser les performances. Les efforts
de Broadcom en matière de virtualisation permettent
aux entreprises qui utilisent les systèmes Dell de tirer
parti des technologies de déchargement et des E/S en
temps réel et flexibles. Ces améliorations permettent de
bénéficier d'une virtualisation efficace et performante plus
facilement. Les fonctionnalités Broadcom de virtualisation
SR-IOV et de passerelle d'E/S pour les contrôleurs réseau
Ethernet, avec le déchargement TCP et iSCSI, peuvent
offrir des performances proches de performances natives
ainsi qu'une latence réduite. À l'avenir, Broadcom envisage
de continuer à prendre en charge et de permettre la
virtualisation sur les plateformes de serveurs Dell pour
permettre aux entreprises informatiques d'accélérer
l'adoption d'infrastructures virtualisées tout en augmentant
les performances et en contrôlant les coûts. 

Dhiraj Sehgal est responsable senior de gamme de
produits pour les contrôleurs Ethernet au sein de
Broadcom.
Abhijit Aswath est responsable senior de gamme
de produits pour le logiciel des contrôleurs Ethernet
au sein de Broadcom.
Srinivas Thodati est responsable senior du
marketing produits pour les serveurs PowerEdge
série M au sein de Dell.
En savoir plus
Contrôleurs Ethernet Broadcom :
broadcom.com/products/Ethernet-Controllers
Serveurs Dell PowerEdge :
dell.com/poweredge
Reproduction de Dell Power Solutions , troisième édition 2010. Copyright © 2010 Dell Inc. Tous droits réservés.
dell.com/powersolutions | Troisième édition 2010
71