Amélioration des contrôleurs réseau Ethernet pour la virtualisation
Transcription
Amélioration des contrôleurs réseau Ethernet pour la virtualisation
Mise en réseau Amélioration des contrôleurs réseau Ethernet pour la virtualisation des serveurs Par Dhiraj Sehgal, Abhijit Aswath et Srinivas Thodati Broadcom et Dell travaillent avec un ensemble de fournisseurs de virtualisation pour améliorer les contrôleurs réseau Broadcom® au sein des serveurs Dell™ PowerEdge™, afin de réduire les goulots d'étranglement et la surcharge qui peuvent altérer les performances dans les environnements virtualisés. D ans les environnements informatiques professionnels, la virtualisation offre de nombreux avantages qui permettent aux entreprises de consolider et de partager les ressources informatiques, d'augmenter le contrôle et l'efficacité et de faire fonctionner leurs datacenters de manière économique. Toutefois, tirer pleinement parti d'un environnement virtualisé exige plus que le simple déploiement de machines virtuelles. Il est indispensable d'avoir une infrastructure réseau efficace. Comme les autres ressources matérielles au sein des systèmes Dell, les adaptateurs réseau Broadcom sont virtualisés dans la machine virtuelle. Les plateformes de virtualisation utilisent une architecture basée sur un hyperviseur, également appelée architecture d'écran de machine virtuelle (VMM), qui cache les caractéristiques physiques de la plateforme informatique et permet aux machines virtuelles non modifiées d'être exécutées simultanément sur des plateformes d'hôtes. Cette conception signifie que la virtualisation se fait aux dépens des performances. Les architectures de virtualisation d'aujourd'hui comprennent des machines virtuelles avec des pilotes de périphérique, des piles d'E/S et des applications exécutées au sommet d'une couche de virtualisation. Cette dernière inclut l'émulation des périphériques, des piles d'E/S et des pilotes de périphériques physiques qui gèrent les contrôleurs réseau Ethernet. Cette couche de virtualisation engendre une charge supplémentaire et réduit les performances des systèmes, en augmentant l'utilisation du processeur et en diminuant la bande passante disponible. Broadcom, leader de la mise en réseau dans le domaine des contrôleurs réseau Gigabit Ethernet (GbE) et 10 Gigabit Ethernet (10GbE), travaille en étroite collaboration avec de nombreux fournisseurs de virtualisation, comme VMware, Microsoft, Citrix et Dell, 68 Troisième édition 2010 | dell.com/powersolutions afin de résoudre ce type de problèmes. Les contrôleurs Broadcom sont inclus sur toute une série de serveurs Dell PowerEdge en tant que cartes réseau intégrées LOM (LAN on Motherboard), cartes mezzanine et cartes d'interface réseau standard, et font également partie des solutions de virtualisation globales Dell. Broadcom travaille actuellement sur un projet en deux phases afin d'améliorer l'utilisation de ses contrôleurs dans les environnements virtualisés. La société aide ainsi les entreprises utilisatrices de systèmes Dell à optimiser les avantages de leurs initiatives de virtualisation. Phase 1 : suppression des goulots d'étranglement et accroissement des performances Pendant la première phase de son projet d'amélioration, Broadcom a cherché à supprimer les goulots d'étranglement liés à la virtualisation et à augmenter les performances du système grâce à un certain nombre de fonctionnalités supplémentaires. Par exemple, les contrôleurs réseau Ethernet Broadcom prennent maintenant en charge les déchargements sans état, tels que le déchargement des sommes de contrôle TCP, qui permet aux adaptateurs réseau de calculer les sommes de contrôle TCP à la transmission/réception, et le déchargement matériel (LSO, Large Send Offload) TCP, qui permet à la couche TCP de créer un message TCP jusqu'à 64 Ko et de l'envoyer en un seul appel en bas de la pile via IP et le pilote de périphérique Ethernet. Ainsi, le processeur hôte n'a plus à calculer les sommes de contrôle dans un environnement virtualisé. De plus, la prise en charge des trames Jumbo par Broadcom dans les environnements virtualisés est conçue pour réduire l'utilisation du processeur en diminuant les interruptions, et pour accroître le débit en permettant au système de se concentrer sur les données des trames, plutôt que sur les trames autour Reproduction de Dell Power Solutions , troisième édition 2010. Copyright © 2010 Dell Inc. Tous droits réservés. des données. Cependant, à cause de la nature monothread de l'hyperviseur dans le traitement des E/S et des copies d'E/S dupliquées dans la couche de virtualisation, les performances restent limitées avec cette approche. Broadcom prend également en charge les fonctionnalités VMware® NetQueue et Microsoft® Hyper-V™ VM Queue (VMQ), qui permettent de supprimer ces goulots d'étranglement à file d'attente unique et d'éviter d'avoir à effectuer des déchargements sans état, tels que le déchargement TCP. En outre, le mode adaptateur de bus hôte (HBA) Internet SCSI (iSCSI) dans les contrôleurs Broadcom, pris en charge dans le cadre des solutions de virtualisation Dell, peut offrir d'excellentes performances dans les environnements virtualisés. Utilisation de files d'attente multiples La tendance à l'augmentation de la densité des cœurs de processeur donne lieu à l'utilisation d'un nombre croissant de machines virtuelles, qui nécessitent des cycles de processeur supplémentaires pour diriger les paquets vers les machines virtuelles. À l'aide des files d'attente matérielles fournies par le contrôleur réseau, les fournisseurs de virtualisation ont évité de se limiter au thread unique d'un système d'exploitation traditionnel et ont optimisé l'hyperviseur pour bénéficier de plusieurs threads matériels. Sur les plateformes VMware et Microsoft Hyper-V, les paquets doivent traverser la partition parente et de l'hyperviseur, car il n'y a pas de chemin direct disponible entre le contrôleur et les machines virtuelles. À leur sortie, les paquets sont d'abord copiés depuis la machine virtuelle source pour être traités dans le commutateur virtuel. Leur adresse MAC (Media Access Control) de destination et leur ID de LAN virtuel (VLAN) sont examinés pour déterminer le chemin. Le paquet est ensuite copié dans la file d'attente de réception des autres machines virtuelles et/ou soumis au pilote réseau pour être transmis. À leur entrée, les paquets sont signalés au commutateur, qui utilise l'adresse MAC de destination et l'ID de VLAN pour déterminer dans quelle machine virtuelle ou quel groupe de machines virtuelles les paquets pourront être copiés. Les tâches de recherche de chemin, de copie des données et de filtrage représentent une latence et une charge de processeur supplémentaires, absentes dans les environnements non virtualisés. La surcharge associée peut avoir un impact considérable sur les performances réseau, surtout à 10 Gbit/s. Pour résoudre ce problème, ces tâches sont déchargées vers un adaptateur réseau, où le gestionnaire de file d'attente de transport peut transmettre les paquets à partir de plusieurs files d'attente et diriger les paquets en réception vers plusieurs files d'attente. Les fonctionnalités VMware NetQueue et Microsoft Hyper-V VMQ permettent aux contrôleurs Broadcom d'effectuer ces tâches, afin de mieux répondre aux demandes des applications gourmandes en bande passante, qui nécessitent des niveaux élevés de performance et de débit de réseau dans les environnements virtualisés. Déchargement du stockage Le stockage en réseau est capital dans les environnements virtualisés, car il permet le basculement et la migration sans heurt d'une machine virtuelle d'un serveur physique à l'autre. De nombreux déploiements de virtualisation utilisent maintenant la technologie iSCSI, une technologie de stockage en réseau accessible et hautes performances. La fonctionnalité HBA iSCSI NetXtreme II® de Broadcom, qui prend en charge la virtualisation avec VMware, Microsoft Hyper-V et Citrix® Xen®, offre la fonction de convergence requise dans les environnements virtualisés en fournissant un traitement sur la puce pour libérer les ressources de processeur et augmenter les performances et la bande passante, tel que le montre la figure 1. La fonctionnalité HBA iSCSI 10GbE et GbE de Broadcom, telle qu'elle est décrite dans cette figure, est activée par défaut sur la plateforme VMware vSphere™ 4.1 au sein des serveurs Dell PowerEdge. La fonctionnalité HBA iSCSI de Broadcom permet le traitement sur la puce du protocole iSCSI (et des protocoles TCP et IP), ce qui permet de libérer les ressources du processeur hôte à un débit linéaire de 10 Gbit/s sur un seul port Ethernet. Cette fonctionnalité offre de meilleurs avantages en termes de performances. Cela permet de répondre aux demandes des applications gourmandes en bande passante, qui nécessitent des E/S de stockage par blocs hautes performances pour l'hyperviseur, et d'alimenter toutes les instances de la machine virtuelle. Démarrage iSCSI Le démarrage iSCSI permet à un serveur de démarrer un système d'exploitation sur un réseau de stockage SAN. Ainsi, il n'est plus nécessaire de recourir au stockage sur disque local, à l'origine d'un grand nombre de pannes informatiques. En plus d'améliorer la fiabilité du système, l'utilisation de serveurs sans disque permet de simplifier la charge de travail de l'administrateur informatique en centralisant la création, la distribution et la maintenance des images de serveur. Le besoin global en capacité de stockage est ainsi réduit grâce à une plus grande utilisation de la capacité de disque, et la redondance des données augmente grâce à l'utilisation de la mise en miroir et de la réplication des données. Alors que les réseaux SAN sont de plus en plus utilisés dans les environnements virtualisés et que les administrateurs continuent à reconnaître les avantages de la migration du stockage local des serveurs individuels vers des baies de stockage gérées de façon centralisée, les options de démarrage réseau, telles que le démarrage iSCSI, sont appelées à devenir des fonctionnalités de plus en plus courantes au sein du datacenter et dans l'ensemble Significantly reduced iSCSI processing in OS stack benefits the guest OS and virtualization platform VM 1 VM 2 VM n OS SCSI stack OS SCSI stack OS SCSI stack VMware iSCSI stack Broadcom iSCSI Hypervisor or VMM Existing iSCSI and network stack Figure 1. Mode Broadcom HBA iSCSI dans un environnement virtualisé On-chip iSCSI Broadcom GbE/10GbE NIC Third-party GbE/10GbE NIC On-chip iSCSI processing frees processor cycles, helping to reduce power consumption and increase performance Reproduction de Dell Power Solutions , troisième édition 2010. Copyright © 2010 Dell Inc. Tous droits réservés. dell.com/powersolutions | Troisième édition 2010 69 Networking de l'entreprise. Broadcom, VMware, Microsoft et Citrix collaborent pour créer des options de démarrage iSCSI simples et complètes qui utilisent la technologie iSCSI pour remplacer le stockage local dans les environnements virtualisés. La fonctionnalité de démarrage iSCSI GbE et 10GbE de Broadcom est activée par défaut dans VMware vSphere 4.1 sur les serveurs Dell PowerEdge, et le mode HBA iSCSI ainsi que le démarrage iSCSI de Broadcom pour les contrôleurs 10GbE dans les hyperviseurs sont tous deux pris en charge sur les plateformes Dell.1 Phase 2 : intégration des améliorations SR-IOV La deuxième phase du projet de virtualisation améliorée de Broadcom est en cours. Elle se concentre sur la virtualisation des E/S à racine unique (SR-IOV). Ces améliorations seront probablement disponibles sur les systèmes Dell utilisant des contrôleurs Broadcom NetXtreme II 57712. Les contrôleurs réseau Ethernet qui prennent an charge la virtualisation SR-IOV sont conçus pour augmenter le débit d'E/S et pour réduire l'utilisation du processeur, tout en améliorant l'évolutivité et les fonctions de partage des périphériques. La virtualisation SR-IOV permet d'affecter directement les E/S d'un contrôleur réseau Ethernet à plusieurs machines virtuelles, afin d'optimiser le potentiel de bande passante de l'adaptateur réseau. La spécification SR-IOV PCI Express (PCIe) pour les technologies de partage et de virtualisation d'E/S PCI constitue la base pour implémenter la virtualisation SR-IOV dans les contrôleurs Broadcom compatibles SR-IOV. Cette spécification définit une extension à la spécification PCIe qui permet à plusieurs images systèmes ou machines virtuelles de partager des ressources matérielles PCIe (voir figure 2). Le périphérique SR-IOV Broadcom présente une fonction physique qui comprend plusieurs fonctions virtuelles. Une fonction virtuelle est une fonction PCIe légère, et les ressources associées au transfert de données principal de la fonction sont à la disposition de la machine virtuelle. La fonction virtuelle peut être partagée en série Figure 2. Contrôleur Broadcom prenant en charge la virtualisation SR-IOV dans un environnement virtualisé. entre différentes machines virtuelles (elle est affectée à une machine virtuelle, puis reconfigurée et affectée à une autre). En outre, une fonction virtuelle peut être transformée en fonction physique. La prise en charge complète de la virtualisation SRIOV PCIe implique d'améliorer à la fois les fonctionnalités existantes et d'en ajouter de nouvelles à la plateforme et au système d'exploitation. Les pilotes de périphériques de contrôleur réseau prenant en charge la virtualisation SRIOV doivent également être remodelés pour prendre en charge des chemins de communication supplémentaires entre les fonctions physiques et virtuelles. VMware VMDirectPath Il est particulièrement important de bénéficier d'un débit élevé et d'une faible latence dans un système distribué, où les latences d'E/S des nœuds affectent les performances du cluster et de l'application dans son ensemble. Une faible latence est nécessaire pour préserver la cohérence des données dans les clusters de base de données de grande taille lors de l'implémentation d'adaptateurs réseau SR-IOV évolutifs. Grâce à l'architecture du plug-in réseau VMware VMDirectPath et à un périphérique Broadcom compatible SR-IOV, une fonction virtuelle peut être directement affectée à une machine virtuelle. Vous obtenez ainsi des performances proches de performances natives sans copier d'E/S supplémentaires dans l'hyperviseur, ainsi qu'une gamme complète de fonctionnalités de virtualisation, telles que la technologie VMware vMotion™ et la migration dynamique Microsoft Hyper-V (voir figure 3). L'affectation directe des périphériques PCI aux machines virtuelles est nécessaire pour les appliances d'E/S et les machines virtuelles hautes performances. Avec la fonction VMDirectPath dynamique ou Uniform Pass-Through version 2 (UPTv2), l'interface du périphérique est divisée en deux, pour pouvoir faire passer les opérations stratégiques (registres d'index producteur TX/RX, registres de masque d'interruption et opérations émulées peu fréquentes, par exemple) vers VM 1 VM 2 VM n Virtual NIC VF device driver VF device driver PF device driver Hypervisor or VMM PF VF VF SR-IOV-capable Broadcom controller 1Pour plus d'informations sur la fonctionnalité iSCSI des adaptateurs Broadcom pour les systèmes Dell, consultez l'article « Une approche réseau unifiée du stockage iSCSI avec les contrôleurs Broadcom » de Dhiraj Sehgal, Abhijit Aswath et Srinivas Thodati, disponible dans la deuxième édition 2010 de Dell Power Solutions, dell.com/downloads/global/power/ps2q10-20100411-broadcom.pdf. 70 Troisième édition 2010 | dell.com/powersolutions Reproduction de Dell Power Solutions , troisième édition 2010. Copyright © 2010 Dell Inc. Tous droits réservés. VM 1 VM 2 VM n Virtual NIC VF device driver VF device driver PF device driver Hypervisor or VMM VF Figure 3. Fonction VMDirectPath VMware avec un contrôleur Broadcom prenant en charge la virtualisation SR-IOV VF PF NIC embedded switch SR-IOV-capable Broadcom controller le pilote de gestion exécuté dans VMware ESX. Pour implémenter la migration dynamique, la fonction virtuelle est acceptée et passe du mode passerelle au mode émulation, pour que l'état minimal du périphérique soit contrôlé ou restauré. La plus grande partie de l'état se trouve dans la mémoire d'une machine virtuelle, et les systèmes d'exploitation invités ne sont pas au courant de la migration. La prise en charge de la fonction VMDirectPath dynamique nécessite de remodeler la plateforme du système d'exploitation et le pilote de périphérique réseau. La plateforme VMware implémente une architecture de plug-in réseau qui permet de faire passer les opérations stratégiques en partitionnant le pilote vmxnet pour inclure un interpréteur de commandes spécifique aux machines virtuelles et un module ou un pilote de plug-in réseau spécifique au matériel. L'interpréteur de commandes spécifique aux machines virtuelles implémente l'interface sur la pile réseau du système d'exploitation et interagit avec l'hyperviseur pour la configuration. Le pilote de plug-in réseau spécifique au matériel interagit avec le matériel dans le chemin de données et utilise l'interface de l'interpréteur de commandes de machine virtuelle pour les appels spécifiques au système d'exploitation. VMware ESX contrôle le plug-in réseau utilisé par l'interpréteur de commandes pour charger le plug-in dans la machine virtuelle basée sur la fonction virtuelle et pour mapper la fonction virtuelle dans un espace d'adressage de machine virtuelle. Commutateur intégré à la carte d'interface réseau La virtualisation et le partage des E/S sont également requis pour les configurations point à point et basées sur le commutateur, afin d'assurer l'interopérabilité entre les machines virtuelles, les fonctions virtuelles, les puces, les commutateurs, les points de terminaison et les ponts. Un commutateur Broadcom intégré à la carte d'interface réseau permet la commutation Ethernet entre machines virtuelles, d'une fonction virtuelle à l'autre, et à partir ou vers des ports externes. Virtualisation efficace Le réseau est un élément clé des environnements virtualisés, et les contrôleurs réseau qui sont optimisés pour répondre aux demandes de la virtualisation peuvent contribuer à maximiser les performances. Les efforts de Broadcom en matière de virtualisation permettent aux entreprises qui utilisent les systèmes Dell de tirer parti des technologies de déchargement et des E/S en temps réel et flexibles. Ces améliorations permettent de bénéficier d'une virtualisation efficace et performante plus facilement. Les fonctionnalités Broadcom de virtualisation SR-IOV et de passerelle d'E/S pour les contrôleurs réseau Ethernet, avec le déchargement TCP et iSCSI, peuvent offrir des performances proches de performances natives ainsi qu'une latence réduite. À l'avenir, Broadcom envisage de continuer à prendre en charge et de permettre la virtualisation sur les plateformes de serveurs Dell pour permettre aux entreprises informatiques d'accélérer l'adoption d'infrastructures virtualisées tout en augmentant les performances et en contrôlant les coûts.   Dhiraj Sehgal est responsable senior de gamme de produits pour les contrôleurs Ethernet au sein de Broadcom. Abhijit Aswath est responsable senior de gamme de produits pour le logiciel des contrôleurs Ethernet au sein de Broadcom. Srinivas Thodati est responsable senior du marketing produits pour les serveurs PowerEdge série M au sein de Dell. En savoir plus Contrôleurs Ethernet Broadcom : broadcom.com/products/Ethernet-Controllers Serveurs Dell PowerEdge : dell.com/poweredge Reproduction de Dell Power Solutions , troisième édition 2010. Copyright © 2010 Dell Inc. Tous droits réservés. dell.com/powersolutions | Troisième édition 2010 71