En février, Stanford a organisé une conférence sur le calcul haute performance (HPC). Les représentants de VMware ont déclaré qu'en travaillant avec un GPU, un système basé sur un hyperviseur ESXi modifié est aussi rapide que des solutions bare metal.
Nous vous parlerons des technologies qui ont rendu cela possible.
/ photo
Problème de performance
Les analystes estiment qu'environ 70 % des charges de travail dans les centres de données . Cependant, les 30 % restants fonctionnent encore sur du matériel nu, sans hyperviseur. Ces 30 % sont principalement constitués d'applications à forte charge, comme l'entraînement des réseaux neuronaux, qui utilisent des GPU.
Les experts expliquent cette tendance par le fait que l'hyperviseur, en tant que couche d'abstraction intermédiaire, peut affecter les performances de l'ensemble du système. Des études menées il y a cinq ans montraient : Une réduction d'environ 10 % de la vitesse de fonctionnement. Par conséquent, les entreprises et les opérateurs de centres de données ne sont pas pressés de transférer la charge HPC vers un environnement virtuel.
Mais les technologies de virtualisation évoluent et s'améliorent. Lors d'une conférence il y a un mois, VMware a déclaré que l'hyperviseur ESXi n'avait pas d'impact négatif sur les performances du GPU. La vitesse de calcul peut être réduite de 3 %, ce qui est comparable à celle d'une machine virtuelle.
Comment ça marche
Afin d'améliorer les performances des systèmes HPC équipés de GPU, VMware a apporté plusieurs modifications à l'hyperviseur. VMware a notamment supprimé la fonction vMotion. Celle-ci est nécessaire à l'équilibrage de charge et permet généralement la migration des machines virtuelles (VM) entre serveurs ou GPU. La désactivation de vMotion a permis d'attribuer un GPU spécifique à chaque VM, réduisant ainsi les coûts d'échange de données.
Un autre élément clé du système E/S DirectPath. Elle permet au pilote CUDA pour le calcul parallèle d'interagir directement avec les machines virtuelles, sans passer par l'hyperviseur. Lorsque plusieurs machines virtuelles doivent être exécutées simultanément sur un même GPU, la solution GRID vGPU est utilisée. Elle divise la mémoire de la carte en plusieurs segments (mais les cycles de calcul ne sont pas divisés).
Le schéma de fonctionnement de deux machines virtuelles dans ce cas ressemblera à ceci :

Résultats et prévisions
société hyperviseur, ayant formé un modèle de langage basé sur La perte de performance n'était que de 3 à 4 % par rapport au système nu. En contrepartie, le système était capable de distribuer les ressources à la demande, en fonction des charges actuelles.
Le géant de l'informatique aussi avec des conteneurs. Les ingénieurs de l'entreprise ont entraîné des réseaux neuronaux à reconnaître des images. Ce faisant, les ressources d'un processeur graphique ont été réparties entre quatre machines virtuelles conteneurisées. Résultat : les performances de chaque machine ont diminué de 17 % (par rapport à une machine virtuelle disposant d'un accès complet aux ressources GPU). Cependant, le nombre d'images traitées par seconde a été réduit. trois fois. On s'attend à ce que de tels systèmes application dans le domaine de l'analyse de données et de la modélisation informatique.
Parmi les problèmes potentiels auxquels VMware pourrait être confronté, les experts affirment un public cible assez restreint. Seul un petit nombre d'entreprises utilisent des systèmes hautes performances. Bien que Statista , que d'ici 2021, 94 % des charges de travail des centres de données mondiaux seront virtualisées. Les analystes estiment que la valeur du marché du HPC passera de 32 à 45 milliards de dollars entre 2017 et 2022.

/ photo PD
Solutions similaires
Il existe sur le marché plusieurs analogues développés par de grandes sociétés informatiques : AMD et Intel.
La première entreprise à virtualiser les GPU Approche SR-IOV (virtualisation d'entrées/sorties à racine unique). Cette technologie permet aux machines virtuelles d'accéder à une partie des capacités matérielles du système. La solution permet de partager un processeur graphique entre 16 utilisateurs avec des performances équivalentes à celles des systèmes virtualisés.
Quant au deuxième géant de l’informatique, leur sur l'hyperviseur Citrix XenServer 7. Il combine le fonctionnement d'un pilote GPU standard et d'une machine virtuelle, ce qui permet à cette dernière d'afficher des applications et des bureaux 3D sur les appareils de centaines d'utilisateurs.
L'avenir de la technologie
Développeurs de GPU virtuels sur la mise en œuvre de systèmes d'IA et la popularité croissante des solutions hautes performances sur le marché des technologies d'entreprise. Ils espèrent que la nécessité de traiter de grandes quantités de données augmentera la demande de vGPU.
Maintenant les producteurs Combiner les fonctionnalités du CPU et du GPU dans un seul cœur pour accélérer la résolution des problèmes graphiques, mathématiques, logiques et de traitement des données. L'arrivée future de tels cœurs sur le marché modifiera l'approche de la virtualisation des ressources et leur répartition entre les charges de travail dans un environnement virtuel et cloud.
Que lire sur ce sujet dans notre blog d'entreprise :
Quelques publications de notre chaîne Telegram :
Source: habr.com
