Situation : les GPU virtuels ne sont pas inférieurs en performances aux solutions matérielles

En février, Stanford a organisé une conférence sur le calcul haute performance (HPC). Les représentants de VMware ont déclaré que lorsqu'on travaille avec un GPU, un système basé sur un hyperviseur ESXi modifié n'est pas inférieur en vitesse aux solutions nues.

Nous parlons des technologies qui ont permis d’y parvenir.

Situation : les GPU virtuels ne sont pas inférieurs en performances aux solutions matérielles
/ photo Victorgrigas CC BY-SA

Problème de performance

Selon les analystes, environ 70 % des charges de travail dans les centres de données virtualisé. Cependant, les 30 % restants fonctionnent toujours sur du bare metal, sans hyperviseurs. Ces 30 % sont principalement constitués d'applications à forte charge, comme celles liées à l'entraînement des réseaux de neurones et à l'utilisation de GPU.

Les experts expliquent cette tendance par le fait que l'hyperviseur, en tant que couche d'abstraction intermédiaire, peut affecter les performances de l'ensemble du système. Aux études il y a cinq ans vous pouvez trouver les données sur la réduction de la vitesse de travail de 10 %. Par conséquent, les entreprises et les opérateurs de centres de données ne sont pas pressés de transférer les charges de travail HPC vers un environnement virtuel.

Mais les technologies de virtualisation se développent et s’améliorent. Lors d'une conférence il y a un mois, VMware a déclaré que l'hyperviseur ESXi n'avait pas d'impact négatif sur les performances du GPU. La vitesse de calcul peut être réduite de trois pour cent, ce qui est comparable au bare metal.

Comment ça marche

Pour améliorer les performances des systèmes HPC avec GPU, VMware a apporté un certain nombre de modifications à l'hyperviseur. Il a notamment été débarrassé de la fonction vMotion. Il est nécessaire à l'équilibrage de charge et transfère généralement des machines virtuelles (VM) entre serveurs ou GPU. La désactivation de vMotion a permis à chaque VM de se voir attribuer un GPU spécifique. Cela a permis de réduire les coûts lors de l’échange de données.

Un autre élément clé du système c'est la technologie E/S DirectPath. Il permet au pilote de calcul parallèle CUDA d'interagir directement avec les machines virtuelles, en contournant l'hyperviseur. Lorsque vous devez exécuter plusieurs machines virtuelles sur un GPU à la fois, la solution GRID vGPU est utilisée. Il divise la mémoire de la carte en plusieurs segments (mais les cycles de calcul ne sont pas divisés).

Le schéma de fonctionnement de deux machines virtuelles dans ce cas ressemblera à ceci :

Situation : les GPU virtuels ne sont pas inférieurs en performances aux solutions matérielles

Résultats et prévisions

société tests effectués hyperviseur en entraînant un modèle de langage basé sur TensorFlow. Les « dommages » aux performances n’étaient que de 3 à 4 % par rapport au bare metal. En retour, le système était capable de distribuer les ressources à la demande en fonction de la charge actuelle.

Le géant de l'informatique aussi tests effectués avec des conteneurs. Les ingénieurs de l'entreprise ont formé des réseaux neuronaux pour reconnaître les images. Dans le même temps, les ressources d’un GPU étaient réparties entre quatre VM de conteneur. En conséquence, les performances des machines individuelles ont diminué de 17 % (par rapport à une seule VM avec un accès complet aux ressources GPU). Cependant, le nombre d'images traitées par seconde a augmenté trois fois. On s'attend à ce que de tels systèmes trouvera applications en analyse de données et en modélisation informatique.

Parmi les problèmes potentiels auxquels VMware peut être confronté, les experts émettre public cible plutôt restreint. Un petit nombre d'entreprises travaillent encore avec des systèmes performants. Bien que dans Statista célébrerque d'ici 2021, 94 % des charges de travail des centres de données dans le monde seront virtualisées. Par projeté Selon les analystes, la valeur du marché du HPC passera de 32 à 45 milliards de dollars entre 2017 et 2022.

Situation : les GPU virtuels ne sont pas inférieurs en performances aux solutions matérielles
/ photo Point d'accès mondial PD

Solutions similaires

Il existe plusieurs analogues sur le marché développés par de grandes sociétés informatiques : AMD et Intel.

La première entreprise de virtualisation GPU offre approche basée sur SR-IOV (virtualisation entrée/sortie à racine unique). Cette technologie donne à la VM accès à une partie des capacités matérielles du système. La solution permet de partager le GPU entre 16 utilisateurs avec des performances égales des systèmes virtualisés.

Quant au deuxième géant de l'informatique, il basé sur la technologie sur l'hyperviseur Citrix XenServer 7. Il combine le travail d'un pilote GPU standard et d'une machine virtuelle, ce qui permet à cette dernière d'afficher des applications et des bureaux 3D sur les appareils de centaines d'utilisateurs.

L'avenir de la technologie

Développeurs de GPU virtuels parier sur la mise en œuvre de systèmes d'IA et la popularité croissante des solutions hautes performances sur le marché des technologies d'entreprise. Ils espèrent que la nécessité de traiter de grandes quantités de données augmentera la demande de vGPU.

Maintenant les fabricants je cherche un moyen combinez les fonctionnalités du CPU et du GPU dans un seul cœur pour accélérer la résolution des problèmes liés aux graphiques, à l'exécution de calculs mathématiques, d'opérations logiques et de traitement des données. L'apparition de tels cœurs sur le marché à l'avenir modifiera l'approche de la virtualisation des ressources et leur répartition entre les charges de travail dans les environnements virtuels et cloud.

Que lire sur le sujet sur notre blog d'entreprise :

Quelques articles de notre chaîne Telegram :

Source: habr.com

Ajouter un commentaire