Situación: as GPU virtuais non son inferiores en rendemento ás solucións de hardware

En febreiro, Stanford acolleu unha conferencia sobre computación de alto rendemento (HPC). Os representantes de VMware dixeron que cando se traballa cunha GPU, un sistema baseado nun hipervisor ESXi modificado non é inferior en velocidade ás solucións simples.

Falamos das tecnoloxías que fixeron posible conseguilo.

Situación: as GPU virtuais non son inferiores en rendemento ás solucións de hardware
/ foto Victorgrigas CC BY-SA

Problema de rendemento

Segundo os analistas, preto do 70% das cargas de traballo nos centros de datos virtualizado. Non obstante, o 30% restante aínda funciona con metal nu sen hipervisores. Este 30% consiste na súa maioría en aplicacións de alta carga, como as relacionadas co adestramento de redes neuronais e o uso de GPU.

Os expertos explican esta tendencia polo feito de que o hipervisor, como capa de abstracción intermedia, pode afectar o rendemento de todo o sistema. En estudos hai cinco anos podes atopar os datos sobre reducir a velocidade de traballo nun 10%. Polo tanto, as empresas e os operadores de centros de datos non teñen présa por transferir cargas de traballo de HPC a un ambiente virtual.

Pero as tecnoloxías de virtualización están a desenvolver e mellorar. Nunha conferencia hai un mes, VMware dixo que o hipervisor ESXi non ten un impacto negativo no rendemento da GPU. A velocidade de cálculo pódese reducir nun tres por cento, o que é comparable ao metal nu.

Chat isto

Para mellorar o rendemento dos sistemas HPC con GPU, VMware realizou unha serie de cambios no hipervisor. En particular, eliminouse da función vMotion. É necesario para o equilibrio de carga e normalmente transfire máquinas virtuais (VM) entre servidores ou GPU. Ao desactivar vMotion, a cada máquina virtual se lle asignaba agora unha GPU específica. Isto axudou a reducir os custos ao intercambiar datos.

Outro compoñente clave do sistema é tecnoloxía E/S DirectPath. Permite que o controlador de computación paralela CUDA interactúe coas máquinas virtuais directamente, evitando o hipervisor. Cando precisa executar varias máquinas virtuales nunha GPU á vez, utilízase a solución GRID vGPU. Divide a memoria da tarxeta en varios segmentos (pero os ciclos computacionais non están divididos).

O diagrama de funcionamento de dúas máquinas virtuais neste caso terá o seguinte aspecto:

Situación: as GPU virtuais non son inferiores en rendemento ás solucións de hardware

Resultados e previsións

Compañía probas realizadas hipervisor mediante a formación dun modelo de linguaxe baseado en TensorFlow. O "dano" no rendemento foi só do 3-4% en comparación co bare metal. A cambio, o sistema foi capaz de distribuír os recursos baixo demanda en función da carga actual.

O xigante das TIC tamén probas realizadas con contedores. Os enxeñeiros da compañía adestraron redes neuronais para recoñecer imaxes. Ao mesmo tempo, os recursos dunha GPU distribuíronse entre catro máquinas virtuales de contedores. Como resultado, o rendemento das máquinas individuais diminuíu un 17 % (en comparación cunha única máquina virtual con acceso total aos recursos da GPU). Non obstante, o número de imaxes procesadas por segundo aumentou tres veces. Espérase que tales sistemas atopará aplicacións en análise de datos e modelado informático.

Entre os posibles problemas que pode enfrontarse VMware, os expertos asignar público obxectivo máis ben reducido. Un pequeno número de empresas seguen traballando con sistemas de alto rendemento. Aínda que en Statista celebrarque para 2021, o 94% das cargas de traballo dos centros de datos do mundo estarán virtualizadas. Por previsións analistas, o valor do mercado HPC crecerá de 32 a 45 mil millóns de dólares no período de 2017 a 2022.

Situación: as GPU virtuais non son inferiores en rendemento ás solucións de hardware
/ foto Punto de acceso global PD

Solucións semellantes

Existen varios análogos no mercado que son desenvolvidos por grandes empresas informáticas: AMD e Intel.

A primeira empresa de virtualización de GPU ofertas enfoque baseado en SR-IOV (virtualización de entrada/saída de raíz única). Esta tecnoloxía dálle á máquina virtual acceso a parte das capacidades de hardware do sistema. A solución permítelle compartir a GPU entre 16 usuarios co mesmo rendemento dos sistemas virtualizados.

En canto ao segundo xigante das TIC, eles baseada na tecnoloxía no hipervisor Citrix XenServer 7. Combina o traballo dun controlador de GPU estándar e unha máquina virtual, o que permite a esta última mostrar aplicacións e escritorios 3D nos dispositivos de centos de usuarios.

Futuro da tecnoloxía

Desenvolvedores de GPU virtuais facer unha aposta sobre a implementación de sistemas de IA e a crecente popularidade de solucións de alto rendemento no mercado tecnolóxico empresarial. Esperan que a necesidade de procesar grandes cantidades de datos aumente a demanda de vGPU.

Agora os fabricantes buscando un camiño combina a funcionalidade da CPU e da GPU nun só núcleo para acelerar a resolución de problemas relacionados cos gráficos, a realización de cálculos matemáticos, operacións lóxicas e procesamento de datos. A aparición destes núcleos no mercado no futuro cambiará o enfoque da virtualización de recursos e a súa distribución entre cargas de traballo en ambientes virtuais e na nube.

Que ler sobre o tema no noso blog corporativo:

Un par de publicacións da nosa canle de Telegram:

Fonte: www.habr.com

Engadir un comentario