Situación: las GPU virtuales no son inferiores en rendimiento a las soluciones de hardware

En febrero, Stanford organizó una conferencia sobre informática de alto rendimiento (HPC). Los representantes de VMware dijeron que cuando se trabaja con una GPU, un sistema basado en un hipervisor ESXi modificado no es inferior en velocidad a las soluciones bare metal.

Hablamos de las tecnologías que permitieron lograrlo.

Situación: las GPU virtuales no son inferiores en rendimiento a las soluciones de hardware
/ foto victorgrigas CC BY-SA

Problema de rendimiento

Según los analistas, alrededor del 70% de las cargas de trabajo en los centros de datos virtualizado. Sin embargo, el 30% restante todavía funciona sin hipervisores. Este 30% se compone principalmente de aplicaciones de alta carga, como las relacionadas con el entrenamiento de redes neuronales y el uso de GPU.

Los expertos explican esta tendencia por el hecho de que el hipervisor, como capa de abstracción intermedia, puede afectar el rendimiento de todo el sistema. En estudios hace cinco años. puedes encontrar los datos sobre reducir la velocidad de trabajo en un 10%. Por tanto, las empresas y los operadores de centros de datos no tienen prisa por trasladar las cargas de trabajo de HPC a un entorno virtual.

Pero las tecnologías de virtualización se están desarrollando y mejorando. En una conferencia hace un mes, VMware dijo que el hipervisor ESXi no tiene un impacto negativo en el rendimiento de la GPU. La velocidad de la computadora se puede reducir en un tres por ciento, lo que es comparable con el metal desnudo.

¿Cómo funciona esto

Para mejorar el rendimiento de los sistemas HPC con GPU, VMware ha realizado una serie de cambios en el hipervisor. En particular, se eliminó la función vMotion. Es necesario para el equilibrio de carga y, por lo general, transfiere máquinas virtuales (VM) entre servidores o GPU. Al deshabilitar vMotion, a cada VM se le asignó una GPU específica. Esto ayudó a reducir los costos al intercambiar datos.

Otro componente clave del sistema. es tecnología E/S de ruta directa. Permite que el controlador de computación paralela CUDA interactúe con máquinas virtuales directamente, sin pasar por el hipervisor. Cuando necesita ejecutar varias máquinas virtuales en una GPU a la vez, se utiliza la solución GRID vGPU. Divide la memoria de la tarjeta en varios segmentos (pero los ciclos computacionales no están divididos).

El diagrama de funcionamiento de dos máquinas virtuales en este caso se verá así:

Situación: las GPU virtuales no son inferiores en rendimiento a las soluciones de hardware

Resultados y previsiones

Inmobiliaria pruebas realizadas hipervisor entrenando un modelo de lenguaje basado en TensorFlow. El "daño" al rendimiento fue sólo del 3 al 4% en comparación con el metal desnudo. A cambio, el sistema pudo distribuir recursos según la demanda dependiendo de la carga actual.

El gigante de TI también pruebas realizadas con contenedores. Los ingenieros de la empresa entrenaron redes neuronales para reconocer imágenes. Al mismo tiempo, los recursos de una GPU se distribuyeron entre cuatro máquinas virtuales de contenedor. Como resultado, el rendimiento de las máquinas individuales disminuyó en un 17% (en comparación con una sola VM con acceso completo a los recursos de la GPU). Sin embargo, el número de imágenes procesadas por segundo. ha aumentado tres veces. Se espera que tales sistemas encontrará Aplicaciones en análisis de datos y modelado por ordenador.

Entre los posibles problemas que puede enfrentar VMware, los expertos emitir público objetivo bastante reducido. Un pequeño número de empresas todavía trabajan con sistemas de alto rendimiento. Aunque en Statista celebrarque para 2021, el 94% de las cargas de trabajo de los centros de datos del mundo estarán virtualizadas. Por proyectado Según los analistas, el valor del mercado de HPC crecerá de 32 a 45 mil millones de dólares en el período de 2017 a 2022.

Situación: las GPU virtuales no son inferiores en rendimiento a las soluciones de hardware
/ foto Punto de acceso global PD

Soluciones similares

Hay varios análogos en el mercado desarrollados por grandes empresas de TI: AMD e Intel.

La primera empresa de virtualización de GPU. ofertas enfoque basado en SR-IOV (virtualización de entrada/salida de raíz única). Esta tecnología le da a la VM acceso a parte de las capacidades de hardware del sistema. La solución le permite compartir la GPU entre 16 usuarios con el mismo rendimiento de los sistemas virtualizados.

En cuanto al segundo gigante de TI, basado en tecnología en el hipervisor Citrix XenServer 7. Combina el trabajo de un controlador GPU estándar y una máquina virtual, lo que permite a esta última mostrar aplicaciones y escritorios 3D en los dispositivos de cientos de usuarios.

El futuro de la tecnología

Desarrolladores de GPU virtuales Haz una apuesta sobre la implementación de sistemas de IA y la creciente popularidad de soluciones de alto rendimiento en el mercado de tecnología empresarial. Esperan que la necesidad de procesar grandes cantidades de datos aumente la demanda de vGPU.

Ahora fabricantes buscando una manera combine la funcionalidad de la CPU y GPU en un núcleo para acelerar la resolución de problemas relacionados con gráficos, realización de cálculos matemáticos, operaciones lógicas y procesamiento de datos. La aparición de estos núcleos en el mercado en el futuro cambiará el enfoque de la virtualización de recursos y su distribución entre cargas de trabajo en entornos virtuales y en la nube.

Qué leer sobre el tema en nuestro blog corporativo:

Un par de publicaciones de nuestro canal de Telegram:

Fuente: habr.com

Añadir un comentario