Situação: GPUs virtuais não são inferiores em desempenho às soluções de hardware

Em fevereiro, Stanford organizou uma conferência sobre computação de alto desempenho (HPC). Representantes da VMware disseram que, ao trabalhar com uma GPU, um sistema baseado em um hipervisor ESXi modificado não é inferior em velocidade às soluções bare metal.

Falamos sobre as tecnologias que tornaram possível conseguir isso.

Situação: GPUs virtuais não são inferiores em desempenho às soluções de hardware
/ foto Victor Grigas CC BY-SA

Problema de desempenho

Segundo analistas, cerca de 70% das cargas de trabalho em data centers virtualizado. No entanto, os 30% restantes ainda funcionam em bare metal, sem hipervisores. Esses 30% consistem principalmente em aplicativos de alta carga, como aqueles relacionados ao treinamento de redes neurais e ao uso de GPUs.

Os especialistas explicam essa tendência pelo fato de o hipervisor, como camada intermediária de abstração, poder afetar o desempenho de todo o sistema. Em estudos há cinco anos você pode encontrar os dados sobre reduzir a velocidade de trabalho em 10%. Portanto, as empresas e os operadores de data centers não têm pressa em transferir cargas de trabalho de HPC para um ambiente virtual.

Mas as tecnologias de virtualização estão se desenvolvendo e melhorando. Em uma conferência há um mês, a VMware disse que o hipervisor ESXi não tem impacto negativo no desempenho da GPU. A velocidade de computação pode ser reduzida em três por cento, o que é comparável ao bare metal.

Как это работает

Para melhorar o desempenho dos sistemas HPC com GPUs, a VMware fez diversas alterações no hipervisor. Em particular, eliminou a função vMotion. É necessário para balanceamento de carga e geralmente transfere máquinas virtuais (VMs) entre servidores ou GPUs. A desativação do vMotion resultou na atribuição de uma GPU específica a cada VM. Isso ajudou a reduzir custos na troca de dados.

Outro componente chave do sistema é tecnologia E/S DirectPath. Ele permite que o driver de computação paralela CUDA interaja diretamente com máquinas virtuais, ignorando o hipervisor. Quando você precisa executar várias VMs em uma GPU ao mesmo tempo, a solução GRID vGPU é usada. Divide a memória do cartão em vários segmentos (mas os ciclos computacionais não são divididos).

O diagrama de operação de duas máquinas virtuais, neste caso, ficará assim:

Situação: GPUs virtuais não são inferiores em desempenho às soluções de hardware

Resultados e previsões

companhia testes realizados hipervisor treinando um modelo de linguagem baseado em TensorFlow. O “dano” de desempenho foi de apenas 3–4% em comparação com o bare metal. Em troca, o sistema foi capaz de distribuir recursos sob demanda, dependendo da carga atual.

A gigante de TI também testes realizados com recipientes. Os engenheiros da empresa treinaram redes neurais para reconhecer imagens. Ao mesmo tempo, os recursos de uma GPU foram distribuídos entre quatro VMs contêineres. Como resultado, o desempenho de máquinas individuais diminuiu 17% (em comparação com uma única VM com acesso total aos recursos da GPU). No entanto, o número de imagens processadas por segundo aumentou três vezes. Espera-se que tais sistemas vai encontrar aplicações em análise de dados e modelagem computacional.

Entre os problemas potenciais que a VMware pode enfrentar, especialistas emitir público-alvo bastante restrito. Um pequeno número de empresas ainda trabalha com sistemas de alto desempenho. Embora no Statista celebrarque até 2021, 94% das cargas de trabalho dos data centers do mundo serão virtualizadas. Por previsões analistas, o valor do mercado de HPC crescerá de 32 para 45 bilhões de dólares no período de 2017 a 2022.

Situação: GPUs virtuais não são inferiores em desempenho às soluções de hardware
/ foto Ponto de acesso global PD

Soluções semelhantes

Existem vários análogos no mercado desenvolvidos por grandes empresas de TI: AMD e Intel.

A primeira empresa para virtualização de GPU oferece abordagem baseada em SR-IOV (virtualização de entrada/saída de raiz única). Esta tecnologia dá à VM acesso a parte dos recursos de hardware do sistema. A solução permite compartilhar a GPU entre 16 usuários com igual desempenho de sistemas virtualizados.

Quanto ao segundo gigante de TI, eles baseado em tecnologia no hipervisor Citrix XenServer 7. Ele combina o trabalho de um driver GPU padrão e uma máquina virtual, que permite a esta última exibir aplicativos e desktops 3D nos dispositivos de centenas de usuários.

O futuro da tecnologia

Desenvolvedores de GPU Virtual fazer uma aposta na implementação de sistemas de IA e na crescente popularidade de soluções de alto desempenho no mercado de tecnologia empresarial. Eles esperam que a necessidade de processar grandes quantidades de dados aumente a procura por vGPUs.

Agora fabricantes procurando um caminho combine a funcionalidade da CPU e GPU em um núcleo para acelerar a resolução de problemas relacionados a gráficos, realizando cálculos matemáticos, operações lógicas e processamento de dados. O aparecimento de tais núcleos no mercado no futuro mudará a abordagem à virtualização de recursos e à sua distribuição entre cargas de trabalho em ambientes virtuais e em nuvem.

O que ler sobre o tema em nosso blog corporativo:

Algumas postagens do nosso canal Telegram:

Fonte: habr.com

Adicionar um comentário