Situation: virtuelle GPU'er er ikke ringere i ydeevne end hardwareløsninger

I februar var Stanford vært for en konference om high-performance computing (HPC). VMware-repræsentanter sagde, at når man arbejder med en GPU, er et system baseret på en modificeret ESXi hypervisor ikke ringere i hastighed end bare metal-løsninger.

Vi taler om de teknologier, der gjorde det muligt at opnå dette.

Situation: virtuelle GPU'er er ikke ringere i ydeevne end hardwareløsninger
/ Foto Victorgrigas CC BY-SA

Performance problem

Ifølge analytikere, omkring 70% af arbejdsbelastningen i datacentre virtualiseret. De resterende 30 % kører dog stadig på bar metal uden hypervisorer. Disse 30 % består for det meste af højbelastningsapplikationer, såsom dem, der er relateret til træning af neurale netværk og brug af GPU'er.

Eksperter forklarer denne tendens med, at hypervisoren, som et mellemliggende abstraktionslag, kan påvirke hele systemets ydeevne. I studier for fem år siden du kan finde dataene om at reducere arbejdshastigheden med 10 %. Derfor har virksomheder og datacenteroperatører ikke travlt med at overføre HPC-arbejdsbelastninger til et virtuelt miljø.

Men virtualiseringsteknologier udvikler sig og forbedres. På en konference for en måned siden sagde VMware, at ESXi-hypervisoren ikke har en negativ indvirkning på GPU-ydeevnen. Beregningshastigheden kan reduceres med tre procent, hvilket kan sammenlignes med bart metal.

Hvordan fungerer denne her

For at forbedre ydeevnen af ​​HPC-systemer med GPU'er har VMware foretaget en række ændringer af hypervisoren. Især blev den af ​​med vMotion-funktionen. Det er nødvendigt for belastningsbalancering og overfører normalt virtuelle maskiner (VM'er) mellem servere eller GPU'er. Deaktivering af vMotion resulterede i, at hver VM nu blev tildelt en specifik GPU. Dette var med til at reducere omkostningerne ved udveksling af data.

En anden nøglekomponent i systemet er teknologi DirectPath I/O. Det gør det muligt for CUDA parallel computing-driveren at interagere med virtuelle maskiner direkte og omgå hypervisoren. Når du skal køre flere VM'er på én GPU på én gang, bruges GRID vGPU-løsningen. Det opdeler kortets hukommelse i flere segmenter (men beregningscyklusserne er ikke opdelt).

Operationsdiagrammet for to virtuelle maskiner i dette tilfælde vil se sådan ud:

Situation: virtuelle GPU'er er ikke ringere i ydeevne end hardwareløsninger

Resultater og prognoser

selskab gennemførte tests hypervisor ved at træne en sprogmodel ud fra TensorFlow. Ydeevnen "skade" var kun 3-4% sammenlignet med bart metal. Til gengæld var systemet i stand til at fordele ressourcer efter behov afhængigt af den aktuelle belastning.

IT-giganten også gennemførte tests med containere. Virksomhedens ingeniører trænede neurale netværk til at genkende billeder. Samtidig blev ressourcerne fra én GPU fordelt på fire container-VM'er. Som et resultat faldt ydeevnen af ​​individuelle maskiner med 17 % (sammenlignet med en enkelt VM med fuld adgang til GPU-ressourcer). Dog antallet af billeder behandlet pr. sekund steget tre gange. Det forventes, at sådanne systemer vil finde applikationer inden for dataanalyse og computermodellering.

Blandt de potentielle problemer, som VMware kan stå over for, er eksperter tildele ret snæver målgruppe. Et lille antal virksomheder arbejder stadig med højtydende systemer. Skønt i Statista markat i 2021 vil 94 % af verdens datacenter-arbejdsbelastninger være virtualiseret. Ved prognoser analytikere, vil værdien af ​​HPC-markedet vokse fra 32 til 45 milliarder dollars i perioden fra 2017 til 2022.

Situation: virtuelle GPU'er er ikke ringere i ydeevne end hardwareløsninger
/ Foto Globalt adgangspunkt PD

Lignende løsninger

Der er flere analoger på markedet, der er udviklet af store it-virksomheder: AMD og Intel.

Det første firma for GPU-virtualisering tilbud tilgang baseret på SR-IOV (single-rod input/output virtualisering). Denne teknologi giver VM'en adgang til en del af systemets hardwarefunktioner. Løsningen giver dig mulighed for at dele GPU'en mellem 16 brugere med samme ydeevne af virtualiserede systemer.

Hvad angår den anden it-gigant, de teknologi baseret på Citrix XenServer 7 hypervisor. Den kombinerer arbejdet fra en standard GPU-driver og en virtuel maskine, som gør det muligt for sidstnævnte at vise 3D-applikationer og desktops på hundredvis af brugeres enheder.

Teknologiens fremtid

Virtuelle GPU-udviklere lav et væddemål om implementering af AI-systemer og den voksende popularitet af højtydende løsninger på erhvervsteknologimarkedet. De håber, at behovet for at behandle store mængder data vil øge efterspørgslen efter vGPU'er.

Nu producenter leder efter en måde kombinere funktionaliteten af ​​CPU'en og GPU'en i én kerne for at fremskynde løsning af problemer relateret til grafik, udføre matematiske beregninger, logiske operationer og databehandling. Fremkomsten af ​​sådanne kerner på markedet i fremtiden vil ændre tilgangen til ressourcevirtualisering og deres fordeling mellem arbejdsbelastninger i virtuelle og cloud-miljøer.

Hvad skal du læse om emnet i vores virksomhedsblog:

Et par indlæg fra vores Telegram-kanal:

Kilde: www.habr.com

Tilføj en kommentar