Situation: virtuella GPU:er är inte sämre i prestanda än hårdvarulösningar

I februari anordnade Stanford en konferens om högpresterande datoranvändning (HPC). VMware-representanter sa att när man arbetar med GPU är systemet baserat på den modifierade ESXi-hypervisorn inte sämre i hastighet än bare metal-lösningar.

Vi berättar om teknikerna som gjorde detta möjligt.

Situation: virtuella GPU:er är inte sämre i prestanda än hårdvarulösningar
/ Foto Victorgrigas CC BY-SA

Prestandaproblem

Analytiker uppskattar att cirka 70 % av arbetsbelastningarna i datacenter virtualiserad. De återstående 30 % körs dock fortfarande på bare metal utan hypervisorer. Dessa 30 % består mestadels av högbelastade applikationer, såsom träning av neurala nätverk, som använder GPU:er.

Experter förklarar denna trend med att hypervisorn, som ett mellanliggande abstraktionslager, kan påverka hela systemets prestanda. I studier som genomfördes för fem år sedan du kan hitta uppgifterna om att minska driftshastigheten med 10 %. Det är därför företag och datacenteroperatörer inte har någon brådska med att överföra HPC-arbetsbelastningar till en virtuell miljö.

Men virtualiseringstekniker utvecklas och förbättras. Vid en konferens för en månad sedan rapporterade VMware att ESXi-hypervisorn inte har någon negativ inverkan på GPU-prestanda. Datorhastigheten kan minska med tre procent, vilket är jämförbart med ren metall.

Hur fungerar den här

För att förbättra prestandan hos HPC-system med GPU:er har VMware gjort ett antal ändringar i hypervisorn. I synnerhet togs vMotion-funktionen bort. Den används för lastbalansering och migrerar vanligtvis virtuella maskiner (VM) mellan servrar eller GPU:er. Att inaktivera vMotion innebär att varje virtuell maskin nu tilldelas en specifik GPU. Detta bidrog till att minska kostnaderna för datautbyte.

En annan viktig del av systemet är en teknologi DirectPath I/O. Det gör att CUDA-drivrutinen för parallell databehandling kan interagera direkt med virtuella maskiner och kringgå hypervisorn. När flera virtuella maskiner behöver köras på en enda GPU används GRID vGPU-lösningen. Den delar upp kortets minne i flera segment (men beräkningscyklerna är inte uppdelade).

Driftsschemat för två virtuella maskiner kommer i det här fallet att se ut så här:

Situation: virtuella GPU:er är inte sämre i prestanda än hårdvarulösningar

Resultat och prognoser

företaget utförda tester hypervisor, efter att ha tränat en språkmodell baserad på TensorFlow. Prestanda"förlusten" var bara 3-4% jämfört med ren metall. I gengäld fick systemet möjligheten att distribuera resurser på begäran beroende på aktuell belastning.

IT-jätten också utförda tester med containrar. Företagets ingenjörer tränade neurala nätverk att känna igen bilder. I det här fallet fördelades resurserna för en grafikprocessor mellan fyra virtuella containermaskiner. Som ett resultat minskade prestandan för enskilda maskiner med 17 % (jämfört med en enskild virtuell maskin med full åtkomst till GPU-resurser). Antalet bilder som bearbetas per sekund ökad tre gånger. Det förväntas att sådana system kommer att hitta tillämpning inom dataanalys och datormodellering.

Bland de potentiella problem som VMware kan möta, säger experter fördela en ganska snäv målgrupp. Endast ett litet antal företag arbetar för närvarande med högpresterande system. Även om det finns i Statista mark, att år 2021 kommer 94 % av världens datacenterarbetsbelastningar att vara virtualiserade. Av prognoser Analytiker uppskattar att HPC-marknadsvärdet kommer att växa från 32 miljarder dollar till 45 miljarder dollar mellan 2017 och 2022.

Situation: virtuella GPU:er är inte sämre i prestanda än hårdvarulösningar
/ Foto Global åtkomstpunkt PD

Liknande lösningar

Det finns flera analoger på marknaden som utvecklas av stora IT-företag: AMD och Intel.

Det första företaget som virtualiserade GPU:er erbjuder metod baserad på SR-IOV (single-root input/output virtualisering). Den här tekniken ger virtuella maskiner tillgång till vissa av systemets hårdvarufunktioner. Lösningen möjliggör delning av en grafikprocessor mellan 16 användare med samma prestanda som virtualiserade system.

När det gäller den andra IT-jätten, deras Tekniken är baserad på Citrix XenServer 7-hypervisorn. Den kombinerar arbetet hos en vanlig GPU-drivrutin och en virtuell maskin, vilket gör att den senare kan visa 3D-applikationer och skrivbord på enheter med hundratals användare.

Teknikens framtid

Virtuella GPU-utvecklare slå vad om implementeringen av AI-system och den växande populariteten för högpresterande lösningar på marknaden för affärsteknologi. De hoppas att behovet av att bearbeta stora mängder data kommer att öka efterfrågan på vGPU:er.

Nu producenterna letar efter ett sätt kombinerar processorns och grafikkortets funktionalitet i en kärna för att snabba upp lösningen av grafikrelaterade problem, utföra matematiska beräkningar, logiska operationer och databehandling. Framtida uppkomst av sådana kärnor på marknaden kommer att förändra tillvägagångssättet för resursvirtualisering och deras fördelning mellan arbetsbelastningar i virtuella och molnmiljöer.

Vad du kan läsa om detta ämne i vår företagsblogg:

Ett par inlägg från vår Telegram-kanal:

Källa: will.com

Köp pålitlig hosting för webbplatser med DDoS-skydd, VPS VDS-servrar 🔥 Köp pålitlig webbhotell med DDoS-skydd, VPS VDS-servrar | ProHoster