I februari anordnade Stanford en konferens om högpresterande datoranvändning (HPC). VMware-representanter sa att när man arbetar med GPU är systemet baserat på den modifierade ESXi-hypervisorn inte sämre i hastighet än bare metal-lösningar.
Vi berättar om teknikerna som gjorde detta möjligt.
/ Foto
Prestandaproblem
Analytiker uppskattar att cirka 70 % av arbetsbelastningarna i datacenter . De återstående 30 % körs dock fortfarande på bare metal utan hypervisorer. Dessa 30 % består mestadels av högbelastade applikationer, såsom träning av neurala nätverk, som använder GPU:er.
Experter förklarar denna trend med att hypervisorn, som ett mellanliggande abstraktionslager, kan påverka hela systemets prestanda. I studier som genomfördes för fem år sedan om att minska driftshastigheten med 10 %. Det är därför företag och datacenteroperatörer inte har någon brådska med att överföra HPC-arbetsbelastningar till en virtuell miljö.
Men virtualiseringstekniker utvecklas och förbättras. Vid en konferens för en månad sedan rapporterade VMware att ESXi-hypervisorn inte har någon negativ inverkan på GPU-prestanda. Datorhastigheten kan minska med tre procent, vilket är jämförbart med ren metall.
Hur fungerar den här
För att förbättra prestandan hos HPC-system med GPU:er har VMware gjort ett antal ändringar i hypervisorn. I synnerhet togs vMotion-funktionen bort. Den används för lastbalansering och migrerar vanligtvis virtuella maskiner (VM) mellan servrar eller GPU:er. Att inaktivera vMotion innebär att varje virtuell maskin nu tilldelas en specifik GPU. Detta bidrog till att minska kostnaderna för datautbyte.
En annan viktig del av systemet DirectPath I/O. Det gör att CUDA-drivrutinen för parallell databehandling kan interagera direkt med virtuella maskiner och kringgå hypervisorn. När flera virtuella maskiner behöver köras på en enda GPU används GRID vGPU-lösningen. Den delar upp kortets minne i flera segment (men beräkningscyklerna är inte uppdelade).
Driftsschemat för två virtuella maskiner kommer i det här fallet att se ut så här:

Resultat och prognoser
företaget hypervisor, efter att ha tränat en språkmodell baserad på . Prestanda"förlusten" var bara 3-4% jämfört med ren metall. I gengäld fick systemet möjligheten att distribuera resurser på begäran beroende på aktuell belastning.
IT-jätten också med containrar. Företagets ingenjörer tränade neurala nätverk att känna igen bilder. I det här fallet fördelades resurserna för en grafikprocessor mellan fyra virtuella containermaskiner. Som ett resultat minskade prestandan för enskilda maskiner med 17 % (jämfört med en enskild virtuell maskin med full åtkomst till GPU-resurser). Antalet bilder som bearbetas per sekund tre gånger. Det förväntas att sådana system tillämpning inom dataanalys och datormodellering.
Bland de potentiella problem som VMware kan möta, säger experter en ganska snäv målgrupp. Endast ett litet antal företag arbetar för närvarande med högpresterande system. Även om det finns i Statista , att år 2021 kommer 94 % av världens datacenterarbetsbelastningar att vara virtualiserade. Av Analytiker uppskattar att HPC-marknadsvärdet kommer att växa från 32 miljarder dollar till 45 miljarder dollar mellan 2017 och 2022.

/ Foto PD
Liknande lösningar
Det finns flera analoger på marknaden som utvecklas av stora IT-företag: AMD och Intel.
Det första företaget som virtualiserade GPU:er metod baserad på SR-IOV (single-root input/output virtualisering). Den här tekniken ger virtuella maskiner tillgång till vissa av systemets hårdvarufunktioner. Lösningen möjliggör delning av en grafikprocessor mellan 16 användare med samma prestanda som virtualiserade system.
När det gäller den andra IT-jätten, deras på Citrix XenServer 7-hypervisorn. Den kombinerar arbetet hos en vanlig GPU-drivrutin och en virtuell maskin, vilket gör att den senare kan visa 3D-applikationer och skrivbord på enheter med hundratals användare.
Teknikens framtid
Virtuella GPU-utvecklare om implementeringen av AI-system och den växande populariteten för högpresterande lösningar på marknaden för affärsteknologi. De hoppas att behovet av att bearbeta stora mängder data kommer att öka efterfrågan på vGPU:er.
Nu producenterna kombinerar processorns och grafikkortets funktionalitet i en kärna för att snabba upp lösningen av grafikrelaterade problem, utföra matematiska beräkningar, logiska operationer och databehandling. Framtida uppkomst av sådana kärnor på marknaden kommer att förändra tillvägagångssättet för resursvirtualisering och deras fördelning mellan arbetsbelastningar i virtuella och molnmiljöer.
Vad du kan läsa om detta ämne i vår företagsblogg:
Ett par inlägg från vår Telegram-kanal:
Källa: will.com
