Situation: virtuella GPU:er är inte sämre i prestanda än hårdvarulösningar

I februari var Stanford värd för en konferens om högpresterande datoranvändning (HPC). VMware-representanter sa att när man arbetar med en GPU, är ett system baserat på en modifierad ESXi-hypervisor inte sämre i hastighet än bara metalllösningar.

Vi pratar om teknikerna som gjorde det möjligt att uppnå detta.

Situation: virtuella GPU:er är inte sämre i prestanda än hårdvarulösningar
/ Foto Victorgrigas CC BY-SA

Prestandaproblem

Enligt analytiker, cirka 70% av arbetsbelastningen i datacenter virtualiserad. Men de återstående 30 % körs fortfarande på bar metall utan hypervisorer. Dessa 30 % består mestadels av högbelastningsapplikationer, till exempel de som är relaterade till träning av neurala nätverk och användning av GPU:er.

Experter förklarar denna trend med det faktum att hypervisorn, som ett mellanliggande abstraktionslager, kan påverka hela systemets prestanda. I studier för fem år sedan du kan hitta data om att minska arbetshastigheten med 10 %. Därför har företag och datacenteroperatörer ingen brådska att överföra HPC-arbetsbelastningar till en virtuell miljö.

Men virtualiseringstekniker utvecklas och förbättras. Vid en konferens för en månad sedan sa VMware att ESXi-hypervisorn inte har en negativ inverkan på GPU-prestanda. Beräkningshastigheten kan minskas med tre procent, vilket är jämförbart med ren metall.

Hur fungerar den här

För att förbättra prestanda hos HPC-system med GPU:er har VMware gjort ett antal ändringar i hypervisorn. I synnerhet blev det av med vMotion-funktionen. Den behövs för lastbalansering och överför vanligtvis virtuella maskiner (VM) mellan servrar eller GPU:er. Inaktivering av vMotion resulterade i att varje virtuell dator nu tilldelas en specifik GPU. Detta bidrog till att minska kostnaderna vid utbyte av data.

En annan nyckelkomponent i systemet är teknik DirectPath I/O. Det tillåter CUDA parallella datordrivrutinen att interagera med virtuella maskiner direkt, förbi hypervisorn. När du behöver köra flera virtuella datorer på en GPU samtidigt, används GRID vGPU-lösningen. Den delar upp kortets minne i flera segment (men beräkningscyklerna är inte uppdelade).

Operationsdiagrammet för två virtuella maskiner kommer i det här fallet att se ut så här:

Situation: virtuella GPU:er är inte sämre i prestanda än hårdvarulösningar

Resultat och prognoser

företaget genomfört tester hypervisor genom att träna en språkmodell baserad på TensorFlow. Prestandaskadan var bara 3–4 % jämfört med ren metall. I gengäld kunde systemet fördela resurser på begäran beroende på aktuell belastning.

IT-jätten också genomfört tester med behållare. Företagets ingenjörer tränade neurala nätverk för att känna igen bilder. Samtidigt fördelades resurserna för en GPU på fyra container-VM. Som ett resultat minskade prestanda för enskilda maskiner med 17 % (jämfört med en enda virtuell dator med full tillgång till GPU-resurser). Däremot antalet bilder som behandlas per sekund ökade tre gånger. Det förväntas att sådana system kommer att hitta tillämpningar inom dataanalys och datormodellering.

Bland de potentiella problem som VMware kan möta, experter fördela ganska smal målgrupp. Ett litet antal företag arbetar fortfarande med högpresterande system. Fast i Statista markatt år 2021 kommer 94 % av världens datacenterarbetsbelastningar att vara virtualiserade. Förbi prognoser analytiker kommer värdet på HPC-marknaden att växa från 32 till 45 miljarder dollar under perioden 2017 till 2022.

Situation: virtuella GPU:er är inte sämre i prestanda än hårdvarulösningar
/ Foto Global åtkomstpunkt PD

Liknande lösningar

Det finns flera analoger på marknaden som utvecklas av stora IT-företag: AMD och Intel.

Det första företaget för GPU-virtualisering erbjuder tillvägagångssätt baserad på SR-IOV (ingångs-/utgångsvirtualisering med en rot). Denna teknik ger den virtuella datorn tillgång till en del av systemets hårdvarufunktioner. Lösningen låter dig dela GPU:n mellan 16 användare med samma prestanda som virtualiserade system.

När det gäller den andra IT-jätten, de teknikbaserad på hypervisorn Citrix XenServer 7. Den kombinerar arbetet med en standard GPU-drivrutin och en virtuell maskin, vilket gör att den senare kan visa 3D-applikationer och skrivbord på hundratals användares enheter.

Teknikens framtid

Virtuella GPU-utvecklare slå vad om implementeringen av AI-system och den växande populariteten för högpresterande lösningar på affärsteknologimarknaden. De hoppas att behovet av att bearbeta stora mängder data kommer att öka efterfrågan på vGPU:er.

Nu tillverkare letar efter ett sätt kombinera funktionaliteten hos CPU och GPU i en kärna för att påskynda lösning av problem relaterade till grafik, utföra matematiska beräkningar, logiska operationer och databehandling. Uppkomsten av sådana kärnor på marknaden i framtiden kommer att förändra synen på resursvirtualisering och deras fördelning mellan arbetsbelastningar i virtuella miljöer och molnmiljöer.

Vad du kan läsa om ämnet i vår företagsblogg:

Ett par inlägg från vår Telegram-kanal:

Källa: will.com

Lägg en kommentar