Situasie: virtuele GPU's is nie minderwaardig in werkverrigting as hardeware-oplossings nie

In Februarie het Stanford 'n konferensie oor hoëprestasie-rekenaarkunde (HPC) aangebied. VMware-verteenwoordigers het gesê dat wanneer daar met 'n GPU gewerk word, 'n stelsel gebaseer op 'n gewysigde ESXi-hypervisor nie minderwaardig is in spoed as kaalmetaaloplossings nie.

Ons praat oor die tegnologieë wat dit moontlik gemaak het om dit te bereik.

Situasie: virtuele GPU's is nie minderwaardig in werkverrigting as hardeware-oplossings nie
/ foto Victorgrigas CC BY-SA

Prestasie kwessie

Volgens ontleders, ongeveer 70% van werklading in datasentrums gevirtualiseer. Die oorblywende 30% loop egter steeds op kaal metaal sonder hipervisers. Hierdie 30% bestaan ​​meestal uit hoëladingstoepassings, soos dié wat verband hou met die opleiding van neurale netwerke, en die gebruik van GPU's.

Kenners verduidelik hierdie tendens deur die feit dat die hiperviseerder, as 'n intermediêre abstraksielaag, die werkverrigting van die hele stelsel kan beïnvloed. In studies vyf jaar gelede jy kan die data vind oor die vermindering van die spoed van werk met 10%. Daarom is maatskappye en datasentrumoperateurs nie haastig om HPC-werkladings na 'n virtuele omgewing oor te dra nie.

Maar virtualisasietegnologieë ontwikkel en verbeter. Op 'n konferensie 'n maand gelede het VMware gesê dat die ESXi-hipervisor nie 'n negatiewe impak op GPU-prestasie het nie. Rekenspoed kan met drie persent verminder word, wat vergelykbaar is met kaal metaal.

Hoe werk dit

Om die werkverrigting van HPC-stelsels met GPU's te verbeter, het VMware 'n aantal veranderinge aan die hipervisor aangebring. Dit was veral ontslae van die vMotion-funksie. Dit is nodig vir lasbalansering en dra gewoonlik virtuele masjiene (VM's) tussen bedieners of GPU's oor. Die deaktivering van vMotion het daartoe gelei dat elke VM nou 'n spesifieke GPU toegewys is. Dit het gehelp om koste te verminder tydens die uitruil van data.

Nog 'n belangrike komponent van die stelsel tegnologie is DirectPath I/O. Dit laat die CUDA parallelle rekenaarbestuurder toe om direk met virtuele masjiene te kommunikeer en die hipervisor te omseil. Wanneer jy verskeie VM's op een GPU gelyktydig moet laat loop, word die GRID vGPU-oplossing gebruik. Dit verdeel die kaart se geheue in verskeie segmente (maar die berekeningsiklusse word nie verdeel nie).

Die werkingsdiagram van twee virtuele masjiene sal in hierdie geval soos volg lyk:

Situasie: virtuele GPU's is nie minderwaardig in werkverrigting as hardeware-oplossings nie

Resultate en voorspellings

maatskappy toetse gedoen het hipervisor deur die opleiding van 'n taalmodel gebaseer op TensorFlow. Die prestasie-“skade” was slegs 3–4% in vergelyking met kaal metaal. In ruil daarvoor kon die stelsel hulpbronne op aanvraag versprei na gelang van die huidige vrag.

Die IT-reus ook toetse gedoen het met houers. Die maatskappy se ingenieurs het neurale netwerke opgelei om beelde te herken. Terselfdertyd is die hulpbronne van een GPU onder vier houer-VM's versprei. Gevolglik het die werkverrigting van individuele masjiene met 17% afgeneem (in vergelyking met 'n enkele VM met volle toegang tot GPU-hulpbronne). Die aantal beelde wat egter per sekonde verwerk word toegeneem drie keer. Daar word verwag dat sulke stelsels sal vind toepassings in data-analise en rekenaarmodellering.

Onder die potensiële probleme wat VMware in die gesig staar, kenners toeken eerder smal teikengehoor. ’n Klein aantal maatskappye werk steeds met hoëprestasiestelsels. Alhoewel in Statista merkdat teen 2021 94% van die wêreld se datasentrumwerkladings gevirtualiseer sal wees. Deur voorspellings ontleders, sal die waarde van die HPC-mark van 32 tot 45 miljard dollar groei in die tydperk van 2017 tot 2022.

Situasie: virtuele GPU's is nie minderwaardig in werkverrigting as hardeware-oplossings nie
/ foto Globale toegangspunt PD

Soortgelyke oplossings

Daar is verskeie analoë op die mark wat deur groot IT-maatskappye ontwikkel word: AMD en Intel.

Die eerste maatskappy vir GPU-virtualisering bied benadering gebaseer op SR-IOV (enkelworteltoevoer/afvoervirtualisering). Hierdie tegnologie gee die VM toegang tot 'n deel van die stelsel se hardeware vermoëns. Die oplossing laat jou toe om die GPU tussen 16 gebruikers te deel met gelyke werkverrigting van gevirtualiseerde stelsels.

Wat die tweede IT-reus betref, hulle tegnologie gebaseer op die Citrix XenServer 7-hypervisor. Dit kombineer die werk van 'n standaard GPU-bestuurder en 'n virtuele masjien, wat laasgenoemde in staat stel om 3D-toepassings en rekenaars op die toestelle van honderde gebruikers te vertoon.

Toekoms van tegnologie

Virtuele GPU-ontwikkelaars maak 'n weddenskap oor die implementering van KI-stelsels en die groeiende gewildheid van hoëprestasie-oplossings in die besigheidstegnologiemark. Hulle hoop dat die behoefte om groot hoeveelhede data te verwerk die vraag na vGPU's sal verhoog.

Nou vervaardigers op soek na 'n manier kombineer die funksionaliteit van die SVE en GPU in een kern om die oplossing van probleme wat verband hou met grafika, die uitvoer van wiskundige berekeninge, logiese bewerkings en dataverwerking te bespoedig. Die voorkoms van sulke kerne op die mark in die toekoms sal die benadering tot hulpbronvirtualisering en hul verspreiding tussen werkladings in virtuele en wolkomgewings verander.

Wat om te lees oor die onderwerp in ons korporatiewe blog:

'n Paar plasings van ons Telegram-kanaal:

Bron: will.com

Voeg 'n opmerking