Situata: GPU-të virtuale nuk janë inferiore në performancë ndaj zgjidhjeve harduerike

Në shkurt, Stanford priti një konferencë mbi informatikë me performancë të lartë (HPC). Përfaqësuesit e VMware thanë se kur punoni me një GPU, një sistem i bazuar në një hipervizor të modifikuar ESXi nuk është inferior në shpejtësi ndaj zgjidhjeve metalike të zhveshura.

Ne flasim për teknologjitë që bënë të mundur arritjen e kësaj.

Situata: GPU-të virtuale nuk janë inferiore në performancë ndaj zgjidhjeve harduerike
/ Foto Victorgrigas CC BY-SA

Çështja e performancës

Sipas analistëve, rreth 70% e ngarkesave të punës në qendrat e të dhënave virtualizuar. Sidoqoftë, 30% e mbetur ende funksionon në metal të zhveshur pa hipervizorë. Ky 30% përbëhet kryesisht nga aplikacione me ngarkesë të lartë, të tilla si ato që lidhen me trajnimin e rrjeteve nervore dhe përdorimin e GPU-ve.

Ekspertët e shpjegojnë këtë prirje me faktin se hipervizori, si një shtresë e ndërmjetme abstraksioni, mund të ndikojë në performancën e të gjithë sistemit. Në studimet e pesë viteve më parë ju mund të gjeni të dhënat për uljen e shpejtësisë së punës me 10%. Prandaj, kompanitë dhe operatorët e qendrave të të dhënave nuk po nxitojnë të transferojnë ngarkesat e punës HPC në një mjedis virtual.

Por teknologjitë e virtualizimit po zhvillohen dhe po përmirësohen. Në një konferencë një muaj më parë, VMware tha se hipervizori ESXi nuk ka një ndikim negativ në performancën e GPU. Shpejtësia e llogaritjes mund të reduktohet me tre përqind, e cila është e krahasueshme me metalin e zhveshur.

Si punon kjo

Për të përmirësuar performancën e sistemeve HPC me GPU, VMware ka bërë një sërë ndryshimesh në hipervisor. Në veçanti, ai u hoq nga funksioni vMotion. Është i nevojshëm për balancimin e ngarkesës dhe zakonisht transferon makina virtuale (VM) midis serverëve ose GPU-ve. Çaktivizimi i vMotion rezultoi që çdo VM tani t'i caktohet një GPU specifike. Kjo ndihmoi në uljen e kostove gjatë shkëmbimit të të dhënave.

Një tjetër komponent kyç i sistemit është teknologjia DirectPath I/O. Ai lejon drejtuesin e llogaritjes paralele CUDA të ndërveprojë drejtpërdrejt me makinat virtuale, duke anashkaluar hipervizorin. Kur duhet të ekzekutoni disa VM në një GPU në të njëjtën kohë, përdoret zgjidhja GRID vGPU. Ai e ndan kujtesën e kartës në disa segmente (por ciklet llogaritëse nuk ndahen).

Diagrami i funksionimit të dy makinave virtuale në këtë rast do të duket kështu:

Situata: GPU-të virtuale nuk janë inferiore në performancë ndaj zgjidhjeve harduerike

Rezultatet dhe parashikimet

kompani kryer teste hipervizor duke trajnuar një model gjuhësor të bazuar në TensorFlow. "Dëmi" i performancës ishte vetëm 3-4% krahasuar me metalin e zhveshur. Në këmbim, sistemi ishte në gjendje të shpërndante burime sipas kërkesës në varësi të ngarkesës aktuale.

Gjiganti i IT gjithashtu kryer teste me kontejnerë. Inxhinierët e kompanisë trajnuan rrjetet nervore për të njohur imazhet. Në të njëjtën kohë, burimet e një GPU u shpërndanë midis katër VM-ve të kontejnerit. Si rezultat, performanca e makinave individuale u ul me 17% (krahasuar me një VM të vetme me akses të plotë në burimet GPU). Megjithatë, numri i imazheve të përpunuara për sekondë rritur tri herë. Pritet që sisteme të tilla do të gjejë aplikime në analizën e të dhënave dhe modelimin kompjuterik.

Ndër problemet e mundshme me të cilat mund të përballet VMware, ekspertët ndajnë audiencë mjaft e ngushtë e synuar. Një numër i vogël kompanish janë ende duke punuar me sisteme me performancë të lartë. Edhe pse në Statista Markse deri në vitin 2021, 94% e ngarkesave të qendrave të të dhënave në botë do të virtualizohen. Nga parashikimet analistët, vlera e tregut të HPC do të rritet nga 32 në 45 miliardë dollarë në periudhën 2017-2022.

Situata: GPU-të virtuale nuk janë inferiore në performancë ndaj zgjidhjeve harduerike
/ Foto Pika Globale e Aksesit PD

Zgjidhje të ngjashme

Ka disa analoge në treg që janë zhvilluar nga kompani të mëdha IT: AMD dhe Intel.

Kompania e parë për virtualizimin e GPU ofertat qasje e bazuar në SR-IOV (virtualizimi me një rrënjë hyrëse/dalëse). Kjo teknologji i jep VM-së akses në një pjesë të aftësive harduerike të sistemit. Zgjidhja ju lejon të ndani GPU-në midis 16 përdoruesve me performancë të barabartë të sistemeve të virtualizuara.

Sa për gjigantin e dytë të IT, ata bazuar në teknologji në hipervizorin Citrix XenServer 7. Ai kombinon punën e një drejtuesi standard GPU dhe një makinerie virtuale, e cila i lejon kësaj të fundit të shfaqë aplikacione 3D dhe desktop në pajisjet e qindra përdoruesve.

E ardhmja e teknologjisë

Zhvilluesit virtualë të GPU bëj një bast mbi zbatimin e sistemeve të AI dhe popullaritetin në rritje të zgjidhjeve me performancë të lartë në tregun e teknologjisë së biznesit. Ata shpresojnë se nevoja për të përpunuar sasi të mëdha të dhënash do të rrisë kërkesën për vGPU.

Tani prodhuesit duke kërkuar një mënyrë kombinoni funksionalitetin e CPU-së dhe GPU-së në një bërthamë për të shpejtuar zgjidhjen e problemeve që lidhen me grafikën, kryerjen e llogaritjeve matematikore, operacionet logjike dhe përpunimin e të dhënave. Shfaqja e bërthamave të tilla në treg në të ardhmen do të ndryshojë qasjen ndaj virtualizimit të burimeve dhe shpërndarjes së tyre midis ngarkesave të punës në mjediset virtuale dhe cloud.

Çfarë duhet të lexoni për temën në blogun tonë të korporatës:

Disa postime nga kanali ynë Telegram:

Burimi: www.habr.com

Shto një koment