Olukord: virtuaalsed GPU-d ei jää jõudluselt alla riistvaralahendustele

Veebruaris toimus Stanfordis kõrgjõudlusega andmetöötluse (HPC) konverents. VMware esindajad ütlesid, et GPU-ga töötades ei jää modifitseeritud ESXi hüperviisoril põhinev süsteem kiiruselt alla paljasmetalli lahendustele.

Räägime tehnoloogiatest, mis võimaldasid seda saavutada.

Olukord: virtuaalsed GPU-d ei jää jõudluselt alla riistvaralahendustele
/ foto Victorgrigas CC BY-SA

Tulemuslikkuse probleem

Analüütikute hinnangul on andmekeskustes ligikaudu 70% töökoormusest virtualiseeritud. Ülejäänud 30% töötab aga endiselt paljal metallil ilma hüperviisoriteta. See 30% koosneb enamasti suure koormusega rakendustest, näiteks need, mis on seotud närvivõrkude treenimisega ja GPU-de kasutamisega.

Eksperdid selgitavad seda suundumust sellega, et hüperviisor kui vahepealne abstraktsioonkiht võib mõjutada kogu süsteemi jõudlust. Õpingutes viis aastat tagasi leiate andmed umbes 10% töökiiruse vähendamisest. Seetõttu ei kiirusta ettevõtted ja andmekeskuste operaatorid HPC töökoormust virtuaalkeskkonda üle kandma.

Kuid virtualiseerimistehnoloogiad arenevad ja täiustuvad. Kuu aega tagasi toimunud konverentsil ütles VMware, et ESXi hüperviisor ei avalda GPU jõudlusele negatiivset mõju. Arvutuskiirust saab vähendada kolm protsenti, mis on võrreldav palja metalliga.

Kuidas see töötab

GPU-dega HPC-süsteemide jõudluse parandamiseks on VMware teinud hüperviisoris mitmeid muudatusi. Eelkõige vabanes see funktsioonist vMotion. Seda on vaja koormuse tasakaalustamiseks ja see edastab tavaliselt virtuaalmasinaid (VM-id) serverite või GPU-de vahel. VMotioni keelamise tulemusel määrati nüüd igale VM-ile konkreetne GPU. See aitas andmete vahetamisel kulusid vähendada.

Teine süsteemi oluline komponent on tehnoloogia DirectPath I/O. See võimaldab CUDA paralleelarvutusdraiveril suhelda virtuaalmasinatega otse, hüperviisorist mööda minnes. Kui teil on vaja ühes GPU-s korraga käitada mitut VM-i, kasutatakse GRID vGPU lahendust. See jagab kaardi mälu mitmeks segmendiks (kuid arvutustsükleid ei jagata).

Kahe virtuaalse masina tööskeem näeb sel juhul välja järgmine:

Olukord: virtuaalsed GPU-d ei jää jõudluselt alla riistvaralahendustele

Tulemused ja prognoosid

Ettevõte testid läbi viinud hüperviisor koolitades keelemudelit, mis põhineb TensorFlow. Toimivus "kahju" oli vaid 3–4% võrreldes palja metalliga. Vastutasuks suutis süsteem jaotada ressursse vastavalt nõudlusele, olenevalt praegusest koormusest.

IT-hiiglane samuti testid läbi viinud konteineritega. Ettevõtte insenerid koolitasid närvivõrke piltide äratundmiseks. Samal ajal jaotati ühe GPU ressursid nelja konteiner-VM-i vahel. Selle tulemusena vähenes üksikute masinate jõudlus 17% (võrreldes ühe virtuaalse masinaga, millel on täielik juurdepääs GPU ressurssidele). Samas töödeldavate piltide arv sekundis suurenenud kolm korda. Eeldatakse, et sellised süsteemid leiab rakendused andmeanalüüsis ja arvutimodelleerimises.

Võimalike probleemide hulgas, millega VMware võib kokku puutuda, on eksperdid eraldama üsna kitsas sihtrühm. Väike hulk ettevõtteid töötab endiselt suure jõudlusega süsteemidega. Kuigi Statistas tähistamaet aastaks 2021 on 94% maailma andmekeskuste töökoormusest virtualiseeritud. Kõrval prognoosid analüütikute hinnangul kasvab HPC turu väärtus perioodil 32-45 2017 miljardilt dollarilt 2022 miljardile dollarile.

Olukord: virtuaalsed GPU-d ei jää jõudluselt alla riistvaralahendustele
/ foto Globaalne pöörduspunkt PD

Sarnased lahendused

Turul on mitmeid analooge, mida arendavad suured IT-ettevõtted: AMD ja Intel.

Esimene GPU virtualiseerimise ettevõte pakub SR-IOV-l põhinev lähenemine (single-root input/output virtualisation). See tehnoloogia annab VM-ile juurdepääsu osale süsteemi riistvara võimalustest. Lahendus võimaldab jagada GPU-d 16 kasutaja vahel virtualiseeritud süsteemide võrdse jõudlusega.

Mis puudutab teist IT-hiiglast, siis nemad tehnoloogiapõhine hüperviisoril Citrix XenServer 7. See ühendab endas standardse GPU draiveri ja virtuaalmasina töö, mis võimaldab viimasel kuvada 3D-rakendusi ja töölaudu sadade kasutajate seadmetes.

Tehnoloogia tulevik

Virtuaalsed GPU arendajad panustada tehisintellektisüsteemide juurutamise ja kõrgjõudlusega lahenduste populaarsuse kasvu kohta äritehnoloogia turul. Nad loodavad, et suurte andmemahtude töötlemise vajadus suurendab nõudlust vGPU-de järele.

Nüüd tootjad teed otsima ühendage CPU ja GPU funktsionaalsus ühes tuumas, et kiirendada graafikaga seotud probleemide lahendamist, matemaatiliste arvutuste sooritamist, loogilisi toiminguid ja andmetöötlust. Selliste tuumade turule ilmumine tulevikus muudab lähenemist ressursside virtualiseerimisele ja nende jaotamisele töökoormuste vahel virtuaal- ja pilvekeskkonnas.

Mida meie ettevõtte ajaveebis sellel teemal lugeda:

Paar postitust meie Telegrami kanalilt:

Allikas: www.habr.com

Lisa kommentaar