Situacija: virtualūs GPU savo našumu nenusileidžia aparatūros sprendimams

Vasario mėnesį Stenforde įvyko didelio našumo skaičiavimo (HPC) konferencija. „VMware“ atstovai teigė, kad dirbant su GPU, modifikuotu ESXi hipervizoriumi pagrįsta sistema savo greičiu nenusileidžia pliko metalo sprendimams.

Kalbame apie technologijas, kurios leido tai pasiekti.

Situacija: virtualūs GPU savo našumu nenusileidžia aparatūros sprendimams
/ nuotrauka Viktorgrigas CC BY-SA

Našumo problema

Anot analitikų, duomenų centruose tenka apie 70 proc virtualizuotas. Tačiau likę 30% vis dar veikia ant pliko metalo be hipervizorių. Šiuos 30 % daugiausia sudaro didelės apkrovos programos, pvz., susijusios su neuroninių tinklų mokymu ir GPU naudojimu.

Ekspertai šią tendenciją aiškina tuo, kad hipervizorius, kaip tarpinis abstrakcijos sluoksnis, gali paveikti visos sistemos veikimą. Studijose prieš penkerius metus galite rasti duomenis apie darbo greičio sumažinimą 10 proc. Todėl įmonės ir duomenų centrų operatoriai neskuba HPC darbo krūvių perkelti į virtualią aplinką.

Tačiau virtualizacijos technologijos vystosi ir tobulėja. Prieš mėnesį vykusioje konferencijoje VMware teigė, kad ESXi hipervizorius neturi neigiamos įtakos GPU veikimui. Skaičiavimo greitį galima sumažinti trimis procentais, o tai prilygsta pliko metalo greičiui.

Kaip tai veikia

Siekdama pagerinti HPC sistemų su GPU našumą, VMware atliko keletą hipervizoriaus pakeitimų. Visų pirma, buvo atsisakyta „vMotion“ funkcijos. Jis reikalingas apkrovai balansuoti ir paprastai perkelia virtualias mašinas (VM) tarp serverių arba GPU. Išjungus „vMotion“, kiekvienai VM dabar buvo priskirtas konkretus GPU. Tai padėjo sumažinti išlaidas keičiantis duomenimis.

Kitas svarbus sistemos komponentas yra technologija „DirectPath“ įvestis/išvestis. Tai leidžia CUDA lygiagrečiojo skaičiavimo tvarkyklei tiesiogiai sąveikauti su virtualiomis mašinomis, apeinant hipervizorių. Kai vienu GPU reikia paleisti kelias VM, naudojamas GRID vGPU sprendimas. Jis padalija kortelės atmintį į kelis segmentus (tačiau skaičiavimo ciklai neskirstomi).

Šiuo atveju dviejų virtualių mašinų veikimo schema atrodys taip:

Situacija: virtualūs GPU savo našumu nenusileidžia aparatūros sprendimams

Rezultatai ir prognozės

įmonė atliko bandymus hipervizorius mokydamas kalbos modelį, pagrįstą TensorFlow. Eksploatacinės savybės „žala“ buvo tik 3–4%, palyginti su pliko metalo. Mainais sistema galėjo paskirstyti išteklius pagal poreikį, priklausomai nuo esamos apkrovos.

IT milžinas taip pat atliko bandymus su konteineriais. Bendrovės inžinieriai apmokė neuroninius tinklus atpažinti vaizdus. Tuo pačiu metu vieno GPU ištekliai buvo paskirstyti keturioms konteinerinėms VM. Dėl to atskirų mašinų našumas sumažėjo 17% (lyginant su viena VM su visa prieiga prie GPU išteklių). Tačiau per sekundę apdorotų vaizdų skaičius padidėjo triskart. Tikimasi, kad tokios sistemos suras duomenų analizės ir kompiuterinio modeliavimo taikymas.

Tarp galimų problemų, su kuriomis gali susidurti VMware, ekspertai paskirstyti gana siaura tikslinė auditorija. Nedidelė dalis įmonių vis dar dirba su didelio našumo sistemomis. Nors statistikoje švęstikad iki 2021 metų 94% pasaulio duomenų centrų darbo krūvių bus virtualizuoti. Autorius prognozės analitikų, HPC rinkos vertė laikotarpiu nuo 32 iki 45 metų augs nuo 2017 iki 2022 milijardų dolerių.

Situacija: virtualūs GPU savo našumu nenusileidžia aparatūros sprendimams
/ nuotrauka Pasaulinis prieigos taškas PD

Panašūs sprendimai

Rinkoje yra keli analogai, kuriuos kuria didelės IT kompanijos: AMD ir Intel.

Pirmoji GPU virtualizavimo įmonė siūlo metodas, pagrįstas SR-IOV (vienos šakninės įvesties/išvesties virtualizacija). Ši technologija suteikia VM prieigą prie dalies sistemos techninės įrangos galimybių. Sprendimas leidžia dalintis GPU tarp 16 vartotojų, vienodai našiai virtualizuotoms sistemoms.

Kalbant apie antrąjį IT milžiną, jie pagrįsta technologija hipervizoriuje Citrix XenServer 7. Jis apjungia standartinės GPU tvarkyklės ir virtualios mašinos darbą, leidžiantį pastarajai rodyti 3D programas ir darbalaukius šimtų vartotojų įrenginiuose.

Technologijos ateitis

Virtualūs GPU kūrėjai lažintis apie AI sistemų diegimą ir augantį didelio našumo sprendimų populiarumą verslo technologijų rinkoje. Jie tikisi, kad poreikis apdoroti didelius duomenų kiekius padidins vGPU paklausą.

Dabar gamintojai ieškant kelio sujungti procesoriaus ir GPU funkcionalumą viename branduolyje, kad pagreitintumėte su grafika susijusių problemų sprendimą, matematinių skaičiavimų, loginių operacijų ir duomenų apdorojimo atlikimą. Tokių branduolių atsiradimas rinkoje ateityje pakeis požiūrį į resursų virtualizavimą ir jų paskirstymą tarp darbo krūvių virtualioje ir debesų aplinkoje.

Ką perskaityti šia tema mūsų įmonės tinklaraštyje:

Keletas įrašų iš mūsų Telegram kanalo:

Šaltinis: www.habr.com

Добавить комментарий