Egoera: GPU birtualak ez dira burdinazko soluzioen errendimenduan txikiagoak

Otsailean, Stanfordek errendimendu handiko informatikari (HPC) buruzko hitzaldi bat antolatu zuen. VMwareko ordezkariek esan zuten GPU batekin lan egiten denean, aldatutako ESXi hipervisore batean oinarritutako sistema bat ez dela abiadura txikiagoa metalezko soluzioekin alderatuta.

Hori lortzea posible egin duten teknologiei buruz hitz egiten dugu.

Egoera: GPU birtualak ez dira burdinazko soluzioen errendimenduan txikiagoak
/ argazkia Victorgrigas CC BY-SA

Errendimendu arazoa

Analisten arabera, datu-zentroetako lan-kargaren %70 inguru birtualizatua. Hala eta guztiz ere, gainerako % 30ek hipervisorik gabeko metal hutsean funtzionatzen dute. %30 hori gehienbat karga handiko aplikazioek osatzen dute, adibidez, neurona-sareak entrenatzearekin eta GPUak erabiltzearekin lotutakoak.

Adituek joera hori azaltzen dute hipervisoreak, tarteko abstrakzio-geruza gisa, sistema osoaren errendimenduan eragina izan dezakeela. Duela bost urteko ikasketetan datuak aurki ditzakezu lanaren abiadura %10 murrizteari buruz. Hori dela eta, enpresek eta datu-zentroko operadoreek ez dute presarik HPC lan-kargak ingurune birtualera transferitzeko.

Baina birtualizazio teknologiak garatzen eta hobetzen ari dira. Duela hilabeteko hitzaldi batean, VMware-k esan zuen ESXi hipervisoreak ez duela eragin negatiborik GPUren errendimenduan. Konputazio-abiadura ehuneko hiru murriztu daiteke, metal hutsaren parekoa dena.

Nola egiten du lan

GPUekin HPC sistemen errendimendua hobetzeko, VMware-k aldaketa ugari egin ditu hipervisorean. Bereziki, vMotion funtzioa kendu zuen. Karga orekatzeko beharrezkoa da eta normalean makina birtualak (VM) transferitzen ditu zerbitzarien edo GPUen artean. vMotion desgaituz gero, VM bakoitzari GPU zehatz bat esleitzen zaio. Horrek kostuak murrizten lagundu zuen datuak trukatzean.

Sistemaren funtsezko beste osagai bat teknologia da DirectPath I/O. CUDA konputazio paraleloko kontrolatzaileari makina birtualekin zuzenean elkarreragiteko aukera ematen dio, hipervisorea saihestuz. Hainbat VM GPU batean aldi berean exekutatu behar dituzunean, GRID vGPU irtenbidea erabiltzen da. Txartelaren memoria hainbat segmentutan banatzen du (baina konputazio-zikloak ez daude banatuta).

Kasu honetan bi makina birtualen funtzionamendu-diagrama honela izango da:

Egoera: GPU birtualak ez dira burdinazko soluzioen errendimenduan txikiagoak

Emaitzak eta aurreikuspenak

Enpresaren probak egin hipervisorean oinarritutako hizkuntza-eredu bat trebatuz TensorFlow. Errendimenduaren "kaltea" % 3-4 baino ez zen metal hutsarekin alderatuta. Horren truke, sistemak eskariaren arabera baliabideak banatzeko gai izan zen uneko kargaren arabera.

IT erraldoia ere probak egin ontziekin. Konpainiako ingeniariek sare neuronalak trebatu zituzten irudiak ezagutzeko. Aldi berean, GPU baten baliabideak lau edukiontzi VMren artean banatu ziren. Ondorioz, banakako makinen errendimendua % 17 murriztu zen (GPU baliabideetarako sarbide osoa duen VM bakar batekin alderatuta). Hala ere, segundoko prozesatutako irudi kopurua handitu Hiru aldiz. Espero da horrelako sistemak aurkituko du datuen analisian eta ordenagailu bidezko modelizazioan aplikazioak.

VMware-k izan ditzakeen arazo potentzialen artean, adituak esleitu xede-publiko estu samarra. Enpresa kopuru txiki batek errendimendu handiko sistemekin lanean jarraitzen du. Statista-n bada ere marka2021erako, munduko datu-zentroen lan-kargaren % 94 birtualizatuko dela. Nork aurreikuspenak analistek, HPC merkatuaren balioa 32 milioi dolar izatetik 45 milioira haziko da 2017tik 2022ra bitartean.

Egoera: GPU birtualak ez dira burdinazko soluzioen errendimenduan txikiagoak
/ argazkia Sarbide Globala PD

Antzeko irtenbideak

Merkatuan hainbat analogo daude informatika-enpresa handiek garatzen dituztenak: AMD eta Intel.

GPU birtualizaziorako lehen konpainia eskaintza SR-IOVn oinarritutako ikuspegia (erro bakarreko sarrera/irteera birtualizazioa). Teknologia honek VM sistemaren hardware-gaitasunen zati bat atzitzeko aukera ematen dio. Irtenbideak sistema birtualizatuen errendimendu berdinarekin 16 erabiltzaileren artean GPU partekatzeko aukera ematen du.

Bigarren IT erraldoiari dagokionez, haiek teknologian oinarrituta Citrix XenServer 7 hipervisorean.GPU kontrolatzaile estandarraren eta makina birtual baten lana uztartzen ditu, azken honek ehunka erabiltzaileren gailuetan 3D aplikazioak eta mahaigainak bistaratzeko aukera ematen diona.

Teknologiaren etorkizuna

GPU birtualeko garatzaileak apustu bat egin AI sistemen ezarpenari eta negozio teknologikoen merkatuan errendimendu handiko soluzioen gero eta ospe handiagoari buruz. Datu kopuru handiak prozesatu beharrak vGPUen eskaera areagotzea espero dute.

Orain fabrikatzaileak bide baten bila PUZaren eta GPUaren funtzionalitateak nukleo batean konbinatu grafikoekin lotutako arazoak, kalkulu matematikoak, eragiketa logikoak eta datuen prozesatzea azkartzeko. Etorkizunean merkatuan horrelako nukleoak agertzeak baliabideen birtualizazioaren ikuspegia aldatuko du eta haien lan-kargaren artean banatzea ingurune birtualetan eta hodeian.

Zer irakurri gaiari buruz gure blog korporatiboan:

Gure Telegram kanaleko mezu pare bat:

Iturria: www.habr.com

Gehitu iruzkin berria