Situācija: virtuālie GPU veiktspējas ziņā nav zemāki par aparatūras risinājumiem

Februārī Stenfordā notika konference par augstas veiktspējas skaitļošanu (HPC). VMware pārstāvji stāstīja, ka, strādājot ar GPU, sistēma, kuras pamatā ir modificēts ESXi hipervizors, ātrumā nav zemāka par plikmetāla risinājumiem.

Mēs runājam par tehnoloģijām, kas ļāva to sasniegt.

Situācija: virtuālie GPU veiktspējas ziņā nav zemāki par aparatūras risinājumiem
/ foto Viktorgrigas CC BY-SA

Veiktspējas problēma

Pēc analītiķu domām, aptuveni 70% no darba slodzes datu centros virtualizēts. Tomēr atlikušie 30% joprojām darbojas uz tukša metāla bez hipervizoriem. Šos 30% lielākoties veido lielas slodzes lietojumprogrammas, piemēram, tās, kas saistītas ar neironu tīklu apmācību un GPU izmantošanu.

Eksperti šo tendenci skaidro ar to, ka hipervizors kā starpposma abstrakcijas slānis var ietekmēt visas sistēmas veiktspēju. Studijās pirms pieciem gadiem jūs varat atrast datus par darba ātruma samazināšanu par 10%. Tāpēc uzņēmumi un datu centru operatori nesteidzas pārcelt HPC slodzes uz virtuālo vidi.

Bet virtualizācijas tehnoloģijas attīstās un pilnveidojas. Konferencē pirms mēneša VMware teica, ka ESXi hipervizoram nav negatīvas ietekmes uz GPU veiktspēju. Skaitļošanas ātrumu var samazināt par trīs procentiem, kas ir salīdzināms ar tukšu metālu.

Kā tas darbojas

Lai uzlabotu HPC sistēmu ar GPU veiktspēju, VMware ir veikusi vairākas hipervizora izmaiņas. Jo īpaši tas tika atbrīvots no vMotion funkcijas. Tas ir nepieciešams slodzes līdzsvarošanai un parasti pārsūta virtuālās mašīnas (VM) starp serveriem vai GPU. Atspējojot vMotion, katrai virtuālajai mašīnai tagad tika piešķirts konkrēts GPU. Tas palīdzēja samazināt izmaksas, apmainoties ar datiem.

Vēl viena svarīga sistēmas sastāvdaļa ir tehnoloģija DirectPath I/O. Tas ļauj CUDA paralēlās skaitļošanas draiverim tieši mijiedarboties ar virtuālajām mašīnām, apejot hipervizoru. Ja vienā GPU vienlaikus jāpalaiž vairākas virtuālās mašīnas, tiek izmantots GRID vGPU risinājums. Tas sadala kartes atmiņu vairākos segmentos (bet skaitļošanas cikli nav sadalīti).

Šajā gadījumā divu virtuālo mašīnu darbības shēma izskatīsies šādi:

Situācija: virtuālie GPU veiktspējas ziņā nav zemāki par aparatūras risinājumiem

Rezultāti un prognozes

kompānija veica testus hipervizors, apmācot valodas modeli, kura pamatā ir TensorFlow. Darbības "bojājumi" bija tikai 3–4%, salīdzinot ar tukšu metālu. Savukārt sistēma spēja sadalīt resursus pēc pieprasījuma atkarībā no pašreizējās slodzes.

Arī IT gigants veica testus ar konteineriem. Uzņēmuma inženieri apmācīja neironu tīklus attēlu atpazīšanai. Tajā pašā laikā viena GPU resursi tika sadalīti starp četrām konteineru virtuālajām mašīnām. Rezultātā atsevišķu mašīnu veiktspēja samazinājās par 17% (salīdzinājumā ar vienu virtuālo mašīnu ar pilnu piekļuvi GPU resursiem). Tomēr sekundē apstrādāto attēlu skaits palielinājies trīs reizes. Paredzams, ka šādas sistēmas atradīs lietojumi datu analīzē un datormodelēšanā.

Starp iespējamām problēmām, ar kurām var saskarties VMware, eksperti piešķirt diezgan šaura mērķauditorija. Neliels skaits uzņēmumu joprojām strādā ar augstas veiktspējas sistēmām. Kaut vai Statistā svinētka līdz 2021. gadam 94% no pasaules datu centru darba slodzēm tiks virtualizēti. Autors prognozes analītiķi, HPC tirgus vērtība laika posmā no 32. līdz 45. gadam pieaugs no 2017 līdz 2022 miljardiem dolāru.

Situācija: virtuālie GPU veiktspējas ziņā nav zemāki par aparatūras risinājumiem
/ foto Globālais piekļuves punkts PD

Līdzīgi risinājumi

Tirgū ir vairāki analogi, kurus izstrādā lielie IT uzņēmumi: AMD un Intel.

Pirmais uzņēmums GPU virtualizācijai piedāvājumus pieeja, kuras pamatā ir SR-IOV (vienas saknes ievades/izvades virtualizācija). Šī tehnoloģija nodrošina VM piekļuvi daļai no sistēmas aparatūras iespējām. Risinājums ļauj koplietot GPU starp 16 lietotājiem ar vienādu veiktspēju virtualizētajām sistēmām.

Kas attiecas uz otro IT gigantu, viņi balstīta uz tehnoloģijām uz hipervizora Citrix XenServer 7. Tas apvieno standarta GPU draivera un virtuālās mašīnas darbu, kas ļauj pēdējai parādīt 3D lietojumprogrammas un galddatorus simtiem lietotāju ierīcēs.

Tehnoloģiju nākotne

Virtuālo GPU izstrādātāji izdarīt likmi par AI sistēmu ieviešanu un augstas veiktspējas risinājumu pieaugošo popularitāti biznesa tehnoloģiju tirgū. Viņi cer, ka nepieciešamība apstrādāt lielus datu apjomus palielinās pieprasījumu pēc vGPU.

Tagad ražotāji meklē ceļu apvienot CPU un GPU funkcionalitāti vienā kodolā, lai paātrinātu ar grafiku saistītu problēmu risināšanu, matemātisko aprēķinu veikšanu, loģisko darbību un datu apstrādi. Šādu kodolu parādīšanās tirgū nākotnē mainīs pieeju resursu virtualizācijai un to sadalei starp darba slodzēm virtuālajā un mākoņa vidē.

Ko par tēmu lasīt mūsu korporatīvajā emuārā:

Pāris ieraksti no mūsu telegrammas kanāla:

Avots: www.habr.com

Pievieno komentāru