Situacija: virtualni GPU nisu inferiorni u performansama od hardverskih rješenja

U veljači je Stanford bio domaćin konferencije o računalstvu visokih performansi (HPC). Predstavnici VMware-a rekli su da kada rade s GPU-om, sustav temeljen na modificiranom ESXi hipervizoru nije inferioran u brzini od golih metalnih rješenja.

Govorimo o tehnologijama koje su to omogućile.

Situacija: virtualni GPU nisu inferiorni u performansama od hardverskih rješenja
/ fotografija Victorgrigas CC BY-SA

Problem s izvedbom

Prema analitičarima, oko 70% opterećenja u podatkovnim centrima virtualizirano. Međutim, preostalih 30% i dalje radi na golom metalu bez hipervizora. Tih 30% uglavnom se sastoji od visokoopterećenih aplikacija, poput onih koje se odnose na obuku neuronskih mreža i korištenje GPU-a.

Stručnjaci ovaj trend objašnjavaju činjenicom da hipervizor, kao međusloj apstrakcije, može utjecati na performanse cijelog sustava. U studijama prije pet godina možete pronaći podatke o smanjenju brzine rada za 10%. Stoga se tvrtke i operateri podatkovnih centara ne žure s prijenosom HPC radnih opterećenja u virtualno okruženje.

Ali tehnologije virtualizacije se razvijaju i poboljšavaju. Na konferenciji prije mjesec dana, VMware je rekao da ESXi hipervizor nema negativan utjecaj na performanse GPU-a. Brzina računanja može se smanjiti za tri posto, što je usporedivo s golim metalom.

Kako ovo radi

Kako bi poboljšao performanse HPC sustava s GPU-ima, VMware je napravio niz promjena u hipervizoru. Osobito je uklonjena funkcija vMotion. Potreban je za balansiranje opterećenja i obično prenosi virtualne strojeve (VM) između poslužitelja ili GPU-a. Onemogućavanje vMotiona rezultiralo je time da je svakom VM-u sada dodijeljen određeni GPU. To je pomoglo smanjiti troškove prilikom razmjene podataka.

Još jedna ključna komponenta sustava je tehnologija DirectPath I/O. Omogućuje CUDA paralelnom računarskom upravljačkom programu izravnu interakciju s virtualnim strojevima, zaobilazeći hipervizor. Kada trebate pokrenuti nekoliko VM-ova na jednom GPU-u odjednom, koristi se GRID vGPU rješenje. Dijeli memoriju kartice u nekoliko segmenata (ali računalni ciklusi nisu podijeljeni).

Dijagram rada dvaju virtualnih strojeva u ovom će slučaju izgledati ovako:

Situacija: virtualni GPU nisu inferiorni u performansama od hardverskih rješenja

Rezultati i prognoze

poduzeće provedena ispitivanja hipervizor obučavanjem jezičnog modela temeljenog na TensorFlow. "Oštećenje" izvedbe bilo je samo 3-4% u usporedbi s golim metalom. Zauzvrat, sustav je mogao distribuirati resurse na zahtjev ovisno o trenutnom opterećenju.

IT div također provedena ispitivanja sa kontejnerima. Inženjeri tvrtke uvježbali su neuronske mreže da prepoznaju slike. U isto vrijeme, resursi jednog GPU-a raspoređeni su između četiri kontejnerska VM-a. Kao rezultat toga, izvedba pojedinačnih strojeva smanjena je za 17% (u usporedbi s jednim VM-om s punim pristupom GPU resursima). Međutim, broj slika obrađenih u sekundi povećana tri puta. Očekuje se da takvi sustavi ću naći primjene u analizi podataka i računalno modeliranje.

Među potencijalnim problemima s kojima se VMware može suočiti, stručnjaci dodijeliti prilično uska ciljna publika. Mali broj tvrtki još uvijek radi sa sustavima visokih performansi. Iako u Statisti oznakada će do 2021. godine 94% radnih opterećenja svjetskih podatkovnih centara biti virtualizirano. Po prognoze analitičari, vrijednost HPC tržišta će u razdoblju od 32. do 45. godine narasti sa 2017 na 2022 milijardi dolara.

Situacija: virtualni GPU nisu inferiorni u performansama od hardverskih rješenja
/ fotografija Globalna pristupna točka PD

Slična rješenja

Na tržištu postoji nekoliko analoga koje su razvile velike IT tvrtke: AMD i Intel.

Prva tvrtka za GPU virtualizaciju ponude pristup temeljen na SR-IOV (single-root input/output virtualization). Ova tehnologija VM-u daje pristup dijelu hardverskih mogućnosti sustava. Rješenje vam omogućuje dijeljenje GPU-a između 16 korisnika s jednakim performansama virtualiziranih sustava.

Što se tiče drugog informatičkog diva, oni temeljen na tehnologiji na hipervizoru Citrix XenServer 7. Kombinira rad standardnog GPU drajvera i virtualnog stroja, koji potonjem omogućuje prikaz 3D aplikacija i desktopa na uređajima stotina korisnika.

Budućnost tehnologije

Virtualni GPU programeri napraviti okladu o implementaciji AI sustava i sve većoj popularnosti rješenja visokih performansi na tržištu poslovne tehnologije. Nadaju se da će potreba za obradom velikih količina podataka povećati potražnju za vGPU-ima.

Sada proizvođači tražeći način kombinirajte funkcionalnost CPU-a i GPU-a u jednoj jezgri kako biste ubrzali rješavanje problema povezanih s grafikom, izvođenjem matematičkih izračuna, logičkih operacija i obrade podataka. Pojava ovakvih jezgri na tržištu u budućnosti promijenit će pristup virtualizaciji resursa i njihovu raspodjelu između radnih opterećenja u virtualnim i cloud okruženjima.

Što čitati o ovoj temi u našem korporativnom blogu:

Par objava s našeg Telegram kanala:

Izvor: www.habr.com

Dodajte komentar