Situacija: virtuelni GPU-ovi nisu inferiorni u performansama od željeznih rješenja

U februaru je Stanford bio domaćin konferencije o računarstvu visokih performansi (HPC). Predstavnici VMware-a su rekli da kada se radi sa GPU-om, sistem baziran na modifikovanom ESXi hipervizoru nije inferioran u brzini od golih metalnih rešenja.

Razgovaramo o tehnologijama koje su to omogućile.

Situacija: virtuelni GPU-ovi nisu inferiorni u performansama od željeznih rješenja
/ photo Victorgrigas CC BY-SA

Problem sa performansama

Prema analitičarima, oko 70% posla u centrima podataka virtuelizovano. Međutim, preostalih 30% i dalje radi na golom metalu bez hipervizora. Ovih 30% uglavnom se sastoji od aplikacija visokog opterećenja, poput onih koje se odnose na obuku neuronskih mreža i korištenje GPU-a.

Stručnjaci ovaj trend objašnjavaju činjenicom da hipervizor, kao srednji sloj apstrakcije, može uticati na performanse cijelog sistema. U studijama prije pet godina možete pronaći podatke o smanjenju brzine rada za 10%. Stoga, kompanije i operateri centara podataka ne žure da prenose HPC radna opterećenja u virtuelno okruženje.

Ali tehnologije virtuelizacije se razvijaju i poboljšavaju. Na konferenciji prije mjesec dana, VMware je rekao da ESXi hipervizor nema negativan utjecaj na performanse GPU-a. Brzina računara može se smanjiti za tri posto, što je uporedivo sa golim metalom.

Kako ovo radi

Da bi poboljšao performanse HPC sistema sa GPU-ovima, VMware je napravio brojne promene na hipervizoru. Konkretno, uklonjena je funkcija vMotion. Potreban je za balansiranje opterećenja i obično prenosi virtuelne mašine (VM) između servera ili GPU-a. Onemogućavanje vMotion-a rezultiralo je time da je svakom VM-u sada dodijeljen određeni GPU. To je pomoglo u smanjenju troškova prilikom razmjene podataka.

Još jedna ključna komponenta sistema je tehnologija DirectPath I/O. Omogućava CUDA drajveru paralelnog računarstva da direktno komunicira sa virtuelnim mašinama, zaobilazeći hipervizor. Kada trebate pokrenuti nekoliko VM-ova na jednom GPU-u odjednom, koristi se GRID vGPU rješenje. On dijeli memoriju kartice na nekoliko segmenata (ali ciklusi računanja nisu podijeljeni).

Dijagram rada dvije virtuelne mašine u ovom slučaju će izgledati ovako:

Situacija: virtuelni GPU-ovi nisu inferiorni u performansama od željeznih rješenja

Rezultati i prognoze

Firma sprovedena ispitivanja hipervizor obučavanjem jezičkog modela zasnovanog na TensorFlow. Performanse „oštećenja“ bile su samo 3-4% u poređenju sa golim metalom. Zauzvrat, sistem je mogao distribuirati resurse na zahtjev u zavisnosti od trenutnog opterećenja.

IT gigant takođe sprovedena ispitivanja sa kontejnerima. Inženjeri kompanije obučili su neuronske mreže da prepoznaju slike. Istovremeno, resursi jednog GPU-a bili su raspoređeni na četiri kontejnerska VM-a. Kao rezultat toga, performanse pojedinačnih mašina su smanjene za 17% (u poređenju sa jednim VM-om sa punim pristupom GPU resursima). Međutim, broj obrađenih slika u sekundi povećana tri puta. Očekuje se da ovakvi sistemi će nači primjene u analizi podataka i kompjuterskom modeliranju.

Među potencijalnim problemima s kojima se VMware može suočiti, stručnjaci alocirati prilično uska ciljna publika. Mali broj kompanija još uvijek radi sa sistemima visokih performansi. Iako u Statisti slavitida će do 2021. 94% posla u svjetskim podatkovnim centrima biti virtuelizirano. By prognoze analitičari, vrijednost HPC tržišta će porasti sa 32 na 45 milijardi dolara u periodu od 2017. do 2022. godine.

Situacija: virtuelni GPU-ovi nisu inferiorni u performansama od željeznih rješenja
/ photo Globalna pristupna tačka PD

Slična rješenja

Na tržištu postoji nekoliko analoga koje su razvile velike IT kompanije: AMD i Intel.

Prva kompanija za GPU virtuelizaciju ponude pristup baziran na SR-IOV (single-root input/output virtuelizacija). Ova tehnologija daje VM pristup dijelu hardverskih mogućnosti sistema. Rešenje vam omogućava da delite GPU između 16 korisnika sa jednakim performansama virtuelizovanih sistema.

Što se tiče drugog IT giganta, oni baziran na tehnologiji na hipervizoru Citrix XenServer 7. Kombinira rad standardnog GPU drajvera i virtuelne mašine, što omogućava ovoj drugoj da prikazuje 3D aplikacije i desktope na uređajima stotina korisnika.

Budućnost tehnologije

Virtualni GPU programeri kladiti se o implementaciji AI sistema i rastućoj popularnosti rješenja visokih performansi na tržištu poslovne tehnologije. Nadaju se da će potreba za obradom velikih količina podataka povećati potražnju za vGPU-ovima.

Sada proizvođači tražim način kombinuju funkcionalnost CPU-a i GPU-a u jednom jezgru kako bi ubrzali rješavanje problema vezanih za grafiku, izvođenje matematičkih proračuna, logičkih operacija i obrade podataka. Pojava ovakvih jezgara na tržištu u budućnosti će promijeniti pristup virtuelizaciji resursa i njihovu distribuciju između radnih opterećenja u virtuelnim i cloud okruženjima.

Šta čitati o ovoj temi na našem korporativnom blogu:

Par postova sa našeg Telegram kanala:

izvor: www.habr.com

Dodajte komentar