Situacija: virtuelni GPU-ovi nisu inferiorni u performansama od željeznih rjeŔenja

U februaru je Stanford bio domaćin konferencije o računarstvu visokih performansi (HPC). Predstavnici VMware-a su rekli da kada se radi sa GPU-om, sistem baziran na modifikovanom ESXi hipervizoru nije inferioran u brzini od golih metalnih reÅ”enja.

Razgovaramo o tehnologijama koje su to omogućile.

Situacija: virtuelni GPU-ovi nisu inferiorni u performansama od željeznih rjeŔenja
/ photo Victorgrigas CC BY-SA

Problem sa performansama

Prema analitičarima, oko 70% posla u centrima podataka virtuelizovano. Međutim, preostalih 30% i dalje radi na golom metalu bez hipervizora. Ovih 30% uglavnom se sastoji od aplikacija visokog opterećenja, poput onih koje se odnose na obuku neuronskih mreža i koriÅ”tenje GPU-a.

Stručnjaci ovaj trend objaÅ”njavaju činjenicom da hipervizor, kao srednji sloj apstrakcije, može uticati na performanse cijelog sistema. U studijama prije pet godina možete pronaći podatke o smanjenju brzine rada za 10%. Stoga, kompanije i operateri centara podataka ne žure da prenose HPC radna opterećenja u virtuelno okruženje.

Ali tehnologije virtuelizacije se razvijaju i poboljŔavaju. Na konferenciji prije mjesec dana, VMware je rekao da ESXi hipervizor nema negativan utjecaj na performanse GPU-a. Brzina računara može se smanjiti za tri posto, Ŕto je uporedivo sa golim metalom.

Kako ovo radi

Da bi poboljÅ”ao performanse HPC sistema sa GPU-ovima, VMware je napravio brojne promene na hipervizoru. Konkretno, uklonjena je funkcija vMotion. Potreban je za balansiranje opterećenja i obično prenosi virtuelne maÅ”ine (VM) između servera ili GPU-a. Onemogućavanje vMotion-a rezultiralo je time da je svakom VM-u sada dodijeljen određeni GPU. To je pomoglo u smanjenju troÅ”kova prilikom razmjene podataka.

JoÅ” jedna ključna komponenta sistema je tehnologija DirectPath I/O. Omogućava CUDA drajveru paralelnog računarstva da direktno komunicira sa virtuelnim maÅ”inama, zaobilazeći hipervizor. Kada trebate pokrenuti nekoliko VM-ova na jednom GPU-u odjednom, koristi se GRID vGPU rjeÅ”enje. On dijeli memoriju kartice na nekoliko segmenata (ali ciklusi računanja nisu podijeljeni).

Dijagram rada dvije virtuelne maÅ”ine u ovom slučaju će izgledati ovako:

Situacija: virtuelni GPU-ovi nisu inferiorni u performansama od željeznih rjeŔenja

Rezultati i prognoze

Firma sprovedena ispitivanja hipervizor obučavanjem jezičkog modela zasnovanog na TensorFlow. Performanse ā€žoÅ”tećenjaā€œ bile su samo 3-4% u poređenju sa golim metalom. Zauzvrat, sistem je mogao distribuirati resurse na zahtjev u zavisnosti od trenutnog opterećenja.

IT gigant takođe sprovedena ispitivanja sa kontejnerima. Inženjeri kompanije obučili su neuronske mreže da prepoznaju slike. Istovremeno, resursi jednog GPU-a bili su raspoređeni na četiri kontejnerska VM-a. Kao rezultat toga, performanse pojedinačnih maÅ”ina su smanjene za 17% (u poređenju sa jednim VM-om sa punim pristupom GPU resursima). Međutim, broj obrađenih slika u sekundi povećana tri puta. Očekuje se da ovakvi sistemi će nači primjene u analizi podataka i kompjuterskom modeliranju.

Među potencijalnim problemima s kojima se VMware može suočiti, stručnjaci alocirati prilično uska ciljna publika. Mali broj kompanija joÅ” uvijek radi sa sistemima visokih performansi. Iako u Statisti slavitida će do 2021. 94% posla u svjetskim podatkovnim centrima biti virtuelizirano. By prognoze analitičari, vrijednost HPC tržiÅ”ta će porasti sa 32 na 45 milijardi dolara u periodu od 2017. do 2022. godine.

Situacija: virtuelni GPU-ovi nisu inferiorni u performansama od željeznih rjeŔenja
/ photo Globalna pristupna tačka PD

Slična rjeŔenja

Na tržiŔtu postoji nekoliko analoga koje su razvile velike IT kompanije: AMD i Intel.

Prva kompanija za GPU virtuelizaciju ponude pristup baziran na SR-IOV (single-root input/output virtuelizacija). Ova tehnologija daje VM pristup dijelu hardverskih mogućnosti sistema. ReÅ”enje vam omogućava da delite GPU između 16 korisnika sa jednakim performansama virtuelizovanih sistema.

Å to se tiče drugog IT giganta, oni baziran na tehnologiji na hipervizoru Citrix XenServer 7. Kombinira rad standardnog GPU drajvera i virtuelne maÅ”ine, Å”to omogućava ovoj drugoj da prikazuje 3D aplikacije i desktope na uređajima stotina korisnika.

Budućnost tehnologije

Virtualni GPU programeri kladiti se o implementaciji AI sistema i rastućoj popularnosti rjeÅ”enja visokih performansi na tržiÅ”tu poslovne tehnologije. Nadaju se da će potreba za obradom velikih količina podataka povećati potražnju za vGPU-ovima.

Sada proizvođači tražim način kombinuju funkcionalnost CPU-a i GPU-a u jednom jezgru kako bi ubrzali rjeÅ”avanje problema vezanih za grafiku, izvođenje matematičkih proračuna, logičkih operacija i obrade podataka. Pojava ovakvih jezgara na tržiÅ”tu u budućnosti će promijeniti pristup virtuelizaciji resursa i njihovu distribuciju između radnih opterećenja u virtuelnim i cloud okruženjima.

Šta čitati o ovoj temi na naŔem korporativnom blogu:

Par postova sa naŔeg Telegram kanala:

izvor: www.habr.com

Kupite pouzdan hosting za sajtove sa DDoS zaÅ”titom, VPS VDS servere šŸ”„ Kupite pouzdan web hosting sa DDoS zaÅ”titom, VPS VDS servere | ProHoster