Tilanne: Virtuaaliset GPU:t eivät ole suorituskyvyltään huonompia kuin laitteistoratkaisut

Helmikuussa Stanford isännöi konferenssia korkean suorituskyvyn tietojenkäsittelystä (HPC). VMwaren edustajat sanoivat, että GPU:n kanssa työskennellessä muunneltuun ESXi-hypervisoriin perustuva järjestelmä ei ole nopeudeltaan huonompi kuin paljasmetalliratkaisut.

Puhumme teknologioista, jotka mahdollistivat tämän saavuttamisen.

Tilanne: Virtuaaliset GPU:t eivät ole suorituskyvyltään huonompia kuin laitteistoratkaisut
/ valokuva Victorgrigas CC BY-SA

Suorituskykyongelma

Analyytikkojen mukaan noin 70% työkuormista datakeskuksissa virtualisoitu. Loput 30 % toimii kuitenkin edelleen paljaalla metallilla ilman hypervisoreita. Tämä 30 % koostuu enimmäkseen suuren kuormituksen sovelluksista, kuten neuroverkkojen koulutukseen liittyvistä ja GPU:iden käyttämisestä.

Asiantuntijat selittävät tämän suuntauksen sillä, että hypervisori välittävänä abstraktiokerroksena voi vaikuttaa koko järjestelmän suorituskykyyn. Opinnoissa viisi vuotta sitten voit löytää tiedot työnopeuden vähentämisestä 10 %. Siksi yrityksillä ja konesalioperaattoreilla ei ole kiirettä siirtää HPC-työkuormia virtuaaliseen ympäristöön.

Mutta virtualisointiteknologiat kehittyvät ja paranevat. Kuukausi sitten pidetyssä konferenssissa VMware sanoi, että ESXi-hypervisorilla ei ole negatiivista vaikutusta GPU:n suorituskykyyn. Laskentanopeutta voidaan vähentää kolme prosenttia, mikä on verrattavissa paljaalle metallille.

Kuinka tämä toimii

GPU:lla varustettujen HPC-järjestelmien suorituskyvyn parantamiseksi VMware on tehnyt useita muutoksia hypervisoriin. Erityisesti se erotettiin vMotion-toiminnosta. Sitä tarvitaan kuormituksen tasapainottamiseen ja se yleensä siirtää virtuaalikoneita (VM) palvelimien tai GPU:iden välillä. VMotionin poistaminen käytöstä johti siihen, että jokaiselle virtuaalikoneelle määritettiin nyt tietty GPU. Tämä auttoi vähentämään kustannuksia tiedonvaihdossa.

Toinen järjestelmän keskeinen osa on tekniikkaa DirectPath I/O. Sen avulla CUDA-rinnakkaislaskentaohjain voi olla vuorovaikutuksessa virtuaalikoneiden kanssa suoraan ohittaen hypervisorin. Kun haluat käyttää useita virtuaalikoneita yhdellä grafiikkasuorittimella kerralla, käytetään GRID vGPU -ratkaisua. Se jakaa kortin muistin useisiin segmentteihin (mutta laskentajaksoja ei jaeta).

Kahden virtuaalikoneen toimintakaavio näyttää tässä tapauksessa tältä:

Tilanne: Virtuaaliset GPU:t eivät ole suorituskyvyltään huonompia kuin laitteistoratkaisut

Tulokset ja ennusteet

yritys suoritettuja testejä hypervisor kouluttamalla kielimallin pohjalta TensorFlow. Suorituskykyinen "vaurio" oli vain 3–4 % paljaaseen metalliin verrattuna. Vastineeksi järjestelmä pystyi jakamaan resursseja kysynnän mukaan nykyisen kuormituksen mukaan.

Myös IT-jätti suoritettuja testejä konttien kanssa. Yrityksen insinöörit kouluttivat hermoverkkoja tunnistamaan kuvia. Samanaikaisesti yhden GPU:n resurssit jaettiin neljälle kontti-VM:lle. Tämän seurauksena yksittäisten koneiden suorituskyky heikkeni 17 % (verrattuna yhteen virtuaalikoneeseen, jolla oli täysi pääsy GPU-resursseihin). Kuitenkin sekunnissa käsiteltyjen kuvien määrä lisääntynyt kolme kertaa. On odotettavissa, että tällaisia ​​järjestelmiä löytää sovellukset tietojen analysointiin ja tietokonemallinnukseen.

Asiantuntijat voivat kohdata VMwaren mahdollisia ongelmia jakaa melko kapea kohdeyleisö. Pieni määrä yrityksiä työskentelee edelleen korkean suorituskyvyn järjestelmien parissa. Vaikka Statistassa merkkiettä vuoteen 2021 mennessä 94 % maailman datakeskusten työkuormista virtualisoidaan. Tekijä: ennusteita Analyytikoiden mukaan HPC-markkinoiden arvo kasvaa 32 miljardista 45 miljardiin dollariin vuosina 2017-2022.

Tilanne: Virtuaaliset GPU:t eivät ole suorituskyvyltään huonompia kuin laitteistoratkaisut
/ valokuva Maailmanlaajuinen tukiasema PD

Samanlaisia ​​ratkaisuja

Markkinoilla on useita suurten IT-yritysten kehittämiä analogeja: AMD ja Intel.

Ensimmäinen GPU-virtualisointiyritys tarjoukset SR-IOV:iin (single-root input/output virtualisation) perustuva lähestymistapa. Tämä tekniikka antaa VM:lle pääsyn osaan järjestelmän laitteistoominaisuuksista. Ratkaisun avulla voit jakaa GPU:n 16 käyttäjän kesken virtualisoitujen järjestelmien yhtäläisellä suorituskyvyllä.

Mitä tulee toiseen IT-jättiläiseen, he teknologiaan perustuva Citrix XenServer 7 -hypervisorissa. Se yhdistää tavallisen GPU-ohjaimen ja virtuaalikoneen työn, jonka avulla jälkimmäinen voi näyttää 3D-sovelluksia ja pöytäkoneita satojen käyttäjien laitteilla.

Tekniikan tulevaisuus

Virtual GPU -kehittäjät lyödä vetoa tekoälyjärjestelmien käyttöönotosta ja korkean suorituskyvyn ratkaisujen kasvavasta suosiosta yritysteknologiamarkkinoilla. He toivovat, että tarve käsitellä suuria tietomääriä lisää vGPU:iden kysyntää.

Nyt valmistajat etsivät tietä yhdistä CPU:n ja GPU:n toiminnallisuus yhteen ytimeen nopeuttaaksesi grafiikkaan liittyvien ongelmien ratkaisemista, matemaattisten laskelmien suorittamista, loogisia operaatioita ja tietojenkäsittelyä. Tällaisten ytimien ilmestyminen markkinoille tulevaisuudessa muuttaa lähestymistapaa resurssien virtualisointiin ja niiden jakautumiseen työkuormien välillä virtuaali- ja pilviympäristöissä.

Mitä luettavaa aiheesta yritysblogissamme:

Pari viestiä Telegram-kanavaltamme:

Lähde: will.com

Lisää kommentti