Helyzet: A virtuális GPU-k teljesítményükben nem rosszabbak a hardveres megoldásoknál

Februárban Stanford konferenciának adott otthont a nagy teljesítményű számítástechnikáról (HPC). A VMware képviselői elmondták, hogy a GPU-val történő munkavégzés során a módosított ESXi hypervisorra épülő rendszer sebességében nem alacsonyabb, mint a csupasz fém megoldások.

Beszélünk azokról a technológiákról, amelyek ezt lehetővé tették.

Helyzet: A virtuális GPU-k teljesítményükben nem rosszabbak a hardveres megoldásoknál
/ fotó Victorgrigas CC BY-SA

Teljesítményprobléma

Az elemzők szerint az adatközpontokban a munkaterhelés mintegy 70%-a virtualizált. A fennmaradó 30% azonban továbbra is csupasz fémen fut hipervizorok nélkül. Ez a 30% többnyire nagy terhelésű alkalmazásokból áll, például neurális hálózatok betanításához és GPU-k használatához.

A szakértők ezt a tendenciát azzal magyarázzák, hogy a hipervizor, mint köztes absztrakciós réteg az egész rendszer teljesítményét befolyásolhatja. Öt évvel ezelőtti tanulmányokban megtalálhatja az adatokat a munka sebességének 10%-os csökkentéséről. Ezért a vállalatok és az adatközpontok üzemeltetői nem sietnek a HPC-terhelések virtuális környezetbe átvitelével.

A virtualizációs technológiák azonban fejlődnek és javulnak. Egy hónappal ezelőtti konferencián a VMware azt mondta, hogy az ESXi hypervisor nincs negatív hatással a GPU teljesítményére. A számítási sebesség három százalékkal csökkenthető, ami a csupasz fémhez hasonlítható.

Ez hogy működik

A GPU-s HPC-rendszerek teljesítményének javítása érdekében a VMware számos változtatást hajtott végre a hypervisoron. Különösen a vMotion funkciótól szabadult meg. A terheléselosztáshoz szükséges, és általában virtuális gépeket (VM-eket) visz át kiszolgálók vagy GPU-k között. A vMotion letiltása azt eredményezte, hogy most minden virtuális géphez egy adott GPU lett hozzárendelve. Ez segített csökkenteni a költségeket az adatcsere során.

A rendszer másik kulcseleme a technológia DirectPath I/O. Lehetővé teszi, hogy a CUDA párhuzamos számítástechnikai illesztőprogramja közvetlenül kommunikáljon a virtuális gépekkel, a hypervisor megkerülésével. Ha egyszerre több virtuális gépet kell futtatnia egy GPU-n, a GRID vGPU megoldást használja a rendszer. A kártya memóriáját több szegmensre osztja (de a számítási ciklusok nincsenek felosztva).

Ebben az esetben két virtuális gép működési diagramja így fog kinézni:

Helyzet: A virtuális GPU-k teljesítményükben nem rosszabbak a hardveres megoldásoknál

Eredmények és előrejelzések

társaság teszteket végzett hypervisor nyelvi modell képzésével TensorFlow. A teljesítmény „kár” mindössze 3-4% volt a csupasz fémhez képest. Cserébe a rendszer az aktuális terheléstől függően igény szerint el tudta osztani az erőforrásokat.

Az informatikai óriás is teszteket végzett konténerekkel. A cég mérnökei neurális hálózatokat képeztek ki a képek felismerésére. Ugyanakkor egy GPU erőforrásait négy konténeres virtuális gép között osztották fel. Ennek eredményeként az egyes gépek teljesítménye 17%-kal csökkent (egyetlen virtuális géphez képest, amely teljes hozzáférést biztosít a GPU-erőforrásokhoz). Azonban a másodpercenként feldolgozott képek száma megnövekedett háromszor. Várható, hogy az ilyen rendszerek fog találni alkalmazások adatelemzésben és számítógépes modellezésben.

A VMware lehetséges problémái közé tartoznak a szakértők kioszt meglehetősen szűk célközönség. Néhány vállalat még mindig nagy teljesítményű rendszerekkel dolgozik. Bár a Statistában jelhogy 2021-re a világ adatközpontjainak 94%-a virtualizált lesz. Által előrejelzések elemzők szerint a HPC-piac értéke 32-ről 45 milliárd dollárra nő a 2017 és 2022 közötti időszakban.

Helyzet: A virtuális GPU-k teljesítményükben nem rosszabbak a hardveres megoldásoknál
/ fotó Globális hozzáférési pont PD

Hasonló megoldások

Számos analóg van a piacon, amelyeket nagy IT-cégek fejlesztettek ki: AMD és Intel.

Az első GPU virtualizációs cég ajánlatok SR-IOV (egygyökérű bemeneti/kimeneti virtualizáció) alapú megközelítés. Ez a technológia hozzáférést biztosít a virtuális gép számára a rendszer hardverképességeinek egy részéhez. A megoldás lehetővé teszi a GPU megosztását 16 felhasználó között a virtualizált rendszerek azonos teljesítményével.

Ami a második informatikai óriást illeti, ők technológia alapú a Citrix XenServer 7 hypervisoron.. Egy szabványos GPU-illesztőprogram és egy virtuális gép munkáját ötvözi, ami lehetővé teszi, hogy utóbbi több száz felhasználó eszközén jelenítsen meg 3D-s alkalmazásokat és asztali gépeket.

A technológia jövője

Virtuális GPU fejlesztők fogadni az AI rendszerek bevezetéséről és a nagy teljesítményű megoldások növekvő népszerűségéről az üzleti technológiai piacon. Azt remélik, hogy a nagy mennyiségű adat feldolgozásának szükségessége növeli a vGPU-k iránti keresletet.

Most a gyártók utat keresve a CPU és a GPU funkcionalitását egy magban egyesítik, hogy felgyorsítsák a grafikával kapcsolatos problémák megoldását, matematikai számításokat, logikai műveleteket és adatfeldolgozást. Az ilyen magok megjelenése a jövőben megváltoztatja az erőforrás-virtualizáció megközelítését és a virtuális és felhőkörnyezetben a munkaterhelések közötti elosztásukat.

Amit a témában érdemes elolvasni céges blogunkban:

Pár bejegyzés a Telegram csatornánkról:

Forrás: will.com

Hozzászólás