Situace: virtuální GPU nejsou ve výkonu horší než hardwarová řešení

V únoru uspořádal Stanford konferenci o vysoce výkonných počítačích (HPC). Zástupci VMware uvedli, že při práci s GPU není systém založený na upraveném hypervizoru ESXi v rychlosti horší než řešení z holého kovu.

Mluvíme o technologiích, které toho umožnily.

Situace: virtuální GPU nejsou ve výkonu horší než hardwarová řešení
/ foto Victorgrigas CC BY-SA

Problém s výkonem

Podle analytiků je asi 70 % zátěže v datových centrech virtualizované. Zbývajících 30 % však stále běží na holém kovu bez hypervizorů. Těchto 30 % většinou tvoří aplikace s vysokou zátěží, jako jsou ty, které se týkají trénování neuronových sítí a využívajících GPU.

Odborníci tento trend vysvětlují tím, že hypervizor jako mezivrstva abstrakce může ovlivnit výkon celého systému. Na studiích před pěti lety můžete najít data o snížení rychlosti práce o 10 %. Společnosti a provozovatelé datových center proto nikam nespěchají s přenosem zátěže HPC do virtuálního prostředí.

Ale virtualizační technologie se vyvíjejí a zlepšují. Na konferenci před měsícem VMware řekl, že hypervizor ESXi nemá negativní dopad na výkon GPU. Výpočetní rychlost lze snížit o tři procenta, což je srovnatelné s holým kovem.

Jak to funguje

Pro zlepšení výkonu systémů HPC s GPU provedl VMware řadu změn v hypervizoru. Zejména byla zbavena funkce vMotion. Je potřebný pro vyrovnávání zátěže a obvykle přenáší virtuální stroje (VM) mezi servery nebo GPU. Zakázání vMotion vedlo k tomu, že každému virtuálnímu počítači je nyní přiřazena konkrétní GPU. To pomohlo snížit náklady při výměně dat.

Další klíčová součást systému je technologie DirectPath I/O. Umožňuje paralelnímu výpočetnímu ovladači CUDA komunikovat přímo s virtuálními stroji a obcházet hypervizor. Pokud potřebujete spustit několik virtuálních počítačů na jednom GPU najednou, použije se řešení GRID vGPU. Rozděluje paměť karty na několik segmentů (ale výpočetní cykly nejsou rozděleny).

Operační diagram dvou virtuálních strojů v tomto případě bude vypadat takto:

Situace: virtuální GPU nejsou ve výkonu horší než hardwarová řešení

Výsledky a prognózy

společnost provedli testy hypervizor trénováním jazykového modelu založeného na TensorFlow. Výkonové „poškození“ bylo pouze 3–4 % ve srovnání s holým kovem. Na oplátku byl systém schopen distribuovat zdroje na vyžádání v závislosti na aktuální zátěži.

IT gigant také provedli testy s kontejnery. Inženýři společnosti vycvičili neuronové sítě k rozpoznávání obrázků. Současně byly prostředky jednoho GPU rozděleny mezi čtyři kontejnerové VM. V důsledku toho se výkon jednotlivých strojů snížil o 17 % (ve srovnání s jedním VM s plným přístupem ke zdrojům GPU). Počet zpracovaných snímků za sekundu zvýšené třikrát. Očekává se, že takové systémy najde aplikace v analýze dat a počítačovém modelování.

Mezi potenciální problémy, kterým může VMware čelit, patří odborníci přidělit spíše úzké cílové publikum. Malý počet společností stále pracuje s vysoce výkonnými systémy. I když ve Statista slavitže do roku 2021 bude 94 % světové zátěže datových center virtualizováno. Podle předpovědi analytiků, hodnota HPC trhu vzroste v období 32 až 45 z 2017 na 2022 miliard dolarů.

Situace: virtuální GPU nejsou ve výkonu horší než hardwarová řešení
/ foto Globální přístupový bod PD

Podobná řešení

Na trhu existuje několik analogů, které vyvíjejí velké IT společnosti: AMD a Intel.

První společnost pro virtualizaci GPU nabízí přístup založený na SR-IOV (single-root input/output virtualization). Tato technologie umožňuje virtuálnímu počítači přístup k části hardwarových schopností systému. Řešení umožňuje sdílet GPU mezi 16 uživateli se stejným výkonem jako virtualizované systémy.

Pokud jde o druhého IT giganta, oni založené na technologii na hypervisoru Citrix XenServer 7. Spojuje práci standardního ovladače GPU a virtuálního stroje, který umožňuje zobrazovat 3D aplikace a desktopy na zařízeních stovek uživatelů.

Budoucnost technologie

Vývojáři virtuálních GPU uzavřít sázku o implementaci systémů AI a rostoucí oblibě vysoce výkonných řešení na trhu podnikových technologií. Doufají, že potřeba zpracovávat velké množství dat zvýší poptávku po vGPU.

Nyní výrobci hledat cestu spojí funkčnost CPU a GPU v jednom jádru pro urychlení řešení problémů souvisejících s grafikou, provádění matematických výpočtů, logických operací a zpracování dat. Objevení se takových jader na trhu v budoucnu změní přístup k virtualizaci zdrojů a jejich distribuci mezi pracovní zátěže ve virtuálních a cloudových prostředích.

Co si k tématu přečíst na našem firemním blogu:

Pár příspěvků z našeho kanálu Telegram:

Zdroj: www.habr.com

Přidat komentář