Situácia: virtuálne GPU nie sú vo výkone horšie ako hardvérové ​​riešenia

Vo februári usporiadal Stanford konferenciu o vysokovýkonných počítačoch (HPC). Zástupcovia VMware uviedli, že pri práci s GPU nie je systém založený na upravenom hypervízore ESXi v rýchlosti horší ako holé kovové riešenia.

Hovoríme o technológiách, ktoré to umožnili dosiahnuť.

Situácia: virtuálne GPU nie sú vo výkone horšie ako hardvérové ​​riešenia
/ foto Victorgrigas CC BY-SA

Problém s výkonom

Podľa analytikov je asi 70 % pracovnej záťaže v dátových centrách virtualizované. Zvyšných 30 % však stále beží na holom kovu bez hypervízorov. Týchto 30 % väčšinou tvoria aplikácie s vysokou záťažou, ako sú tie, ktoré súvisia s trénovaním neurónových sietí a využívajúce GPU.

Odborníci tento trend vysvetľujú tým, že hypervízor ako medzivrstva abstrakcie môže ovplyvniť výkon celého systému. Na štúdiách pred piatimi rokmi môžete nájsť údaje o zníženie rýchlosti práce o 10 %. Spoločnosti a prevádzkovatelia dátových centier sa preto neponáhľajú s prenosom pracovnej záťaže HPC do virtuálneho prostredia.

Ale virtualizačné technológie sa vyvíjajú a zlepšujú. Na konferencii pred mesiacom VMware povedal, že ESXi hypervízor nemá negatívny vplyv na výkon GPU. Výpočtová rýchlosť sa dá znížiť o tri percentá, čo je porovnateľné s holým kovom.

Ako to funguje

Na zlepšenie výkonu systémov HPC s GPU vykonal VMware množstvo zmien v hypervízore. Zbavila sa najmä funkcie vMotion. Je potrebný na vyrovnávanie záťaže a zvyčajne prenáša virtuálne stroje (VM) medzi servermi alebo GPU. Zakázanie vMotion viedlo k tomu, že každému virtuálnemu počítaču bol teraz priradený špecifický GPU. To pomohlo znížiť náklady pri výmene dát.

Ďalšia kľúčová súčasť systému je technológia DirectPath I/O. Umožňuje paralelnému výpočtovému ovládaču CUDA interagovať s virtuálnymi strojmi priamo a obísť hypervízor. Keď potrebujete spustiť niekoľko VM na jednom GPU naraz, použije sa riešenie GRID vGPU. Rozdeľuje pamäť karty na niekoľko segmentov (výpočtové cykly však nie sú rozdelené).

Operačný diagram dvoch virtuálnych strojov bude v tomto prípade vyzerať takto:

Situácia: virtuálne GPU nie sú vo výkone horšie ako hardvérové ​​riešenia

Výsledky a prognózy

spoločnosť vykonali testy hypervízor trénovaním jazykového modelu založeného na TensorFlow. Výkonové „škody“ boli len 3–4 % v porovnaní s holým kovom. Na oplátku bol systém schopný distribuovať zdroje na požiadanie v závislosti od aktuálneho zaťaženia.

IT gigant tiež vykonali testy s nádobami. Inžinieri spoločnosti vycvičili neurónové siete na rozpoznávanie obrázkov. Zároveň boli zdroje jedného GPU rozdelené medzi štyri kontajnerové VM. V dôsledku toho sa výkon jednotlivých strojov znížil o 17 % (v porovnaní s jedným VM s plným prístupom k prostriedkom GPU). Avšak počet obrázkov spracovaných za sekundu zvýšená tri krát. Očakáva sa, že takéto systémy nájde aplikácie v oblasti analýzy údajov a počítačového modelovania.

Medzi potenciálne problémy, ktorým môže VMware čeliť, patria odborníci prideliť pomerne úzke cieľové publikum. Malý počet spoločností stále pracuje s vysokovýkonnými systémami. Hoci v Statista značkaže do roku 2021 bude 94 % celosvetovej pracovnej záťaže dátových centier virtualizovaných. Autor: predpovede analytikov, hodnota trhu HPC vzrastie v období rokov 32 až 45 z 2017 na 2022 miliárd dolárov.

Situácia: virtuálne GPU nie sú vo výkone horšie ako hardvérové ​​riešenia
/ foto Globálny prístupový bod PD

Podobné riešenia

Na trhu existuje niekoľko analógov, ktoré vyvíjajú veľké IT spoločnosti: AMD a Intel.

Prvá spoločnosť pre virtualizáciu GPU ponúk prístup založený na SR-IOV (single-root input/output virtualization). Táto technológia poskytuje VM prístup k časti hardvérových schopností systému. Riešenie umožňuje zdieľať GPU medzi 16 používateľov s rovnakým výkonom ako virtualizované systémy.

Čo sa týka druhého IT giganta, oni založené na technológii na hypervízore Citrix XenServer 7. Spája prácu štandardného ovládača GPU a virtuálneho stroja, ktorý umožňuje zobrazovať 3D aplikácie a desktopy na zariadeniach stoviek používateľov.

Budúcnosť technológie

Vývojári virtuálnych GPU uzavrieť stávku o implementácii systémov AI a rastúcej obľube vysokovýkonných riešení na trhu podnikových technológií. Dúfajú, že potreba spracovávať veľké množstvo dát zvýši dopyt po vGPU.

Teraz výrobcovia hľadá cestu kombinujte funkčnosť CPU a GPU v jednom jadre, aby ste urýchlili riešenie problémov súvisiacich s grafikou, vykonávanie matematických výpočtov, logických operácií a spracovania dát. Objavenie sa takýchto jadier na trhu v budúcnosti zmení prístup k virtualizácii zdrojov a ich distribúcii medzi pracovné záťaže vo virtuálnych a cloudových prostrediach.

Čo si k téme prečítať v našom firemnom blogu:

Pár príspevkov z nášho telegramového kanála:

Zdroj: hab.com

Pridať komentár