Ситуация: виртуалните графични процесори не отстъпват по производителност на хардуерните решения

През февруари Станфорд беше домакин на конференция за високопроизводителни изчисления (HPC). Представители на VMware казаха, че при работа с графичен процесор, система, базирана на модифициран хипервизор ESXi, не отстъпва по скорост на голите метални решения.

Говорим за технологиите, които направиха възможно постигането на това.

Ситуация: виртуалните графични процесори не отстъпват по производителност на хардуерните решения
/ снимка Викторгригас CC BY-SA

Проблем с производителността

Според анализаторите около 70% от натоварванията в центровете за данни виртуализиран. Въпреки това, останалите 30% все още работят на гол метал без хипервайзори. Тези 30% се състоят предимно от приложения с голямо натоварване, като тези, свързани с обучение на невронни мрежи и използване на графични процесори.

Експертите обясняват тази тенденция с факта, че хипервайзорът, като междинен абстракционен слой, може да повлияе на производителността на цялата система. В проучвания преди пет години можете да намерите данните за намаляване на скоростта на работа с 10%. Поради това компаниите и операторите на центрове за данни не бързат да прехвърлят работните натоварвания на HPC във виртуална среда.

Но технологиите за виртуализация се развиват и подобряват. На конференция преди месец VMware каза, че хипервайзорът ESXi няма отрицателно въздействие върху производителността на GPU. Компютърната скорост може да бъде намалена с три процента, което е сравнимо с гол метал.

Как работи

За да подобри производителността на HPC системите с GPU, VMware направи редица промени в хипервайзора. По-специално, беше премахната функцията vMotion. Той е необходим за балансиране на натоварването и обикновено прехвърля виртуални машини (VM) между сървъри или GPU. Деактивирането на vMotion доведе до присвояване на конкретен GPU на всяка виртуална машина. Това помогна за намаляване на разходите при обмен на данни.

Друг ключов компонент на системата е технология DirectPath I/O. Той позволява на драйвера за паралелни изчисления CUDA да взаимодейства директно с виртуални машини, заобикаляйки хипервайзора. Когато трябва да стартирате няколко виртуални машини на един графичен процесор наведнъж, се използва решението GRID vGPU. Той разделя паметта на картата на няколко сегмента (но изчислителните цикли не са разделени).

Диаграмата на работа на две виртуални машини в този случай ще изглежда така:

Ситуация: виртуалните графични процесори не отстъпват по производителност на хардуерните решения

Резултати и прогнози

компания проведени тестове хипервизор чрез обучение на езиков модел, базиран на TensorFlow. „Щетите“ на производителността бяха само 3–4% в сравнение с чист метал. В замяна системата успя да разпредели ресурси при поискване в зависимост от текущото натоварване.

ИТ гигантът също проведени тестове с контейнери. Инженерите на компанията обучиха невронни мрежи да разпознават изображения. В същото време ресурсите на един GPU бяха разпределени между четири контейнерни виртуални машини. В резултат на това производителността на отделните машини намаля със 17% (в сравнение с една виртуална машина с пълен достъп до ресурсите на GPU). Броят на изображенията, обработени в секунда обаче увеличена три пъти. Очаква се такива системи ще намеря приложения при анализ на данни и компютърно моделиране.

Сред потенциалните проблеми, с които VMware може да се сблъска, експертите разпределя доста тясна целева аудитория. Малък брой компании все още работят с високопроизводителни системи. Въпреки че в Statista маркаче до 2021 г. 94% от работните натоварвания на центровете за данни в света ще бъдат виртуализирани. от прогнози анализаторите, стойността на HPC пазара ще нарасне от 32 на 45 милиарда долара в периода от 2017 до 2022 г.

Ситуация: виртуалните графични процесори не отстъпват по производителност на хардуерните решения
/ снимка Глобална точка за достъп PD

Подобни решения

На пазара има няколко аналози, които са разработени от големи IT компании: AMD и Intel.

Първата компания за GPU виртуализация оферти подход, базиран на SR-IOV (еднокоренна входно-изходна виртуализация). Тази технология дава на VM достъп до част от хардуерните възможности на системата. Решението ви позволява да споделяте GPU между 16 потребители с еднаква производителност на виртуализирани системи.

Що се отнася до втория IT гигант, те технологично базирани на хипервайзора Citrix XenServer 7. Той съчетава работата на стандартен GPU драйвер и виртуална машина, което позволява на последната да показва 3D приложения и настолни компютри на устройствата на стотици потребители.

Бъдещето на технологиите

Разработчици на виртуални GPU направи залог относно внедряването на AI системи и нарастващата популярност на високопроизводителни решения на пазара на бизнес технологии. Те се надяват, че необходимостта от обработка на големи количества данни ще увеличи търсенето на vGPU.

Сега производители търси начин комбинирайте функционалността на CPU и GPU в едно ядро, за да ускорите решаването на проблеми, свързани с графики, извършване на математически изчисления, логически операции и обработка на данни. Появата на такива ядра на пазара в бъдеще ще промени подхода към виртуализацията на ресурсите и разпределението им между натоварванията във виртуална и облачна среда.

Какво да прочетете по темата в нашия корпоративен блог:

Няколко публикации от нашия канал в Telegram:

Източник: www.habr.com

Добавяне на нов коментар