Сітуацыя: віртуальныя GPU не саступаюць па прадукцыйнасці жалезным рашэнням

У лютым у Стэнфардзе прайшла канферэнцыя, прысвечаная высокапрадукцыйным вылічэнням (HPC). Прадстаўнікі VMware распавялі, што пры працы з GPU сістэма на базе мадыфікаванага гіпервізара ESXi па хуткасці не саступае bare metal рашэнням.

Расказваем аб тэхналогіях, якія дазволілі гэтага дабіцца.

Сітуацыя: віртуальныя GPU не саступаюць па прадукцыйнасці жалезным рашэнням
/ фота Victorgrigas CC BY-SA

Праблема прадукцыйнасці

Паводле ацэнак аналітыкаў, каля 70% працоўных нагрузак у дата-цэнтрах віртуалізаваны. Аднак пакінутыя 30% па-ранейшаму працуюць на bare metal без гіпервізораў. Гэтыя 30% па большай частцы складаюцца з высоканагружаных прыкладанняў, злучаных, напрыклад, з навучаннем нейронавых сетак, і выкарыстоўвалых графічныя працэсары.

Падобны трэнд эксперты тлумачаць тым, што гіпервізар як прамежкавы пласт абстракцыі можа ўплываць на прадукцыйнасць усёй сістэмы. У даследаваннях пяцігадовай даўнасці можна знайсці дадзеныя аб зніжэнні хуткасці працы на 10%. Таму кампаніі і аператары дата-цэнтраў не спяшаюцца пераводзіць HPC-нагрузку ў віртуальнае асяроддзе.

Але тэхналогіі віртуалізацыі развіваюцца і ўдасканальваюцца. На канферэнцыі месяц таму ў VMware распавялі, што гіпервізор ESXi не аказвае негатыўнага ўплыву на прадукцыйнасць GPU. Хуткасць вылічэнняў можа знізіцца на тры працэнты, а гэта параўнальна з паказчыкамі bare metal.

Як гэта працуе

Каб падвысіць прадукцыйнасць HPC-сістэм з графічнымі працэсарамі, VMware занеслі ў працу гіпервізара шэраг змен. У прыватнасьці, яго пазбавілі ад функцыі vMotion. Яна патрэбна для балансавання нагрузкі і звычайна пераносіць віртуальныя машыны (ВМ) паміж серверамі ці GPU. Адключэнне vMotion прывяло да таго, што за кожнай ВМ зараз замацаваны пэўны графічны працэсар. Гэта дапамагло скараціць выдаткі пры абмене дадзенымі.

Іншым ключавым кампанентам сістэмы з'яўляецца тэхналогія DirectPath I/O. Яна дазваляе драйверу CUDA для паралельных вылічэнняў ўзаемадзейнічаць з віртуальнымі машынамі напрамую, абыходзячы гіпервізор. Калі на адным GPU патрабуецца запусціць адразу некалькі ВМ, тое задзейнічаецца рашэнне GRID vGPU. Яно падзяляе памяць карты на некалькі сегментаў (але вылічальныя цыклы пры гэтым не дзеляцца).

Схема працы дзвюх віртуальных машын у гэтым выпадку будзе выглядаць наступным чынам:

Сітуацыя: віртуальныя GPU не саступаюць па прадукцыйнасці жалезным рашэнням

Вынікі і прагнозы

кампанія правяла тэсты гіпервізара, навучыўшы моўную мадэль на базе TensorFlow. "Шкода" прадукцыйнасці склаў усяго 3-4%, у параўнанні з bare metal. Пры гэтым наўзамен сістэма атрымала магчымасць размяркоўваць рэсурсы па патрабаванні ў залежнасці ад бягучых нагрузак.

ІТ-гігант таксама праводзіў тэсты з кантэйнерамі. Інжынеры кампаніі навучалі нейронавыя сеткі распазнаваць выявы. Пры гэтым рэсурсы аднаго графічнага працэсара размеркавалі паміж чатырма кантэйнернымі ВМ. У выніку прадукцыйнасць асобных машын знізілася на 17% (у параўнанні з адной ВМ, якая мае поўны доступ да рэсурсаў GPU). Аднак колькасць апрацоўваных малюнкаў за секунду узрасло у тры разы. Чакаецца, што падобныя сістэмы знойдуць прымяненне ў галіне аналізу даных і камп'ютарнага мадэлявання.

Сярод патэнцыйных праблем, з якімі можа сутыкнуцца VMware, эксперты. вылучаюць даволі вузкую мэтавую аўдыторыю. З высокапрадукцыйнымі сістэмамі пакуль працуе невялікі лік кампаній. Хаця ў Statista адзначаюць, Што да 2021 віртуалізаваны будуць ужо 94% працоўных нагрузак сусветных ЦАД. Па прагнозам аналітыкаў, кошт HPC-рынку вырасце з 32 да 45 млрд даляраў у перыяд з 2017 па 2022 год.

Сітуацыя: віртуальныя GPU не саступаюць па прадукцыйнасці жалезным рашэнням
/ фота Global Access Point PD

Падобныя рашэнні

На рынку ёсць некалькі аналагаў, якія распрацоўваюць буйныя ІТ-кампаніі: AMD і Intel.

Першая кампанія для віртуалізацыі графічных працэсараў прапануе падыход на аснове SR-IOV (single-root input/output virtualization). Гэтая тэхналогія дае ВМ доступ да часткі апаратных магчымасцяў сістэмы. Рашэнне дазваляе падзяліць графічны працэсар паміж 16 карыстальнікамі пры роўнай прадукцыйнасці віртуалізаваных сістэм.

Што тычыцца другога ІТ-гіганта, то іх тэхналогія засноўваецца на гіпервізоры Citrix XenServer 7. Яна аб'ядноўвае працу стандартнага GPU-драйвера і віртуальнай машыны, што дазваляе апошняй адлюстроўваць 3D-прыкладанні і дэсктопы на прыладах сотняў карыстачоў.

Будучыня тэхналогіі

Распрацоўнікі віртуальных графічных працэсараў робяць стаўку на ўкараненне сістэм ІІ і рост папулярнасці высокапрадукцыйных рашэнняў на рынку бізнес-тэхналогій. Яны спадзяюцца, што запатрабаванне ў апрацоўцы вялікіх аб'ёмаў дадзеных падвысіць попыт на vGPU.

Цяпер вытворцы шукаюць спосаб сумясціць функцыянальнасць CPU і GPU у адным ядры, каб паскорыць рашэнне задач, звязаных з графікай, выкананне матэматычных вылічэнняў, лагічных аперацый, апрацоўку дадзеных. З'яўленне на рынку такіх ядраў у будучыні зменіць падыход да віртуалізацыі рэсурсаў і іх размеркавання паміж працоўнымі нагрузкамі ў віртуальным і хмарным асяроддзі.

Што пачытаць па тэме ў нашым карпаратыўным блогу:

Пара пастоў з нашага Telegram-канала:

Крыніца: habr.com

Дадаць каментар