Лічыцца, што віртуальныя серверы з vGPU каштуюць дорага. У невялікім аглядзе я паспрабую абвергнуць гэтую тэзу.

Пошук у сетцы адразу выдае арэнду суперкампутараў на NVIDIA Tesla V100 або сервераў з магутнымі вылучанымі GPU прасцей. Падобныя паслугі ёсць, напрыклад, у , або . Іх месячны кошт вымяраецца дзясяткамі тысяч рублёў, а мне жадалася знайсці таннейшыя варыянты для прыкладанняў OpenCL і/ці CUDA. Бюджэтных VPS з відэаадптарамі на расійскім рынку не так шмат, у невялікім артыкуле я параўнаю іх вылічальныя магчымасці з дапамогай сінтэтычных тэстаў.
Удзельнікі
У спіс кандыдатаў на ўдзел у аглядзе патрапілі віртуальныя серверы хосцераў , , , и . З атрыманнем доступу асаблівых праблем не ўзнікла, паколькі амаль ва ўсіх правайдэраў ёсць бясплатны тэставы перыяд. У UltraVDS бясплатнага тэсту афіцыйна няма, але дамовіцца аказалася нескладана: даведаўшыся аб публікацыі, супрацоўнікі падтрымкі накінулі мне патрэбную для замовы VPS суму на бонусны рахунак. На гэтым этапе з дыстанцыі сышлі віртуальныя машыны VDS4YOU, таму што для бясплатнага тэставання хостэр патрабуе падаць скан пасведчанні асобы. Разумею, што ад злоўжыванняў трэба абараняцца, але для праверкі цалкам дастаткова рэквізітаў пашпарта ці, напрыклад, прывязкі акаўнта ў сацыяльнай сетцы - яе патрабуе 1Gb.ru.
Канфігурацыі і кошты
Для тэставання былі ўзяты машыны сярэдняга ўзроўню, коштам менш за 10 тысяч рублёў у месяц: 2 вылічальных ядра, 4 ГБ аператыўнай памяці, SSD на 20 – 50 ГБ, vGPU з 256 МБ VRAM і Windows Server 2016. Перад ацэнкай прадукцыйнасці VDS паглядзім на іх графічныя падсістэмы ўзброеным поглядам. Створаная кампаніяй ўтыліта дазваляе атрымаць падрабязную інфармацыю аб выкарыстоўваных хостэрамі апаратных і праграмных рашэннях. З яе дапамогай можна ўбачыць, напрыклад, версію відэадрайвера, аб'ём даступнай відэапамяці, а таксама дадзеныя аб падтрымцы OpenCL і CUDA.
1Gb.ru
GPUcloud
RuVDS
UltraVDS
віртуалізацыя
Hyper-V,
OpenStack
Hyper-V,
Hyper-V,
Вылічальных ядраў
2*2,6 Ггц
2*2,8 Ггц
2*3,4 Ггц
2*2,2 Ггц
RAM, ГБ
4
4
4
4
Назапашвальнік, ГБ
30 (SSD)
50 (SSD)
20 (SSD)
30 (SSD)
vGPU
RemoteFX
NVIDIA GRID
RemoteFX
RemoteFX
відэаадптар
NVIDIA GeForce GTX Ti 1080
NVIDIA Tesla T4
NVIDIA Quadro P4000
AMD FirePro W4300
vRAM, МБ
256
4063
256
256
Падтрымка OpenCL
+
+
+
+
Падтрымка CUDA
-
+
-
-
Кошт у месяц (пры аплаце за год), руб.
3494 (3015)
7923,60
1904 (1333)
1930 (1351)
Аплата за рэсурсы, руб
няма
CPU = 0,42 руб / гадзіну,
RAM = 0,24 руб / гадзіну,
SSD = 0,0087 руб/гадзіна,
OS Windows = 1,62 руб/гадзіна,
IPv4 = 0,15 руб/гадзіна,
vGPU (T4/4Gb) = 7 руб/гадзіна.
ад 623,28 + 30 за інсталяцыю
няма
Тэставы перыяд
10 дзён
7 дзён ці больш па дамоўленасці
3 дні пры памесячнай тарыфікацыі
няма
З разгледжаных правайдэраў толькі GPUcloud выкарыстоўвае віртуалізацыю OpenStack і тэхналогію NVIDIA GRID. З-за вялікага аб'ёму відэапамяці (даступныя профілі на 4, 8 і 16 ГБ) паслуга каштуе даражэй, але ў кліента будуць працаваць прыкладанні OpenCL і CUDA. Астатнія прэтэндэнты прапануюць vGPU і з меншым аб'ёмам VRAM, створаныя з выкарыстаннем Microsoft RemoteFX. Каштуюць яны значна танней, але падтрымліваюць толькі OpenCL.
Тэставанне прадукцыйнасці
Geek Bench 5
З дапамогай гэтай папулярнай можна вымераць прадукцыйнасць графічнай падсістэмы для прыкладанняў OpenCL і CUDA. На прыведзенай ніжэй дыяграме паказаны зводны вынік, а больш падрабязныя дадзеныя для віртуальных сервераў , GPUcloud ( и ), и даступныя на сайце распрацоўніка бенчмарку. Калі іх адкрыць, выявіцца цікавы факт: GeekBench паказвае аб'ёмы VRAM, нашмат якія перавышаюць заказаныя 256 МБ. Тактавая частата цэнтральных працэсараў таксама можа быць больш заяўленай. У віртуальных асяроддзях гэта звычайная з'ява - шматлікае залежыць ад загружанасці фізічнага хаста, на якім працуе VPS.

Якія падзяляюцца "серверныя" vGPU слабей прадукцыйных "настольных" відэаадптараў, калі выкарыстоўваць іх для цяжкавагавых графічных прыкладанняў. Такія рашэнні прызначаны ў асноўным для вылічальных задач. Для адзнакі іх эфектыўнасці былі праведзены іншыя сінтэтычныя тэсты.
FAHBench 2.3.1
Для ўсебаковага аналізу вылічальных магчымасцяў vGPU не падыходзіць, але з яго дапамогай можна параўнаць прадукцыйнасць відэаадптараў розных VPS у складаных разліках з выкарыстаннем OpenCL. Праект размеркаваных вылічэнняў вырашае вузкую задачу кампутарнага мадэлявання згортвання бялковых малекул. Даследнікі спрабуюць зразумець прычыны ўзнікнення звязаных з дэфектнымі вавёркамі паталогій: хвароб Альцгеймера і Паркінсана, каровінага шаленства, безуважлівага склерозу і г.д. Вымераная з дапамогай створанай імі ўтыліты прадукцыйнасць вылічэнняў з адзінарнай і падвойнай дакладнасцю паказана на дыяграме. Нажаль на віртуальнай машыне UltraVDS утыліта выдала памылку.

Далей прывяду параўнанне вынікаў вылічэнняў для метаду мадэлявання dhfr-implicit.

SiSoftware Sandra 20/20
Пакет выдатна падыходзіць для ацэнкі вылічальных магчымасцяў віртуальных відэаадптараў розных хосцераў. Утыліта змяшчае наборы эталонных вылічальных тэстаў агульнага прызначэння (GPGPU) і падтрымлівае OpenCL, DirectCompute і CUDA. Для пачатку была зроблена агульная ацэнка розных vGPU. Дыяграма паказвае зводны вынік, больш падрабязныя дадзеныя для віртуальных сервераў , GPUcloud () і даступныя на сайце распрацоўніка бенчмарку.

З доўгім тэстам Sandra таксама былі праблемы. Для VPS правайдэра GPUcloud не атрымалася правесці агульную адзнаку з выкарыстаннем OpenCL. Пры выбары адпаведнай опцыі ўтыліта ўсё роўна працавала праз CUDA. Не мінуў гэты тэст і для машыны UltraVDS: бенчмарк замёр на 86%, спрабуючы вызначыць латэнтнасць памяці.
У агульным пакеце тэстаў нельга ўбачыць паказчыкі з дастатковай ступенню дэталізацыі або прарабіць вылічэнні з высокай дакладнасцю. Прыйшлося правесці некалькі асобных выпрабаванняў, пачынальна з вызначэння пікавай прадукцыйнасці відэаадптара з дапамогай набору простых матэматычных разлікаў з выкарыстаннем OpenCL і (калі гэта магчыма) CUDA. Тут таксама адлюстраваны толькі агульны паказчык, а дэталізаваныя вынікі для VPS ад , GPUcloud ( и ), и даступныя на сайце.

Для параўнання хуткасці кадавання і дэкадаванні дадзеных у Sandra ёсць набор крыптаграфічных тэстаў. На сайце даступныя падрабязныя вынікі для , GPUcloud ( и ), и .

Паралельныя фінансавыя разлікі патрабуюць які падтрымлівае вылічэнні з падвойнай дакладнасцю адаптара. Гэта яшчэ адна важная сфера прымянення vGPU. На сайце даступныя падрабязныя вынікі для , GPUcloud ( и ), и .

Sandra 20/20 дазваляе пратэставаць магчымасці выкарыстання vGPU для навуковых разлікаў з высокай дакладнасцю: множання матрыц, хуткага пераўтварэння Фур'е і г.д. На сайце даступныя падрабязныя вынікі для , GPUcloud ( и ), и .

Напрыканцы быў праведзены тэст магчымасцяў vGPU па апрацоўцы выяваў. На сайце даступныя падрабязныя вынікі для , GPUcloud ( и ), и .

Высновы
Віртуальны сервер GPUcloud паказаў выдатныя вынікі ў тэстах GeekBench 5 і FAHBench, але ў эталонных тэстах Sandra вышэй агульнага ўзроўню не падняўся. Каштуе ён нашмат даражэй паслуг канкурэнтаў, аднак мае значна большы аб'ём відэапамяці і падтрымлівае CUDA. У тэстах Sandra з высокай дакладнасцю вылічэнняў лідзіраваў VPS ад 1Gb.ru, але ён таксама не з танных і ў іншых выпрабаваннях выявіў сябе сярэдне. Відавочным аўтсайдэрам апынуўся UltraVDS: не ведаю ці ёсць тут сувязь, але толькі гэты хостэр прапануе кліентам відэакарты AMD. Па суадносінах кошт/прадукцыйнасць лепшым мне здаўся сервер RuVDS. Каштуе ён менш за 2000 рублёў у месяц, пры гэтым выпрабаванні прайшоў цалкам годна. Выніковая турнірная табліца выглядае наступным чынам:
Месца
Хостэр
Падтрымка OpenCL
Падтрымка CUDA
Высокая прадукцыйнасць па GeekBench 5
Высокая прадукцыйнасць па FAHBench
Высокая прадукцыйнасць па Sandra 20/20
нізкая цана
I
RuVDS
+
-
+
+
+
+
II
1Gb.ru
+
-
+
+
+
+
III
GPUcloud
+
+
+
+
+
-
IV
UltraVDS
+
-
-
-
-
+
У мяне былі пэўныя сумневы з нагоды пераможцы, але агляд прысвечаны бюджэтным VPS з vGPU, а віртуальная машына RuVDS каштуе амаль удвая танней бліжэйшага канкурэнта і больш чым у чатыры разы – самай дарагой прапановы з разгледжаных. Другое і трэцяе месца таксама было няпроста падзяліць, але і тут кошт пераважыла іншыя фактары.
У выніку тэсціравання высветлілася, што vGPU пачатковага ўзроўню каштуюць не так дорага і карыстацца імі для вырашэння вылічальных задач ужо можна. Вядома па сінтэтычных тэстах складана прадказаць, як павядзе сябе машына пад рэальнай нагрузкай, да таго ж ад суседзяў па фізічным хасце напрамую залежыць магчымасць выдзялення рэсурсаў - рабіце на гэта зніжку. Калі ж вы знойдзеце на прасторах рунэту іншыя бюджэтныя VPS з vGPU, не палічыце за працу напісаць пра іх у каментарах.
Крыніца: habr.com
