Uważa się, że serwery wirtualne z vGPU są drogie. W krótkiej recenzji postaram się obalić tę tezę.

Przeszukanie sieci natychmiast ujawnia wynajem superkomputerów NVIDIA Tesla V100 lub serwerów z potężnymi dedykowanymi procesorami graficznymi, które są prostsze. Podobne usługi są dostępne na przykład w , lub . Ich miesięczny koszt mierzony jest w dziesiątkach tysięcy rubli, a ja chciałem znaleźć tańsze opcje dla aplikacji OpenCL i/lub CUDA. Na rynku rosyjskim nie ma zbyt wielu niedrogich VPS z kartami wideo, w krótkim artykule porównam ich możliwości obliczeniowe za pomocą testów syntetycznych.
Uczestnicy
Na liście kandydatów do udziału w przeglądzie znalazły się serwery wirtualne dostawców hostingu , , , и . Nie było szczególnych problemów z uzyskaniem dostępu, ponieważ prawie wszyscy dostawcy mają bezpłatny okres próbny. UltraVDS oficjalnie nie ma bezpłatnego okresu próbnego, ale łatwo było dojść do porozumienia: dowiedziawszy się o publikacji, personel wsparcia dodał kwotę potrzebną do zamówienia VPS do mojego konta bonusowego. Na tym etapie maszyny wirtualne VDS4YOU odpadły z wyścigu, ponieważ do bezpłatnego testowania host wymaga zeskanowania dowodu osobistego. Rozumiem, że trzeba zabezpieczyć się przed nadużyciami, ale do weryfikacji zupełnie wystarczą dane paszportowe lub na przykład powiązanie konta w sieci społecznościowej - tego wymaga 1Gb.ru.
Konfiguracje i ceny
Do testów wykorzystaliśmy maszyny średniej klasy, kosztujące mniej niż 10 tys. rubli miesięcznie: 2 rdzenie obliczeniowe, 4 GB pamięci RAM, dysk SSD o pojemności 20–50 GB, vGPU z 256 MB pamięci VRAM i Windows Server 2016. Zanim ocenimy wydajność VDS, przyjrzyjmy się bliżej ich podsystemom graficznym. Stworzone przez użyteczność pozwala uzyskać szczegółowe informacje o rozwiązaniach sprzętowych i programowych stosowanych przez hosterów. Z jego pomocą można zobaczyć na przykład wersję sterownika wideo, ilość dostępnej pamięci wideo, a także dane na temat obsługi OpenCL i CUDA.
1Gb.ru
Chmura GPU
RuVDS
UltraVDS
иртуализация
Hyper-V
OpenStack
Hyper-V
Hyper-V
Rdzenie obliczeniowe
2*2,6 GHz
2*2,8 GHz
2*3,4 GHz
2*2,2 GHz
RAM, GB
4
4
4
4
Przechowywanie, GB
30 (dysk SSD)
50 (dysk SSD)
20 (dysk SSD)
30 (dysk SSD)
vGPU
RemoteFX
NVIDIA GRID
RemoteFX
RemoteFX
Adapter wideo
NVIDIA GeForce GTX Ti 1080
NVIDIA Tesla T4
NVIDIA Quadro P4000
Karta graficzna AMD FirePro W4300
Pamięć vRAM, MB
256
4063
256
256
Wsparcie OpenCL
+
+
+
+
Obsługa CUDA
-
+
-
-
Cena za miesiąc (przy płatności rocznej), RUB.
3494 (3015)
7923,60
1904 (1333)
1930 (1351)
Płatność za zasoby, RUB
nie
CPU = 0,42 rub/godzinę,
RAM = 0,24 rub/godzinę,
SSD = 0,0087 RUB/godzinę,
OS Windows = 1,62 rubla/godzinę,
IPv4 = 0,15 rubli/godzinę,
vGPU (T4/4Gb) = 7 RUR/godzinę.
od 623,28 + 30 za montaż
nie
Okres próbny
Dni 10
7 dni lub więcej po uzgodnieniu
3 dni z rozliczeniem miesięcznym
nie
Spośród rozważanych dostawców tylko GPUcloud korzysta z wirtualizacji OpenStack i technologii NVIDIA GRID. Ze względu na dużą ilość pamięci wideo (dostępne są profile 4, 8 i 16 GB) usługa jest droższa, ale klient będzie mógł uruchamiać aplikacje OpenCL i CUDA. Pozostali konkurenci oferują vGPU z mniejszą ilością pamięci VRAM, utworzone przy użyciu Microsoft RemoteFX. Są one znacznie tańsze, ale obsługują tylko OpenCL.
Test wydajności
GeekBench 5
Dzięki tej popularnej Możesz zmierzyć wydajność grafiki dla aplikacji OpenCL i CUDA. Poniższy wykres pokazuje wynik podsumowania i bardziej szczegółowe dane dla serwerów wirtualnych , Chmura GPU ( и ), и są dostępne na stronie internetowej twórcy benchmarku. Jeśli je otworzysz, znajdziesz interesujący fakt: GeekBench pokazuje wolumeny VRAM, które są znacznie wyższe niż zamówione 256 MB. Prędkość zegara procesorów może być również wyższa niż podana. W środowiskach wirtualnych jest to powszechne zjawisko - wiele zależy od obciążenia fizycznego hosta, na którym działa VPS.

Współdzielone „serwerowe” vGPU są słabsze niż wydajne „desktopowe” karty graficzne, gdy są używane do ciężkich aplikacji graficznych. Takie rozwiązania są przeznaczone głównie do zadań obliczeniowych. Przeprowadzono inne testy syntetyczne, aby ocenić ich skuteczność.
Podstawowa wersja 2.3.1
Aby uzyskać kompleksową analizę możliwości obliczeniowych vGPU nie nadaje się, ale może być używany do porównywania wydajności kart wideo różnych VPS w złożonych obliczeniach przy użyciu OpenCL. Projekt Distributed Computing rozwiązuje wąski problem komputerowego modelowania koagulacji białek. Naukowcy próbują zrozumieć przyczyny patologii związanych z wadliwymi białkami: choroby Alzheimera i Parkinsona, choroba szalonych krów, stwardnienie rozsiane itp. Zmierzona wartość przy użyciu narzędzia, które stworzyli Wydajność obliczeń pojedynczej i podwójnej precyzji pokazano na schemacie. Niestety, narzędzie zwróciło błąd na maszynie wirtualnej UltraVDS.

Poniżej przedstawiam porównanie wyników obliczeń dla metody modelowania niejawnego dhfr.

Sandra 20/20
Pakiet jest świetny do oceny możliwości obliczeniowych wirtualnych kart wideo różnych hosterów. Narzędzie zawiera zestawy ogólnych testów porównawczych obliczeniowych (GPGPU) i obsługuje OpenCL, DirectCompute i CUDA. Na początek dokonano ogólnej oceny różnych vGPU. Diagram pokazuje podsumowanie wyników, bardziej szczegółowe dane dla serwerów wirtualnych , Chmura GPU () I są dostępne na stronie internetowej twórcy testu porównawczego.

Wystąpiły również problemy z „długim” testem Sandra. W przypadku dostawcy VPS GPUcloud nie było możliwe przeprowadzenie ogólnej oceny przy użyciu OpenCL. Po wybraniu odpowiedniej opcji narzędzie nadal działało przez CUDA. Ten test również nie powiódł się w przypadku maszyny UltraVDS: benchmark zamarł na poziomie 86%, próbując określić opóźnienie pamięci.
Ogólny zestaw testów porównawczych nie pokazuje metryk w wystarczającym stopniu szczegółowości ani nie wykonuje obliczeń z wysoką precyzją. Trzeba było wykonać kilka indywidualnych testów, zaczynając od określenia szczytowej wydajności karty graficznej przy użyciu zestawu prostych obliczeń matematycznych z wykorzystaniem OpenCL i (jeśli to możliwe) CUDA. Tutaj również pokazano tylko ogólną metrykę, a szczegółowe wyniki dla VPS z , Chmura GPU ( и ), и dostępne na stronie internetowej.

Aby porównać szybkość kodowania i dekodowania danych, Sandra ma zestaw testów kryptograficznych. Szczegółowe wyniki są dostępne na stronie , Chmura GPU ( и ), и .

Równoległe obliczenia finansowe wymagają adaptera obsługującego obliczenia o podwójnej precyzji. To kolejny ważny obszar zastosowań dla vGPU. Szczegółowe wyniki są dostępne na stronie internetowej , Chmura GPU ( и ), и .

Sandra 20/20 pozwala na przetestowanie możliwości wykorzystania vGPU do precyzyjnych obliczeń naukowych: mnożenia macierzy, szybkiej transformacji Fouriera itp. Szczegółowe wyniki są dostępne na stronie , Chmura GPU ( и ), и .

Na koniec przeprowadzono test możliwości przetwarzania obrazu przez vGPU. Szczegółowe wyniki są dostępne na stronie , Chmura GPU ( и ), и .

odkrycia
Serwer wirtualny GPUcloud wykazał doskonałe wyniki w testach GeekBench 5 i FAHBench, ale nie wybił się ponad ogólny poziom w testach Sandra. Kosztuje znacznie więcej niż konkurenci, ale ma znacznie większą ilość pamięci wideo i obsługuje CUDA. W testach Sandra z wysoką dokładnością obliczeń VPS od 1Gb.ru był na prowadzeniu, ale też nie jest tani i wykazał przeciętne wyniki w innych testach. Wyraźnym outsiderem był UltraVDS: nie wiem, czy jest tu jakieś powiązanie, ale tylko ten dostawca hostingu oferuje klientom karty graficzne AMD. Pod względem ceny/wydajności serwer RuVDS wydał mi się najlepszy. Kosztuje mniej niż 2000 rubli miesięcznie i całkiem dobrze zdał testy. Ostateczna tabela turniejowa wygląda następująco:
Miejsce
Hoster
Wsparcie OpenCL
Obsługa CUDA
Wysoka wydajność według GeekBench 5
Wysoka wydajność według FAHBench
Wysoka wydajność według Sandry 20/20
Niska cena
I
RuVDS
+
-
+
+
+
+
II
1Gb.ru
+
-
+
+
+
+
III
Chmura GPU
+
+
+
+
+
-
IV
UltraVDS
+
-
-
-
-
+
Miałem pewne wątpliwości co do zwycięzcy, ale recenzja jest poświęcona budżetowym VPS z vGPU, a maszyna wirtualna RuVDS kosztuje prawie połowę tego, co jej najbliższy konkurent i ponad cztery razy więcej niż najdroższa oferta z recenzowanych. Drugie i trzecie miejsce również trudno było podzielić, ale i tutaj cena przeważyła nad innymi czynnikami.
W wyniku testów okazało się, że vGPU klasy podstawowej nie są aż tak drogie i można ich już używać do rozwiązywania problemów obliczeniowych. Oczywiście trudno przewidzieć, jak maszyna zachowa się pod rzeczywistym obciążeniem na podstawie testów syntetycznych, a możliwość przydzielania zasobów zależy bezpośrednio od sąsiadów na hoście fizycznym - zrób na to rabat. Jeśli znajdziesz inne budżetowe VPS z vGPU na RuNet, nie wahaj się napisać o nich w komentarzach.
Źródło: www.habr.com
