Vəziyyət: virtual GPU-lar performans baxımından hardware həllərindən geri qalmır

Fevral ayında Stenford yüksək performanslı hesablama (HPC) mövzusunda konfrans keçirdi. VMware nümayəndələri bildiriblər ki, GPU ilə işləyərkən dəyişdirilmiş ESXi hipervizoruna əsaslanan sistem sürət baxımından çılpaq metal həllərdən heç də geri qalmır.

Buna nail olmağı mümkün edən texnologiyalardan danışırıq.

Vəziyyət: virtual GPU-lar performans baxımından hardware həllərindən geri qalmır
/ Şəkil Viktorqriqas CC BY-SA

Performans problemi

Analitiklərin fikrincə, məlumat mərkəzlərində iş yükünün təxminən 70% -i virtuallaşdırılıb. Bununla belə, qalan 30% hələ də hipervizorlar olmadan çılpaq metal üzərində işləyir. Bu 30% əsasən neyron şəbəkələrinin öyrədilməsi və GPU-ların istifadəsi kimi yüksək yüklü proqramlardan ibarətdir.

Mütəxəssislər bu tendensiyanı onunla izah edirlər ki, hipervizor aralıq abstraksiya təbəqəsi kimi bütün sistemin işinə təsir göstərə bilər. Beş il əvvəl tədqiqatlarda məlumatları tapa bilərsiniz iş sürətinin 10% azaldılması haqqında. Buna görə şirkətlər və məlumat mərkəzi operatorları HPC iş yüklərini virtual mühitə köçürməyə tələsmirlər.

Lakin virtualizasiya texnologiyaları inkişaf edir və təkmilləşir. Bir ay əvvəl keçirilən konfransda VMware ESXi hipervizorunun GPU performansına mənfi təsir göstərmədiyini söylədi. Hesablama sürəti üç faiz azaldıla bilər ki, bu da çılpaq metal ilə müqayisə edilə bilər.

Bu necə işləyir

GPU-larla HPC sistemlərinin işini yaxşılaşdırmaq üçün VMware hipervizora bir sıra dəyişikliklər etdi. Xüsusilə, vMotion funksiyasından xilas oldu. O, yük balansı üçün lazımdır və adətən serverlər və ya GPU-lar arasında virtual maşınları (VM) köçürür. vMotion-un söndürülməsi hər bir VM-yə indi xüsusi GPU təyin edilməsi ilə nəticələndi. Bu, məlumat mübadiləsi zamanı xərcləri azaltmağa kömək etdi.

Sistemin başqa bir əsas komponenti texnologiyadır DirectPath I/O. O, CUDA paralel hesablama drayverinə hipervizordan yan keçməklə birbaşa virtual maşınlarla qarşılıqlı əlaqə yaratmağa imkan verir. Bir GPU-da bir neçə VM-ni eyni anda işə salmaq lazım olduqda, GRID vGPU həlli istifadə olunur. O, kartın yaddaşını bir neçə seqmentə bölür (lakin hesablama dövrləri bölünmür).

Bu vəziyyətdə iki virtual maşının işləmə diaqramı belə görünəcək:

Vəziyyət: virtual GPU-lar performans baxımından hardware həllərindən geri qalmır

Nəticələr və proqnozlar

şirkət sınaqlar keçirmişdir əsaslanan dil modelini öyrətməklə hipervizor TensorFlow. Performans "zərər" çılpaq metal ilə müqayisədə yalnız 3-4% idi. Bunun müqabilində sistem cari yükdən asılı olaraq resursları tələbata uyğun bölüşdürə bildi.

İT nəhəngi də sınaqlar keçirmişdir qablarla. Şirkətin mühəndisləri şəkilləri tanımaq üçün neyron şəbəkələri öyrədiblər. Eyni zamanda, bir GPU-nun resursları dörd konteyner VM arasında bölüşdürüldü. Nəticədə ayrı-ayrı maşınların performansı 17% azalıb (GPU resurslarına tam çıxışı olan tək VM ilə müqayisədə). Ancaq saniyədə işlənən şəkillərin sayı artıb üç dəfə. Belə sistemlərin olması gözlənilir tapacaq məlumatların təhlili və kompüter modelləşdirməsində tətbiqlər.

VMware-nin qarşılaşa biləcəyi potensial problemlər arasında mütəxəssislər yaymaq kifayət qədər dar hədəf auditoriyası. Az sayda şirkət hələ də yüksək məhsuldar sistemlərlə işləyir. Statistada olsa da qeyd etmək2021-ci ilə qədər dünya data mərkəzi iş yüklərinin 94%-nin virtuallaşdırılacağını bildirib. By proqnozlar Analitiklərin fikrincə, HPC bazarının dəyəri 32-45-ci illərdə 2017 milyard dollardan 2022 milyard dollara qədər artacaq.

Vəziyyət: virtual GPU-lar performans baxımından hardware həllərindən geri qalmır
/ Şəkil Qlobal giriş nöqtəsi PD

Oxşar Həllər

Bazarda böyük İT şirkətləri tərəfindən hazırlanmış bir neçə analoq var: AMD və Intel.

GPU virtualizasiyası üçün ilk şirkət təklif SR-IOV (bir köklü giriş/çıxış virtualizasiyası) əsasında yanaşma. Bu texnologiya VM-yə sistemin aparat imkanlarının bir hissəsinə giriş imkanı verir. Həll virtuallaşdırılmış sistemlərin bərabər performansı ilə 16 istifadəçi arasında GPU-nu paylaşmağa imkan verir.

İkinci İT nəhənginə gəlincə, onlar texnologiyaya əsaslanır Citrix XenServer 7 hipervizorunda.O, standart GPU drayverinin və virtual maşının işini özündə birləşdirir ki, bu da sonuncuya yüzlərlə istifadəçinin cihazlarında 3D proqramları və masaüstlərini göstərməyə imkan verir.

Texnologiyanın gələcəyi

Virtual GPU Tərtibatçıları mərc edin AI sistemlərinin tətbiqi və biznes texnologiyaları bazarında yüksək məhsuldar həllərin artan populyarlığı haqqında. Onlar ümid edirlər ki, böyük həcmdə məlumatların işlənməsi ehtiyacı vGPU-lara tələbatı artıracaq.

İndi istehsalçılar yol axtarır qrafika ilə bağlı problemlərin həllini sürətləndirmək, riyazi hesablamalar, məntiqi əməliyyatlar və məlumatların işlənməsini sürətləndirmək üçün CPU və GPU-nun funksionallığını bir nüvədə birləşdirin. Gələcəkdə bu cür nüvələrin bazarda görünməsi resursun virtuallaşdırılmasına yanaşmanı və onların virtual və bulud mühitlərində iş yükləri arasında bölüşdürülməsini dəyişəcək.

Korporativ bloqumuzda mövzu ilə bağlı nə oxumaq lazımdır:

Telegram kanalımızdan bir neçə yazı:

Mənbə: www.habr.com

Добавить комментарий