Durum: sanal GPU'lar performans açısından demir çözümlerden daha düşük değildir

Şubat ayında Stanford, yüksek performanslı bilgi işlem (HPC) üzerine bir konferansa ev sahipliği yaptı. VMware temsilcileri, bir GPU ile çalışırken, değiştirilmiş bir ESXi hipervizörünü temel alan bir sistemin, hız açısından çıplak donanım çözümlerinden daha düşük olmadığını söyledi.

Bunu başarmayı mümkün kılan teknolojilerden bahsediyoruz.

Durum: sanal GPU'lar performans açısından demir çözümlerden daha düşük değildir
/ Fotoğraf viktorgrigas CC BY-SA

Performans sorunu

Analistlere göre iş yüklerinin yaklaşık %70'i veri merkezlerinde sanallaştırılmış. Ancak kalan %30'luk kısım hala hipervizörler olmadan çıplak donanımla çalışıyor. Bu %30 çoğunlukla sinir ağlarının eğitimi ve GPU kullanımıyla ilgili olanlar gibi yüksek yüklü uygulamalardan oluşuyor.

Uzmanlar bu eğilimi hipervizörün bir ara soyutlama katmanı olarak tüm sistemin performansını etkileyebileceği gerçeğiyle açıklıyor. Beş yıl önce yapılan çalışmalarda verileri bulabilirsin iş hızının %10 azaltılması hakkında. Bu nedenle şirketlerin ve veri merkezi operatörlerinin HPC iş yüklerini sanal ortama aktarma konusunda aceleleri yok.

Ancak sanallaştırma teknolojileri gelişiyor ve gelişiyor. Bir ay önce düzenlenen bir konferansta VMware, ESXi hipervizörünün GPU performansı üzerinde olumsuz bir etkisinin olmadığını söylemişti. Bilgi işlem hızı, çıplak donanımla karşılaştırılabilecek şekilde yüzde üç oranında azaltılabilir.

Bu nasıl çalışıyor

GPU'lu HPC sistemlerinin performansını artırmak için VMware, hipervizörde bir dizi değişiklik yaptı. Özellikle vMotion işlevinden kurtuldu. Yük dengeleme için gereklidir ve genellikle sanal makineleri (VM'ler) sunucular veya GPU'lar arasında aktarır. vMotion'un devre dışı bırakılması, artık her sanal makineye belirli bir GPU atanmasıyla sonuçlandı. Bu, veri alışverişi sırasında maliyetlerin azaltılmasına yardımcı oldu.

Sistemin bir diğer önemli bileşeni teknoloji mi DirectPath G/Ç. CUDA paralel hesaplama sürücüsünün, hipervizörü atlayarak sanal makinelerle doğrudan etkileşime girmesine olanak tanır. Aynı anda birden fazla VM'yi tek bir GPU üzerinde çalıştırmanız gerektiğinde GRID vGPU çözümü kullanılır. Kartın hafızasını birkaç parçaya böler (ancak hesaplama döngüleri bölünmez).

Bu durumda iki sanal makinenin çalışma şeması şöyle görünecektir:

Durum: sanal GPU'lar performans açısından demir çözümlerden daha düşük değildir

Sonuçlar ve tahminler

şirket yapılan testler dayalı bir dil modeli eğiterek hipervizör TensorFlow. Performans "hasarı" çıplak metalle karşılaştırıldığında yalnızca %3-4 idi. Bunun karşılığında sistem, mevcut yüke bağlı olarak kaynakları talebe göre dağıtabiliyordu.

Bilişim devi aynı zamanda yapılan testler konteynerler ile. Şirketin mühendisleri sinir ağlarını görüntüleri tanıyacak şekilde eğitti. Aynı zamanda bir GPU'nun kaynakları dört konteyner VM'si arasında dağıtıldı. Sonuç olarak, bireysel makinelerin performansı %17 azaldı (GPU kaynaklarına tam erişime sahip tek bir VM'ye kıyasla). Ancak saniyede işlenen görüntü sayısı arttı üç kere. Bu tür sistemlerin olması bekleniyor. bulacak Veri analizi ve bilgisayar modellemede uygulamalar.

Uzmanlar, VMware'in karşılaşabileceği olası sorunlar arasında yalıtılmış oldukça dar bir hedef kitleye sahiptir. Az sayıda firma halen yüksek performanslı sistemlerle çalışmaktadır. Statista'da olmasına rağmen işaret2021 yılına kadar dünyadaki veri merkezi iş yüklerinin %94'ünün sanallaştırılacağı öngörülüyor. İle tahminleri Analistler, HPC pazarının değerinin 32'den 45'ye kadar olan dönemde 2017 milyar dolardan 2022 milyar dolara çıkacağını söylüyor.

Durum: sanal GPU'lar performans açısından demir çözümlerden daha düşük değildir
/ Fotoğraf Küresel Erişim Noktası PD

Benzer çözümler

Piyasada büyük BT şirketleri tarafından geliştirilen birkaç analog var: AMD ve Intel.

GPU sanallaştırma konusunda ilk şirket sunar SR-IOV'ye (tek köklü giriş/çıkış sanallaştırma) dayalı yaklaşım. Bu teknoloji, VM'nin sistemin donanım yeteneklerinin bir kısmına erişmesini sağlar. Çözüm, GPU'yu sanallaştırılmış sistemlerin eşit performansıyla 16 kullanıcı arasında paylaşmanıza olanak tanır.

İkinci bilişim devine gelince, onlar teknoloji tabanlı Citrix XenServer 7 hipervizöründe standart bir GPU sürücüsünün ve sanal makinenin çalışmasını birleştirerek sanal makinenin yüzlerce kullanıcının cihazlarında 3D uygulamaları ve masaüstü bilgisayarları görüntülemesine olanak tanır.

Teknolojinin geleceği

Sanal GPU Geliştiricileri Bahis yapmak AI sistemlerinin uygulanması ve iş teknolojisi pazarında yüksek performanslı çözümlerin artan popülaritesi hakkında. Büyük miktarlarda veri işleme ihtiyacının vGPU'lara olan talebi artıracağını umuyorlar.

Şimdi üreticiler bir yol arıyorum Grafiklerle ilgili sorunları çözmeyi, matematiksel hesaplamaları, mantıksal işlemleri ve veri işlemeyi hızlandırmak için CPU ve GPU'nun işlevselliğini tek bir çekirdekte birleştirir. Gelecekte bu tür çekirdeklerin piyasada ortaya çıkması, kaynak sanallaştırmaya ve bunların sanal ve bulut ortamlarındaki iş yükleri arasındaki dağılımına yönelik yaklaşımı değiştirecektir.

Konuyla ilgili kurumsal blogumuzda neler okunmalı:

Telegram kanalımızdan birkaç gönderi:

Kaynak: habr.com

Yorum ekle