5.8 milyon IOPS: neden bu kadar çok?

Merhaba Habr! Büyük Veri ve makine öğrenimine yönelik veri kümeleri katlanarak artıyor ve bizim de bunlara ayak uydurmamız gerekiyor. Yüksek performanslı bilgi işlem alanındaki bir başka yenilikçi teknoloji (HPC, Yüksek Performanslı Bilgi İşlem) hakkındaki yazımız, Kingston standında sergilendi. Süper Bilgisayar-2019. Bu, grafik işlem birimleri (GPU) ve GPUDirect Storage veri yolu teknolojisine sahip sunucularda Hi-End veri depolama sistemlerinin (SDS) kullanılmasıdır. Depolama sistemi ile GPU arasındaki, CPU'yu atlayarak doğrudan veri alışverişi sayesinde, verilerin GPU hızlandırıcılara yüklenmesi büyük ölçüde hızlandırılır, böylece Büyük Veri uygulamaları GPU'ların sağladığı maksimum performansta çalışır. Buna karşılık, HPC sistem geliştiricileri, Kingston tarafından üretilenler gibi en yüksek G/Ç hızlarına sahip depolama sistemlerindeki gelişmelerle ilgileniyor.

5.8 milyon IOPS: neden bu kadar çok?

GPU performansı veri yüklemeyi geride bırakıyor

Genel amaçlı uygulamaların geliştirilmesine yönelik GPU tabanlı bir donanım ve yazılım paralel bilgi işlem mimarisi olan CUDA'nın 2007 yılında oluşturulmasından bu yana, GPU'ların donanım yetenekleri inanılmaz derecede arttı. Günümüzde GPU'lar Büyük Veri, makine öğrenimi (ML) ve derin öğrenme (DL) gibi HPC uygulamalarında giderek daha fazla kullanılmaktadır.

Terimlerin benzerliğine rağmen son ikisinin algoritmik olarak farklı görevler olduğunu unutmayın. ML, bilgisayarı yapılandırılmış verilere dayalı olarak eğitirken, DL, bilgisayarı bir sinir ağından gelen geri bildirime dayalı olarak eğitir. Farklılıkları anlamanıza yardımcı olacak bir örnek oldukça basittir. Bilgisayarın, depolama sisteminden yüklenen kedi ve köpek fotoğraflarını birbirinden ayırması gerektiğini varsayalım. ML için, her biri hayvanın belirli bir özelliğini tanımlayan birçok etiket içeren bir dizi görsel göndermelisiniz. DL için çok daha fazla sayıda görsel yüklemek yeterlidir, ancak yalnızca tek bir etiketle "bu bir kedidir" veya "bu bir köpektir". DL, küçük çocuklara nasıl öğretildiğine çok benzer - onlara kitaplarda ve hayattaki köpeklerin ve kedilerin resimleri gösterilir (çoğunlukla, ayrıntılı fark bile açıklanmadan) ve çocuğun beyni, daha sonra hayvanın türünü belirlemeye başlar. karşılaştırma için belirli sayıda kritik resim ( Tahminlere göre, erken çocukluk döneminde yalnızca yüz veya iki gösteriden bahsediyoruz). DL algoritmaları henüz o kadar mükemmel değil: Bir sinir ağının görüntüleri tanımlama konusunda da başarılı bir şekilde çalışması için milyonlarca görüntünün GPU'ya beslenmesi ve işlenmesi gerekiyor.

Önsözün özeti: GPU'lara dayanarak, Büyük Veri, ML ve DL alanında HPC uygulamaları oluşturabilirsiniz, ancak bir sorun var - veri kümeleri o kadar büyük ki, depolama sisteminden GPU'ya veri yüklemek için harcanan zaman uygulamanın genel performansını düşürmeye başlar. Başka bir deyişle, diğer alt sistemlerden gelen yavaş G/Ç verileri nedeniyle hızlı GPU'lar yeterince kullanılmamaktadır. GPU'nun G/Ç hızı ile CPU/depolama sistemine giden veri yolu arasındaki fark çok büyük olabilir.

GPUDirect Depolama teknolojisi nasıl çalışır?

G/Ç işlemi ve daha ileri işlemler için verilerin depolamadan GPU'lara yüklenmesi işlemi CPU tarafından kontrol edilir. Bu, GPU'lar ve NVMe sürücüleri arasında birbirleriyle hızlı bir şekilde iletişim kurmak için doğrudan erişim sağlayacak bir teknoloji talebine yol açtı. NVIDIA bu teknolojiyi sunan ilk şirket oldu ve buna GPUDirect Storage adını verdi. Aslında bu, daha önce geliştirdikleri GPUDirect RDMA (Uzaktan Doğrudan Bellek Adresi) teknolojisinin bir çeşididir.

5.8 milyon IOPS: neden bu kadar çok?
NVIDIA CEO'su Jensen Huang, SC-19'da GPUDirect Storage'ı GPUDirect RDMA'nın bir çeşidi olarak sunacak. Kaynak: NVIDIA

GPUDirect RDMA ve GPUDirect Storage arasındaki fark, adreslemenin aralarında gerçekleştirildiği cihazlardadır. GPUDirect RDMA teknolojisi, verileri doğrudan ön uç ağ arabirim kartı (NIC) ile GPU belleği arasında taşımak üzere yeniden tasarlanmıştır ve GPUDirect Depolama, NVMe veya Yapı Üzerinden NVMe (NVMe-oF) gibi yerel veya uzak depolama birimleri arasında doğrudan bir veri yolu sağlar. GPU belleği.

Hem GPUDirect RDMA hem de GPUDirect Depolama, CPU belleğindeki bir arabellek aracılığıyla gereksiz veri hareketlerini önler ve doğrudan bellek erişimi (DMA) mekanizmasının, verileri ağ kartından veya depolama biriminden doğrudan GPU belleğine veya GPU belleğinden taşımasına olanak tanır; üstelik bunların tümü merkezi CPU üzerinde yük oluşturmaz. GPUDirect Depolama için depolamanın konumu önemli değildir: GPU ünitesi içindeki bir NVME diski, bir rafın içindeki veya NVMe-oF olarak ağ üzerinden bağlanan bir NVME diski olabilir.

5.8 milyon IOPS: neden bu kadar çok?
GPUDirect Storage'ın çalışma şeması. Kaynak: NVIDIA

NVMe'deki Hi-End depolama sistemleri HPC uygulama pazarında talep görüyor

GPUDirect Storage'ın gelişiyle büyük müşterilerin ilgisinin GPU'nun verimine karşılık gelen I/O hızlarına sahip depolama sistemleri sunmaya çekileceğini fark eden Kingston, SC-19 fuarında aşağıdaki bileşenlerden oluşan bir sistemin demosunu gösterdi: NVMe disklerine dayalı bir depolama sistemi ve saniyede binlerce uydu görüntüsünü analiz eden GPU'lu bir ünite. 10 DC1000M U.2 NVMe sürücüsünü temel alan böyle bir depolama sistemi hakkında zaten yazmıştık. süper bilgisayar sergisindeki bir raporda.

5.8 milyon IOPS: neden bu kadar çok?
10 DC1000M U.2 NVMe sürücüsünü temel alan bir depolama sistemi, grafik hızlandırıcılara sahip bir sunucuyu yeterince tamamlar. Kaynak: Kingston

Bu depolama sistemi, 1U veya daha büyük bir raf ünitesi olarak tasarlanmıştır ve her biri 1000-2 TB kapasiteye sahip DC3.84M U.7.68 NVMe sürücülerinin sayısına bağlı olarak ölçeklendirilebilir. DC1000M, Kingston'ın veri merkezi sürücüleri serisindeki U.2 form faktörlü ilk NVMe SSD modelidir. Bir dayanıklılık derecesine (DWPD, Sürücü günlük yazma sayısı) sahiptir ve sürücünün garantili ömrü boyunca verileri günde bir kez tam kapasitesinde yeniden yazmasına olanak tanır.

Linux çekirdeği 3.13-18.04.3-generic olan Ubuntu 5.0.0 LTS işletim sistemi üzerindeki fio v31 testinde sergi depolama örneği, sürdürülebilir bir üretim (Sürdürülebilir Bant Genişliği) ile 5.8 milyon IOPS okuma hızı (Sürekli Okuma) gösterdi ) 23.8 Gbit/sn.

Kingston SSD işletme müdürü Ariel Perez, yeni depolama sistemleri hakkında şunları söyledi: "Geleneksel olarak depolamayla ilişkilendirilen veri aktarımı darboğazlarının çoğunu ortadan kaldırmak için yeni nesil sunucuları U.2 NVMe SSD çözümleriyle donatmaya hazırız. NVMe SSD sürücülerin ve birinci sınıf Sunucu Premier DRAM'imizin birleşimi, Kingston'ı sektörün en kapsamlı uçtan uca veri çözümü sağlayıcılarından biri haline getiriyor."

5.8 milyon IOPS: neden bu kadar çok?
Gfio v3.13 testi, DC23.8M U.1000 NVMe sürücülerindeki demo depolama sistemi için 2 Gbps'lik bir verim gösterdi. Kaynak: Kingston

HPC uygulamalarına yönelik tipik bir sistem, GPUDirect Storage veya benzer teknolojilerin kullanılmasına benzer mi? Bu, bir raf içindeki işlevsel birimlerin fiziksel olarak ayrıldığı bir mimaridir: RAM için bir veya iki birim, GPU ve CPU bilgi işlem düğümleri için birkaç birim ve depolama sistemleri için bir veya daha fazla birim.

GPUDirect Storage'ın duyurulması ve diğer GPU satıcılarının da benzer teknolojilerin ortaya çıkma ihtimaliyle birlikte Kingston'ın yüksek performanslı bilgi işlemde kullanılmak üzere tasarlanmış depolama sistemlerine olan talebi artıyor. İşaretleyici, GPU'lu bir bilgi işlem ünitesinin girişindeki 40 veya 100 Gbit ağ kartlarının verimiyle karşılaştırılabilecek şekilde depolama sisteminden veri okuma hızı olacaktır. Böylece, Fabric aracılığıyla harici NVMe de dahil olmak üzere ultra yüksek hızlı depolama sistemleri, HPC uygulamaları için egzotik olmaktan çıkıp ana akım haline gelecek. Bilimsel ve finansal hesaplamalara ek olarak, Güvenli Şehir metropol düzeyindeki güvenlik sistemleri veya saniyede milyonlarca HD görüntünün tanıma ve tanımlama hızının gerekli olduğu ulaşım gözetim merkezleri gibi diğer birçok pratik alanda da uygulama bulacaklar." en iyi Depolama sisteminin pazar nişi

Kingston ürünleri hakkında daha fazla bilgi şu adreste bulunabilir: resmi sitesi şirketi.

Kaynak: habr.com

Yorum ekle