Intel Xeon, bir sinir ağını eğitirken sekiz Tesla V100'den birkaç kez daha iyi performans gösterdi

Merkezi işlemci, derin öğrenme sinir ağlarında aynı anda sekiz grafik işlemcinin birleşiminden performans açısından birkaç kat daha hızlıydı. Bilim kurgudan çıkmış bir şeye benziyor değil mi? Ancak Rice Üniversitesi'nden araştırmacılar Intel Xeon'u kullanarak bunun mümkün olduğunu kanıtladılar.

Intel Xeon, bir sinir ağını eğitirken sekiz Tesla V100'den birkaç kez daha iyi performans gösterdi

GPU'lar, derin öğrenme sinir ağları için CPU'lardan her zaman çok daha uygun olmuştur. Bunun nedeni, birçok küçük görevi paralel olarak gerçekleştirebilen çok sayıda küçük çekirdekten oluşan GPU'ların mimarisidir; bu, sinir ağlarının eğitimi için tam olarak gerekli olan şeydir. Ancak merkezi işlemcilerin doğru yaklaşımla derin öğrenmede oldukça etkili olabileceği ortaya çıktı.

SLIDE derin öğrenme algoritması kullanıldığında, 44 çekirdekli bir Intel Xeon işlemcinin, sekiz NVIDIA Tesla V3,5 bilgi işlem hızlandırıcısının birleşiminden 100 kat daha verimli olduğu bildiriliyor. Bu, belki de CPU'nun böyle bir senaryoda GPU'yu yakalamakla kalmayıp aynı zamanda onları da çok belirgin şekilde geride bıraktığı ilk seferdir.

Üniversite tarafından yayınlanan bir basın bülteninde, SLIDE algoritmasının tamamen farklı bir yaklaşım kullandığı için GPU'lara ihtiyaç duymadığı belirtiliyor. Tipik olarak, sinir ağlarını eğitirken, GPU için ideal bir yük olan matris çarpımını kullanan eğitim hatası geri yayılım tekniği kullanılır. SLIDE ise öğrenmeyi karma tablolar kullanılarak çözülen bir arama problemine dönüştürür.


Intel Xeon, bir sinir ağını eğitirken sekiz Tesla V100'den birkaç kez daha iyi performans gösterdi

Araştırmacılara göre bu, sinir ağlarının eğitiminin hesaplama maliyetini önemli ölçüde azaltıyor. Bir temel elde etmek için araştırmacılar, Google'ın TensorFlow kütüphanesini kullanarak bir sinir ağını eğitmek için Rice Üniversitesi laboratuvarının sekiz Tesla V100 hızlandırıcılı mevcut sistemini kullandılar. İşlem 3,5 saat sürdü. Daha sonra benzer bir sinir ağı, 44 çekirdekli tek Xeon işlemcili bir sistem üzerinde SLIDE algoritması kullanılarak eğitildi ve bu işlem yalnızca 1 saat sürdü.

Burada Intel'in şu anda ürün gamında 44 çekirdekli işlemci modellerinin bulunmadığını belirtmekte fayda var. Araştırmacıların bir tür özel veya yayınlanmamış çip kullanmış olması mümkündür, ancak bu pek olası değildir. Burada iki adet 22 çekirdekli Intel Xeon'lu bir sistemin kullanılmış olması veya basın bülteninde sadece bir hata olması çok daha olasıdır ve 44 çekirdekli bir işlemci tarafından sağlanan 22 iş parçacığından bahsediyoruz. Ancak her durumda, bu başarının kendisinden bir şey eksiltmez.

Tabii ki, SLIDE algoritmasının hala birçok testten geçmesi ve etkinliğini ve ayrıca herhangi bir tuhaflık ve tuzak olmadığını kanıtlaması gerekiyor. Ancak şu anda gördüğümüz şey oldukça etkileyici ve sektörün gelişimi üzerinde gerçekten büyük bir etkiye sahip olabilir.



Kaynak: 3dnews.ru

Yorum ekle