Intel Xeon beberapa kali mengungguli delapan Tesla V100 saat melatih jaringan saraf

Prosesor pusat memiliki kinerja beberapa kali lebih cepat dibandingkan kombinasi delapan prosesor grafis sekaligus saat mempelajari jaringan saraf secara mendalam. Kedengarannya seperti sesuatu yang keluar dari fiksi ilmiah, bukan? Namun para peneliti dari Rice University, yang menggunakan Intel Xeon, telah membuktikan bahwa hal tersebut mungkin terjadi.

Intel Xeon beberapa kali mengungguli delapan Tesla V100 saat melatih jaringan saraf

GPU selalu lebih cocok untuk jaringan saraf pembelajaran mendalam daripada CPU. Hal ini disebabkan oleh arsitektur GPU, yang terdiri dari banyak inti kecil yang mampu melakukan banyak tugas kecil secara paralel, dan hal ini diperlukan untuk melatih jaringan saraf. Namun ternyata prosesor sentral, dengan pendekatan yang tepat, bisa sangat efektif dalam pembelajaran mendalam.

Dilaporkan bahwa ketika menggunakan algoritma pembelajaran mendalam SLIDE, prosesor Intel Xeon dengan 44 inti 3,5 kali lebih produktif dibandingkan kombinasi delapan akselerator komputasi NVIDIA Tesla V100. Ini mungkin pertama kalinya CPU tidak hanya mampu menyamai GPU dalam skenario seperti itu, namun juga mengunggulinya, dan dengan sangat nyata.

Siaran pers yang dikeluarkan oleh universitas menyatakan bahwa algoritma SLIDE tidak memerlukan GPU karena menggunakan pendekatan yang sama sekali berbeda. Biasanya, saat melatih jaringan saraf, teknik backpropagation digunakan, yang menggunakan perkalian matriks, yang merupakan beban kerja ideal untuk GPU. SLIDE, di sisi lain, mengubah pembelajaran menjadi masalah pencarian yang diselesaikan menggunakan tabel hash.


Intel Xeon beberapa kali mengungguli delapan Tesla V100 saat melatih jaringan saraf

Menurut para peneliti, hal ini secara signifikan mengurangi biaya komputasi untuk melatih jaringan saraf. Untuk mendapatkan dasar, para peneliti menggunakan sistem yang ada di laboratorium Rice University dengan delapan akselerator Tesla V100 untuk melatih jaringan saraf menggunakan perpustakaan TensorFlow Google. Prosesnya memakan waktu 3,5 jam. Setelah itu, jaringan saraf serupa dilatih menggunakan algoritma SLIDE pada sistem dengan prosesor Xeon 44-core tunggal, dan hanya membutuhkan waktu 1 jam.

Perlu dicatat di sini bahwa Intel saat ini tidak memiliki model prosesor 44-inti dalam rangkaian produknya. Ada kemungkinan bahwa para peneliti menggunakan semacam chip khusus atau yang belum dirilis, tetapi kemungkinannya kecil. Kemungkinan besar sistem dengan dua Intel Xeon 22-inti digunakan di sini, atau hanya ada kesalahan dalam siaran pers, dan kita berbicara tentang 44 thread yang disediakan oleh satu prosesor 22-inti. Namun bagaimanapun juga, hal ini tidak mengurangi pencapaian itu sendiri.

Tentu saja algoritma SLIDE masih harus melalui banyak pengujian dan membuktikan keefektifannya, serta tidak adanya keanehan dan kendala. Namun, apa yang kita lihat sekarang sangatlah mengesankan dan benar-benar dapat memberikan dampak yang besar bagi perkembangan industri.



Sumber: 3dnews.ru

Tambah komentar