Intel Xeon ngluwihi wolung Tesla V100 kaping pirang-pirang nalika nglatih jaringan saraf

Prosesor tengah kaping pirang-pirang luwih cepet ing kinerja tinimbang kombinasi wolung prosesor grafis sekaligus nalika sinau jaringan saraf jero. Muni kaya sing metu saka fiksi ilmiah, ta? Nanging peneliti saka Universitas Rice, nggunakake Intel Xeon, wis mbuktekaken sing bisa.

Intel Xeon ngluwihi wolung Tesla V100 kaping pirang-pirang nalika nglatih jaringan saraf

GPU mesthi luwih cocog kanggo jaringan saraf sinau jero tinimbang CPU. Iki amarga arsitektur GPUs, kang kasusun saka akeh inti cilik sing bisa nindakake akeh tugas cilik ing podo karo, kang persis apa sing dibutuhake kanggo latihan jaringan syaraf. Nanging ternyata prosesor tengah, kanthi pendekatan sing bener, bisa dadi efektif banget kanggo sinau jero.

Kacarita nalika nggunakake algoritma SLIDE deep learning, prosesor Intel Xeon kanthi 44 intine 3,5 kaping luwih produktif tinimbang kombinasi wolung akselerator komputasi NVIDIA Tesla V100. Iki mbok menawa pisanan sing CPU ora mung kejiret munggah karo GPU ing skenario kuwi, nanging uga ngluwihi wong-wong mau, lan banget noticeably.

Siaran pers sing diterbitake dening universitas kasebut nyatakake yen algoritma SLIDE ora mbutuhake GPU amarga nggunakake pendekatan sing beda. Biasane, nalika nglatih jaringan saraf, teknik backpropagation kesalahan latihan digunakake, sing nggunakake perkalian matriks, sing minangka beban sing cocog kanggo GPU. SLIDE, ing sisih liya, ngowahi sinau dadi masalah goleki sing ditanggulangi nggunakake tabel hash.


Intel Xeon ngluwihi wolung Tesla V100 kaping pirang-pirang nalika nglatih jaringan saraf

Miturut peneliti, iki sacara signifikan nyuda biaya komputasi kanggo latihan jaringan saraf. Kanggo entuk garis dasar, para peneliti nggunakake sistem laboratorium Rice University sing wis ana kanthi wolung akselerator Tesla V100 kanggo nglatih jaringan saraf nggunakake perpustakaan TensorFlow Google. Proses njupuk 3,5 jam. Sawise iku, jaringan syaraf sing padha dilatih nggunakake algoritma SLIDE ing sistem kanthi prosesor Xeon 44-inti tunggal, lan mung butuh 1 jam.

Wigati dicathet yen Intel saiki ora duwe model prosesor 44-inti ing sawetara produk. Bisa uga peneliti nggunakake sawetara chip khusus utawa ora dirilis, nanging iki ora mungkin. Iku luwih kamungkinan sing sistem karo loro 22-inti Intel Xeons digunakake kene, utawa ana mung kesalahan ing release penet, lan kita ngomong bab 44 Utas sing diwenehake dening siji prosesor 22-inti. Nanging ing kasus apa wae, iki ora nyuda prestasi kasebut.

Mesthi, algoritma SLIDE isih kudu ngliwati akeh tes lan mbuktekake efektifitas, uga ora ana keanehan lan pitfalls. Nanging, apa sing kita deleng saiki banget nyengsemake lan bisa duwe pengaruh gedhe kanggo pangembangan industri.



Source: 3dnews.ru

Add a comment