Intel Xeon outperformed dalapan Tesla V100s sababaraha kali nalika ngalatih jaringan saraf

Prosesor sentral sababaraha kali langkung gancang dina pagelaran tibatan kombinasi dalapan prosesor grafik sakaligus nalika diajar jaringan saraf jero. Sigana mah anu kaluar tina fiksi ilmiah, sanés? Tapi peneliti ti Universitas Rice, ngagunakeun Intel Xeon, geus ngabuktikeun yén éta mungkin.

Intel Xeon outperformed dalapan Tesla V100s sababaraha kali nalika ngalatih jaringan saraf

GPUs sok langkung cocog pikeun jaringan saraf diajar jero tibatan CPU. Ieu alatan arsitéktur GPUs, nu diwangun ku loba cores leutik nu sanggup ngajalankeun loba tugas leutik dina paralel, nu kahayang diperlukeun pikeun latihan jaringan neural. Tapi tétéla yén prosesor sentral, kalayan pendekatan anu leres, tiasa efektif pisan dina diajar jero.

Dilaporkeun yén nalika ngagunakeun algoritma pembelajaran jero SLIDE, prosésor Intel Xeon sareng 44 intina 3,5 kali langkung produktif tibatan kombinasi dalapan akselerator komputasi NVIDIA Tesla V100. Ieu meureun kahiji kalina yén CPU teu ngan bray up jeung GPU dina skenario kitu, tapi ogé surpassed aranjeunna, sarta pohara noticeably.

Siaran pers anu dikaluarkeun ku universitas nyatakeun yén algoritma SLIDE henteu meryogikeun GPU sabab ngagunakeun pendekatan anu béda-béda. Biasana, nalika ngalatih jaringan saraf, téknik backpropagation kasalahan latihan dianggo, anu ngagunakeun multiplikasi matriks, anu mangrupikeun beban idéal pikeun GPU. SLIDE, di sisi séjén, ngarobah diajar kana masalah lookup anu direngsekeun ngagunakeun tabel hash.


Intel Xeon outperformed dalapan Tesla V100s sababaraha kali nalika ngalatih jaringan saraf

Numutkeun kana panaliti, ieu sacara signifikan ngirangan biaya komputasi pikeun ngalatih jaringan saraf. Pikeun kéngingkeun dasar, panaliti ngagunakeun sistem laboratorium Rice University anu aya sareng dalapan akselerator Tesla V100 pikeun ngalatih jaringan saraf nganggo perpustakaan TensorFlow Google. Prosésna nyandak 3,5 jam. Saatos éta, jaringan saraf anu sami dilatih nganggo algoritma SLIDE dina sistem anu nganggo prosesor Xeon 44-inti tunggal, sareng ngan ukur nyandak 1 jam.

Ieu kudu dicatet yén Intel ayeuna teu boga model processor 44-inti dina rentang produk na. Ieu mungkin nu peneliti dipaké sababaraha jenis custom atanapi unreleased chip, tapi ieu téh saperti teu mirip. Éta pisan kamungkinan yén sistem dua 22-inti Intel Xeons dipaké di dieu, atawa ngan aya kasalahan dina siaran pers, sarta kami ngawangkong ngeunaan 44 threads nu disadiakeun ku hiji processor 22-inti. Tapi dina sagala hal, ieu teu detract ti prestasi sorangan.

Tangtosna, algoritma SLIDE masih kedah ngaliwat seueur tes sareng ngabuktikeun efektivitasna, ogé henteuna peculiarities sareng pitfalls. Sanajan kitu, naon urang tingali ayeuna pisan impressive tur bener bisa boga dampak badag dina ngembangkeun industri.



sumber: 3dnews.ru

Tambahkeun komentar