Intel Xeon vairākas reizes pārspēja astoņas Tesla V100, apmācot neironu tīklu

Centrālais procesors bija vairākas reizes ātrāks veiktspējas ziņā nekā astoņu grafikas procesoru kombinācija vienlaikus, dziļi apgÅ«stot neironu tÄ«klus. Izklausās pēc kaut kā no zinātniskās fantastikas, vai ne? Taču RÄ«sa universitātes pētnieki, izmantojot Intel Xeon, ir pierādÄ«juÅ”i, ka tas ir iespējams.

Intel Xeon vairākas reizes pārspēja astoņas Tesla V100, apmācot neironu tīklu

GPU vienmēr ir bijuÅ”i daudz labāk piemēroti dziļas mācÄ«Å”anās neironu tÄ«kliem nekā CPU. Tas ir saistÄ«ts ar GPU arhitektÅ«ru, kas sastāv no daudziem maziem kodoliem, kas spēj paralēli veikt daudzus mazus uzdevumus, kas ir tieÅ”i tas, kas nepiecieÅ”ams neironu tÄ«klu apmācÄ«bai. Bet izrādÄ«jās, ka centrālie procesori ar pareizo pieeju var bÅ«t ļoti efektÄ«vi dziļā apmācÄ«bā.

Tiek ziņots, ka, izmantojot SLIDE dziļās mācÄ«Å”anās algoritmu, Intel Xeon procesors ar 44 kodoliem bija 3,5 reizes produktÄ«vāks nekā astoņu NVIDIA Tesla V100 skaitļoÅ”anas paātrinātāju kombinācija. Iespējams, ka Ŕī ir pirmā reize, kad CPU ne tikai panāca GPU Ŕādā scenārijā, bet arÄ« pārspēja tos, turklāt ļoti manāmi.

Universitātes izdotajā paziņojumā presei teikts, ka SLIDE algoritmam nav nepiecieÅ”ami GPU, jo tiek izmantota pavisam cita pieeja. Parasti, apmācot neironu tÄ«klus, tiek izmantota apmācÄ«bas kļūdu atpakaļpavairoÅ”anas tehnika, kas izmanto matricas reizināŔanu, kas ir ideāla slodze GPU. No otras puses, SLIDE pārvērÅ” mācÄ«Å”anos par uzmeklÄ“Å”anas problēmu, kas tiek atrisināta, izmantojot hash tabulas.


Intel Xeon vairākas reizes pārspēja astoņas Tesla V100, apmācot neironu tīklu

Pēc pētnieku domām, tas ievērojami samazina neironu tÄ«klu apmācÄ«bas skaitļoÅ”anas izmaksas. Lai iegÅ«tu bāzes lÄ«niju, pētnieki izmantoja RÄ«sa universitātes laboratorijas esoÅ”o sistēmu ar astoņiem Tesla V100 paātrinātājiem, lai apmācÄ«tu neironu tÄ«klu, izmantojot Google TensorFlow bibliotēku. Process ilga 3,5 stundas. Pēc tam lÄ«dzÄ«gs neironu tÄ«kls tika apmācÄ«ts, izmantojot SLIDE algoritmu sistēmā ar vienu 44 kodolu Xeon procesoru, un tas aizņēma tikai 1 stundu.

Å eit ir vērts atzÄ«mēt, ka Intel produktu klāstā paÅ”laik nav 44 kodolu procesoru modeļu. Iespējams, ka pētnieki izmantoja kādu pielāgotu vai neizlaistu mikroshēmu, taču tas ir maz ticams. Daudz lielāka iespējamÄ«ba, ka Å”eit tika izmantota sistēma ar diviem 22 kodolu Intel Xeoniem vai vienkārÅ”i preses relÄ«zē bija kļūda, un runa ir par 44 pavedieniem, kurus nodroÅ”ināja viens 22 kodolu procesors. Bet jebkurā gadÄ«jumā tas nemazina paÅ”u sasniegumu.

Protams, SLIDE algoritmam vēl ir jāiziet daudzi testi un jāpierāda tā efektivitāte, kā arÄ« nekādu Ä«patnÄ«bu un nepilnÄ«bu neesamÄ«ba. Tomēr tas, ko mēs redzam tagad, ir ļoti iespaidÄ«gs un patieŔām var bÅ«tiski ietekmēt nozares attÄ«stÄ«bu.



Avots: 3dnews.ru

Pievieno komentāru