Intel Xeon ia kalonte tetë Tesla V100 disa herë kur trajnonte një rrjet nervor

Procesori qendror ishte disa herë më i shpejtë në performancë sesa një kombinim i tetë procesorëve grafikë në të njëjtën kohë kur rrjetet nervore të mësuarit të thellë. Tingëllon si diçka jashtë fantashkencës, apo jo? Por studiuesit nga Universiteti Rice, duke përdorur Intel Xeon, kanë vërtetuar se është e mundur.

Intel Xeon ia kalonte tetë Tesla V100 disa herë kur trajnonte një rrjet nervor

GPU-të kanë qenë gjithmonë më të përshtatshme për rrjetet nervore të të mësuarit të thellë sesa CPU-të. Kjo është për shkak të arkitekturës së GPU-ve, të cilat përbëhen nga shumë bërthama të vogla që janë në gjendje të kryejnë shumë detyra të vogla paralelisht, gjë që është pikërisht ajo që kërkohet për trajnimin e rrjeteve nervore. Por doli që procesorët qendrorë, me qasjen e duhur, mund të jenë shumë efektivë në mësimin e thellë.

Është raportuar se gjatë përdorimit të algoritmit të mësimit të thellë SLIDE, një procesor Intel Xeon me 44 bërthama ishte 3,5 herë më produktiv sesa një kombinim i tetë përshpejtuesve informatikë NVIDIA Tesla V100. Kjo është ndoshta hera e parë që CPU jo vetëm që e kapi GPU-në në një skenar të tillë, por edhe i tejkaloi ato, dhe shumë dukshëm.

Një njoftim për shtyp i lëshuar nga universiteti thotë se algoritmi SLIDE nuk kërkon GPU pasi përdor një qasje krejtësisht të ndryshme. Në mënyrë tipike, gjatë trajnimit të rrjeteve nervore, përdoret teknika e përhapjes së gabimeve të trajnimit, e cila përdor shumëzimin e matricës, e cila është një ngarkesë ideale për GPU. SLIDE, nga ana tjetër, e kthen mësimin në një problem kërkimi që zgjidhet duke përdorur tabelat hash.


Intel Xeon ia kalonte tetë Tesla V100 disa herë kur trajnonte një rrjet nervor

Sipas studiuesve, kjo ul ndjeshëm koston llogaritëse të trajnimit të rrjeteve nervore. Për të marrë një bazë, studiuesit përdorën sistemin ekzistues të laboratorit të Universitetit Rice me tetë përshpejtues Tesla V100 për të trajnuar një rrjet nervor duke përdorur bibliotekën TensorFlow të Google. Procesi zgjati 3,5 orë. Më pas, një rrjet nervor i ngjashëm u trajnua duke përdorur algoritmin SLIDE në një sistem me një procesor të vetëm Xeon me 44 bërthama dhe iu desh vetëm 1 orë.

Vlen të përmendet këtu se Intel aktualisht nuk ka modele të procesorëve 44 bërthama në gamën e produkteve të saj. Është e mundur që studiuesit kanë përdorur një lloj çipi të personalizuar ose të papublikuar, por kjo nuk ka gjasa. Ka shumë më shumë gjasa që këtu të jetë përdorur një sistem me dy Intel Xeon me 22 bërthama, ose thjesht ka pasur një gabim në njoftimin për shtyp, dhe ne po flasim për 44 fije që janë siguruar nga një procesor 22-bërthamë. Por në çdo rast, kjo nuk e ul vetë arritjen.

Sigurisht, algoritmi SLIDE ende duhet të kalojë nëpër shumë teste dhe të provojë efektivitetin e tij, si dhe mungesën e ndonjë veçorie dhe kurthi. Sidoqoftë, ajo që shohim tani është shumë mbresëlënëse dhe mund të ketë vërtet një ndikim të madh në zhvillimin e industrisë.



Burimi: 3dnews.ru

Shto një koment