La centra procesoro estis plurajn fojojn pli rapida en rendimento ol kombinaĵo de ok grafikaj procesoroj samtempe kiam profunda lernado de neŭralaj retoj. Sonas io el sciencfikcio, ĉu ne? Sed esploristoj de Rice University, uzante Intel Xeon, pruvis, ke ĝi eblas.

GPUoj ĉiam multe pli taŭgas por profunda lernado de neŭralaj retoj ol CPUoj. Ĉi tio estas pro la arkitekturo de GPUoj, kiuj konsistas el multaj malgrandaj kernoj, kiuj kapablas plenumi multajn malgrandajn taskojn paralele, kio estas ĝuste tio, kio estas postulata por trejnado de neŭralaj retoj. Sed montriĝis, ke centraj procesoroj, kun la ĝusta aliro, povas esti tre efikaj en profunda lernado.
Oni raportas, ke uzante la algoritmon de profunda lernado SLIDE, procesoro Intel Xeon kun 44 kernoj estis 3,5 fojojn pli produktiva ol kombinaĵo de ok komputilaj akceliloj de NVIDIA Tesla V100. Ĉi tio eble estas la unua fojo, ke la CPU ne nur kaptis la GPU en tia scenaro, sed ankaŭ superis ilin, kaj tre rimarkinde.
Gazetara komuniko eldonita de la universitato deklaras ke la SLIDE-algoritmo ne postulas GPUojn ĉar ĝi uzas tute malsaman aliron. Tipe, dum trejnado de neŭralaj retoj, la trejnaderara retropropagada tekniko estas uzata, kiu uzas matrican multiplikon, kiu estas ideala ŝarĝo por la GPU. SLIDE, aliflanke, igas lernadon en serĉproblemon, kiu estas solvita per haŝtabeloj.

Laŭ la esploristoj, ĉi tio signife reduktas la komputilan koston de trejnado de neŭralaj retoj. Por akiri bazlinion, la esploristoj uzis la ekzistantan sistemon de la Rice University-laboratorio kun ok Tesla V100-akceliloj por trejni neŭralan reton uzante la bibliotekon TensorFlow de Google. La procezo daŭris 3,5 horojn. Poste, simila neŭrala reto estis trejnita uzante la SLIDE-algoritmon sur sistemo kun ununura 44-kerna Xeon-procesoro, kaj ĝi daŭris nur 1 horon.
Indas rimarki ĉi tie, ke Intel nuntempe ne havas 44-kernajn procesorajn modelojn en sia produkta gamo. Eblas, ke la esploristoj uzis ian kutiman aŭ nepublikigitan blaton, sed ĉi tio estas neverŝajna. Estas multe pli verŝajne, ke ĉi tie oni uzis sistemon kun du 22-kernaj Intel Xeons, aŭ simple estis eraro en la gazetara komuniko, kaj ni parolas pri 44 fadenoj, kiuj estis provizitaj de unu 22-kerna procesoro. Sed ĉiaokaze, ĉi tio ne malpliigas la atingon mem.
Kompreneble, la SLIDE-algoritmo ankoraŭ devas trapasi multajn provojn kaj pruvi ĝian efikecon, same kiel la foreston de iuj proprecoj kaj malfacilaĵoj. Tamen, tio, kion ni vidas nun, estas tre impresa kaj vere povas havi grandan efikon al la disvolviĝo de la industrio.
fonto: 3dnews.ru
