Intel Xeon-ը մի քանի անգամ գերազանցել է Tesla V100-ի ութը նեյրոնային ցանցը վարժեցնելիս

Կենտրոնական պրոցեսորն իր կատարողականությամբ մի քանի անգամ ավելի արագ էր, քան միանգամից ութ գրաֆիկական պրոցեսորների համադրությունը, երբ խորը ուսուցման նեյրոնային ցանցեր էին: Թվում է, թե ինչ-որ բան գիտաֆանտաստիկայից դուրս է, այնպես չէ՞: Սակայն Ռայսի համալսարանի հետազոտողները, օգտագործելով Intel Xeon-ը, ապացուցել են, որ դա հնարավոր է:

Intel Xeon-ը մի քանի անգամ գերազանցել է Tesla V100-ի ութը նեյրոնային ցանցը վարժեցնելիս

GPU-ները միշտ շատ ավելի հարմար են եղել խորը ուսուցման նեյրոնային ցանցերի համար, քան պրոցեսորները: Դա պայմանավորված է GPU-ների ճարտարապետությամբ, որոնք բաղկացած են բազմաթիվ փոքր միջուկներից, որոնք ի վիճակի են կատարել բազմաթիվ փոքր առաջադրանքներ զուգահեռաբար, ինչը հենց այն է, ինչ պահանջվում է նեյրոնային ցանցերի վերապատրաստման համար: Բայց պարզվեց, որ կենտրոնական պրոցեսորները, ճիշտ մոտեցմամբ, կարող են շատ արդյունավետ լինել խորը ուսուցման մեջ։

Հաղորդվում է, որ SLIDE խորը ուսուցման ալգորիթմն օգտագործելիս 44 միջուկով Intel Xeon պրոցեսորը 3,5 անգամ ավելի արդյունավետ է եղել, քան ութ NVIDIA Tesla V100 հաշվողական արագացուցիչների համադրությունը։ Սա, թերևս, առաջին դեպքն է, երբ պրոցեսորը ոչ միայն հասավ GPU-ին նման սցենարով, այլև գերազանցեց նրանց և շատ նկատելի:

Համալսարանի կողմից հրապարակված մամուլի հաղորդագրությունում ասվում է, որ SLIDE ալգորիթմը չի պահանջում GPU-ներ, քանի որ այն օգտագործում է բոլորովին այլ մոտեցում: Սովորաբար նեյրոնային ցանցեր վարժեցնելիս օգտագործվում է ուսուցման սխալների հետ տարածման տեխնիկան, որն օգտագործում է մատրիցային բազմապատկում, ինչը իդեալական բեռ է GPU-ի համար: SLIDE-ը, մյուս կողմից, ուսուցումը վերածում է որոնման խնդրի, որը լուծվում է հեշ աղյուսակների միջոցով:


Intel Xeon-ը մի քանի անգամ գերազանցել է Tesla V100-ի ութը նեյրոնային ցանցը վարժեցնելիս

Ըստ հետազոտողների՝ դա զգալիորեն նվազեցնում է նեյրոնային ցանցերի ուսուցման հաշվողական ծախսերը։ Ելակետ ստանալու համար հետազոտողները օգտագործել են Ռայսի համալսարանի լաբորատորիայի գոյություն ունեցող համակարգը Tesla V100 ութ արագացուցիչներով՝ Google-ի TensorFlow գրադարանի միջոցով նեյրոնային ցանց վարժեցնելու համար: Գործընթացը տեւել է 3,5 ժամ։ Այնուհետև նմանատիպ նեյրոնային ցանցը վերապատրաստվել է՝ օգտագործելով SLIDE ալգորիթմը մեկ 44 միջուկանի Xeon պրոցեսորով համակարգի վրա, և դա տևել է ընդամենը 1 ժամ:

Այստեղ հարկ է նշել, որ Intel-ը ներկայումս չունի 44 միջուկային պրոցեսորային մոդելներ իր արտադրանքի տեսականու մեջ: Հնարավոր է, որ հետազոտողները օգտագործել են ինչ-որ մաքսային կամ չթողարկված չիպ, բայց դա քիչ հավանական է: Շատ ավելի հավանական է, որ այստեղ օգտագործվել է երկու 22 միջուկանի Intel Xeons-ով համակարգ, կամ պարզապես մամուլի հաղորդագրության մեջ սխալ է եղել, և խոսքը 44 թեմայի մասին է, որոնք տրամադրվել են մեկ 22 միջուկանի պրոցեսորով։ Բայց, ամեն դեպքում, դա չի շեղում բուն ձեռքբերումից։

Իհարկե, SLIDE ալգորիթմը դեռ պետք է անցնի բազմաթիվ թեստեր և ապացուցի իր արդյունավետությունը, ինչպես նաև որևէ յուրահատկության և որոգայթի բացակայությունը։ Այնուամենայնիվ, այն, ինչ մենք հիմա տեսնում ենք, շատ տպավորիչ է և իսկապես կարող է մեծ ազդեցություն ունենալ ոլորտի զարգացման վրա։



Source: 3dnews.ru

Добавить комментарий