ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

Նոր պրոցեսորային միջուկի հետ միասին Cortex-A77 ARM-ը ներկայացրել է գրաֆիկական պրոցեսոր, որը նախատեսված է հաջորդ սերնդի շարժական մեկ չիպային համակարգերի համար: Mali-G77, որը չպետք է շփոթել ցուցադրման նոր պրոցեսորի հետ Մալի-D77, նշում է անցումը ARM Bifrost ճարտարապետությունից դեպի Valhall:

ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

ARM-ը հայտարարում է Mali-G77-ի գրաֆիկական կատարողականի զգալի աճ՝ 40%-ով, ներկայիս սերնդի Mali-G76-ի համեմատ: Դա ձեռք է բերվել ինչպես տեխնիկական գործընթացի, այնպես էլ ճարտարապետական ​​բարելավումների միջոցով: Mali-G77-ը կարող է ունենալ 7-ից 16 միջուկ (ապագայում հնարավոր է 1-ից 32-ի մասշտաբում), և դրանցից յուրաքանչյուրը գրեթե նույն չափն ունի, ինչ G76-ը: Հետևաբար, բարձրակարգ սմարթֆոնները, հավանաբար, կունենան նույն թվով GPU միջուկներ:

ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

Խաղերում դուք կարող եք ակնկալել կատարողականի բարելավում 20-ից 40%-ի սահմաններում՝ կախված գրաֆիկական ծանրաբեռնվածության տեսակից: Դատելով Manhattan GFXBench հանրահայտ թեստի արդյունքներից՝ նոր GPU-ի զգալի գերազանցությունը ներկայիս սերնդի նկատմամբ կստիպի մրցակից Qualcomm-ին անհանգստանալ Adreno գրաֆիկական կատարողականության զգալի բարելավման մասին:

ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

Ինքնուրույն, նոր Mali-G77 ճարտարապետությունը ապահովում է էներգիայի արդյունավետության կամ կատարողականի միջինը 30 տոկոս բարելավում, ասում է ARM-ը: ARM Valhall-ի սկալյար ճարտարապետության երկրորդ սերունդը թույլ է տալիս GPU-ին կատարել 16 հրահանգ յուրաքանչյուր ցիկլում ՄՄ-ի վրա զուգահեռ՝ համեմատած ութի հետ Bifrost-ում (Mali-G76): Մյուս նորամուծությունները ներառում են ամբողջությամբ ապարատային վրա հիմնված դինամիկ հրահանգների պլանավորում և բոլորովին նոր հրահանգների հավաքածու՝ պահպանելով հետընթաց համատեղելիությունը Bifrost-ի հետ: Ավելացվել է նաև ARM AFBC1.3 սեղմման ձևաչափի և այլ նորամուծությունների աջակցությունը (FP16 ռենդերի թիրախներ, շերտավոր արտապատկերում և գագաթային շեյդեր ելքեր):


ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

Bifrost CU-ն պարունակում էր 3 կատարողական շարժիչներ, որոնցից յուրաքանչյուրը ներառում էր հրահանգների քեշ, ռեգիստր և Warp կառավարման միավոր: Այս երեք շարժիչների վրա բաշխումը թույլ տվեց 24 FMA հրահանգներ կատարել 32 բիթ լողացող կետի ճշգրտությամբ (FP32): Վալհոլում յուրաքանչյուր CU ունի միայն մեկ կատարողական շարժիչ՝ բաժանված երկու հաշվարկային միավորների միջև, որոնք կարող են մշակել 16 Warp հրահանգներ մեկ ժամացույցի համար, ինչը հանգեցնում է 32 FMA FP32 հրահանգների ընդհանուր թողունակության մեկ CU-ի համար: Այս ճարտարապետական ​​փոփոխությունների շնորհիվ Mali-G77-ը կարող է կատարել մեկ երրորդով ավելի մաթեմատիկական հաշվարկներ զուգահեռ հաշվարկներով՝ համեմատած Mali-G76-ի հետ:

ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

Բացի այդ, այս CU-ներից յուրաքանչյուրը պարունակում է երկու նոր մաթեմատիկական ֆունկցիայի բլոկ: Նոր փոխակերպման շարժիչը (CVT) մշակում է հիմնական ամբողջ թվերի, տրամաբանական, ճյուղերի և փոխակերպման հրահանգները: Հատուկ ֆունկցիայի միավորը (SFU) արագացնում է ամբողջ թվերի բազմապատկումը, բաժանումը, քառակուսի արմատը, լոգարիթմները և այլ բարդ ամբողջ թվերի ֆունկցիաները:

ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

Ստանդարտ FMA բլոկն ունի մի քանի կարգավորումներ, որոնք աջակցում են 16 FP32 հրահանգներ մեկ ցիկլի համար, 32՝ FP16-ի համար կամ 64՝ INT8 Dot Product-ի համար: Այս օպտիմալացումները կարող են ապահովել մինչև 60% կատարողականի բարելավում մեքենայական ուսուցման հավելվածներում:

ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

Mali-G77-ի մեկ այլ հիմնական փոփոխությունը հյուսվածքային շարժիչի աշխատանքի կրկնապատկումն է, որն այժմ մշակում է 4 երկգծային տեքսել մեկ ժամացույցի համեմատ՝ նախորդ երկուսի համեմատ՝ 2 եռագիծ տեքսել մեկ ժամացույցում, ինչը հնարավորություն է տալիս FP16 և FP32 ավելի արագ զտում:

ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

ARM Mali-G77 GPU-ն 40%-ով ավելի արագ է

ARM-ը կատարել է մի շարք այլ փոփոխություններ՝ Mali-G77-ը և Valhall-ը խոստանում են զգալի կատարողականի բարելավումներ խաղերի և մեքենայական ուսուցման աշխատանքային ծանրաբեռնվածության համար: Կարևորն այն է, որ էներգիայի սպառումը և չիպերի տարածքը պահվում են Bifrost մակարդակներում, ինչը խոստանում է շարժական սարքերի բարձր առավելագույն արդյունավետություն՝ առանց էներգիայի սպառման, ջերմության տարածման և չափի պահանջների ավելացման:



Source: 3dnews.ru

Добавить комментарий