GPU ARM Mali-G77 je o 40 % rychlejší

Spolu s novým jádrem procesoru Cortex-A77 ARM představil grafický procesor určený pro mobilní jednočipové systémy nové generace. Mali-G77, který by se neměl zaměňovat s novým zobrazovacím procesorem Mali-D77, označuje přechod z architektury ARM Bifrost na Valhall.

GPU ARM Mali-G77 je o 40 % rychlejší

ARM deklaruje výrazný nárůst grafického výkonu Mali-G77 – o 40 % oproti současné generaci Mali-G76. Toho bylo dosaženo jak technickým postupem, tak architektonickými vylepšeními. Mali-G77 může mít od 7 do 16 jader (v budoucnu je možné škálování od 1 do 32) a každé z nich je téměř stejně velké jako G76. V důsledku toho budou smartphony vyšší třídy pravděpodobně obsahovat stejný počet jader GPU.

GPU ARM Mali-G77 je o 40 % rychlejší

GPU ARM Mali-G77 je o 40 % rychlejší

Ve hrách můžete očekávat zlepšení výkonu o 20 až 40 % v závislosti na typu grafické zátěže. Soudě podle výsledků populárního testu Manhattan GFXBench, výrazná převaha nového GPU nad současnou generací donutí konkurenční Qualcomm obávat se výrazného zlepšení grafického výkonu Adreno.

GPU ARM Mali-G77 je o 40 % rychlejší

GPU ARM Mali-G77 je o 40 % rychlejší

Nová architektura Mali-G77 sama o sobě přináší průměrné 30procentní zlepšení energetické účinnosti nebo výkonu, říká ARM. Druhá generace skalární architektury ARM Valhall umožňuje GPU provádět 16 instrukcí za cyklus paralelně na CU, ve srovnání s osmi v Bifrost (Mali-G76). Mezi další novinky patří plně hardwarově řízené dynamické plánování instrukcí a zcela nová instrukční sada při zachování zpětné kompatibility s Bifrost. Přibyla také podpora kompresního formátu ARM AFBC1.3 a další novinky (renderové cíle FP16, vrstvené vykreslování a výstupy vertex shaderu).


GPU ARM Mali-G77 je o 40 % rychlejší

GPU ARM Mali-G77 je o 40 % rychlejší

Bifrost CU obsahoval 3 prováděcí enginy, z nichž každý obsahoval instrukční cache, registr a Warp řídící jednotku. Distribuce mezi těmito třemi motory umožnila provedení 24 instrukcí FMA s 32bitovou přesností s plovoucí desetinnou čárkou (FP32). Ve Valhallu má každá CU pouze jeden prováděcí engine, rozdělený mezi dvě výpočetní jednotky schopné zpracovat 16 Warp instrukcí na takt, což má za následek celkovou propustnost 32 FMA FP32 instrukcí na CU. Díky těmto architektonickým změnám může Mali-G77 provádět o jednu třetinu více matematických výpočtů v paralelních výpočtech ve srovnání s Mali-G76.

GPU ARM Mali-G77 je o 40 % rychlejší

GPU ARM Mali-G77 je o 40 % rychlejší

Každá z těchto CU navíc obsahuje dva nové matematické funkční bloky. Nový převodní stroj (CVT) zpracovává základní celočíselné, logické, větvené a převodní instrukce. Jednotka speciálních funkcí (SFU) urychluje násobení celých čísel, dělení, odmocninu, logaritmy a další komplexní celočíselné funkce.

GPU ARM Mali-G77 je o 40 % rychlejší

GPU ARM Mali-G77 je o 40 % rychlejší

Standardní blok FMA má několik nastavení, která podporují 16 instrukcí FP32 na cyklus, 32 pro FP16 nebo 64 pro INT8 Dot Product. Tyto optimalizace mohou poskytnout až 60% zlepšení výkonu v aplikacích strojového učení.

GPU ARM Mali-G77 je o 40 % rychlejší

GPU ARM Mali-G77 je o 40 % rychlejší

Další klíčovou změnou v Mali-G77 je zdvojnásobení výkonu texturového enginu, který nyní zpracovává 4 bilineární texely na takt ve srovnání s předchozími dvěma, 2 trilineární texely na takt, což umožňuje rychlejší filtrování FP16 a FP32.

GPU ARM Mali-G77 je o 40 % rychlejší

GPU ARM Mali-G77 je o 40 % rychlejší

ARM provedl řadu dalších změn, přičemž Mali-G77 a Valhall slibují výrazné zlepšení výkonu pro herní a strojové učení. Důležité je, že spotřeba energie a plocha čipu jsou udržovány na úrovních Bifrost, což slibuje mobilním zařízením vyšší špičkový výkon bez zvýšení spotřeby energie, rozptylu tepla a požadavků na velikost.



Zdroj: 3dnews.ru

Přidat komentář