Графічний процесор ARM Mali-G77 став на 40% швидше

Поряд із новим процесорним ядром Cortex-A77 ARM представила графічний процесор, призначений для мобільних однокристальних систем наступного покоління. Mali-G77, який не слід плутати з новим процесором дисплея Малі-D77, знаменує собою перехід з архітектури ARM Bifrost і Valhall.

Графічний процесор ARM Mali-G77 став на 40% швидше

ARM декларує суттєвий приріст графічної продуктивності Mali-G77 – на 40% порівняно із сучасним поколінням Mali-G76. Це досягнуто як рахунок техпроцесу, і архітектурних поліпшень. Mali-G77 може мати від 7 до 16 ядер (у перспективі можливе масштабування від 1 до 32), причому кожне з них майже такого ж розміру, як у G76. Отже, високопродуктивні смартфони, ймовірно, оснащуватимуться тією ж кількістю ядер ГП.

Графічний процесор ARM Mali-G77 став на 40% швидше

Графічний процесор ARM Mali-G77 став на 40% швидше

В іграх очікується підвищення швидкодії на рівні від 20 до 40 %, залежно від типу графічних навантажень. Судячи з результатів популярного тесту Manhattan GFXBench, істотна перевага нового графічного процесора над поточним поколінням змусить подбати і конкуруючу компанію Qualcomm про значне покращення продуктивності графіки Adreno.

Графічний процесор ARM Mali-G77 став на 40% швидше

Графічний процесор ARM Mali-G77 став на 40% швидше

За словами ARM, сама по собі нова архітектура Mali-G77 забезпечує в середньому 30% поліпшення енергоефективності або продуктивності. Друге покоління скалярної архітектури ARM Valhall дозволяє графічному процесору паралельно виконувати 16 команд за цикл на CU порівняно з вісьмома Bifrost (Mali-G76). Серед інших нововведень: динамічне планування команд, що повністю апаратно керується, і абсолютно новий набір команд зі збереженням зворотної сумісності з Bifrost. Додано також підтримку формату стиснення ARM AFBC1.3 та інші нововведення (FP16 render targets, layered rendering та vertex shader outputs).


Графічний процесор ARM Mali-G77 став на 40% швидше

Графічний процесор ARM Mali-G77 став на 40% швидше

У Bifrost CU містили 3 движки виконання команд, кожен з яких включав кеш інструкцій, регістр і блок управління Warp. Розподіл за цими трьома двигунами дозволяв виконувати 24 інструкції FMA з 32-бітною точністю розрахунків з плаваючою комою (FP32). У Valhall кожен CU має лише один двигун виконання команд, розділеним між двома обчислювальними модулями, здатними обробляти по 16 команд Warp за такт, тобто забезпечується загальна пропускна здатність в 32 інструкції FMA FP32 на CU. Завдяки цим архітектурним змінам при паралельних розрахунках Mali-G77 може виконувати на третину більше математичних розрахунків у порівнянні з Mali-G76.

Графічний процесор ARM Mali-G77 став на 40% швидше

Графічний процесор ARM Mali-G77 став на 40% швидше

Крім того, кожен з цих обчислювальних модулів CU містить два нові математичні функціональні блоки. Новий модуль перетворення (CVT) обробляє основні цілі, логічні, розгалужені та інструкції перетворення. Блок спеціальних функцій (SFU) прискорює операції множення цілих чисел, поділу, квадратного кореня, логарифмів та інших складних цілих функцій.

Графічний процесор ARM Mali-G77 став на 40% швидше

Графічний процесор ARM Mali-G77 став на 40% швидше

У стандартному блоці FMA є кілька налаштувань, що підтримують виконання 16 інструкцій FP32 за цикл, 32 FP16 або 64 INT8 Dot Product. Ці оптимізації можуть забезпечити підвищення продуктивності додатків машинного навчання значення до 60 %.

Графічний процесор ARM Mali-G77 став на 40% швидше

Графічний процесор ARM Mali-G77 став на 40% швидше

Інша ключова зміна в Mali-G77 - це подвоєння продуктивності текстурного модуля, який тепер обробляє 4 білінійних текселів за такт в порівнянні з двома раніше, 2 трилінійних текселів за такт, забезпечуючи швидшу фільтрацію FP16 і FP32.

Графічний процесор ARM Mali-G77 став на 40% швидше

Графічний процесор ARM Mali-G77 став на 40% швидше

ARM внесла й низку інших змін, внаслідок чого Mali-G77 та Valhall обіцяють значне підвищення продуктивності для ігрових навантажень та завдань машинного навчання. Важливо відзначити, що енергоспоживання та площа чіпа збережені на рівні Bifrost, що обіцяє випуск мобільних пристроїв з більш високою піковою продуктивністю без підвищення вимог до електроспоживання, тепловідведення та розміру.



Джерело: 3dnews.ru

Додати коментар або відгук