Поряд із новим процесорним ядром
ARM декларує суттєвий приріст графічної продуктивності Mali-G77 – на 40% порівняно із сучасним поколінням Mali-G76. Це досягнуто як рахунок техпроцесу, і архітектурних поліпшень. Mali-G77 може мати від 7 до 16 ядер (у перспективі можливе масштабування від 1 до 32), причому кожне з них майже такого ж розміру, як у G76. Отже, високопродуктивні смартфони, ймовірно, оснащуватимуться тією ж кількістю ядер ГП.
В іграх очікується підвищення швидкодії на рівні від 20 до 40 %, залежно від типу графічних навантажень. Судячи з результатів популярного тесту Manhattan GFXBench, істотна перевага нового графічного процесора над поточним поколінням змусить подбати і конкуруючу компанію Qualcomm про значне покращення продуктивності графіки Adreno.
За словами ARM, сама по собі нова архітектура Mali-G77 забезпечує в середньому 30% поліпшення енергоефективності або продуктивності. Друге покоління скалярної архітектури ARM Valhall дозволяє графічному процесору паралельно виконувати 16 команд за цикл на CU порівняно з вісьмома Bifrost (Mali-G76). Серед інших нововведень: динамічне планування команд, що повністю апаратно керується, і абсолютно новий набір команд зі збереженням зворотної сумісності з Bifrost. Додано також підтримку формату стиснення ARM AFBC1.3 та інші нововведення (FP16 render targets, layered rendering та vertex shader outputs).
У Bifrost CU містили 3 движки виконання команд, кожен з яких включав кеш інструкцій, регістр і блок управління Warp. Розподіл за цими трьома двигунами дозволяв виконувати 24 інструкції FMA з 32-бітною точністю розрахунків з плаваючою комою (FP32). У Valhall кожен CU має лише один двигун виконання команд, розділеним між двома обчислювальними модулями, здатними обробляти по 16 команд Warp за такт, тобто забезпечується загальна пропускна здатність в 32 інструкції FMA FP32 на CU. Завдяки цим архітектурним змінам при паралельних розрахунках Mali-G77 може виконувати на третину більше математичних розрахунків у порівнянні з Mali-G76.
Крім того, кожен з цих обчислювальних модулів CU містить два нові математичні функціональні блоки. Новий модуль перетворення (CVT) обробляє основні цілі, логічні, розгалужені та інструкції перетворення. Блок спеціальних функцій (SFU) прискорює операції множення цілих чисел, поділу, квадратного кореня, логарифмів та інших складних цілих функцій.
У стандартному блоці FMA є кілька налаштувань, що підтримують виконання 16 інструкцій FP32 за цикл, 32 FP16 або 64 INT8 Dot Product. Ці оптимізації можуть забезпечити підвищення продуктивності додатків машинного навчання значення до 60 %.
Інша ключова зміна в Mali-G77 - це подвоєння продуктивності текстурного модуля, який тепер обробляє 4 білінійних текселів за такт в порівнянні з двома раніше, 2 трилінійних текселів за такт, забезпечуючи швидшу фільтрацію FP16 і FP32.
ARM внесла й низку інших змін, внаслідок чого Mali-G77 та Valhall обіцяють значне підвищення продуктивності для ігрових навантажень та завдань машинного навчання. Важливо відзначити, що енергоспоживання та площа чіпа збережені на рівні Bifrost, що обіцяє випуск мобільних пристроїв з більш високою піковою продуктивністю без підвищення вимог до електроспоживання, тепловідведення та розміру.
Джерело: 3dnews.ru