ARM Mali-G77 GPU е с 40% по-бърз

Заедно с новото процесорно ядро Cortex-A77 ARM представи графичен процесор, предназначен за следващо поколение мобилни едночипови системи. Mali-G77, който не трябва да се бърка с новия дисплей процесор Mali-D77, бележи прехода от архитектурата ARM Bifrost към Valhall.

ARM Mali-G77 GPU е с 40% по-бърз

ARM декларира значително увеличение на графичната производителност на Mali-G77 - с 40% в сравнение с текущото поколение на Mali-G76. Това беше постигнато както чрез техническия процес, така и чрез архитектурни подобрения. Mali-G77 може да има от 7 до 16 ядра (в бъдеще е възможно мащабиране от 1 до 32) и всяко от тях е с почти същия размер като G76. Следователно смартфоните от висок клас вероятно ще разполагат със същия брой GPU ядра.

ARM Mali-G77 GPU е с 40% по-бърз

ARM Mali-G77 GPU е с 40% по-бърз

В игрите можете да очаквате подобрения на производителността между 20 и 40%, в зависимост от вида на графичното натоварване. Съдейки по резултатите от популярния тест Manhattan GFXBench, значителното превъзходство на новия GPU над сегашното поколение ще принуди съперника Qualcomm да се тревожи за значително подобрение на графичната производителност на Adreno.

ARM Mali-G77 GPU е с 40% по-бърз

ARM Mali-G77 GPU е с 40% по-бърз

Сама по себе си, новата архитектура Mali-G77 осигурява средно 30 процента подобрение в енергийната ефективност или производителност, казва ARM. Второто поколение скаларна архитектура ARM Valhall позволява на GPU да изпълнява 16 инструкции на цикъл паралелно на CU, в сравнение с осем в Bifrost (Mali-G76). Други иновации включват изцяло хардуерно управлявано динамично планиране на инструкции и напълно нов набор от инструкции, като същевременно се поддържа обратна съвместимост с Bifrost. Добавена е и поддръжка за формата за компресиране ARM AFBC1.3 и други нововъведения (FP16 цели за изобразяване, наслоено изобразяване и изходи на шейдър на върхове).


ARM Mali-G77 GPU е с 40% по-бърз

ARM Mali-G77 GPU е с 40% по-бърз

Bifrost CU съдържаше 3 изпълнителни машини, всяка от които включваше кеш инструкции, регистър и единица за управление на Warp. Разпределението между тези три машини позволи изпълнението на 24 FMA инструкции с 32-битова точност с плаваща запетая (FP32). Във Valhall всеки CU има само един изпълнителен двигател, разделен между две изчислителни единици, способни да обработват 16 Warp инструкции на такт, което води до обща производителност от 32 FMA FP32 инструкции на CU. Благодарение на тези архитектурни промени, Mali-G77 може да извършва една трета повече математически изчисления в паралелни изчисления в сравнение с Mali-G76.

ARM Mali-G77 GPU е с 40% по-бърз

ARM Mali-G77 GPU е с 40% по-бърз

Освен това всеки от тези CU съдържа два нови блока с математически функции. Новият механизъм за преобразуване (CVT) обработва основни цели числа, логически инструкции, разклонения и инструкции за преобразуване. Специалната функционална единица (SFU) ускорява целочислено умножение, деление, квадратен корен, логаритми и други сложни цели числа.

ARM Mali-G77 GPU е с 40% по-бърз

ARM Mali-G77 GPU е с 40% по-бърз

Стандартният FMA блок има няколко настройки, които поддържат 16 FP32 инструкции на цикъл, 32 за FP16 или 64 за INT8 Dot Product. Тези оптимизации могат да осигурят до 60% подобрения на производителността в приложенията за машинно обучение.

ARM Mali-G77 GPU е с 40% по-бърз

ARM Mali-G77 GPU е с 40% по-бърз

Друга ключова промяна в Mali-G77 е удвояването на производителността на текстурния двигател, който сега обработва 4 билинейни тексела на такт в сравнение с предишните два, 2 трилинейни тексела на такт, което позволява по-бързо FP16 и FP32 филтриране.

ARM Mali-G77 GPU е с 40% по-бърз

ARM Mali-G77 GPU е с 40% по-бърз

ARM направи редица други промени, като Mali-G77 и Valhall обещават значителни подобрения в производителността за натоварвания от игри и машинно обучение. Важно е, че консумацията на енергия и площта на чипа се поддържат на нивата на Bifrost, обещавайки мобилни устройства с по-висока пикова производителност без увеличаване на консумацията на енергия, разсейването на топлината и изискванията за размер.



Източник: 3dnews.ru

Добавяне на нов коментар