Procesor graficzny ARM Mali-G77 jest o 40% szybszy

Wraz z nowym rdzeniem procesora Cortex-A77 Firma ARM wprowadziła procesor graficzny przeznaczony dla mobilnych systemów jednoukładowych nowej generacji. Mali-G77, którego nie należy mylić z nowym procesorem wyświetlacza Mali-D77, oznacza przejście od architektury ARM Bifrost do Valhall.

Procesor graficzny ARM Mali-G77 jest o 40% szybszy

ARM deklaruje znaczny wzrost wydajności graficznej Mali-G77 – o 40% w porównaniu do obecnej generacji Mali-G76. Osiągnięto to zarówno poprzez proces techniczny, jak i ulepszenia architektoniczne. Mali-G77 może mieć od 7 do 16 rdzeni (w przyszłości możliwe jest skalowanie od 1 do 32), a każdy z nich jest niemal tej samej wielkości co G76. W rezultacie smartfony z wyższej półki będą prawdopodobnie wyposażone w tę samą liczbę rdzeni GPU.

Procesor graficzny ARM Mali-G77 jest o 40% szybszy

Procesor graficzny ARM Mali-G77 jest o 40% szybszy

W grach można spodziewać się poprawy wydajności od 20 do 40%, w zależności od rodzaju obciążenia graficznego. Sądząc po wynikach popularnego testu Manhattan GFXBench, znaczna przewaga nowego procesora graficznego nad obecną generacją zmusi rywala Qualcomma do obaw o znaczną poprawę wydajności grafiki Adreno.

Procesor graficzny ARM Mali-G77 jest o 40% szybszy

Procesor graficzny ARM Mali-G77 jest o 40% szybszy

Sama nowa architektura Mali-G77 zapewnia średnio 30-procentową poprawę efektywności energetycznej lub wydajności, twierdzi ARM. Druga generacja skalarnej architektury ARM Valhall umożliwia procesorowi graficznemu wykonywanie 16 instrukcji na cykl równolegle na CU, w porównaniu do ośmiu w Bifrost (Mali-G76). Inne innowacje obejmują w pełni sterowane sprzętowo dynamiczne planowanie instrukcji i zupełnie nowy zestaw instrukcji przy jednoczesnym zachowaniu kompatybilności wstecznej z Bifrost. Dodano także obsługę formatu kompresji ARM AFBC1.3 i inne innowacje (cele renderowania FP16, renderowanie warstwowe i wyjścia modułu cieniującego wierzchołków).


Procesor graficzny ARM Mali-G77 jest o 40% szybszy

Procesor graficzny ARM Mali-G77 jest o 40% szybszy

Bifrost CU zawierał 3 silniki wykonawcze, z których każdy zawierał pamięć podręczną instrukcji, rejestr i jednostkę sterującą Warp. Dystrybucja między tymi trzema silnikami umożliwiła wykonanie 24 instrukcji FMA z 32-bitową precyzją zmiennoprzecinkową (FP32). W Valhall każda jednostka CU ma tylko jeden silnik wykonawczy, podzielony pomiędzy dwie jednostki obliczeniowe zdolne do przetwarzania 16 instrukcji Warp na zegar, co daje całkowitą przepustowość 32 instrukcji FMA FP32 na jednostkę CU. Dzięki tym zmianom architektonicznym Mali-G77 może wykonywać o jedną trzecią więcej obliczeń matematycznych w obliczeniach równoległych w porównaniu do Mali-G76.

Procesor graficzny ARM Mali-G77 jest o 40% szybszy

Procesor graficzny ARM Mali-G77 jest o 40% szybszy

Ponadto każda z tych jednostek CU zawiera dwa nowe bloki funkcji matematycznych. Nowy silnik konwersji (CVT) obsługuje podstawowe instrukcje dotyczące liczb całkowitych, logicznych, rozgałęzień i konwersji. Jednostka funkcji specjalnych (SFU) przyspiesza mnożenie, dzielenie, pierwiastkowanie kwadratowe, logarytmy i inne złożone funkcje całkowite.

Procesor graficzny ARM Mali-G77 jest o 40% szybszy

Procesor graficzny ARM Mali-G77 jest o 40% szybszy

Standardowy blok FMA ma kilka ustawień obsługujących 16 instrukcji FP32 na cykl, 32 dla FP16 lub 64 dla INT8 Dot Product. Te optymalizacje mogą zapewnić nawet 60% poprawę wydajności w aplikacjach uczenia maszynowego.

Procesor graficzny ARM Mali-G77 jest o 40% szybszy

Procesor graficzny ARM Mali-G77 jest o 40% szybszy

Kolejną kluczową zmianą w Mali-G77 jest podwojenie wydajności silnika tekstur, który teraz przetwarza 4 dwuliniowe teksele na zegar w porównaniu do poprzednich dwóch, 2 trójliniowe teksele na zegar, umożliwiając szybsze filtrowanie FP16 i FP32.

Procesor graficzny ARM Mali-G77 jest o 40% szybszy

Procesor graficzny ARM Mali-G77 jest o 40% szybszy

ARM wprowadził szereg innych zmian, przy czym Mali-G77 i Valhall obiecały znaczną poprawę wydajności w przypadku obciążeń związanych z grami i uczeniem maszynowym. Co ważne, pobór mocy i powierzchnia chipa są utrzymywane na poziomie Bifrost, co zapewnia urządzeniom mobilnym wyższą wydajność szczytową bez zwiększania zużycia energii, rozpraszania ciepła i wymagań dotyczących rozmiaru.



Źródło: 3dnews.ru

Dodaj komentarz