Wraz z nowym rdzeniem procesora
ARM deklaruje znaczny wzrost wydajności graficznej Mali-G77 – o 40% w porównaniu do obecnej generacji Mali-G76. Osiągnięto to zarówno poprzez proces techniczny, jak i ulepszenia architektoniczne. Mali-G77 może mieć od 7 do 16 rdzeni (w przyszłości możliwe jest skalowanie od 1 do 32), a każdy z nich jest niemal tej samej wielkości co G76. W rezultacie smartfony z wyższej półki będą prawdopodobnie wyposażone w tę samą liczbę rdzeni GPU.
W grach można spodziewać się poprawy wydajności od 20 do 40%, w zależności od rodzaju obciążenia graficznego. Sądząc po wynikach popularnego testu Manhattan GFXBench, znaczna przewaga nowego procesora graficznego nad obecną generacją zmusi rywala Qualcomma do obaw o znaczną poprawę wydajności grafiki Adreno.
Sama nowa architektura Mali-G77 zapewnia średnio 30-procentową poprawę efektywności energetycznej lub wydajności, twierdzi ARM. Druga generacja skalarnej architektury ARM Valhall umożliwia procesorowi graficznemu wykonywanie 16 instrukcji na cykl równolegle na CU, w porównaniu do ośmiu w Bifrost (Mali-G76). Inne innowacje obejmują w pełni sterowane sprzętowo dynamiczne planowanie instrukcji i zupełnie nowy zestaw instrukcji przy jednoczesnym zachowaniu kompatybilności wstecznej z Bifrost. Dodano także obsługę formatu kompresji ARM AFBC1.3 i inne innowacje (cele renderowania FP16, renderowanie warstwowe i wyjścia modułu cieniującego wierzchołków).
Bifrost CU zawierał 3 silniki wykonawcze, z których każdy zawierał pamięć podręczną instrukcji, rejestr i jednostkę sterującą Warp. Dystrybucja między tymi trzema silnikami umożliwiła wykonanie 24 instrukcji FMA z 32-bitową precyzją zmiennoprzecinkową (FP32). W Valhall każda jednostka CU ma tylko jeden silnik wykonawczy, podzielony pomiędzy dwie jednostki obliczeniowe zdolne do przetwarzania 16 instrukcji Warp na zegar, co daje całkowitą przepustowość 32 instrukcji FMA FP32 na jednostkę CU. Dzięki tym zmianom architektonicznym Mali-G77 może wykonywać o jedną trzecią więcej obliczeń matematycznych w obliczeniach równoległych w porównaniu do Mali-G76.
Ponadto każda z tych jednostek CU zawiera dwa nowe bloki funkcji matematycznych. Nowy silnik konwersji (CVT) obsługuje podstawowe instrukcje dotyczące liczb całkowitych, logicznych, rozgałęzień i konwersji. Jednostka funkcji specjalnych (SFU) przyspiesza mnożenie, dzielenie, pierwiastkowanie kwadratowe, logarytmy i inne złożone funkcje całkowite.
Standardowy blok FMA ma kilka ustawień obsługujących 16 instrukcji FP32 na cykl, 32 dla FP16 lub 64 dla INT8 Dot Product. Te optymalizacje mogą zapewnić nawet 60% poprawę wydajności w aplikacjach uczenia maszynowego.
Kolejną kluczową zmianą w Mali-G77 jest podwojenie wydajności silnika tekstur, który teraz przetwarza 4 dwuliniowe teksele na zegar w porównaniu do poprzednich dwóch, 2 trójliniowe teksele na zegar, umożliwiając szybsze filtrowanie FP16 i FP32.
ARM wprowadził szereg innych zmian, przy czym Mali-G77 i Valhall obiecały znaczną poprawę wydajności w przypadku obciążeń związanych z grami i uczeniem maszynowym. Co ważne, pobór mocy i powierzchnia chipa są utrzymywane na poziomie Bifrost, co zapewnia urządzeniom mobilnym wyższą wydajność szczytową bez zwiększania zużycia energii, rozpraszania ciepła i wymagań dotyczących rozmiaru.
Źródło: 3dnews.ru