Az ARM Mali-G77 GPU 40%-kal gyorsabb

Az új processzormaggal együtt Cortex-A77 Az ARM bemutatott egy grafikus processzort, amelyet a következő generációs mobil egychipes rendszerekhez terveztek. Mali-G77, amelyet nem szabad összetéveszteni az új kijelző processzorral Mali-D77, jelzi az átmenetet az ARM Bifrost architektúráról a Valhallra.

Az ARM Mali-G77 GPU 40%-kal gyorsabb

Az ARM jelentős növekedést jelent a Mali-G77 grafikus teljesítményében - 40%-kal a Mali-G76 jelenlegi generációjához képest. Ezt mind a műszaki eljárással, mind az építészeti fejlesztésekkel sikerült elérni. A Mali-G77 7-16 magos lehet (a jövőben 1-től 32-ig skálázható), és mindegyik majdnem akkora, mint a G76. Következésképpen a csúcskategóriás okostelefonok valószínűleg ugyanannyi GPU magot tartalmaznak majd.

Az ARM Mali-G77 GPU 40%-kal gyorsabb

Az ARM Mali-G77 GPU 40%-kal gyorsabb

A játékokban a grafikus terhelés típusától függően 20 és 40% közötti teljesítményjavulásra számíthatunk. A népszerű Manhattan GFXBench teszt eredményei alapján az új GPU jelentős fölénye a jelenlegi generációval szemben arra kényszeríti a rivális Qualcommot, hogy aggódjon az Adreno grafikus teljesítményének jelentős javulása miatt.

Az ARM Mali-G77 GPU 40%-kal gyorsabb

Az ARM Mali-G77 GPU 40%-kal gyorsabb

Az ARM szerint az új Mali-G77 architektúra önmagában átlagosan 30 százalékkal javítja az energiahatékonyságot vagy a teljesítményt. Az ARM Valhall skalárarchitektúra második generációja lehetővé teszi, hogy a GPU ciklusonként 16 utasítást hajtson végre párhuzamosan a CU-n, míg a Bifrost (Mali-G76) nyolc utasítása. Az egyéb újítások közé tartozik a teljesen hardvervezérelt dinamikus utasításütemezés és egy teljesen új utasításkészlet, miközben megőrzi a visszafelé kompatibilitást a Bifrosttal. Az ARM AFBC1.3 tömörítési formátum és más újítások (FP16 renderelési célok, réteges renderelés és vertex shader kimenetek) támogatása is hozzáadásra került.


Az ARM Mali-G77 GPU 40%-kal gyorsabb

Az ARM Mali-G77 GPU 40%-kal gyorsabb

A Bifrost CU 3 végrehajtó motort tartalmazott, amelyek mindegyike tartalmazott egy utasítás-gyorsítótárat, egy regisztert és egy Warp vezérlőegységet. A három motor közötti elosztás lehetővé tette 24 FMA utasítás végrehajtását 32 bites lebegőpontos pontossággal (FP32). A Valhallban minden CU-nak csak egy végrehajtó motorja van, amely két számítási egység között van felosztva, amelyek óránként 16 Warp utasítást képesek feldolgozni, ami CU-nként 32 FMA FP32 utasítás teljes átvitelét eredményezi. Ezeknek az építészeti változtatásoknak köszönhetően a Mali-G77 egyharmadával több matematikai számítást tud végrehajtani párhuzamos számításokban, mint a Mali-G76.

Az ARM Mali-G77 GPU 40%-kal gyorsabb

Az ARM Mali-G77 GPU 40%-kal gyorsabb

Ezenkívül mindegyik CU két új matematikai funkcióblokkot tartalmaz. Az új konverziós motor (CVT) alapvető egész, logikai, elágazási és konverziós utasításokat kezel. A speciális függvényegység (SFU) felgyorsítja az egész számok szorzását, osztását, négyzetgyökét, logaritmusát és más összetett egész függvényeket.

Az ARM Mali-G77 GPU 40%-kal gyorsabb

Az ARM Mali-G77 GPU 40%-kal gyorsabb

A szabványos FMA blokk számos beállítást tartalmaz, amelyek ciklusonként 16 FP32 utasítást támogatnak, FP32 esetén 16 vagy INT64 Dot Product esetén 8 utasítást. Ezek az optimalizálások akár 60%-os teljesítménynövekedést is biztosíthatnak a gépi tanulási alkalmazásokban.

Az ARM Mali-G77 GPU 40%-kal gyorsabb

Az ARM Mali-G77 GPU 40%-kal gyorsabb

A Mali-G77 másik fontos változása a textúramotor teljesítményének megduplázódása, amely immár 4 bilineáris texelt dolgoz fel órajelenként az előző kettőhöz képest, órajelenként 2 trilineáris texelt, ami gyorsabb FP16 és FP32 szűrést tesz lehetővé.

Az ARM Mali-G77 GPU 40%-kal gyorsabb

Az ARM Mali-G77 GPU 40%-kal gyorsabb

Az ARM számos más változtatást is végrehajtott, a Mali-G77 és a Valhall jelentős teljesítményjavítást ígért a játékok és a gépi tanulás terhelése terén. Fontos, hogy az energiafogyasztás és a chip terület a Bifrost szinten marad, ami nagyobb csúcsteljesítményt ígér a mobileszközöknek, anélkül, hogy növelné az energiafogyasztást, a hőelvezetést és a méretigényt.



Forrás: 3dnews.ru

Hozzászólás