ARM je predstavio svoj najnoviji dizajn procesora, Cortex-A77. Kao i prošlogodišnji Cortex-A76, ova je jezgra dizajnirana za vrhunske zadatke u pametnim telefonima i velikom broju uređaja. U njemu programer ima za cilj povećati broj instrukcija koje se izvode po taktu (IPC). Radni takt i potrošnja energije ostali su približno na razini Cortex-A76.
Trenutačno ARM ima za cilj brzo povećati performanse svojih jezgri. Prema svojim planovima, počevši od Cortex-A73 iz 2016. pa sve do dizajna Hercules iz 2020., tvrtka namjerava povećati snagu CPU-a za 2,5 puta. Već su prijelazi sa 16 nm na 10 nm i potom na 7 nm omogućili povećanje taktne frekvencije, au kombinaciji s arhitekturom Cortex-A75, a potom i Cortex-A76, prema procjenama ARM-a, povećanje performansi od 1,8 puta. je do danas postignuto. Sada će jezgra Cortex-A77 omogućiti, zbog povećanja IPC-a, povećanje performansi za dodatnih 20% na istoj frekvenciji takta. Odnosno, povećanje od 2,5 puta u 2020. postaje sasvim realno.
Unatoč povećanju IPC-a od 20%, ARM procjenjuje da se potrošnja energije A77 nije povećala. Kompromis u ovom slučaju je da je površina čipa A77 približno 17% veća od A76 pri istim standardima obrade. Kao rezultat toga, trošak pojedinačne jezgre malo će se povećati. Usporedimo li ARM-ova postignuća s vodećima u industriji, vrijedi reći da je AMD u Zen 2 postigao povećanje IPC-a od 15% u usporedbi sa Zen+, dok je IPC vrijednost Intelovih jezgri ostala približno ista već dugi niz godina.
Prozor izvršenja za promjenu redoslijeda naredbi (veličina prozora izvan reda) povećan je za 25%, na 160 jedinica, što omogućuje kernelu povećanje paralelizma izračuna. Čak je i Cortex-A76 imao veliki Branch Target Buffer, a Cortex-A77 ga je povećao za dodatnih 33%, na 8 KB, što omogućuje jedinici za predviđanje grananja da se učinkovito nosi s povećanjem broja paralelnih instrukcija.
Još zanimljivija inovacija je potpuno nova predmemorija od 1,5 KB koja pohranjuje makro operacije (MOP) vraćene iz modula za dekodiranje. Arhitektura ARM procesora dekodira upute iz korisničke aplikacije u manje makrooperacije, a zatim ih rastavlja na mikrooperacije koje se prosljeđuju izvršnoj jezgri. MOP predmemorija koristi se za smanjenje utjecaja propuštenih grananja i ispiranja jer su makro operacije sada pohranjene u zasebnom bloku i ne zahtijevaju ponovno dekodiranje - čime se povećava ukupna propusnost jezgre. U nekim je radnim opterećenjima novi blok izuzetno koristan dodatak standardnoj predmemorij instrukcija.
Četvrti ALU blok i drugi blok grane dodani su izvršnoj jezgri. Četvrti ALU povećava ukupnu propusnost procesora za 1,5 puta omogućavajući jednociklične instrukcije (kao što su ADD i SUB) i push-pull cjelobrojne operacije kao što je množenje. Druga dva ALU-a mogu rukovati samo osnovnim uputama od jednog ciklusa, dok je zadnji blok napunjen složenijim matematičkim operacijama kao što su dijeljenje, množenje-akumulacija, itd. Drugi blok grananja unutar izvršne jezgre udvostručuje broj istodobnih prijelaza grananja core može podnijeti posao, što je korisno u slučajevima kada se dvije od šest poslanih naredbi odnose na prijelaze grana. Interno testiranje u ARM-u pokazalo je prednosti izvedbe od korištenja ovog drugog bloka grane.
Ostale promjene kernela uključuju dodavanje drugog cjevovoda za AES enkripciju, povećanu propusnost memorije, poboljšani mehanizam za prethodno dohvaćanje podataka sljedeće generacije za poboljšanje energetske učinkovitosti uz povećanje propusnosti DRAM-a sustava, optimizacije predmemorije i više.
Najveći dobici vidljivi su u Cortex-A77 u operacijama s cijelim brojevima i pomičnim zarezom. To je podržano ARM-ovim internim SPEC mjerilima, koja pokazuju povećanje performansi od 20% odnosno 35% u operacijama s cijelim brojevima i operacijama s pomičnim zarezom. Poboljšanja propusnosti memorije su negdje u rasponu od 15-20%. Općenito, optimizacije i promjene na A77 u prosjeku dovode do povećanja performansi od 20 posto u usporedbi s prethodnom generacijom. S novijim tehnološkim normama kao što je 7nm ULV, možemo dobiti dodatne prednosti u konačnim čipovima.
ARM je razvio Cortex-A77 za rad u kombinaciji 4+4 big.LITTLE (4 snažne jezgre i 4 jednostavne energetski učinkovite). No, s obzirom na povećanu površinu nove arhitekture, mnogi proizvođači, radi uštede, mogu uvesti 1+3+4 ili 2+2+4 kombinacije, koje se već aktivno prakticiraju, gdje će samo jedna ili dvije jezgre biti punopravan, neobrezan A77.
Izvor: 3dnews.ru