ARM esitteli uuden tehokkaan CPU-ytimen - Cortex-A77

ARM on julkistanut uusimman prosessorimallinsa, Cortex-A77:n. Kuten viime vuoden Cortex-A76, tämä ydin on suunniteltu älypuhelimien ja monenlaisten laitteiden huippuluokan tehtäviin. Siinä kehittäjä pyrkii lisäämään sykliä kohden suoritettavien käskyjen määrää (IPC). Kellotaajuudet ja virrankulutus pysyivät suunnilleen Cortex-A76:n tasolla.

ARM esitteli uuden tehokkaan CPU-ytimen - Cortex-A77

Tällä hetkellä ARM pyrkii nopeasti lisäämään ytimiensä suorituskykyä. Suunnitelmiensa mukaan, vuoden 73 Cortex-A2016:sta ja vuoden 2020 Hercules-suunnitteluun asti, yritys aikoo lisätä suorittimen tehoa 2,5-kertaiseksi. Jo siirtymät 16 nm:stä 10 nm:iin ja sitten 7 nm:iin mahdollistivat kellotaajuuden lisäämisen, ja yhdessä Cortex-A75- ja sitten Cortex-A76-arkkitehtuurin kanssa ARM-arvioiden mukaan suorituskyky on kasvanut 1,8-kertaiseksi. saavutettu tähän mennessä. Nyt Cortex-A77-ydin mahdollistaa IPC:n kasvun ansiosta lisätä suorituskykyä vielä 20% samalla kellotaajuudella. Eli 2,5-kertainen kasvu vuonna 2020 on tulossa varsin todelliseksi.

ARM esitteli uuden tehokkaan CPU-ytimen - Cortex-A77

Huolimatta 20 % IPC:n kasvusta, ARM arvioi, että A77:n virrankulutus ei ole kasvanut. Kompromissi tässä tapauksessa on, että A77:n suulakepinta-ala on noin 17 % suurempi kuin A76 samoilla prosessinopeuksilla. Tämän seurauksena yhden ytimen hinta nousee hieman. Jos verrataan ARM:n saavutusta alan johtajiin, on syytä sanoa, että AMD Zen 2:ssa saavutti 15%:n lisäyksen IPC:ssä verrattuna Zen +:aan, ja Intel-ytimien IPC-arvo on pysynyt monille suunnilleen samalla tasolla. vuotta.

ARM esitteli uuden tehokkaan CPU-ytimen - Cortex-A77

Suoritusikkunaa, jossa komentojen järjestystä muutetaan (poikkeava ikkunan koko), kasvatetaan 25%, jopa 160 yksikköön, mikä antaa ytimelle mahdollisuuden lisätä laskelmien rinnakkaisuutta. Jopa Cortex-A76:ssa oli suuri Branch Target -puskuri, ja Cortex-A77:ssä sitä nostettiin vielä 33 %:lla 8 kilotavuun, mikä antaa haaran ennustuslohkon selviytyä tehokkaasti rinnakkaisten käskyjen määrän kasvusta.


ARM esitteli uuden tehokkaan CPU-ytimen - Cortex-A77

Vielä mielenkiintoisempi on täysin uusi 1,5 kt:n välimuisti, joka tallentaa dekoodausmoduulista palautetut makrotoiminnot (MOPs). ARM-prosessoriarkkitehtuuri purkaa käyttäjäsovelluksen ohjeet pienemmiksi makrooperaatioiksi ja jakaa ne sitten mikrooperaatioiksi, jotka välitetään suoritusytimeen. MOP-välimuistia käytetään vähentämään ohitettujen haarojen ja huuhtelujen vaikutusta, koska makrotoiminnot on nyt tallennettu erilliseen lohkoon eivätkä vaadi uudelleenkoodausta - mikä lisää ytimen kokonaiskapasiteettia. Joissakin työkuormissa uusi lohko on erittäin hyödyllinen lisäys vakiokäskyvälimuistiin.

ARM esitteli uuden tehokkaan CPU-ytimen - Cortex-A77

ARM esitteli uuden tehokkaan CPU-ytimen - Cortex-A77

Neljäs ALU-lohko ja toinen haarautumislohko on lisätty suoritusytimeen. Neljäs ALU lisää prosessorin kokonaissuorituskykyä 1,5-kertaisesti, koska se pystyy suorittamaan yksijaksoisia käskyjä (kuten ADD ja SUB) ja kaksijaksoisia kokonaislukutoimintoja, kuten kertolaskua. Kaksi muuta ALU:ta voivat käsitellä vain perus yhden syklin käskyjä, kun taas viimeinen lohko on ladattu monimutkaisemmilla matemaattisilla operaatioilla, kuten jako, kerto-keräys jne. Toinen haarayksikkö suoritusytimen sisällä kaksinkertaistaa samanaikaisten haarasiirtojen määrän. core voi käsitellä.työtä, mikä on hyödyllistä tapauksissa, joissa kaksi kuudesta lähetetystä komennosta on haarasiirtoja. ARM:n sisäinen testaus on osoittanut suorituskyvyn hyödyn tämän toisen hyppylohkon käytöstä.

ARM esitteli uuden tehokkaan CPU-ytimen - Cortex-A77

ARM esitteli uuden tehokkaan CPU-ytimen - Cortex-A77

Muita keskeisiä muutoksia ovat toisen AES-salausputkilinjan lisääminen, lisätty muistin kaistanleveys, parannettu seuraavan sukupolven tietojen esihaku tehokkuuden parantamiseksi ja samalla DRAM-järjestelmän suorituskyvyn lisääminen, välimuistin optimointi ja paljon muuta.

ARM esitteli uuden tehokkaan CPU-ytimen - Cortex-A77

ARM esitteli uuden tehokkaan CPU-ytimen - Cortex-A77

Suurin kasvu on havaittu Cortex-A77:ssä kokonaislukuoperaatioissa ja liukulukuissa. Tätä tukevat ARM:n sisäiset testit SPEC:ssä, jotka osoittivat 20 %:n ja 35 %:n suorituskyvyn parannuksia kokonaisluku- ja liukulukuoperaatioissa. Muistin kaistanleveyden parannukset ovat jossain 15-20 % alueella. Kaiken kaikkiaan A77:n optimoinnit ja muutokset parantavat suorituskykyä keskimäärin 20 prosenttia edelliseen sukupolveen verrattuna. Uudemmilla teknologiastandardeilla, kuten 7nm ULV, voimme saada lisäetuja lopullisissa siruissa.

ARM esitteli uuden tehokkaan CPU-ytimen - Cortex-A77

ARM esitteli uuden tehokkaan CPU-ytimen - Cortex-A77

ARM suunnitteli Cortex-A77:n toimimaan 4+4 big.LITTLE -paketissa (4 tehokasta ydintä ja 4 yksinkertaista energiatehokasta). Mutta kun otetaan huomioon uuden arkkitehtuurin lisääntynyt pinta-ala, monet valmistajat voivat säästääkseen ottaa käyttöön 1 + 3 + 4 tai 2 + 2 + 4 -nippuja, joita käytetään jo aktiivisesti, joissa vain yksi tai kaksi ydintä tulee olemaan täysimittainen leikkaamaton A77.

ARM esitteli uuden tehokkaan CPU-ytimen - Cortex-A77



Lähde: 3dnews.ru

Lisää kommentti