Mae ARM wedi datgelu ei ddyluniad prosesydd diweddaraf, y Cortex-A77. Fel Cortex-A76 y llynedd, mae'r craidd hwn wedi'i gynllunio ar gyfer tasgau pen uchel mewn ffonau smart ac amrywiaeth eang o ddyfeisiau. Ynddo, nod y datblygwr yw cynyddu nifer y cyfarwyddiadau a weithredir fesul cloc (IPC). Arhosodd cyflymder cloc a defnydd pŵer tua'r lefel Cortex-A76.
Ar hyn o bryd, nod ARM yw cynyddu perfformiad ei greiddiau yn gyflym. Yn ôl ei gynlluniau, gan ddechrau gyda'r 73 Cortex-A2016 a hyd at ddyluniad Hercules 2020, mae'r cwmni'n bwriadu cynyddu pŵer CPU 2,5 gwaith. Eisoes roedd y trawsnewidiadau o 16 nm i 10 nm ac yna i 7 nm yn ei gwneud hi'n bosibl cynyddu amlder y cloc, ac ar y cyd â phensaernïaeth Cortex-A75 ac yna Cortex-A76, yn ôl amcangyfrifon ARM, cynnydd o 1,8 gwaith yn fwy mewn perfformiad wedi ei gyflawni hyd yma. Nawr bydd y craidd Cortex-A77 yn caniatáu, oherwydd y cynnydd mewn IPC, gynyddu perfformiad 20% arall ar yr un amledd cloc. Hynny yw, mae cynnydd o 2,5 gwaith yn fwy yn 2020 yn dod yn eithaf real.
Er gwaethaf y cynnydd o 20% mewn IPC, mae ARM yn amcangyfrif nad yw defnydd pŵer yr A77 wedi cynyddu. Y cyfaddawd yn yr achos hwn yw bod ardal sglodion yr A77 tua 17% yn fwy na'r A76 ar yr un safonau prosesu. O ganlyniad, bydd cost craidd unigol yn cynyddu ychydig. Os byddwn yn cymharu cyflawniadau ARM ag arweinwyr diwydiant, mae'n werth dweud bod AMD yn Zen 2 wedi cyflawni cynnydd IPC o 15% o'i gymharu â Zen +, tra bod gwerth IPC creiddiau Intel wedi aros tua'r un peth ers blynyddoedd lawer.
Mae'r ffenestr weithredu ar gyfer newid y dilyniant o orchmynion (maint ffenestr allan-o-archeb) wedi'i chynyddu 25%, i 160 o unedau, sy'n caniatáu i'r cnewyllyn gynyddu cyfochrogiaeth cyfrifiadau. Roedd gan hyd yn oed y Cortex-A76 Byffer Targed Cangen mawr, a chynyddodd y Cortex-A77 33% arall, i 8 KB, sy'n caniatáu i'r uned rhagfynegi cangen ymdopi'n effeithiol â'r cynnydd yn nifer y cyfarwyddiadau cyfochrog.
Mae arloesedd hyd yn oed yn fwy diddorol yn storfa 1,5 KB hollol newydd sy'n storio gweithrediadau macro (MOPs) a ddychwelwyd o'r modiwl datgodio. Mae pensaernïaeth prosesydd ARM yn dadgodio cyfarwyddiadau o raglen y defnyddiwr yn weithrediadau macro llai, ac yna'n eu torri i lawr yn ficro-weithrediadau sy'n cael eu trosglwyddo i'r craidd gweithredu. Defnyddir y storfa MOP i leihau effaith canghennau a llaciau a gollwyd oherwydd bod gweithrediadau macro bellach yn cael eu storio mewn bloc ar wahân ac nid oes angen eu hail-ddadgodio - a thrwy hynny gynyddu trwybwn craidd cyffredinol. Mewn rhai llwythi gwaith, mae'r bloc newydd yn ychwanegiad hynod ddefnyddiol i'r storfa gyfarwyddiadau safonol.
Mae pedwerydd bloc ALU ac ail floc cangen wedi'u hychwanegu at y craidd gweithredu. Mae'r pedwerydd ALU yn cynyddu trwybwn cyffredinol y prosesydd 1,5 gwaith trwy alluogi cyfarwyddiadau un cylch (fel ADD ac SUB) a gweithrediadau cyfanrif gwthio-tynnu fel lluosi. Gall y ddau ALU arall drin cyfarwyddiadau un-gylch sylfaenol yn unig, tra bod y bloc olaf yn cael ei lwytho â gweithrediadau mathemateg mwy cymhleth megis rhannu, lluosi-gronni, ac ati Mae ail floc cangen o fewn y craidd gweithredu yn dyblu nifer y trawsnewidiadau cangen cydamserol y Gall craidd drin gwaith, sy'n ddefnyddiol mewn achosion lle mae dau o'r chwe gorchymyn a anfonwyd yn ymwneud â thrawsnewidiadau cangen. Mae profion mewnol yn ARM wedi dangos buddion perfformiad o ddefnyddio'r ail floc cangen hwn.
Mae newidiadau cnewyllyn eraill yn cynnwys ychwanegu ail biblinell amgryptio AES, lled band cof uwch, gwell injan rhagosod data cenhedlaeth nesaf i wella effeithlonrwydd pŵer wrth gynyddu trwybwn system DRAM, optimeiddio storfa, a mwy.
Gwelir yr enillion mwyaf yn y Cortex-A77 mewn gweithrediadau cyfanrif a phwynt arnawf. Cefnogir hyn gan feincnodau SPEC mewnol ARM, sy'n dangos enillion perfformiad o 20% a 35% mewn gweithrediadau cyfanrif a gweithrediadau pwynt arnawf, yn y drefn honno. Mae gwelliannau lled band cof rhywle yn yr ystod 15-20%. Yn gyffredinol, mae optimeiddio a newidiadau i'r A77 ar gyfartaledd yn gynnydd o 20 y cant mewn perfformiad o gymharu â'r genhedlaeth flaenorol. Gyda normau technoleg mwy newydd fel 7nm ULV, gallwn gael buddion ychwanegol mewn sglodion terfynol.
Datblygodd ARM y Cortex-A77 i weithio mewn cyfuniad 4+4 big.LITTLE (4 craidd pwerus a 4 craidd ynni-effeithlon syml). Ond, o ystyried maes cynyddol y bensaernïaeth newydd, gall llawer o weithgynhyrchwyr, er mwyn arbed arian, gyflwyno cyfuniadau 1+3+4 neu 2+2+4, sydd eisoes yn cael eu hymarfer yn weithredol, lle mai dim ond un neu ddau graidd fydd. bod yn llawn, heb ei dorri A77.
Ffynhonnell: 3dnewyddion.ru