ARM prezentis novan potencan CPU-kernon - Cortex-A77

ARM rivelis sian lastan procesoran dezajnon, la Cortex-A77. Kiel la pasintjara Cortex-A76, ĉi tiu kerno estas desegnita por altnivelaj taskoj en inteligentaj telefonoj kaj ampleksa vario de aparatoj. En ĝi, la programisto celas pliigi la nombron da instrukcioj ekzekutitaj per horloĝo (IPC). Horloĝrapideco kaj elektrokonsumo restis proksimume ĉe la Cortex-A76-nivelo.

ARM prezentis novan potencan CPU-kernon - Cortex-A77

Nuntempe, ARM celas rapide pliigi la rendimenton de siaj kernoj. Laŭ siaj planoj, komencante kun la 73 Cortex-A2016 kaj ĝis la Hercules-dezajno de 2020, la kompanio intencas pliigi CPU-potencon je 2,5 fojojn. Jam la transiroj de 16 nm al 10 nm kaj poste al 7 nm ebligis pliigi la horloĝan frekvencon, kaj en kombinaĵo kun la arkitekturo Cortex-A75 kaj poste Cortex-A76, laŭ taksoj de ARM, 1,8-obla pliiĝo de rendimento estis atingita ĝis nun. Nun la kerno Cortex-A77 permesos, pro la pliiĝo de IPC, pliigi rendimenton je pliaj 20% je la sama horloĝa ofteco. Tio estas, 2,5-obla pliiĝo en 2020 fariĝas sufiĉe reala.

ARM prezentis novan potencan CPU-kernon - Cortex-A77

Malgraŭ la 20% pliiĝo en IPC, ARM taksas, ke la elektrokonsumo de la A77 ne pliiĝis. La kompromiso en ĉi tiu kazo estas, ke la A77-peceta areo estas proksimume 17% pli granda ol la A76 laŭ la samaj prilaboraj normoj. Kiel rezulto, la kosto de individua kerno pliiĝos iomete. Se ni komparas la atingojn de ARM kun industriaj gvidantoj, indas diri, ke AMD en Zen 2 atingis IPC-pliiĝon de 15% kompare kun Zen+, dum la IPC-valoro de Intel-kernoj restis proksimume la sama dum multaj jaroj.

ARM prezentis novan potencan CPU-kernon - Cortex-A77

La ekzekutfenestro por ŝanĝi la sekvencon de ordonoj (neorda fenestra grandeco) estis pliigita je 25%, al 160 unuoj, kio permesas al la kerno pliigi la paralelecon de kalkuloj. Eĉ la Cortex-A76 havis grandan Branch Target Buffer, kaj la Cortex-A77 pliigis ĝin je pliaj 33%, al 8 KB, kio permesas al la branĉa prognozunuo efike trakti la pliiĝon en la nombro da paralelaj instrukcioj.


ARM prezentis novan potencan CPU-kernon - Cortex-A77

Eĉ pli interesa novigo estas tute nova 1,5 KB-kaŝmemoro, kiu stokas makrooperaciojn (MOPojn) resenditajn de la malkoda modulo. La ARM-procesarkitekturo deĉifras instrukciojn de la uzantaplikaĵo en pli malgrandajn makrooperaciojn, kaj tiam malkonstruas ilin en mikrooperaciojn kiuj estas pasitaj al la ekzekutkerno. La MOP-kaŝmemoro kutimas redukti la efikon de sopiritaj branĉoj kaj fluoj ĉar makrooperacioj nun estas stokitaj en aparta bloko kaj ne postulas re-malkodigon - tiel pliigante totalan kerntrairon. En kelkaj laborkvantoj, la nova bloko estas ekstreme utila aldono al la norma instrukaĵkaŝmemoro.

ARM prezentis novan potencan CPU-kernon - Cortex-A77

ARM prezentis novan potencan CPU-kernon - Cortex-A77

Kvara ALU-bloko kaj dua branĉbloko estis aldonitaj al la ekzekutkerno. La kvara ALU pliigas la totalan procesoran trairon je 1,5 fojojn ebligante unuciklajn instrukciojn (kiel ekzemple ADD kaj SUB) kaj puŝ-tiri entjeroperaciojn kiel ekzemple multipliko. La aliaj du ALUoj povas nur pritrakti bazajn unuciklajn instrukciojn, dum la lasta bloko estas ŝarĝita kun pli kompleksaj matematikaj operacioj kiel ekzemple dividado, multobligi-akumuli, ktp. Dua branĉbloko ene de la ekzekutkerno duobligas la nombron da samtempaj branĉotransiroj la kerno povas pritrakti laboron, kio estas utila en kazoj kie du el la ses ordonoj senditaj rilatas al branĉotransiroj. Interna testado ĉe ARM montris rendimentajn avantaĝojn de uzado de ĉi tiu dua branĉo-bloko.

ARM prezentis novan potencan CPU-kernon - Cortex-A77

ARM prezentis novan potencan CPU-kernon - Cortex-A77

Aliaj kernaj ŝanĝoj inkluzivas la aldonon de dua AES-ĉifrada dukto, pliigita memorbendolarĝo, plibonigita venontgeneracia datuma antaŭprena motoro por plibonigi potenco-efikecon dum pliigo de la sistemo DRAM-traigo, kaŝmemoro-optimumoj kaj pli.

ARM prezentis novan potencan CPU-kernon - Cortex-A77

ARM prezentis novan potencan CPU-kernon - Cortex-A77

La plej grandaj gajnoj vidiĝas en la Cortex-A77 en entjeraj kaj glitkomaj operacioj. Ĉi tio estas subtenata de la internaj SPEC-remarkoj de ARM, kiuj montras rendimentajn gajnojn de 20% kaj 35% en operacioj en entjero kaj glitkoma, respektive. Pliboniĝoj de la larĝa bando de memoro estas ie en la intervalo de 15-20%. Ĝenerale, optimumigoj kaj ŝanĝoj al la A77 averaĝas 20-procentan pliiĝon en rendimento kompare kun la antaŭa generacio. Kun pli novaj teknologiaj normoj kiel 7nm ULV, ni povas akiri pliajn avantaĝojn en finaj blatoj.

ARM prezentis novan potencan CPU-kernon - Cortex-A77

ARM prezentis novan potencan CPU-kernon - Cortex-A77

ARM evoluigis la Cortex-A77 por funkcii en 4+4 big.LITTLE kombinaĵo (4 potencaj kernoj kaj 4 simplaj energiefikaj). Sed, konsiderante la pligrandigitan areon de la nova arkitekturo, multaj fabrikantoj, por ŝpari monon, povas enkonduki 1+3+4 aŭ 2+2+4 kombinaĵojn, kiuj jam estas aktive praktikataj, kie nur unu aŭ du kernoj estos. estu plenrajta, netranĉita A77.

ARM prezentis novan potencan CPU-kernon - Cortex-A77



fonto: 3dnews.ru

Aldoni komenton