ARM introduceerde een nieuwe krachtige CPU-kern: Cortex-A77

ARM heeft zijn nieuwste processorontwerp onthuld, de Cortex-A77. Net als de Cortex-A76 van vorig jaar is deze kern ontworpen voor geavanceerde taken in smartphones en een grote verscheidenheid aan apparaten. Daarin wil de ontwikkelaar het aantal uitgevoerde instructies per klok (IPC) vergroten. Kloksnelheden en energieverbruik bleven ongeveer op het Cortex-A76-niveau.

ARM introduceerde een nieuwe krachtige CPU-kern: Cortex-A77

Momenteel streeft ARM ernaar de prestaties van zijn kernen snel te verbeteren. Volgens zijn plannen, te beginnen met de Cortex-A73 uit 2016 en tot aan het Hercules-ontwerp uit 2020, is het bedrijf van plan het CPU-vermogen 2,5 keer te vergroten. De overgangen van 16 nm naar 10 nm en vervolgens naar 7 nm maakten het al mogelijk om de klokfrequentie te verhogen, en in combinatie met de Cortex-A75 en vervolgens Cortex-A76-architectuur, volgens ARM-schattingen, een 1,8-voudige prestatieverbetering tot nu toe is bereikt. Nu zal de Cortex-A77-kern, dankzij de toename van de IPC, de prestaties met nog eens 20% kunnen verhogen bij dezelfde klokfrequentie. Dat wil zeggen dat een 2,5-voudige stijging in 2020 heel reëel wordt.

ARM introduceerde een nieuwe krachtige CPU-kern: Cortex-A77

Ondanks de stijging van de IPC met 20% schat ARM dat het stroomverbruik van de A77 niet is toegenomen. De wisselwerking in dit geval is dat het A77-chipoppervlak ongeveer 17% groter is dan de A76 bij dezelfde verwerkingsstandaarden. Als gevolg hiervan zullen de kosten van een individuele kern licht stijgen. Als we de prestaties van ARM vergelijken met marktleiders, is het de moeite waard om te zeggen dat AMD in Zen 2 een IPC-stijging van 15% behaalde in vergelijking met Zen+, terwijl de IPC-waarde van Intel-cores al jaren ongeveer hetzelfde is gebleven.

ARM introduceerde een nieuwe krachtige CPU-kern: Cortex-A77

Het uitvoeringsvenster voor het wijzigen van de volgorde van opdrachten (venstergrootte buiten de juiste volgorde) is met 25% vergroot tot 160 eenheden, waardoor de kernel de parallelliteit van berekeningen kan vergroten. Zelfs de Cortex-A76 had een grote Branch Target Buffer, en de Cortex-A77 verhoogde deze met nog eens 33% tot 8 KB, waardoor de branch-voorspellingseenheid effectief om kon gaan met de toename van het aantal parallelle instructies.


ARM introduceerde een nieuwe krachtige CPU-kern: Cortex-A77

Een nog interessantere innovatie is een volledig nieuwe cache van 1,5 KB waarin macrobewerkingen (MOP's) worden opgeslagen die door de decoderingsmodule worden geretourneerd. De ARM-processorarchitectuur decodeert instructies uit de gebruikersapplicatie in kleinere macrobewerkingen en splitst ze vervolgens op in microbewerkingen die worden doorgegeven aan de uitvoeringskern. De MOP-cache wordt gebruikt om de impact van gemiste vertakkingen en opruimingen te verminderen, omdat macrobewerkingen nu in een apart blok worden opgeslagen en niet opnieuw hoeven te worden gedecodeerd, waardoor de algehele kerndoorvoer toeneemt. Bij sommige workloads is het nieuwe blok een uiterst nuttige aanvulling op de standaard instructiecache.

ARM introduceerde een nieuwe krachtige CPU-kern: Cortex-A77

ARM introduceerde een nieuwe krachtige CPU-kern: Cortex-A77

Aan de uitvoeringskern zijn een vierde ALU-blok en een tweede vertakkingsblok toegevoegd. De vierde ALU verhoogt de algehele verwerkingscapaciteit van de processor met 1,5 keer door instructies met één cyclus (zoals ADD en SUB) en push-pull integer-bewerkingen zoals vermenigvuldiging mogelijk te maken. De andere twee ALU's kunnen alleen basisinstructies van één cyclus verwerken, terwijl het laatste blok is geladen met complexere wiskundige bewerkingen zoals delen, vermenigvuldigen-accumuleren, enz. Een tweede vertakkingsblok binnen de uitvoeringskern verdubbelt het aantal gelijktijdige vertakkingsovergangen. core kan werk afhandelen, wat handig is in gevallen waarin twee van de zes verzonden commando's betrekking hebben op vertakkingsovergangen. Interne tests bij ARM hebben prestatievoordelen aangetoond door het gebruik van dit tweede vertakkingsblok.

ARM introduceerde een nieuwe krachtige CPU-kern: Cortex-A77

ARM introduceerde een nieuwe krachtige CPU-kern: Cortex-A77

Andere kernelwijzigingen zijn onder meer de toevoeging van een tweede AES-versleutelingspijplijn, grotere geheugenbandbreedte, een verbeterde data-prefetch-engine van de volgende generatie om de energie-efficiëntie te verbeteren en tegelijkertijd de DRAM-doorvoer van het systeem te vergroten, cache-optimalisaties en meer.

ARM introduceerde een nieuwe krachtige CPU-kern: Cortex-A77

ARM introduceerde een nieuwe krachtige CPU-kern: Cortex-A77

De grootste winst wordt geboekt bij de Cortex-A77 bij integer- en floating-point-operaties. Dit wordt ondersteund door de interne SPEC-benchmarks van ARM, die prestatiewinsten laten zien van respectievelijk 20% en 35% bij integer- en floating-point-bewerkingen. Verbeteringen in de geheugenbandbreedte liggen ergens tussen de 15 en 20%. Over het geheel genomen zorgen optimalisaties en wijzigingen aan de A77 voor een gemiddelde prestatieverbetering van 20 procent vergeleken met de vorige generatie. Met nieuwere technologienormen zoals 7nm ULV kunnen we extra voordelen behalen in de uiteindelijke chips.

ARM introduceerde een nieuwe krachtige CPU-kern: Cortex-A77

ARM introduceerde een nieuwe krachtige CPU-kern: Cortex-A77

ARM heeft de Cortex-A77 ontwikkeld om te werken in een 4+4 big.LITTLE-combinatie (4 krachtige kernen en 4 eenvoudige energiezuinige kernen). Maar gezien het grotere gebied van de nieuwe architectuur kunnen veel fabrikanten, om geld te besparen, 1+3+4 of 2+2+4 combinaties introduceren, die al actief worden toegepast, waarbij slechts één of twee kernen dat zullen doen wees een volwaardige, ongesneden A77.

ARM introduceerde een nieuwe krachtige CPU-kern: Cortex-A77



Bron: 3dnews.ru

Voeg een reactie