ARM wprowadził nowy, mocny rdzeń procesora - Cortex-A77

ARM zaprezentował swój najnowszy projekt procesora, Cortex-A77. Podobnie jak ubiegłoroczny Cortex-A76, rdzeń ten jest przeznaczony do zaawansowanych zadań w smartfonach i szerokiej gamie urządzeń. W nim deweloper ma na celu zwiększenie liczby instrukcji wykonywanych na zegar (IPC). Prędkości zegara i zużycie energii pozostały w przybliżeniu na poziomie Cortex-A76.

ARM wprowadził nowy, mocny rdzeń procesora - Cortex-A77

Obecnie ARM stawia sobie za cel szybkie zwiększenie wydajności swoich rdzeni. Według swoich planów, począwszy od Cortex-A73 z 2016 r., a skończywszy na konstrukcji Hercules z 2020 r., firma zamierza zwiększyć moc procesora 2,5-krotnie. Już przejścia z 16 nm na 10 nm, a następnie na 7 nm umożliwiły zwiększenie częstotliwości taktowania, a w połączeniu z architekturą Cortex-A75, a następnie Cortex-A76, według szacunków ARM, 1,8-krotny wzrost wydajności zostało osiągnięte do chwili obecnej. Teraz rdzeń Cortex-A77 pozwoli, dzięki wzrostowi IPC, zwiększyć wydajność o kolejne 20% przy tej samej częstotliwości taktowania. Oznacza to, że 2,5-krotny wzrost w 2020 r. staje się całkiem realny.

ARM wprowadził nowy, mocny rdzeń procesora - Cortex-A77

Pomimo 20% wzrostu IPC, ARM szacuje, że zużycie energii przez A77 nie wzrosło. Kompromisem w tym przypadku jest to, że obszar chipa A77 jest o około 17% większy niż A76 przy tych samych standardach przetwarzania. W rezultacie koszt pojedynczego rdzenia nieznacznie wzrośnie. Jeśli porównamy osiągnięcia ARM z liderami branży, warto stwierdzić, że AMD w Zen 2 osiągnęło wzrost IPC o 15% w porównaniu do Zen+, podczas gdy wartość IPC rdzeni Intela utrzymuje się w przybliżeniu na tym samym poziomie od wielu lat.

ARM wprowadził nowy, mocny rdzeń procesora - Cortex-A77

Okno wykonania zmiany kolejności poleceń (rozmiar okna poza kolejnością) zwiększono o 25%, do 160 jednostek, co pozwala jądru zwiększyć równoległość obliczeń. Nawet Cortex-A76 miał duży bufor docelowy rozgałęzienia, a Cortex-A77 zwiększył go o kolejne 33%, do 8 KB, co pozwala jednostce przewidywania rozgałęzień skutecznie radzić sobie ze wzrostem liczby instrukcji równoległych.


ARM wprowadził nowy, mocny rdzeń procesora - Cortex-A77

Jeszcze ciekawszą innowacją jest zupełnie nowa pamięć podręczna o wielkości 1,5 KB, przechowująca operacje makro (MOP) zwrócone z modułu dekodującego. Architektura procesora ARM dekoduje instrukcje z aplikacji użytkownika na mniejsze makrooperacje, a następnie dzieli je na mikrooperacje przekazywane do rdzenia wykonawczego. Pamięć podręczna MOP służy do ograniczenia wpływu pominiętych rozgałęzień i opróżnień, ponieważ operacje makr są teraz przechowywane w oddzielnym bloku i nie wymagają ponownego dekodowania, co zwiększa ogólną przepustowość rdzenia. W przypadku niektórych obciążeń nowy blok jest niezwykle przydatnym dodatkiem do standardowej pamięci podręcznej instrukcji.

ARM wprowadził nowy, mocny rdzeń procesora - Cortex-A77

ARM wprowadził nowy, mocny rdzeń procesora - Cortex-A77

Do rdzenia wykonawczego dodano czwarty blok ALU i drugi blok rozgałęźny. Czwarta jednostka ALU zwiększa ogólną przepustowość procesora 1,5 razy, umożliwiając wykonywanie instrukcji jednocyklowych (takich jak ADD i SUB) oraz operacji na liczbach całkowitych typu push-pull, takich jak mnożenie. Pozostałe dwie jednostki ALU mogą obsługiwać tylko podstawowe instrukcje jednocyklowe, podczas gdy ostatni blok jest obciążony bardziej złożonymi operacjami matematycznymi, takimi jak dzielenie, mnożenie-akumulowanie itp. Drugi blok rozgałęzień w rdzeniu wykonawczym podwaja liczbę jednoczesnych przejść między gałęziami rdzeń może obsłużyć pracę, co jest przydatne w przypadkach, gdy dwa z sześciu wysłanych poleceń dotyczą przejść między gałęziami. Wewnętrzne testy w ARM wykazały korzyści w zakresie wydajności wynikające z zastosowania tego drugiego bloku odgałęzień.

ARM wprowadził nowy, mocny rdzeń procesora - Cortex-A77

ARM wprowadził nowy, mocny rdzeń procesora - Cortex-A77

Inne zmiany w jądrze obejmują dodanie drugiego potoku szyfrowania AES, zwiększoną przepustowość pamięci, ulepszony silnik wstępnego pobierania danych nowej generacji w celu poprawy wydajności energetycznej przy jednoczesnym zwiększeniu przepustowości systemowej pamięci DRAM, optymalizację pamięci podręcznej i nie tylko.

ARM wprowadził nowy, mocny rdzeń procesora - Cortex-A77

ARM wprowadził nowy, mocny rdzeń procesora - Cortex-A77

Największe zyski widać w Cortex-A77 w operacjach na liczbach całkowitych i zmiennoprzecinkowych. Potwierdzają to wewnętrzne testy porównawcze SPEC firmy ARM, które pokazują wzrost wydajności odpowiednio o 20% i 35% w operacjach na liczbach całkowitych i zmiennoprzecinkowych. Poprawa przepustowości pamięci mieści się w przedziale 15–20%. Ogólnie rzecz biorąc, optymalizacje i zmiany w A77 zapewniają średnio 20-procentowy wzrost wydajności w porównaniu z poprzednią generacją. Dzięki nowszym normom technologicznym, takim jak 7 nm ULV, możemy zyskać dodatkowe korzyści w końcowych chipach.

ARM wprowadził nowy, mocny rdzeń procesora - Cortex-A77

ARM wprowadził nowy, mocny rdzeń procesora - Cortex-A77

ARM opracował Cortex-A77 do pracy w kombinacji 4+4 big.LITTLE (4 mocne rdzenie i 4 proste, energooszczędne). Jednak biorąc pod uwagę zwiększony obszar nowej architektury, wielu producentów, aby zaoszczędzić pieniądze, może wprowadzić już aktywnie praktykowane kombinacje 1+3+4 lub 2+2+4, w których będzie działał tylko jeden lub dwa rdzenie być pełnoprawnym, nieciętym A77.

ARM wprowadził nowy, mocny rdzeń procesora - Cortex-A77



Źródło: 3dnews.ru

Dodaj komentarz