Шинэ процессорын цөмтэй хамт
ARM нь Mali-G77-ийн график гүйцэтгэлийг одоогийн Mali-G40-тай харьцуулахад 76% -иар ихэсгэсэн гэж мэдэгдэв. Энэ нь техникийн процесс болон архитектурын сайжруулалтаар хоёуланд нь хүрсэн. Mali-G77 нь 7-оос 16 цөмтэй байж болно (ирээдүйд 1-ээс 32 хүртэл масштаблах боломжтой) бөгөөд тэдгээр нь тус бүр нь G76-тай бараг ижил хэмжээтэй байна. Тиймээс өндөр зэрэглэлийн ухаалаг гар утаснууд ижил тооны GPU цөмтэй байх магадлалтай.
Тоглоомын хувьд та графикийн ажлын ачааллын төрлөөс хамааран 20-40% -ийн гүйцэтгэлийг сайжруулна гэж найдаж болно. Алдартай Manhattan GFXBench тестийн үр дүнгээс харахад шинэ GPU-ийн одоогийн үеийнхээс мэдэгдэхүйц давуу тал нь өрсөлдөгч Qualcomm-ийг Adreno графикийн гүйцэтгэл мэдэгдэхүйц сайжирна гэж санаа зовоход хүргэнэ.
Mali-G77 шинэ архитектур нь дангаараа эрчим хүчний үр ашиг эсвэл гүйцэтгэлийг дунджаар 30 хувиар сайжруулдаг гэж ARM мэдэгдэв. ARM Valhall скаляр архитектурын хоёр дахь үе нь GPU нь Бифрост (Mali-G16) дахь наймтай харьцуулахад CU дээр нэг мөчлөгт 76 зааврыг зэрэгцүүлэн гүйцэтгэх боломжийг олгодог. Бусад шинэлэг зүйлд бүрэн техник хангамжид суурилсан динамик зааварчилгааны хуваарь, Bifrost-тэй хоцрогдсон нийцтэй байдлыг хадгалахын зэрэгцээ цоо шинэ зааврын багц орно. ARM AFBC1.3 шахалтын формат болон бусад шинэчлэлтүүдийг (FP16 дүрслэх зорилтууд, давхаргат дүрслэл болон оройн шэйдерийн гаралт)-д зориулсан дэмжлэг мөн нэмэгдсэн.
Bifrost CU нь 3 гүйцэтгэх хөдөлгүүртэй бөгөөд тус бүр нь зааврын кэш, регистр, Warp хяналтын нэгжийг багтаасан. Эдгээр гурван хөдөлгүүрт хуваарилалт хийснээр 24 FMA зааврыг 32 битийн хөвөгч цэгийн нарийвчлалтайгаар (FP32) гүйцэтгэх боломжтой болсон. Valhall-д CU бүр нь зөвхөн нэг гүйцэтгэх хөдөлгүүртэй бөгөөд нэг цагт 16 Warp зааврыг боловсруулах чадвартай хоёр тооцооллын нэгжид хуваагддаг бөгөөд ингэснээр CU тутамд 32 FMA FP32 зааварчилгааг боловсруулах хүчин чадалтай болно. Эдгээр архитектурын өөрчлөлтүүдийн ачаар Mali-G77 нь Mali-G76-тай харьцуулахад гуравны нэгээр илүү математикийн тооцоог зэрэгцээ тооцоололд хийж чаддаг.
Нэмж дурдахад эдгээр CU-ууд тус бүр нь хоёр шинэ математик функцийг агуулдаг. Шинэ хувиргах хөдөлгүүр (CVT) нь үндсэн бүхэл тоо, логик, салбар, хөрвүүлэх зааварчилгааг гүйцэтгэдэг. Тусгай функцийн нэгж (SFU) нь бүхэл тоог үржүүлэх, хуваах, квадрат язгуур, логарифм болон бусад нарийн төвөгтэй бүхэл тоон функцуудыг хурдасгадаг.
Стандарт FMA блок нь нэг мөчлөгт 16 FP32 зааврыг, FP32-д 16, INT64 цэгийн бүтээгдэхүүний хувьд 8-ийг дэмждэг хэд хэдэн тохиргоотой. Эдгээр оновчлол нь машин сургалтын программуудын гүйцэтгэлийг 60% хүртэл сайжруулж чадна.
Mali-G77-ийн өөр нэг гол өөрчлөлт бол бүтэцтэй хөдөлгүүрийн гүйцэтгэлийг хоёр дахин нэмэгдүүлж, өмнөх хоёртой харьцуулахад цагт 4 хоёр шугаман текст, цагт 2 гурвалсан текстийг боловсруулж, FP16 болон FP32 шүүлтүүрийг илүү хурдан болгох боломжтой болсон.
ARM нь бусад хэд хэдэн өөрчлөлтийг хийсэн бөгөөд Mali-G77 болон Valhall нь тоглоомын болон машин сургалтын ажлын ачаалалд ихээхэн хэмжээний гүйцэтгэлийг сайжруулна гэж амлаж байна. Хамгийн чухал нь эрчим хүчний хэрэглээ, чипний талбайг Bifrost түвшинд байлгаж, эрчим хүчний хэрэглээ, дулааны зарцуулалт, хэмжээ шаардлагуудыг нэмэгдүүлэхгүйгээр хамгийн өндөр гүйцэтгэлтэй хөдөлгөөнт төхөөрөмжүүдийг амлаж байна.
Эх сурвалж: 3dnews.ru