پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

همراه با هسته پردازنده جدید هسته Cortex-A77 ARM یک پردازنده گرافیکی طراحی شده برای نسل بعدی سیستم های تک تراشه موبایل معرفی کرد. Mali-G77 که نباید با پردازنده نمایشگر جدید اشتباه گرفته شود مالی-D77، انتقال از معماری ARM Bifrost به Valhall را نشان می دهد.

پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

ARM افزایش قابل توجهی در عملکرد گرافیکی Mali-G77 - 40٪ در مقایسه با نسل فعلی Mali-G76 اعلام کرده است. این هم از طریق فرآیند فنی و هم از طریق پیشرفت های معماری به دست آمد. Mali-G77 می تواند از 7 تا 16 هسته داشته باشد (مقیاس سازی از 1 تا 32 در آینده امکان پذیر است) و هر یک از آنها تقریباً به اندازه G76 هستند. در نتیجه، گوشی‌های هوشمند سطح بالا احتمالاً دارای همان تعداد هسته‌های گرافیکی خواهند بود.

پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

در بازی ها، بسته به نوع حجم کاری گرافیکی، می توانید انتظار بهبود عملکرد بین 20 تا 40 درصد را داشته باشید. با قضاوت بر اساس نتایج تست محبوب Manhattan GFXBench، برتری قابل توجه GPU جدید نسبت به نسل فعلی، رقیب Qualcomm را مجبور می کند که نگران بهبود قابل توجه عملکرد گرافیک Adreno باشد.

پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

به گفته ARM، معماری جدید Mali-G77 به تنهایی 30 درصد بهبود در بازدهی انرژی یا عملکرد ارائه می دهد. نسل دوم معماری اسکالر ARM Valhall به GPU اجازه می دهد تا 16 دستورالعمل را در هر چرخه به صورت موازی بر روی CU اجرا کند، در مقایسه با 76 دستورالعمل در Bifrost (Mali-G1.3). نوآوری‌های دیگر شامل برنامه‌ریزی دستورالعمل‌های پویا کاملاً سخت‌افزاری و مجموعه دستورالعمل‌های کاملاً جدید با حفظ سازگاری با Bifrost است. پشتیبانی از فرمت فشرده سازی ARM AFBC16 و سایر نوآوری ها (هدف های رندر FPXNUMX، رندر لایه ای و خروجی های سایه زن رأس) نیز اضافه شده است.


پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

Bifrost CU شامل 3 موتور اجرایی بود که هر کدام شامل یک کش دستورالعمل، یک ثبات و یک واحد کنترل Warp بود. توزیع در این سه موتور اجازه می دهد 24 دستورالعمل FMA با دقت ممیز شناور 32 بیتی (FP32) اجرا شود. در Valhall، هر CU تنها یک موتور اجرایی دارد، که بین دو واحد محاسباتی تقسیم می‌شود که قادر به پردازش 16 دستورالعمل Warp در هر ساعت هستند، که منجر به خروجی کل 32 دستورالعمل FMA FP32 در هر CU می‌شود. به لطف این تغییرات معماری، Mali-G77 می تواند یک سوم محاسبات ریاضی بیشتری را در محاسبات موازی در مقایسه با Mali-G76 انجام دهد.

پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

علاوه بر این، هر یک از این CU شامل دو بلوک تابع ریاضی جدید است. موتور تبدیل جدید (CVT) دستورات اولیه اعداد صحیح، منطقی، شاخه و تبدیل را کنترل می کند. واحد تابع ویژه (SFU) ضرب اعداد صحیح، تقسیم، جذر، لگاریتم و سایر توابع اعداد صحیح پیچیده را سرعت می بخشد.

پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

بلوک استاندارد FMA دارای چندین تنظیمات است که از 16 دستورالعمل FP32 در هر چرخه، 32 دستورالعمل برای FP16، یا 64 برای محصول INT8 Dot پشتیبانی می کند. این بهینه‌سازی‌ها می‌توانند تا 60 درصد بهبود عملکرد را در برنامه‌های یادگیری ماشین ارائه دهند.

پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

یکی دیگر از تغییرات کلیدی در Mali-G77 دوبرابر شدن عملکرد موتور بافت است که اکنون 4 تکسل دوخطی در هر ساعت را در مقایسه با دو مورد قبلی پردازش می کند، 2 تکسل سه خطی در هر ساعت، که امکان فیلتر کردن سریعتر FP16 و FP32 را فراهم می کند.

پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

پردازنده گرافیکی ARM Mali-G77 40 درصد سریعتر است

ARM تعدادی تغییرات دیگر را ایجاد کرده است، با Mali-G77 و Valhall که نوید بهبود عملکرد قابل توجهی را برای حجم کاری بازی و یادگیری ماشین داده اند. نکته مهم این است که مصرف برق و مساحت تراشه در سطوح Bifrost نگه داشته می‌شوند که نویدبخش دستگاه‌های تلفن همراه با اوج عملکرد بالاتر بدون افزایش مصرف انرژی، اتلاف گرما و نیاز به اندازه است.



منبع: 3dnews.ru

اضافه کردن نظر