همراه با هسته پردازنده جدید
ARM افزایش قابل توجهی در عملکرد گرافیکی Mali-G77 - 40٪ در مقایسه با نسل فعلی Mali-G76 اعلام کرده است. این هم از طریق فرآیند فنی و هم از طریق پیشرفت های معماری به دست آمد. Mali-G77 می تواند از 7 تا 16 هسته داشته باشد (مقیاس سازی از 1 تا 32 در آینده امکان پذیر است) و هر یک از آنها تقریباً به اندازه G76 هستند. در نتیجه، گوشیهای هوشمند سطح بالا احتمالاً دارای همان تعداد هستههای گرافیکی خواهند بود.
در بازی ها، بسته به نوع حجم کاری گرافیکی، می توانید انتظار بهبود عملکرد بین 20 تا 40 درصد را داشته باشید. با قضاوت بر اساس نتایج تست محبوب Manhattan GFXBench، برتری قابل توجه GPU جدید نسبت به نسل فعلی، رقیب Qualcomm را مجبور می کند که نگران بهبود قابل توجه عملکرد گرافیک Adreno باشد.
به گفته ARM، معماری جدید Mali-G77 به تنهایی 30 درصد بهبود در بازدهی انرژی یا عملکرد ارائه می دهد. نسل دوم معماری اسکالر ARM Valhall به GPU اجازه می دهد تا 16 دستورالعمل را در هر چرخه به صورت موازی بر روی CU اجرا کند، در مقایسه با 76 دستورالعمل در Bifrost (Mali-G1.3). نوآوریهای دیگر شامل برنامهریزی دستورالعملهای پویا کاملاً سختافزاری و مجموعه دستورالعملهای کاملاً جدید با حفظ سازگاری با Bifrost است. پشتیبانی از فرمت فشرده سازی ARM AFBC16 و سایر نوآوری ها (هدف های رندر FPXNUMX، رندر لایه ای و خروجی های سایه زن رأس) نیز اضافه شده است.
Bifrost CU شامل 3 موتور اجرایی بود که هر کدام شامل یک کش دستورالعمل، یک ثبات و یک واحد کنترل Warp بود. توزیع در این سه موتور اجازه می دهد 24 دستورالعمل FMA با دقت ممیز شناور 32 بیتی (FP32) اجرا شود. در Valhall، هر CU تنها یک موتور اجرایی دارد، که بین دو واحد محاسباتی تقسیم میشود که قادر به پردازش 16 دستورالعمل Warp در هر ساعت هستند، که منجر به خروجی کل 32 دستورالعمل FMA FP32 در هر CU میشود. به لطف این تغییرات معماری، Mali-G77 می تواند یک سوم محاسبات ریاضی بیشتری را در محاسبات موازی در مقایسه با Mali-G76 انجام دهد.
علاوه بر این، هر یک از این CU شامل دو بلوک تابع ریاضی جدید است. موتور تبدیل جدید (CVT) دستورات اولیه اعداد صحیح، منطقی، شاخه و تبدیل را کنترل می کند. واحد تابع ویژه (SFU) ضرب اعداد صحیح، تقسیم، جذر، لگاریتم و سایر توابع اعداد صحیح پیچیده را سرعت می بخشد.
بلوک استاندارد FMA دارای چندین تنظیمات است که از 16 دستورالعمل FP32 در هر چرخه، 32 دستورالعمل برای FP16، یا 64 برای محصول INT8 Dot پشتیبانی می کند. این بهینهسازیها میتوانند تا 60 درصد بهبود عملکرد را در برنامههای یادگیری ماشین ارائه دهند.
یکی دیگر از تغییرات کلیدی در Mali-G77 دوبرابر شدن عملکرد موتور بافت است که اکنون 4 تکسل دوخطی در هر ساعت را در مقایسه با دو مورد قبلی پردازش می کند، 2 تکسل سه خطی در هر ساعت، که امکان فیلتر کردن سریعتر FP16 و FP32 را فراهم می کند.
ARM تعدادی تغییرات دیگر را ایجاد کرده است، با Mali-G77 و Valhall که نوید بهبود عملکرد قابل توجهی را برای حجم کاری بازی و یادگیری ماشین داده اند. نکته مهم این است که مصرف برق و مساحت تراشه در سطوح Bifrost نگه داشته میشوند که نویدبخش دستگاههای تلفن همراه با اوج عملکرد بالاتر بدون افزایش مصرف انرژی، اتلاف گرما و نیاز به اندازه است.
منبع: 3dnews.ru