ပရိုဆက်ဆာ core အသစ်နှင့်အတူ
ARM သည် Mali-G77 ၏ လက်ရှိမျိုးဆက် Mali-G40 နှင့် နှိုင်းယှဉ်ပါက 76% ဖြင့် ဂရပ်ဖစ်စွမ်းဆောင်ရည် သိသိသာသာ တိုးလာကြောင်း ကြေညာသည်။ ၎င်းကို နည်းပညာဆိုင်ရာ လုပ်ငန်းစဉ်များနှင့် ဗိသုကာဆိုင်ရာ တိုးတက်မှုများမှတစ်ဆင့် ရရှိခဲ့ပါသည်။ Mali-G77 တွင် 7 မှ 16 cores ရှိနိုင်သည် (အနာဂတ်တွင် 1 မှ 32 အထိ ဖြစ်နိုင်သည်)၊ ၎င်းတို့တစ်ခုစီသည် G76 နှင့် အရွယ်အစားနီးပါးတူညီသည်။ ထို့ကြောင့် high-end စမတ်ဖုန်းများသည် GPU core အရေအတွက် တူညီနိုင်ဖွယ်ရှိသည်။
ဂိမ်းများတွင်၊ ဂရပ်ဖစ်လုပ်ငန်းပမာဏပေါ်မူတည်၍ စွမ်းဆောင်ရည် 20 နှင့် 40% အကြား တိုးတက်မှုကို သင်မျှော်လင့်နိုင်သည်။ လူကြိုက်များသော Manhattan GFXBench စမ်းသပ်မှု၏ရလဒ်ဖြင့်အကဲဖြတ်ပါက၊ လက်ရှိမျိုးဆက်ထက် GPU အသစ်၏သိသိသာသာသာလွန်မှုသည်ပြိုင်ဘက် Qualcomm ကို Adreno ဂရပ်ဖစ်စွမ်းဆောင်ရည်တွင်သိသိသာသာတိုးတက်မှုအတွက်စိုးရိမ်ပူပန်ရန်ဖိအားပေးလိမ့်မည်။
၎င်း၏ကိုယ်ပိုင်အနေဖြင့်၊ Mali-G77 ဗိသုကာအသစ်သည် ပါဝါထိရောက်မှု သို့မဟုတ် စွမ်းဆောင်ရည်တွင် ပျမ်းမျှ 30 ရာခိုင်နှုန်း တိုးတက်မှုကို ပေးစွမ်းသည်ဟု ARM မှပြောကြားခဲ့သည်။ ARM Valhall scalar ဗိသုကာ၏ ဒုတိယမျိုးဆက်သည် GPU အား Bifrost (Mali-G16) တွင် ရှစ်ခုနှင့် နှိုင်းယှဉ်ကာ CU တွင် အပြိုင် 76 ညွှန်ကြားချက်များကို လည်ပတ်စေသည်။ အခြားသော ဆန်းသစ်တီထွင်မှုများတွင် အပြည့်အဝ ဟာ့ဒ်ဝဲ-မောင်းနှင်သည့် တက်ကြွသော ညွှန်ကြားချက် အချိန်ဇယားနှင့် Bifrost နှင့် နောက်ပြန်လိုက်ဖက်မှုကို ထိန်းသိမ်းထားစဉ် လုံးဝအသစ်သော ညွှန်ကြားချက်များ ပါဝင်ပါသည်။ ARM AFBC1.3 ဖိသိပ်မှုဖော်မတ်နှင့် အခြားတီထွင်ဆန်းသစ်မှုများ (FP16 တင်ဆက်မှုပစ်မှတ်များ၊ အလွှာလိုက်ဖော်ပြခြင်းနှင့် vertex shader အထွက်များ) ကိုလည်း ထည့်သွင်းထားပါသည်။
Bifrost CU တွင် လည်ပတ်မှုအင်ဂျင် ၃ လုံးပါရှိပြီး တစ်ခုစီတွင် ညွှန်ကြားချက် ကက်ရှ်၊ မှတ်ပုံတင်တစ်ခု နှင့် Warp ထိန်းချုပ်မှု ယူနစ်တို့ ပါဝင်သည်။ ဤအင်ဂျင်သုံးလုံးတွင် ဖြန့်ဝေမှုသည် 3-bit floating point precision (FP24) တွင် FMA ညွှန်ကြားချက် 32 ခုကို လုပ်ဆောင်နိုင်စေခဲ့သည်။ Valhall တွင်၊ CU တစ်ခုစီတွင် နာရီတစ်လုံးလျှင် Warp ညွှန်ကြားချက် 32 ခုကို လုပ်ဆောင်နိုင်သည့် ကွန်ပျူတာယူနစ်နှစ်ခုကြားတွင် ပိုင်းခြားထားသော လည်ပတ်မှုအင်ဂျင်တစ်ခုစီသာရှိပြီး CU တစ်ခုလျှင် FMA FP16 ညွှန်ကြားချက် စုစုပေါင်း 32 ခုအထိ ထွက်ပေါ်လာသည်။ ဤဗိသုကာဆိုင်ရာပြောင်းလဲမှုများကြောင့် Mali-G32 သည် Mali-G77 နှင့် နှိုင်းယှဉ်ပါက အပြိုင်တွက်ချက်မှုများတွင် သုံးပုံတစ်ပုံသော သင်္ချာဆိုင်ရာ တွက်ချက်မှုများကို လုပ်ဆောင်နိုင်သည်။
ထို့အပြင်၊ ဤ CUs တစ်ခုစီတွင် သင်္ချာလုပ်ဆောင်ချက်အသစ်နှစ်ခုပါရှိသည်။ ပြောင်းလဲခြင်းအင်ဂျင်အသစ် (CVT) သည် အခြေခံကိန်းပြည့်၊ ယုတ္တိ၊ အကိုင်းအခက်နှင့် ပြောင်းလဲခြင်းလမ်းညွှန်ချက်များကို ကိုင်တွယ်ပေးသည်။ အထူးလုပ်ဆောင်ချက်ယူနစ် (SFU) သည် ကိန်းပြည့်မြှောက်ခြင်း၊ ပိုင်းခြားခြင်း၊ နှစ်ထပ်ကိန်းအမြစ်၊ လော့ဂရစ်သမ်နှင့် အခြားရှုပ်ထွေးသော ကိန်းပြည့်လုပ်ဆောင်ချက်များကို အရှိန်မြှင့်ပေးသည်။
စံ FMA ပိတ်ဆို့ခြင်းတွင် စက်ဝိုင်းတစ်ခုလျှင် FP16 ညွှန်ကြားချက် 32 ခု၊ FP32 အတွက် 16၊ သို့မဟုတ် INT64 Dot ထုတ်ကုန်အတွက် 8 တို့ကို ပံ့ပိုးပေးသည့် ဆက်တင်များစွာရှိသည်။ အဆိုပါ ပိုမိုကောင်းမွန်အောင်ပြုလုပ်မှုများသည် စက်သင်ယူမှုအပလီကေးရှင်းများတွင် စွမ်းဆောင်ရည် 60% အထိ မြှင့်တင်ပေးနိုင်ပါသည်။
Mali-G77 ၏နောက်ထပ်သော့ချက်ပြောင်းလဲမှုမှာ ယခင်နာရီတစ်နာရီလျှင် FP4 နှင့် FP2 စစ်ထုတ်ခြင်းထက် ပိုမိုမြန်ဆန်သော FP16 နှင့် FP32 စစ်ထုတ်မှုကို ပိုမိုကောင်းမွန်စေသော XNUMX bilinear texels XNUMX ခုကို လုပ်ဆောင်ပေးသည့် အင်ဂျင်၏စွမ်းဆောင်ရည်၏နှစ်ဆဖြစ်သည်။
ARM သည် Mali-G77 နှင့် Valhall တို့သည် ဂိမ်းနှင့် စက်သင်ယူမှုအလုပ်များများအတွက် သိသာထင်ရှားသောစွမ်းဆောင်ရည်တိုးတက်မှုများကို ကတိပေးခြင်းဖြင့် ARM သည် အခြားပြောင်းလဲမှုများစွာကို ပြုလုပ်ခဲ့သည်။ အရေးကြီးသည်မှာ ပါဝါသုံးစွဲမှုနှင့် ချစ်ပ်ဧရိယာကို Bifrost အဆင့်တွင် ထားရှိထားပြီး ပါဝါသုံးစွဲမှု၊ အပူပေးစနစ်နှင့် အရွယ်အစား လိုအပ်ချက်များကို တိုးမြှင့်ခြင်းမရှိဘဲ ပိုမိုမြင့်မားသော စွမ်းဆောင်ရည်မြင့်မားသော မိုဘိုင်းလ်ပစ္စည်းများကို ကတိပေးပါသည်။
source: 3dnews.ru