🥇 SPMD တိုးချဲ့မှုများပါရှိသော C language အတွက် Intel မှ ဖန်တီးထားသော ISPC 1.31 compiler ကို ထုတ်ဝေခြင်း

Intel သည် ISPC 1.31 (Implicit SPMD Program Compiler) ကို ထုတ်ဝေခဲ့ပြီး၊ ၎င်းသည် SPMD (Single Program, Multiple Data) parallel programming extension များဖြင့် C code ကို compile လုပ်ရန် ဒီဇိုင်းထုတ်ထားပြီး၊ ၎င်းသည် input data အစုံအမျိုးမျိုးဖြင့် တစ်ခုတည်းသော program ၏ instance များစွာကို parallel execution လုပ်နိုင်သည်။ ဤ project code ကို C++ ဖြင့်ရေးသားထားပြီး BSD လိုင်စင်အောက်တွင် ဖြန့်ဝေထားသည်။ ၎င်းသည် ပံ့ပိုးပေးသည် Linux, Windows, macOS နှင့် FreeBSD။

SPMD တိုးချဲ့မှုများပါရှိသော C ပရိုဂရမ်များကို CPU နှင့် GPU မှပေးဆောင်သော SIMD တွက်ချက်မှုယူနစ်များတွင် လုပ်ဆောင်ရန်အတွက် စုစည်းထားပြီး၊ အဆင့်နိမ့်သောပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်းများနှင့် SIMD ညွှန်ကြားချက်များကို တိကျပြတ်သားစွာအသုံးပြုခြင်းမရှိဘဲ SIMD vectorization ယန္တရားများကို အသုံးပြုခွင့်ပေးသည်။ Parallelizable functions များကိုရေးရန်၊ C language ၏ ရင်းနှီးသော syntax နှင့် idioms များကို အသုံးပြုသည် - SPMD လုပ်ဆောင်ချက်များသည် C/C++ တွင်ရေးသားထားသော functions များနှင့် structures များနှင့် တိုက်ရိုက် အပြန်အလှန်သက်ရောက်မှုရှိသည်။ ပရိုဂရမ်များကို အမှားရှာရန် ရှိပြီးသား အမှားရှာများကို အသုံးပြုနိုင်သည်။

ISPC သည် LLVM အခြေခံအဆောက်အအုံအား ကုဒ်ထုတ်လုပ်ခြင်းနှင့် ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်းအတွက် နောက်ကွယ်တွင် အသုံးပြုသည်။ x86 (SSE2၊ SSE4၊ AVX၊ AVX2၊ AVX512) နှင့် ARM (NEON) vector ညွှန်ကြားချက်များကို ပံ့ပိုးပေးထားပြီး GPU ဘက် (Intel Gen9 နှင့် Xe) သို့ တွက်ချက်မှုများကို offloading လုပ်ထားသည်။ SSE vector blocks များဖြင့် တစ်ကြိမ်လျှင် element 4 ခုကို processing လုပ်ထားသော architectures တွင်၊ ISPC ကိုအသုံးပြုခြင်းသည် program execution acceleration ကို 3 ကြိမ် သို့မဟုတ် ထို့ထက်ပို၍အောင်မြင်နိုင်စေသည်၊ နှင့် AVX vector blocks များဖြင့် တစ်ကြိမ်လျှင် element 8 ခုကို processing လုပ်သော အရှိန်အဟုန်သည် 5- သို့ရောက်ရှိနိုင်သည်။ ၆ ကြိမ်။ ထို့အပြင်၊ vector block ၏အရွယ်အစားအပြင်၊ မတူညီသောပရိုဆက်ဆာ cores များပေါ်တွင်လုပ်ဆောင်ခြင်းဖြင့်စကေးချဲ့ခြင်းကိုသေချာစေသည်။

ISPC ဗားရှင်း 1.31 တွင် ထည့်သွင်းထားသော အဓိက တီထွင်ဆန်းသစ်မှုများ-

Добавлена экспериментальная поддержка 64-разрядной little-endian архитектуры PowerPC (ppc64le). По умолчанию осуществляется сборка для POWER ISA 2.7 (POWER8+) с расширениями VSX (Vector Scalar Extension).
Добавлены новые сборочные цели avx10.2nvl-x4, avx10.2nvl-x8, avx10.2nvl-x16, avx10.2nvl-x32 и avx10.2nvl-x64, реализующие поддержку расширенный наборов инструкций AVX10.2 (Advanced Vector Extensions) и APX (Advanced Performance Extensions) для процессоров на базе микроархитектуры Intel Nova Lake.
В диспетчеризаторе обеспечен выбор вариантов сборочных целей с поддержкой AMX (avx512spr, avx512gnr, avx10.2dmr) только при реальной поддержке расширений AMX (Advanced Matrix Extensions) в операционной системе и CPU.
Добавлена опция «—opt=disable-apx» для выборочного отключения отдельных возможностей x86 APX (egpr, ndd, push2pop2, ppx, ccmp, cf, nf, zu и jmpabs), которые по умолчанию включены в поддерживающих APX сборочных целях, таких как avx10.2dmr и avx10.2nvl.
Добавлены сбалансированный («balanced») и агрессивный («aggressive») режимы оптимизации математических вычислений, включаемые через опцию «—opt=fast-math» и более агрессивные по сравнению с применяемым по умолчанию режимом оптимизации.
В сандартную библиотеку добавлены новые математические функции:
erf, erfc (функции ошибок Гаусса), expm1 (точное вычисление «exp(x)-1»), log1p («log(1+x)»), sinh, cosh и tanh (гиперболические синус, косинус и тангенс). Повышена точность и производительность функций asin, acos, atan и log.
Значительно повышена производительность 32-битных операций перестановки (shuffles) для сборочной цели avx2-i32x16 и вычислений popcnt для целей avx2-i8x32, avx512skx-x32 и avx512skx-x64.
Инструментарий LLVM обновлён до находящейся в разработке ветки 23.

source: opennet.ru

SPMD တိုးချဲ့မှုများပါရှိသော C ဘာသာစကားအတွက် Intel မှ ဖန်တီးထားသည့် ISPC 1.31 စုစည်းမှုအား ဖြန့်ချိခြင်း

အဲရစ် ပီတာဆန်