🥇 SPMD एक्सटेंशनसह C भाषेसाठी इंटेलने विकसित केलेल्या ISPC 1.31 कंपायलरचे प्रकाशन

इंटेलने ISPC 1.31 (इम्प्लिसिट SPMD प्रोग्राम कंपायलर) प्रकाशित केला आहे, जो SPMD (सिंगल प्रोग्राम, मल्टिपल डेटा) पॅरलल प्रोग्रामिंग एक्सटेन्शन्ससह C कोड कंपाइल करण्यासाठी डिझाइन केलेला आहे. हे एक्सटेन्शन्स वेगवेगळ्या इनपुट डेटाच्या संचांसह एकाच प्रोग्रामच्या अनेक इन्स्टन्सचे समांतर एक्झिक्यूशन सक्षम करतात. या प्रोजेक्टचा कोड C++ मध्ये लिहिलेला आहे आणि तो BSD लायसन्स अंतर्गत वितरित केला जातो. तो खालील गोष्टींना सपोर्ट करतो: Linux, Windows, macOS आणि फ्रीबीएसडी.

SPMD विस्तारांसह C प्रोग्राम्स CPU आणि GPU द्वारे प्रदान केलेल्या SIMD संगणकीय युनिट्सवर कार्यान्वित करण्यासाठी संकलित केले जातात, जे तुम्हाला निम्न-स्तरीय ऑप्टिमायझेशनशिवाय आणि कोडमधील SIMD सूचनांचा स्पष्ट वापर न करता SIMD वेक्टरायझेशन यंत्रणा वापरण्याची परवानगी देते. समांतर करण्यायोग्य फंक्शन्स लिहिण्यासाठी, सी भाषेचे परिचित वाक्यरचना आणि मुहावरे वापरले जातात - SPMD फंक्शन्स थेट C/C++ मध्ये लिहिलेल्या फंक्शन्स आणि स्ट्रक्चर्सशी संवाद साधतात. विद्यमान डीबगर प्रोग्राम डीबग करण्यासाठी वापरले जाऊ शकतात.

ISPC कोड जनरेशन आणि ऑप्टिमायझेशनसाठी बॅकएंड म्हणून LLVM पायाभूत सुविधा वापरते. x86 (SSE2, SSE4, AVX, AVX2, AVX512) आणि ARM (NEON) वेक्टर सूचना समर्थित आहेत, तसेच GPU बाजूला (Intel Gen9 आणि Xe) ऑफलोडिंग गणना. एकावेळी 4 घटकांवर प्रक्रिया करणाऱ्या SSE व्हेक्टर ब्लॉक्सच्या आर्किटेक्चरवर, ISPC चा वापर 3 किंवा त्याहून अधिक वेळा प्रोग्रॅम एक्झिक्यूशन प्रवेग मिळवणे शक्य करते आणि AVX व्हेक्टर ब्लॉक्सच्या एका वेळी 8 घटकांवर प्रक्रिया करणाऱ्या आर्किटेक्चरवर, प्रवेग 5- पर्यंत पोहोचू शकतो. 6 वेळा शिवाय, वेक्टर ब्लॉकच्या आकाराव्यतिरिक्त, वेगवेगळ्या प्रोसेसर कोरवर अंमलबजावणी करून स्केलिंग देखील सुनिश्चित केले जाते.

ISPC आवृत्ती 1.31 मध्ये जोडलेले प्रमुख नवकल्पना:

Добавлена экспериментальная поддержка 64-разрядной little-endian архитектуры PowerPC (ppc64le). По умолчанию осуществляется сборка для POWER ISA 2.7 (POWER8+) с расширениями VSX (Vector Scalar Extension).
Добавлены новые сборочные цели avx10.2nvl-x4, avx10.2nvl-x8, avx10.2nvl-x16, avx10.2nvl-x32 и avx10.2nvl-x64, реализующие поддержку расширенный наборов инструкций AVX10.2 (Advanced Vector Extensions) и APX (Advanced Performance Extensions) для процессоров на базе микроархитектуры Intel Nova Lake.
В диспетчеризаторе обеспечен выбор вариантов сборочных целей с поддержкой AMX (avx512spr, avx512gnr, avx10.2dmr) только при реальной поддержке расширений AMX (Advanced Matrix Extensions) в операционной системе и CPU.
Добавлена опция «—opt=disable-apx» для выборочного отключения отдельных возможностей x86 APX (egpr, ndd, push2pop2, ppx, ccmp, cf, nf, zu и jmpabs), которые по умолчанию включены в поддерживающих APX сборочных целях, таких как avx10.2dmr и avx10.2nvl.
Добавлены сбалансированный («balanced») и агрессивный («aggressive») режимы оптимизации математических вычислений, включаемые через опцию «—opt=fast-math» и более агрессивные по сравнению с применяемым по умолчанию режимом оптимизации.
В сандартную библиотеку добавлены новые математические функции:
erf, erfc (функции ошибок Гаусса), expm1 (точное вычисление «exp(x)-1»), log1p («log(1+x)»), sinh, cosh и tanh (гиперболические синус, косинус и тангенс). Повышена точность и производительность функций asin, acos, atan и log.
Значительно повышена производительность 32-битных операций перестановки (shuffles) для сборочной цели avx2-i32x16 и вычислений popcnt для целей avx2-i8x32, avx512skx-x32 и avx512skx-x64.
Инструментарий LLVM обновлён до находящейся в разработке ветки 23.

स्त्रोत: opennet.ru

SPMD विस्तारांसह C भाषेसाठी इंटेलने विकसित केलेल्या ISPC 1.31 कंपाइलरचे प्रकाशन

एरिक पीटरसन