OpenCL 3.1

Konsorcium Khronos zveřejnilo specifikaci 5. května OpenCL 3.1 — nejnovější aktualizace otevřeného standardu pro multiplatformní výpočty na CPU, GPU, DSP, NPU a dalších akcelerátorech. Vydání je načasováno tak, aby se shodovalo s konferencí IWOCL 2026 a staví na modelu OpenCL 3.x, přičemž některé funkce byly zpočátku testovány jako rozšíření a poté migrovány do povinného jádra standardu.

Hlavní změnou v OpenCL 3.1 je povinná podpora pro načítání výpočetních jader ve formátu SPIR-V ve všech kompatibilních implementacích. SPIR-V se používá jako přenositelná mezilehlá reprezentace (IR), kterou lze generovat zejména pomocí LLVM/Clang a překladače SPIR-V LLVM. To by mělo zjednodušit použití OpenCL jako backendu pro SYCL, chipStar a specializované kompilátory a také umožnit distribuci jader nikoli jako zdrojového kódu, ale v předkompilované IR formě.

Jádro OpenCL 3.1 také přináší funkce důležité pro úlohy umělé inteligence a HPC: podskupiny s operacemi náhodného přehrávání/rotace a rozšířenou sadou typů, celočíselnými skalárními součiny s možnostmi saturace a akumulace, novými bitovými operacemi, doporučeným dotazem na velikost lokální pracovní skupiny a standardním dotazem na UUID zařízení konzistentním s chováním Vulkanu.

Mezi další změny patří nové jazykové funkce bez nutnosti zahrnovat rozšíření, vylepšený printf v OpenCL C s podporou modifikátorů z a t, vyjasnění sémantiky CL_DEVICE_HOST_UNIFIED_MEMORY, možnost předat nulovou velikost pro argumenty lokální paměti a zjednodušená synchronizace při kontrole události ve stavu CL_COMPLETE.

Práce na implementacích OpenCL 3.1 již probíhá ve společnostech Arm, Imagination, Intel a Qualcomm. Mezi implementacemi s otevřeným zdrojovým kódem Khronos konkrétně zmiňuje rustikální jako součást Mesy, PoCL и CLVKTaké se nadále vyvíjejí vrstvy kompatibility, které běží na OpenCL nad Vulkanem a DirectX 12, což by mělo rozšířit dostupnost OpenCL na systémech bez nativních ovladačů.

Mezi další oblasti vývoje Khronosu patří vyrovnávací paměti příkazů pro nízkoúrovňové opakování příkazů, vylepšení sjednocené sdílené paměti, maticové operace ve sdíleném režimu, nové typy umělé inteligence, jako jsou formáty s nízkou přesností, a také vylepšení externí paměti a kompatibility s Vulkanem, DirectX 12 a mediálními kanály.

Zdroj: linux.org.ru

Kupte si spolehlivý hosting pro stránky s DDoS ochranou, VPS VDS servery 🔥 Kupte si spolehlivý webhosting s ochranou DDoS, VPS VDS servery | ProHoster