αž€αž‰αŸ’αž…αž”αŸ‹αž§αž”αž€αžšαžŽαŸ ZLUDA αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ„αŸ‡αž–αž»αž˜αŸ’αž– αžŠαŸ‚αž›αž’αž“αž»αž‰αŸ’αž‰αžΆαžαž±αŸ’αž™αž’αŸ’αž“αž€αžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž€αž˜αŸ’αž˜αžœαž·αž’αžΈ CUDA αž“αŸ…αž›αžΎ AMD GPUs

αž‚αž˜αŸ’αžšαŸ„αž„ ZLUDA αž”αžΆαž“αžšαŸ€αž”αž…αŸ†αž€αžΆαžšαž’αž“αž»αžœαžαŸ’αžαžŠαŸ„αž™αž”αžΎαž€αž…αŸ†αž αž“αŸƒαž”αž…αŸ’αž…αŸαž€αžœαž·αž‘αŸ’αž™αžΆ CUDA αžŸαž˜αŸ’αžšαžΆαž”αŸ‹ AMD GPUs αžŠαŸ‚αž›αž’αž“αž»αž‰αŸ’αž‰αžΆαžαž±αŸ’αž™αž’αŸ’αž“αž€αžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž€αž˜αŸ’αž˜αžœαž·αž’αžΈ CUDA αžŠαŸ‚αž›αž˜αž·αž“αž’αžΆαž…αž€αŸ‚αž”αŸ’αžšαŸ‚αž”αžΆαž“αž‡αžΆαž˜αž½αž™αž“αžΉαž„αžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž‡αž·αžαž‘αŸ…αž“αžΉαž„αžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž“αŸƒαž€αž˜αŸ’αž˜αžœαž·αž’αžΈαžŠαŸ‚αž›αž€αŸ†αž–αž»αž„αžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαžŠαŸ„αž™αž‚αŸ’αž˜αžΆαž“αžŸαŸ’αžšαž‘αžΆαž”αŸ‹αŸ” αž€αž‰αŸ’αž…αž”αŸ‹αž§αž”αž€αžšαžŽαŸαžŠαŸ‚αž›αž”αžΆαž“αž”αŸ„αŸ‡αž–αž»αž˜αŸ’αž–αž•αŸ’αžŸαžΆαž™αž•αŸ’αžαž›αŸ‹αž“αžΌαžœαž—αžΆαž–αž†αž”αž‚αŸ’αž“αžΆαž”αŸ’αžšαž–αŸαž“αŸ’αž’αž‚αŸ„αž›αž–αžΈαžšαž‡αžΆαž˜αž½αž™αž“αžΉαž„αž€αž˜αŸ’αž˜αžœαž·αž’αžΈ CUDA αžŠαŸ‚αž›αž˜αžΆαž“αžŸαŸ’αžšαžΆαž”αŸ‹αžŠαŸ‚αž›αž”αžΆαž“αž…αž„αž€αŸ’αžšαž„αžŠαŸ„αž™αž”αŸ’αžšαžΎ CUDA compiler αžŸαž˜αŸ’αžšαžΆαž”αŸ‹ NVIDIA GPUs αŸ” αž€αžΆαžšαž’αž“αž»αžœαžαŸ’αžαžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž“αŸ…αž›αžΎαž€αŸ†αž–αžΌαž›αž“αŸƒ ROCm stack αž“αž·αž„ runtime HIP (Heterogeneous-computing Interface for Portability) αžŠαŸ‚αž›αž”αž„αŸ’αž€αžΎαžαž‘αžΎαž„αžŠαŸ„αž™ AMD αŸ” αž€αžΌαžŠαž‚αž˜αŸ’αžšαŸ„αž„αžαŸ’αžšαžΌαžœαž”αžΆαž“αžŸαžšαžŸαŸαžšαž‡αžΆ Rust αž αžΎαž™αžαŸ’αžšαžΌαžœαž”αžΆαž“αž…αŸ‚αž€αž…αžΆαž™αž€αŸ’αžšαŸ„αž˜αž’αžΆαž‡αŸ’αž‰αžΆαž”αŸαžŽαŸ’αžŽ MIT αž“αž·αž„ Apache 2.0αŸ” αž‚αžΆαŸ†αž‘αŸ’αžšαž€αžΆαžšαž„αžΆαžšαž“αŸ…αž›αžΎ Linux αž“αž·αž„ Windows αŸ”

αžŸαŸ’αžšαž‘αžΆαž”αŸ‹αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αžšαŸ€αž”αž…αŸ†αž€αžΆαžšαž„αžΆαžš CUDA αž›αžΎαž”αŸ’αžšαž–αŸαž“αŸ’αž’αž‡αžΆαž˜αž½αž™ AMD GPUs αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αž„αŸ’αž€αžΎαžαž‘αžΎαž„αž€αŸ’αž“αž»αž„αžšαž™αŸˆαž–αŸαž›αž–αžΈαžšαž†αŸ’αž“αžΆαŸ†αž…αž»αž„αž€αŸ’αžšαŸ„αž™αž“αŸαŸ‡ αž”αŸ‰αž»αž“αŸ’αžαŸ‚αž‚αž˜αŸ’αžšαŸ„αž„αž“αŸαŸ‡αž˜αžΆαž“αž”αŸ’αžšαžœαžαŸ’αžαž·αž™αžΌαžšαž‡αžΆαž„αž“αŸαŸ‡ αž αžΎαž™αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αž„αŸ’αž€αžΎαžαž‘αžΎαž„αžŠαŸ†αž”αžΌαž„αžŠαžΎαž˜αŸ’αž”αžΈαž’αžΆαž“αžΆαž”αžΆαž“αž“αžΌαžœαž€αžΆαžšαž„αžΆαžšαžšαž”αžŸαŸ‹ CUDA αž“αŸ…αž›αžΎ Intel GPUs αŸ” αž€αžΆαžšαž•αŸ’αž›αžΆαžŸαŸ‹αž”αŸ’αžαžΌαžšαž“αŸ…αž€αŸ’αž“αž»αž„αž‚αŸ„αž›αž€αžΆαžšαžŽαŸαž‚αžΆαŸ†αž‘αŸ’αžš GPU αžαŸ’αžšαžΌαžœαž”αžΆαž“αž–αž“αŸ’αž™αž›αŸ‹αžŠαŸ„αž™αž€αžΆαžšαž–αž·αžαžŠαŸ‚αž›αžαžΆαžŠαŸ†αž”αžΌαž„αž‘αžΎαž™αž’αŸ’αž“αž€αž’αž—αž·αžœαžŒαŸ’αžαž“αŸ ZLUDA αž‚αžΊαž‡αžΆαž”αž»αž‚αŸ’αž‚αž›αž·αž€αžšαž”αžŸαŸ‹ Intel αž”αŸ‰αž»αž“αŸ’αžαŸ‚αž“αŸ…αž†αŸ’αž“αžΆαŸ† 2021 αž€αŸ’αžšαž»αž˜αž αŸŠαž»αž“αž“αŸαŸ‡αž”αžΆαž“αž–αž·αž…αžΆαžšαžŽαžΆαž€αžΆαžšαž•αŸ’αžαž›αŸ‹αžŸαž˜αžαŸ’αžαž—αžΆαž–αž€αŸ’αž“αž»αž„αž€αžΆαžšαžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž€αž˜αŸ’αž˜αžœαž·αž’αžΈ CUDA αž›αžΎ Intel GPUs αžŠαŸ„αž™αž˜αž·αž“αž…αžΆαž”αŸ‹αž’αžΆαžšαž˜αŸ’αž˜αžŽαŸαž›αžΎαž’αžΆαž‡αžΈαžœαž€αž˜αŸ’αž˜ αž“αž·αž„αž˜αž·αž“αž”αž„αŸ’αž€αžΎαž“αž›αŸ’αž”αžΏαž“αŸ” αž€αžΆαžšαž’αž—αž·αžœαžŒαŸ’αžαž“αŸαž“αŸƒαž‚αŸ†αž“αž·αžαž•αŸ’αžαž½αž…αž•αŸ’αžαžΎαž˜αŸ”

αž“αŸ…αžŠαžΎαž˜αž†αŸ’αž“αžΆαŸ† 2022 αž’αŸ’αž“αž€αž’αž—αž·αžœαžŒαŸ’αžαž“αŸαž”αžΆαž“αž…αžΆαž€αž…αŸαž‰αž–αžΈ Intel αž αžΎαž™αžαŸ’αžšαžΌαžœαž”αžΆαž“αž…αž»αŸ‡αž€αž·αž…αŸ’αž…αžŸαž“αŸ’αž™αžΆαžŠαŸ„αž™ AMD αžŠαžΎαž˜αŸ’αž”αžΈαž”αž„αŸ’αž€αžΎαžαžŸαŸ’αžšαž‘αžΆαž”αŸ‹αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž—αžΆαž–αž†αž”αž‚αŸ’αž“αžΆ CUDA αŸ” αž€αŸ’αž“αž»αž„αž’αŸ†αž‘αž»αž„αž–αŸαž›αž“αŸƒαž€αžΆαžšαž’αž—αž·αžœαžŒαŸ’αžαž“αŸ AMD αž”αžΆαž“αžŸαŸ’αž“αžΎαžŸαž»αŸ†αž˜αž·αž“αž±αŸ’αž™αž•αŸ’αžŸαž–αŸ’αžœαž•αŸ’αžŸαžΆαž™αž…αŸ†αžŽαžΆαž”αŸ‹αž’αžΆαžšαž˜αŸ’αž˜αžŽαŸαžšαž”αžŸαŸ‹ AMD αž…αŸ†αž–αŸ„αŸ‡αž‚αž˜αŸ’αžšαŸ„αž„ ZLUDA αž“αž·αž„αž˜αž·αž“αž’αŸ’αžœαžΎαž€αžΆαžšαž”αŸ’αžαŸαž‡αŸ’αž‰αžΆαž…αž·αžαŸ’αžαž…αŸ†αž–αŸ„αŸ‡αžƒαŸ’αž›αžΆαŸ†αž„ ZLUDA αžŸαžΆαž’αžΆαžšαžŽαŸˆαŸ” αž–αžΈαžšαž†αŸ’αž“αžΆαŸ†αž€αŸ’αžšαŸ„αž™αž˜αž€ AMD αž”αžΆαž“αžŸαž˜αŸ’αžšαŸαž…αž…αž·αžαŸ’αžαžαžΆαž€αžΆαžšαžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž€αž˜αŸ’αž˜αžœαž·αž’αžΈ CUDA αž“αŸ…αž›αžΎ AMD GPUs αž˜αž·αž“αž…αžΆαž”αŸ‹αž’αžΆαžšαž˜αŸ’αž˜αžŽαŸαž…αŸ†αž–αŸ„αŸ‡αž’αžΆαž‡αžΈαžœαž€αž˜αŸ’αž˜αž“αŸ„αŸ‡αž‘αŸ αžŠαŸ‚αž›αž™αŸ„αž„αž‘αŸ…αžαžΆαž˜αž›αž€αŸ’αžαžαžŽαŸ’αžŒαž“αŸƒαž€αž·αž…αŸ’αž…αžŸαž“αŸ’αž™αžΆαž”αžΆαž“αž’αž“αž»αž‰αŸ’αž‰αžΆαžαž±αŸ’αž™αž’αŸ’αž“αž€αž’αž—αž·αžœαžŒαŸ’αžαž“αŸαžŸαŸ’αžœαŸ‚αž„αžšαž€αž€αžΆαžšαž„αžΆαžšαžšαž”αžŸαŸ‹αž‚αžΆαžαŸ‹αŸ” αž…αžΆαž”αŸ‹αžαžΆαŸ†αž„αž–αžΈαž€αŸ’αžšαž»αž˜αž αŸŠαž»αž“αž•αž›αž·αž GPU αž”αžΆαž“αž”αž‰αŸ’αžˆαž”αŸ‹αž€αžΆαžšαž•αŸ’αžαž›αŸ‹αž˜αžΌαž›αž“αž·αž’αž·αžŠαž›αŸ‹αž‚αž˜αŸ’αžšαŸ„αž„αž“αŸαŸ‡ αž‡αŸ„αž‚αžœαžΆαžŸαž“αžΆαžšαž”αžŸαŸ‹αžœαžΆαž₯αž‘αžΌαžœαž“αŸαŸ‡αž’αžΆαžŸαŸ’αžšαŸαž™αž›αžΎαž…αŸ†αžŽαžΆαž”αŸ‹αž’αžΆαžšαž˜αŸ’αž˜αžŽαŸαžšαž”αžŸαŸ‹αžŸαž αž‚αž˜αž“αŸ αž“αž·αž„αž€αžΆαžšαž‘αž‘αž½αž›αžŸαŸ†αžŽαžΎαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž€αž·αž…αŸ’αž…αžŸαž αž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαž–αžΈαž€αŸ’αžšαž»αž˜αž αŸŠαž»αž“αž•αŸ’αžŸαŸαž„αž‘αŸ€αžαŸ” αž”αžΎαž‚αŸ’αž˜αžΆαž“αž€αžΆαžšαž‚αžΆαŸ†αž‘αŸ’αžšαž–αžΈαžαžΆαž„αž€αŸ’αžšαŸ…αž‘αŸ αž‚αž˜αŸ’αžšαŸ„αž„αž“αŸαŸ‡αž“αžΉαž„αž’αžΆαž…αž’αž—αž·αžœαžŒαŸ’αžαž”αžΆαž“αžαŸ‚αž€αŸ’αž“αž»αž„αž‘αž·αžŸαžŠαŸ…αžŠαŸ‚αž›αž’αŸ’αž“αž€αž“αž·αž–αž“αŸ’αž’αž…αžΆαž”αŸ‹αž’αžΆαžšαž˜αŸ’αž˜αžŽαŸαž•αŸ’αž‘αžΆαž›αŸ‹αž”αŸ‰αž»αžŽαŸ’αžŽαŸ„αŸ‡ αžŠαžΌαž…αž‡αžΆ DLSS (Deep Learning Super Sampling) αž‡αžΆαžŠαžΎαž˜αŸ”

αž“αŸ…αž€αŸ’αž“αž»αž„αž‘αž˜αŸ’αžšαž„αŸ‹αž”αž…αŸ’αž…αž»αž”αŸ’αž”αž“αŸ’αž“αžšαž”αžŸαŸ‹αžœαžΆ αž€αž˜αŸ’αžšαž·αžαž‚αž»αžŽαž—αžΆαž–αž“αŸƒαž€αžΆαžšαž’αž“αž»αžœαžαŸ’αžαžαŸ’αžšαžΌαžœαž”αžΆαž“αžœαžΆαž™αžαž˜αŸ’αž›αŸƒαžαžΆαž‡αžΆαž€αŸ†αžŽαŸ‚αž’αžΆαž›αŸ‹αž αŸ’αžœαžΆαŸ” αž‘αŸ„αŸ‡αž™αŸ‰αžΆαž„αžŽαžΆαž€αŸαžŠαŸ„αž™ ZLUDA αž’αžΆαž…αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ’αžšαžΎαžŠαžΎαž˜αŸ’αž”αžΈαžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž€αž˜αŸ’αž˜αžœαž·αž’αžΈ CUDA αž‡αžΆαž…αŸ’αžšαžΎαž“αžšαž½αž˜αž‘αžΆαŸ†αž„ Geekbench, 3DF Zephyr, Blender, Reality Capture, LAMMPS, NAMD, waifu2x, OpenFOAM αž“αž·αž„ Arnold αŸ” αž•αŸ’αžαž›αŸ‹αž€αžΆαžšαž‚αžΆαŸ†αž‘αŸ’αžšαžαž·αž…αžαž½αž…αž”αŸ†αž•αž»αžαžŸαž˜αŸ’αžšαžΆαž”αŸ‹ cuDNN, cuBLAS, cuSPARSE, cuFFT, NCCL αž“αž·αž„ NVML αž“αž·αž„αž”αžŽαŸ’αžŽαžΆαž›αŸαž™αŸ”

αž€αžΆαžšαž…αžΆαž”αŸ‹αž•αŸ’αžαžΎαž˜αžŠαŸ†αž”αžΌαž„αž“αŸƒαž€αž˜αŸ’αž˜αžœαž·αž’αžΈ CUDA αžŠαŸ‚αž›αžŠαŸ†αžŽαžΎαžšαž€αžΆαžš ZLUDA αž€αžΎαžαž‘αžΎαž„αž‡αžΆαž˜αž½αž™αž“αžΉαž„αž€αžΆαžšαž–αž“αŸ’αž™αžΆαžšαž–αŸαž›αž‚αž½αžšαž±αŸ’αž™αž€αžαŸ‹αžŸαž˜αŸ’αž‚αžΆαž›αŸ‹αžŠαŸ„αž™αžŸαžΆαžšαžαŸ‚ ZLUDA αž…αž„αž€αŸ’αžšαž„αž€αžΌαžŠ GPU αŸ” αž˜αž·αž“αž˜αžΆαž“αž€αžΆαžšαž–αž“αŸ’αž™αžΆαžšαž–αŸαž›αž”αŸ‚αž”αž“αŸαŸ‡αž€αŸ’αž“αž»αž„αž€αžΆαžšαžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž‡αžΆαž”αž“αŸ’αžαž”αž“αŸ’αž‘αžΆαž”αŸ‹αž‘αŸ αž–αŸ’αžšαŸ„αŸ‡αž€αžΌαžŠαžŠαŸ‚αž›αž”αžΆαž“αž…αž„αž€αŸ’αžšαž„αžαŸ’αžšαžΌαžœαž”αžΆαž“αžšαž€αŸ’αžŸαžΆαž‘αž»αž€αž€αŸ’αž“αž»αž„αžƒαŸ’αž›αžΆαŸ†αž„αžŸαž˜αŸ’αž„αžΆαžαŸ‹αŸ” αž“αŸ…αž–αŸαž›αžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž€αžΌαžŠαžŠαŸ‚αž›αž”αžΆαž“αž…αž„αž€αŸ’αžšαž„ αž€αžΆαžšαž’αž“αž»αžœαžαŸ’αžαž‚αžΊαž“αŸ…αž‡αž·αžαž“αžΉαž„αžŠαžΎαž˜αŸ” αž“αŸ…αž–αŸαž›αžŠαŸ†αžŽαžΎαžšαž€αžΆαžš Geekbench αž“αŸ…αž›αžΎ AMD Radeon 6800 XT GPU αž€αŸ†αžŽαŸ‚ ZLUDA αž“αŸƒ CUDA benchmark suite αž”αžΆαž“αžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž›αŸ’αž’αž‡αžΆαž„αž€αŸ†αžŽαŸ‚ OpenCL αž‚αž½αžšαž±αŸ’αž™αž€αžαŸ‹αžŸαž˜αŸ’αž‚αžΆαž›αŸ‹αŸ”

αž€αž‰αŸ’αž…αž”αŸ‹αž§αž”αž€αžšαžŽαŸ ZLUDA αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ„αŸ‡αž–αž»αž˜αŸ’αž– αžŠαŸ‚αž›αž’αž“αž»αž‰αŸ’αž‰αžΆαžαž±αŸ’αž™αž’αŸ’αž“αž€αžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž€αž˜αŸ’αž˜αžœαž·αž’αžΈ CUDA αž“αŸ…αž›αžΎ AMD GPUs

αž€αžΆαžšαž‚αžΆαŸ†αž‘αŸ’αžšαžŸαž˜αŸ’αžšαžΆαž”αŸ‹ CUDA Driver API αž•αŸ’αž›αžΌαžœαž€αžΆαžš αž“αž·αž„αž•αŸ’αž“αŸ‚αž€αžŠαŸ‚αž›αžœαž·αžŸαŸ’αžœαž€αž˜αŸ’αž˜αž”αž‰αŸ’αž…αŸ’αžšαžΆαžŸαž“αŸƒ CUDA API αžŠαŸ‚αž›αž‚αŸ’αž˜αžΆαž“αž―αž€αžŸαžΆαžšαžαŸ’αžšαžΌαžœαž”αžΆαž“αž’αž“αž»αžœαžαŸ’αžαž“αŸ…αž€αŸ’αž“αž»αž„ ZLUDA αžŠαŸ„αž™αž‡αŸ†αž“αž½αžŸαž€αžΆαžšαž αŸ…αž˜αž»αžαž„αžΆαžšαž‡αžΆαž˜αž½αž™αž“αžΉαž„αž˜αž»αžαž„αžΆαžšαžŸαŸ’αžšαžŠαŸ€αž„αž‚αŸ’αž“αžΆαžŠαŸ‚αž›αž”αžΆαž“αž•αŸ’αžαž›αŸ‹αž“αŸ…αž€αŸ’αž“αž»αž„αž–αŸαž›αžŠαŸ†αžŽαžΎαžšαž€αžΆαžš HIP αžŠαŸ‚αž›αžŸαŸ’αžšαžŠαŸ€αž„αž‚αŸ’αž“αžΆαž€αŸ’αž“αž»αž„αžœαž·αž’αžΈαž‡αžΆαž…αŸ’αžšαžΎαž“αž…αŸ†αž–αŸ„αŸ‡ CUDA αŸ” αž§αž‘αžΆαž αžšαžŽαŸ αž˜αž»αžαž„αžΆαžš cuDeviceGetAttribute() αžαŸ’αžšαžΌαžœαž”αžΆαž“αž‡αŸ†αž“αž½αžŸαžŠαŸ„αž™ hipDeviceGetAttribute()αŸ” αž—αžΆαž–αž†αž”αž‚αŸ’αž“αžΆαž‡αžΆαž˜αž½αž™αž”αžŽαŸ’αžŽαžΆαž›αŸαž™ NVIDIA αžŠαžΌαž…αž‡αžΆ NVML, cuBLAS αž“αž·αž„ cuSPARSE αžαŸ’αžšαžΌαžœαž”αžΆαž“αž’αžΆαž“αžΆαžαžΆαž˜αžšαž”αŸ€αž”αžŸαŸ’αžšαžŠαŸ€αž„αž‚αŸ’αž“αžΆ - αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž”αžŽαŸ’αžŽαžΆαž›αŸαž™αž”αŸ‚αž”αž“αŸαŸ‡ ZLUDA αž•αŸ’αžαž›αŸ‹αž”αžŽαŸ’αžŽαžΆαž›αŸαž™αž”αž€αž”αŸ’αžšαŸ‚αžŠαŸ‚αž›αž˜αžΆαž“αžˆαŸ’αž˜αŸ„αŸ‡αžŠαžΌαž…αž‚αŸ’αž“αžΆ αž“αž·αž„αžŸαŸ†αžŽαž»αŸ†αž˜αž»αžαž„αžΆαžšαžŠαžΌαž…αž‚αŸ’αž“αžΆ αžŠαŸ‚αž›αž”αž„αŸ’αž€αžΎαžαž‡αžΆαž€αž˜αŸ’αž˜αžœαž·αž’αžΈαž”αž“αŸ’αžαŸ‚αž˜αž›αžΎαž”αžŽαŸ’αžŽαžΆαž›αŸαž™ AMD αžŸαŸ’αžšαžŠαŸ€αž„αž‚αŸ’αž“αžΆαŸ”

αž€αžΌαžŠαž€αž˜αŸ’αž˜αžœαž·αž’αžΈ GPU αžŠαŸ‚αž›αž…αž„αž€αŸ’αžšαž„αž‡αžΆαžαŸ†αžŽαžΆαž„ PTX (Parallel Thread Execution) αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αž€αž”αŸ’αžšαŸ‚αžŠαŸ†αž”αžΌαž„αžŠαŸ„αž™αž’αŸ’αž“αž€αž…αž„αž€αŸ’αžšαž„αž–αž·αžŸαŸαžŸαž‘αŸ…αž‡αžΆαžαŸ†αžŽαžΆαž„αž€αž˜αŸ’αžšαž·αžαž˜αž’αŸ’αž™αž˜ LLVM IR αžŠαŸ„αž™αžˆαžšαž›αžΎαž˜αžΌαž›αžŠαŸ’αž‹αžΆαž“αž“αŸƒαž€αžΌαžŠαž‚αŸ„αž›αž–αžΈαžšαžŸαž˜αŸ’αžšαžΆαž”αŸ‹ AMD GPUs αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αž„αŸ’αž€αžΎαžαŸ”

αž€αž‰αŸ’αž…αž”αŸ‹αž§αž”αž€αžšαžŽαŸ ZLUDA αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ„αŸ‡αž–αž»αž˜αŸ’αž– αžŠαŸ‚αž›αž’αž“αž»αž‰αŸ’αž‰αžΆαžαž±αŸ’αž™αž’αŸ’αž“αž€αžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž€αž˜αŸ’αž˜αžœαž·αž’αžΈ CUDA αž“αŸ…αž›αžΎ AMD GPUs


αž”αŸ’αžšαž—αž–: opennet.ru

αž”αž“αŸ’αžαŸ‚αž˜αž˜αžαž·αž™αŸ„αž”αž›αŸ‹