NVIDIA CUDA-ಆಕ್ಸೈಡ್ 0.2.0

ಸಂಚಿಕೆಯನ್ನು ಪ್ರಕಟಿಸಲಾಗಿದೆ. CUDA-ಆಕ್ಸೈಡ್ 0.2.0 — CUDA ಕರ್ನಲ್‌ಗಳಿಗೆ ಕೋಡ್ ಬರೆಯಲು ನಿಮಗೆ ಅನುಮತಿಸುವ ಪ್ರಾಯೋಗಿಕ NVIDIA ಲ್ಯಾಬ್ಸ್ ಕಂಪೈಲರ್ ಶುದ್ಧ ತುಕ್ಕು ಮತ್ತು ಅವುಗಳನ್ನು ನೇರವಾಗಿ ಕಂಪೈಲ್ ಮಾಡಿ PTXಈ ಯೋಜನೆಯು rustc ಗಾಗಿ ತನ್ನದೇ ಆದ ಬ್ಯಾಕೆಂಡ್ ಅನ್ನು ಬಳಸುತ್ತದೆ ಮತ್ತು ಮಾದರಿಯನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ. ಸಿಮ್ಟ್ ಮತ್ತು ಕಾರ್ಗೋ ಆಕ್ಸೈಡ್ ಆಜ್ಞೆಯನ್ನು ಬಳಸಿಕೊಂಡು ನಿರ್ಮಿಸಲಾಗಿದೆ, ಹೋಸ್ಟ್ ಮತ್ತು ಸಾಧನ ಕೋಡ್ ಒಂದೇ ಮೂಲ ವೃಕ್ಷದಲ್ಲಿ ವಾಸಿಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. ಬಿಡುಗಡೆ ನಡೆಯಿತು. 5 ಜೂನ್ 2026 ವರ್ಷಗಳ ಮತ್ತು ಮೊದಲ "ಸಮುದಾಯ ಬಿಡುಗಡೆ" ಎಂದು ಹೆಸರಿಸಲಾಯಿತು: 0.1.0 ಶಾಖೆಯ ಪ್ರಾರಂಭದ ನಂತರ, ಯೋಜನೆಯು 23 ಭಾಗವಹಿಸುವವರಿಂದ 37 ಪುಲ್ ವಿನಂತಿಗಳನ್ನು ಸ್ವೀಕರಿಸಿತು.

CUDA-ಆಕ್ಸೈಡ್ 0.2.0 ನಲ್ಲಿನ ಪ್ರಮುಖ ಬದಲಾವಣೆಯೆಂದರೆ ಸ್ವಯಂ-ಒಳಗೊಂಡಿರುವ ಕಾರ್ಯಗತಗೊಳ್ಳಬಹುದಾದ ಫೈಲ್‌ಗೆ ಪರಿವರ್ತನೆ. ಉತ್ಪತ್ತಿಯಾದ GPU ಕಲಾಕೃತಿಗಳು - PTX, NVVM-IR, LTOIR, ಮತ್ತು ಕ್ಯೂಬಿನ್ - ಈಗ ಹೊಸ ಆಕ್ಸೈಡ್-ಕಲಾಕೃತಿಗಳ ಸ್ವರೂಪದ ಮೂಲಕ ಹೋಸ್ಟ್ ಬೈನರಿಗೆ ನೇರವಾಗಿ ಎಂಬೆಡ್ ಮಾಡಬಹುದು. ಇದರರ್ಥ CUDA ಕೋರ್‌ಗಳನ್ನು ಹೊಂದಿರುವ ರಸ್ಟ್ ಪ್ರೋಗ್ರಾಂ ಇನ್ನು ಮುಂದೆ ಪ್ರತ್ಯೇಕ .ptx ಫೈಲ್‌ಗಳನ್ನು ಸಾಗಿಸುವ ಅಗತ್ಯವಿಲ್ಲ ಮತ್ತು ಕೋರ್‌ಗಳನ್ನು ಚಾಲನೆಯಲ್ಲಿರುವ ಕಾರ್ಯಗತಗೊಳ್ಳಬಹುದಾದ ಫೈಲ್‌ನಿಂದ ನೇರವಾಗಿ ಲೋಡ್ ಮಾಡಲಾಗುತ್ತದೆ.

ಪ್ರಮುಖ ಬದಲಾವಣೆಗಳು:

  • ಹೋಸ್ಟ್ ಬೈನರಿಗೆ GPU ಕೋರ್‌ಗಳನ್ನು ಎಂಬೆಡ್ ಮಾಡಲಾಗುತ್ತಿದೆ. ಹೊಸ #[cuda_module] ಕಾರ್ಯವಿಧಾನವು ಟೈಪ್ ಮಾಡಿದ ಕರ್ನಲ್ ಲಾಂಚ್ ಇಂಟರ್ಫೇಸ್ ಅನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ ಮತ್ತು ಕಡಿಮೆ-ಮಟ್ಟದ ಮಾಡ್ಯೂಲ್ ಲೋಡಿಂಗ್ ಅನ್ನು ಮರೆಮಾಡುತ್ತದೆ. ಡೆವಲಪರ್‌ಗೆ, ಇದು ಪ್ರಮಾಣಿತ ರಸ್ಟ್ API ಗೆ ಹತ್ತಿರದಲ್ಲಿದೆ ಎಂದು ಭಾಸವಾಗುತ್ತದೆ: ಸ್ಲೈಸ್‌ಗಳು ಮತ್ತು ಬಫರ್‌ಗಳನ್ನು CUDA ಬಫರ್‌ಗಳಿಗೆ ಮ್ಯಾಪ್ ಮಾಡಲಾಗುತ್ತದೆ ಮತ್ತು ಲಾಂಚಿಂಗ್ ಅನ್ನು ಹೆಚ್ಚು ಬಲವಾಗಿ ಟೈಪ್ ಮಾಡಲಾಗುತ್ತದೆ.

  • CUDA ನಿರಂತರ ಮೆಮೊರಿ ಬೆಂಬಲ. #[ಸ್ಥಿರ] ಮತ್ತು ಸ್ಥಿರವನ್ನು ಸೇರಿಸಲಾಗಿದೆ ಹೋಸ್ಟ್ ಸೆಟ್ಟರ್ ಜನರೇಷನ್‌ನೊಂದಿಗೆ. PTX ಮಟ್ಟದಲ್ಲಿ, ಇದು .const ಮತ್ತು ವಿಳಾಸ ಸ್ಥಳ 4 ಗೆ ಅನುರೂಪವಾಗಿದೆ. ಸಾಧನದಲ್ಲಿ ಸ್ಥಿರ ಮೌಲ್ಯಗಳಾಗಿ ಕರ್ನಲ್‌ಗಳಿಗೆ ಪ್ರವೇಶಿಸಬೇಕಾದ ಡೇಟಾಗೆ ಇದು ಮುಖ್ಯವಾಗಿದೆ.

  • ಹೆಚ್ಚಿನ ಸಾಧನ ಗಣಿತ. f32::max, f32::min, ಹಾಗೆಯೇ f32 ಮತ್ತು f64 ಗಾಗಿ atan ಮತ್ತು atan2 ಅನ್ನು libdevice ಮೂಲಕ ಸೇರಿಸಲಾಗಿದೆ. ಇದು C++/CUDA ಅನ್ನು ಆಶ್ರಯಿಸದೆಯೇ ವ್ಯಕ್ತಪಡಿಸಬಹುದಾದ ನೈಜ-ಪ್ರಪಂಚದ ಕಂಪ್ಯೂಟಿಂಗ್ ಕರ್ನಲ್‌ಗಳ ಗುಂಪನ್ನು ವಿಸ್ತರಿಸುತ್ತದೆ.

  • ಮೌನ ತಪ್ಪು ಸಂಕಲನ ಪರಿಹಾರಗಳು. ಹಲವಾರು ನಿಶ್ಯಬ್ದ ತಪ್ಪು ಕಂಪೈಲ್‌ಗಳು ಈಗ ತಪ್ಪಾದ PTX ಅನ್ನು ಉತ್ಪಾದಿಸುವ ಬದಲು ಬಿಲ್ಡ್-ಟೈಮ್ ವೈಫಲ್ಯಕ್ಕೆ ಕಾರಣವಾಗುತ್ತವೆ (ಕಾಣೆಯಾದ wgmma ಸಂಗ್ರಹ, ಹೊರಗಿಡಲಾದ ವಿನಾಶಕಗಳು, ನುಂಗಿದ ಆಪರೇಟರ್‌ಗಳು).

  • ಸುಧಾರಿತ ಹೋಸ್ಟ್ ರನ್‌ಟೈಮ್. ಸಾಧನಕ್ಕೆ ಡೇಟಾ ವರ್ಗಾವಣೆಗಾಗಿ ಡಿವೈಸ್‌ಕಾಪಿ ಭದ್ರತಾ ಒಪ್ಪಂದವನ್ನು ಸೇರಿಸಲಾಗಿದೆ, ಜೊತೆಗೆ ಸ್ಟ್ರೀಮ್-ಆರ್ಡರ್ಡ್ ವರ್ಗಾವಣೆಗಳೊಂದಿಗೆ ಪಿನ್ ಮಾಡಿದ ಹೋಸ್ಟ್ ಬಫರ್‌ಗಳು, ಅಸಮಕಾಲಿಕ ದೋಷ ಫಾರ್ವರ್ಡ್ ಮಾಡುವಿಕೆ ಮತ್ತು CUDA ಡ್ರೈವರ್ API ನೊಂದಿಗೆ ಏಕೀಕರಣಕ್ಕಾಗಿ ಕಚ್ಚಾ CU ಮಾಡ್ಯೂಲ್‌ಗೆ ಕಡಿಮೆ-ಮಟ್ಟದ ಪ್ರವೇಶವನ್ನು ಸೇರಿಸಲಾಗಿದೆ. ಡಿವೈಸ್‌ಬಫರ್ ಅಲೋಕೇಟರ್ ಹೊಂದಾಣಿಕೆಯನ್ನು ಸಹ ಸರಿಪಡಿಸಲಾಗಿದೆ ಮತ್ತು CUDA 12.8/13 ಮತ್ತು aarch64 ನೊಂದಿಗೆ ಹೊಂದಾಣಿಕೆಯನ್ನು ಸೇರಿಸಲಾಗಿದೆ.

  • CUDA ಟೈಲ್‌ನೊಂದಿಗೆ ಏಕೀಕರಣ. ಈ ಬಿಡುಗಡೆಯು cuTile ↔ SIMT ಸಂವಹನದ ಉದಾಹರಣೆಯನ್ನು ಸೇರಿಸುತ್ತದೆ: CUDA-ಆಕ್ಸೈಡ್ ಟೈಲ್ ಕೋರ್ ಮತ್ತು SIMT PTX ಕೋರ್ ಹಂಚಿಕೆಯ ಸಾಧನ ಟೆನ್ಸರ್‌ಗಳೊಂದಿಗೆ ಒಂದೇ CUDA ಸ್ಟ್ರೀಮ್‌ನಲ್ಲಿ ಕಾರ್ಯನಿರ್ವಹಿಸಬಹುದು. ಇದು NVIDIA ದ ವಿಶಾಲವಾದ Rust/CUDA ಕಾರ್ಯತಂತ್ರದಲ್ಲಿ CUDA-ಆಕ್ಸೈಡ್‌ನ ಸ್ಥಾನವನ್ನು ಪ್ರದರ್ಶಿಸುತ್ತದೆ: ಯೋಜನೆಯು Tile DSL ಅನ್ನು ಬದಲಾಯಿಸುವುದಿಲ್ಲ, ಬದಲಿಗೆ Rust ನಲ್ಲಿ ಸ್ಪಷ್ಟ SIMT ಪ್ರೋಗ್ರಾಮಿಂಗ್‌ಗಾಗಿ ಅಂತರವನ್ನು ಮುಚ್ಚುತ್ತದೆ.

  • ಅಪ್‌ಸ್ಟ್ರೀಮ್ ಪ್ಲಿರಾನ್/LLVM ಜೊತೆ ಒಮ್ಮುಖ. ಆಂತರಿಕ ಉಪಭಾಷೆ-llvm ಅನ್ನು pliron-org ಸಮುದಾಯದ ಬಾಹ್ಯ pliron-llvm ನೊಂದಿಗೆ ಬದಲಾಯಿಸಲಾಗಿದೆ ಮತ್ತು ಸ್ಥಳೀಯ ಘಟಕವನ್ನು llvm-export ಎಂದು ಮರುನಾಮಕರಣ ಮಾಡಲಾಗಿದೆ. ಇದು ಯೋಜನೆಯ ಮೂಲಸೌಕರ್ಯದ ಫೋರ್ಕ್ ಅನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ ಮತ್ತು ಅದನ್ನು ಅಪ್‌ಸ್ಟ್ರೀಮ್ ಅಭಿವೃದ್ಧಿಯೊಂದಿಗೆ ಹೆಚ್ಚು ನಿಕಟವಾಗಿ ಜೋಡಿಸುತ್ತದೆ.

  • ಯೋಜನೆಗೆ ಜೋಡಣೆ ಮತ್ತು ಪ್ರವೇಶವನ್ನು ಸರಳಗೊಳಿಸುವುದು. ಕಾರ್ಗೋ ಆಕ್ಸೈಡ್ ಈಗ RUSTFLAGS, CUDA_HOME, nvcc ಹೋಸ್ಟ್ ಕಂಪೈಲರ್ ಅನ್ನು ಗೌರವಿಸುತ್ತದೆ, ರಸ್ಟ್ ಟೂಲ್‌ಚೈನ್‌ನಿಂದ llc ಅನ್ನು ಕಂಡುಹಿಡಿಯಬಹುದು, ಗುರಿ GPU ಅನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಪತ್ತೆ ಮಾಡುತ್ತದೆ ಮತ್ತು ನವೀಕರಣದ ನಂತರ ಹಳೆಯ ಬ್ಯಾಕೆಂಡ್ ಸಂಗ್ರಹವನ್ನು ಮರುಹೊಂದಿಸುತ್ತದೆ. ಪುನರುತ್ಪಾದಿಸಬಹುದಾದ ಅಭಿವೃದ್ಧಿ ಪರಿಸರಕ್ಕಾಗಿ devcontainer ಮತ್ತು Nix ಫ್ಲೇಕ್ ಅನ್ನು ಸೇರಿಸಲಾಗಿದೆ.

CUDA-ಆಕ್ಸೈಡ್ ಇನ್ನೂ ಆರಂಭಿಕ ಆಲ್ಫಾ ಆವೃತ್ತಿಯಾಗಿದೆ: ಈ ಯೋಜನೆಯನ್ನು git ಮೂಲಕ ವಿತರಿಸಲಾಗಿದೆ, crates.io ನಲ್ಲಿ ಇನ್ನೂ ಪ್ರಕಟಿಸಲಾಗಿಲ್ಲ ಮತ್ತು ಕೇವಲ ಬೆಂಬಲಿಸುತ್ತದೆ LinuxAPI ಮುರಿದುಹೋಗಬಹುದು ಮತ್ತು ದೋಷಗಳು ಮತ್ತು ಅಪೂರ್ಣ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ನಿರೀಕ್ಷಿಸಲಾಗಿದೆ ಎಂದು README ಸ್ಪಷ್ಟವಾಗಿ ಎಚ್ಚರಿಸುತ್ತದೆ.

ಪರವಾನಗಿ ನೀಡುವುದರಲ್ಲಿ ಒಂದು ಸೂಕ್ಷ್ಮ ವ್ಯತ್ಯಾಸವಿದೆ.: ಕಾರ್ಯಕ್ಷೇತ್ರದ ಮುಖ್ಯ ಭಾಗವನ್ನು ಇದರ ಅಡಿಯಲ್ಲಿ ವಿತರಿಸಲಾಗಿದೆ ಅಪಾಚೆ ಪರವಾನಗಿ 2.0, ಆದರೆ ಕ್ರೇಟ್ ಕುಡಾ-ಬೈಂಡಿಂಗ್‌ಗಳು ಬಳಸುತ್ತವೆ NVIDIA ಸಾಫ್ಟ್‌ವೇರ್ ಪರವಾನಗಿಆದ್ದರಿಂದ, CUDA-ಆಕ್ಸೈಡ್ ಅನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ಏಕರೂಪದ ಅಪಾಚೆ ಯೋಜನೆ ಎಂದು ವಿವರಿಸಲಾಗುವುದಿಲ್ಲ; ಇದು CUDA ಪರಿಸರ ವ್ಯವಸ್ಥೆಯ ಸುತ್ತಲೂ NVIDIA ಲ್ಯಾಬ್ಸ್‌ನಿಂದ ಮುಕ್ತ-ಮೂಲ ಅಭಿವೃದ್ಧಿಯಾಗಿದ್ದು, ಕಡಿಮೆ-ಮಟ್ಟದ CUDA ಬೈಂಡಿಂಗ್‌ಗಳಿಗೆ ಪ್ರತ್ಯೇಕ ಪರವಾನಗಿಯನ್ನು ಹೊಂದಿದೆ.

ಮೂಲ: linux.org.ru

DDoS ರಕ್ಷಣೆ, VPS VDS ಸರ್ವರ್‌ಗಳೊಂದಿಗೆ ಸೈಟ್‌ಗಳಿಗೆ ವಿಶ್ವಾಸಾರ್ಹ ಹೋಸ್ಟಿಂಗ್ ಅನ್ನು ಖರೀದಿಸಿ 🔥 DDoS ರಕ್ಷಣೆ, VPS VDS ಸರ್ವರ್‌ಗಳೊಂದಿಗೆ ವಿಶ್ವಾಸಾರ್ಹ ವೆಬ್‌ಸೈಟ್ ಹೋಸ್ಟಿಂಗ್ ಅನ್ನು ಖರೀದಿಸಿ | ProHoster