NVIDIA CUDA-Oxide 0.2.0

Arrinta waa la daabacay CUDA-Oksayd 0.2.0 — kombuyuutar NVIDIA Labs ah oo tijaabo ah oo kuu oggolaanaya inaad qorto koodka kernels-ka CUDA Mirdhaya saafi ah oo si toos ah ugu soo ururi gudaha PTXMashruucu wuxuu u adeegsadaa dhabarka dambe ee rustc wuxuuna taageeraa qaabka SIMT waxaana lagu dhisay iyadoo la adeegsanayo amarka xabagta xamuulka, iyadoo lambarka martida iyo qalabka ay awood u leeyihiin inay ku noolaadaan geed isku mid ah. 5 Juun 2026 Juunyo waxaana loo magacaabay "sii deynta bulshada" ee ugu horreysay: ka dib markii la furay laanta 0.1.0, mashruucu wuxuu aqbalay 37 codsi oo jiiditaan ah oo ka yimid 23 ka qaybgalayaasha.

Isbeddelka ugu weyn ee CUDA-Oxide 0.2.0 waa u gudubka fulitaanka iskiis u shaqeeya. Waxyaabaha GPU-ga ee la sameeyay - PTX, NVVM-IR, LTOIR, iyo cubin - hadda si toos ah ayaa loogu dhejin karaa binary-ga martida loo yahay iyada oo loo marayo qaabka cusub ee oxide-artifacts. Tani waxay ka dhigan tahay in barnaamijka Rust oo leh xudunta CUDA uusan u baahnayn inuu qaado faylasha .ptx ee kala duwan, xuduntana si toos ah ayaa looga soo raray kuwa la fulin karo ee socda.

Isbeddellada ugu waaweyn:

  • Ku dhejinta xudunta GPU-ga ee binary-ga martida loo yahay. Habka cusub ee #[cuda_module] wuxuu abuuraa is-dhexgal bilow ah oo kernel ah wuxuuna qariyaa rarista module-ka heerka hoose. Horumariyaha, tani waxay u egtahay mid u dhow Rust API-ga caadiga ah: xaleefyada iyo kaydiyeyaasha waxaa lagu sawiray CUDA buffers, furitaankuna si xoog leh ayaa loo qoraa.

  • Taageerada xusuusta ee joogtada ah ee CUDA. Waxaa lagu daray #[joogto ah] iyo Joogto ah iyadoo la adeegsanayo soo saarista martigeliyaha. Heerka PTX, tani waxay la mid tahay .const iyo booska cinwaanka 4. Tani waa muhiim xogta u baahan in loo heli karo kernels-ka qiimo joogto ah oo ku jira qalabka.

  • Xisaab qalab oo dheeraad ah. f32::max, f32::min, iyo sidoo kale atan iyo atan2 ee f32 iyo f64, ayaa lagu daray libdevice. Tani waxay ballaarinaysaa qaybaha kombiyuutarka ee adduunka dhabta ah ee la muujin karo iyada oo aan loo adeegsan C++/CUDA.

  • Hagaajinta khaldan ee aamusan. Dhowr qalad oo aamusan ayaa hadda keena cillad waqtiga dhismaha ah halkii ay ka abuuri lahaayeen PTX khaldan (wgmma maqan ayaa ururta, laga saaray burburiyeyaasha, hawl wadeennada la liqay).

  • Waqtiga socodsiinta martida loo yahay oo la hagaajiyay. Qandaraas amni oo DeviceCopy ah ayaa lagu daray si loogu wareejiyo xogta qalabka, oo ay weheliso kaydiyeyaasha martida loo xiray oo leh wareejinta durdurka la dalbado, gudbinta khaladaadka aan isku mid ahayn, iyo marin u helidda heerka hoose ee CUmodule cayriin si loogu daro CUDA Driver API. Isku dheelitir la'aanta qaybinta DeviceBuffer ayaa sidoo kale la hagaajiyay, waxaana lagu daray iswaafajinta CUDA 12.8/13 iyo aarch64.

  • Isdhexgalka Taaylka CUDA. Soo-saarku wuxuu ku darayaa tusaale is-dhexgalka cuTile ↔ SIMT: xudunta Tile-ka CUDA-Oxide iyo xudunta SIMT PTX waxay ku shaqeyn karaan hal durdur CUDA ah oo leh tensors qalab la wadaago. Tani waxay muujinaysaa booska CUDA-Oxide ee istaraatiijiyadda ballaaran ee Rust/CUDA ee NVIDIA: mashruucu ma beddelayo Tile DSL, laakiin wuxuu xirayaa farqiga u dhexeeya barnaamijyada SIMT ee cad ee Rust.

  • Isku-xidhka Pliron/LLVM ee kor u socda. Lahjadda gudaha-llvm waxaa lagu beddelay pliro-llvm dibadda ah oo ka timid bulshada pliro-org, qaybta maxalliga ahna waxaa loo bixiyay llvm-export. Tani waxay yaraynaysaa habka mashruuca ee kaabayaasha dhaqaalaha waxayna si dhow ula jaanqaadaysaa horumarka kor u kaca.

  • Fududeynta isu imaatinka iyo gelitaanka mashruuc. Cargo Oxide hadda waxay ixtiraamtaa RUSTFLAGS, CUDA_HOME, oo ah soo-saare martigeliyaha nvcc, wuxuu ka heli karaa llc qalabka Rust toolchain, si toos ah ayuu u ogaadaa GPU-ga bartilmaameedka ah, wuxuuna dib u dejinayaa kaydka dambe ee duugoobay ka dib cusbooneysiin. Waxaa lagu daray devcontainer iyo flake Nix si loogu sameeyo jawi horumarineed oo la soo saari karo.

CUDA-Oxide wali waa nooc hore oo alpha ah: mashruuca waxaa lagu qaybiyaa git, weli laguma daabicin crates.io waxaana la taageeraa oo keliya. LinuxREADME sidoo kale si cad ayay uga digaysaa in API-gu uu jabi karo, iyo in la filayo cayayaanka iyo sifooyinka aan la dhammaystirin.

Waxaa jira farqi u dhexeeya shatiyeynta: qaybta ugu weyn ee goobta shaqada waxaa lagu qaybiyaa hoos Liisanka Apache 2.0, laakiin crate cuda-bindings waxay isticmaashaa Ruqsadda Barnaamijka NVIDIASidaa darteed, CUDA-Oxide laguma tilmaami karo mashruuc Apache ah oo gebi ahaanba isku mid ah; waa horumarin il furan oo ay samaysay NVIDIA Labs oo ku wareegsan nidaamka deegaanka CUDA, oo leh shati gaar ah oo loogu talagalay isku xidhka CUDA ee heerka hoose.

Source: linux.org.ru

U soo iibso martigelin lagu kalsoonaan karo oo loogu talagalay bogagga leh ilaalinta DDoS, VPS VDS servers 🔥 Iibso martigelin degel oo lagu kalsoonaan karo oo leh ilaalinta DDoS, VPS VDS servers | ProHoster