Tensoraj kaj RT-kernoj ne okupas tiom da spaco sur NVIDIA Turing GPU-oj

Eĉ dum la anonco de la unuaj videokartoj de la serio GeForce RTX 20, multaj kredis, ke Turing-GPU-oj ŝuldas siajn tute ne malgrandajn dimensiojn al la ĉeesto de pliaj unuoj: RT-kernoj kaj tensorkernoj. Nun, unu Reddit-uzanto analizis infraruĝajn bildojn de la Turing TU106 kaj TU116 GPU-oj kaj konkludis, ke la novaj komputikaj unuoj ne okupas tiom da spaco kiel origine pensis.

Tensoraj kaj RT-kernoj ne okupas tiom da spaco sur NVIDIA Turing GPU-oj

Komence, ni rememoru, ke la Turing TU106 GPU estas la plej juna kaj plej kompakta NVIDIA-peceto kun specialaj RT-kernoj por radiospurado kaj tensorkernoj por akceli funkciojn de artefarita inteligenteco. Siavice, la grafika procesoro Turing TU116, kiu rilatas al ĝi, estas senigita de ĉi tiuj specialaj komputikaj unuoj kaj tial oni decidis kompari ilin.

Tensoraj kaj RT-kernoj ne okupas tiom da spaco sur NVIDIA Turing GPU-oj
Tensoraj kaj RT-kernoj ne okupas tiom da spaco sur NVIDIA Turing GPU-oj

GPU-oj de NVIDIA Turing estas dividitaj en TPC-unuojn, kiuj inkluzivas paron da fluantaj multprocesoroj (Streaming Multiprocessors), kiuj jam inkluzivas ĉiujn komputikajn kernojn. Kaj kiel ĝi rezultas, la Turing TU106 GPU havas nur 1,95 mm² pli da TPC-areo ol la Turing TU116, aŭ 22%. De tiu areo, 1,25 mm² estas por tensorkernoj, kaj nur 0,7 mm² estas por RT-kernoj.

Tensoraj kaj RT-kernoj ne okupas tiom da spaco sur NVIDIA Turing GPU-oj
Tensoraj kaj RT-kernoj ne okupas tiom da spaco sur NVIDIA Turing GPU-oj

Rezultas, ke sen la nova tensoro kaj RT-kernoj, la ĉefa grafika procesoro Turing TU102, kiu subestas la GeForce RTX 2080 Ti, okupus ne 754 mm², sed 684 mm² (36 TPC). Siavice, la Turing TU104, kiu estas la bazo de la GeForce RTX 2080, povus okupi 498 mm² anstataŭ 545 mm² (24 TPC). Kiel vi povas vidi, eĉ sen tensoraj kaj RT-kernoj, pli malnovaj Turing-GPU-oj estus tre grandaj blatoj. Signife pli da Pascal-GPU-oj.


Tensoraj kaj RT-kernoj ne okupas tiom da spaco sur NVIDIA Turing GPU-oj

Do kio estas la kialo de tiaj konsiderindaj grandecoj? Por komenci, Turing-GPU-oj havis pli grandajn kaŝmemorgrandojn. La grandeco de la ombriloj ankaŭ estis pliigita, kaj Turing-fritoj havas pli grandajn instrukciojn kaj pli grandajn registrojn. Ĉio ĉi ebligis signife pliigi ne nur la areon, sed ankaŭ la rendimenton de Turing-GPU-oj. Ekzemple, la sama GeForce RTX 2060 bazita sur TU106 disponigas preskaŭ la saman nivelon de efikeco kiel la GeForce GTX 1080 bazita sur GP104. Ĉi-lasta, cetere, havas 25% pli grandan nombron da CUDA-kernoj, kvankam ĝi okupas areon de 314 mm2 kontraŭ 410 mm2 por la nova TU106. 




fonto: 3dnews.ru

Aldoni komenton