NVIDIA GeForce RTX 30 цувралын хурдасгуурууд яагаад ийм өндөр гүйцэтгэлтэй байгааг тайлбарлав.

NVIDIA 1-р сарын 30-нд шинэ үеийн Ampere тоглоомын график картуудыг танилцуулсан боловч анхны танилцуулга нь бараг техникийн дэлгэрэнгүй мэдээллийг агуулаагүй байна. Одоо, хэдхэн хоногийн дараа тус компани GeForce RTX XNUMX-цуврал график картуудыг өмнөх хувилбаруудаас нь ялгах гайхалтай гүйцэтгэлийн давуу тал хаанаас ирдгийг тодруулсан баримт бичгийг гаргажээ.

NVIDIA GeForce RTX 30 цувралын хурдасгуурууд яагаад ийм өндөр гүйцэтгэлтэй байгааг тайлбарлав.

NVIDIA вэбсайт дээрх GeForce RTX 3090, GeForce RTX 3080 болон GeForce RTX 3070-ийн албан ёсны үзүүлэлтүүд нь гайхалтай олон тооны CUDA процессоруудыг харуулж байгааг олон хүн тэр даруй анзаарав.

NVIDIA GeForce RTX 30 цувралын хурдасгуурууд яагаад ийм өндөр гүйцэтгэлтэй байгааг тайлбарлав.

Тюрингтэй харьцуулахад Ampere тоглоомын процессоруудын FP32 гүйцэтгэл хоёр дахин нэмэгдэж байгаа нь үнэхээр ажиглагдаж байгаа бөгөөд энэ нь GPU-ийн үндсэн блокууд болох урсгал процессоруудын (SM) архитектурын өөрчлөлттэй холбоотой юм.

NVIDIA GeForce RTX 30 цувралын хурдасгуурууд яагаад ийм өндөр гүйцэтгэлтэй байгааг тайлбарлав.

Тьюрингийн үеийн GPU-ийн SM-ууд хөвөгч цэгийн үйлдлүүдийн нэг тооцооллын замтай байсан бол Амперт урсгал процессор бүр хоёр замыг хүлээн авсан бөгөөд энэ нь Тьюрингийн хувьд 128 цагийн мөчлөгт нийтдээ 64 FMA үйлдлийг гүйцэтгэх боломжтой. Үүний зэрэгцээ, боломжтой Ampere гүйцэтгэх нэгжүүдийн тал хувь нь бүхэл тоо (INT) болон 32 битийн хөвөгч цэгийн (FP32) үйлдлүүдийг хоёуланг нь гүйцэтгэх чадвартай бол төхөөрөмжүүдийн хоёр дахь хагас нь зөвхөн FP32 үйлдлүүдэд зориулагдсан болно. Тоглоомын ачаалал нь INT үйлдлээс хамаагүй илүү FP32 үүсгэдэг гэдгийг үндэслэн транзисторын төсвийг хэмнэхийн тулд энэ аргыг ашигласан. Гэсэн хэдий ч Тьюрингт хосолсон идэвхжүүлэгч огт байгаагүй.


NVIDIA GeForce RTX 30 цувралын хурдасгуурууд яагаад ийм өндөр гүйцэтгэлтэй байгааг тайлбарлав.

Үүний зэрэгцээ, сайжруулсан урсгал процессоруудыг шаардлагатай хэмжээний мэдээллээр хангахын тулд NVIDIA нь SM дахь L1 кэшийн хэмжээг гуравны нэгээр (96-аас 128 КБ хүртэл) нэмэгдүүлж, дамжуулах чадварыг хоёр дахин нэмэгдүүлсэн.

Амперын өөр нэг чухал сайжруулалт бол CUDA, RT болон Tensor цөмүүд одоо бүрэн зэрэгцээ ажиллах боломжтой болсон явдал юм. Энэ нь график хөдөлгүүрт жишээлбэл, DLSS-ийг ашиглан нэг фреймийг масштаблах, CUDA болон RT цөм дээр дараагийн фреймийг тооцоолох боломжийг олгодог бөгөөд энэ нь функциональ зангилааны зогсолтыг багасгаж, нийт гүйцэтгэлийг нэмэгдүүлдэг.

Амрере хотод хэрэгжсэн хоёр дахь үеийн RT цөмүүд нь туяатай гурвалжингийн огтлолцлыг Тюрингтэй харьцуулахад хоёр дахин хурдан тооцоолох боломжтой гэдгийг бид нэмж хэлэх ёстой. Гурав дахь үеийн шинэ тензор цөм нь сийрэг матрицтай ажиллахад математикийн гүйцэтгэлийг хоёр дахин нэмэгдүүлсэн.

Ампер гурвалжингийн огтлолцлыг тооцоолох хурдыг хоёр дахин нэмэгдүүлэх нь туяа мөрийг дэмждэг тоглоомуудын GeForce RTX 30 цуврал хурдасгуурын гүйцэтгэлд чухал нөлөө үзүүлэх ёстой. NVIDIA-ийн үзэж байгаагаар энэ шинж чанар нь Тьюрингийн архитектурт саад тотгор болж байсан бол хиллэдэг параллелепипедүүдийн цацрагийн огтлолцлын хурдыг тооцоолоход ямар ч гомдол гараагүй байна. Одоо мөрийн гүйцэтгэлийн тэнцвэрийг оновчтой болгосон бөгөөд үүнээс гадна Амперт хоёр төрлийн цацрагийн үйлдлийг (гурвалжин ба параллелепипедтэй) зэрэгцүүлэн гүйцэтгэж болно.

Үүнээс гадна Ampere-ийн RT цөмд гурвалжны байрлалыг интерполяцлах шинэ функц нэмэгдсэн. Энэ нь үзэгдлийн бүх гурвалжин тогтмол байрлалд байхгүй үед хөдөлгөөнт объектыг бүдгэрүүлэхэд ашиглаж болно.

Энэ бүхнийг харуулахын тулд NVIDIA нь Turing болон Ampere GPU-ууд Wolfenstein Youngblood-д 4K нягтралтайгаар туяа хянах аргыг хэрхэн зохицуулдгийг шууд харьцуулж үзүүлэв. Үзүүлсэн дүрслэлээс харахад Ampere нь 32-р үеийн RT цөмүүдийн ачаар математикийн FPXNUMX-ын илүү хурдан тооцоолол, мөн GPU-ийн янз бүрийн эх үүсвэрүүдийн зэрэгцээ үйл ажиллагааны ачаар хүрээний барилгын хурдад мэдэгдэхүйц ашиг тустай байдаг.

NVIDIA GeForce RTX 30 цувралын хурдасгуурууд яагаад ийм өндөр гүйцэтгэлтэй байгааг тайлбарлав.

Нэмж дурдахад дээр дурдсан зүйлийг бодитоор батлахын тулд NVIDIA нь GeForce RTX 3090, GeForce RTX 3080 болон GeForce RTX 3070-д зориулсан нэмэлт туршилтын үр дүнг танилцуулсан. Тэдний үзэж байгаагаар GeForce RTX 3070 нь GeForce RTX 60-ээс 2070p хувилбараар ойролцоогоор 1440%-иар илүү байна. Энэ зураг нь RTX дэмжлэгтэй тоглоомууд, уламжлалт растержуулалт, ялангуяа Borderlands 3-т ажиглагддаг.

NVIDIA GeForce RTX 30 цувралын хурдасгуурууд яагаад ийм өндөр гүйцэтгэлтэй байгааг тайлбарлав.

GeForce RTX 3080-ийн гүйцэтгэл нь 2080K нягтралтай GeForce RTX 4-аас хоёр дахин сайн. Үнэн, энэ тохиолдолд RTX дэмжлэггүй Borderlands 3-д шинэ картын давуу тал нь давхар биш, харин ойролцоогоор 80 хувь юм.

NVIDIA GeForce RTX 30 цувралын хурдасгуурууд яагаад ийм өндөр гүйцэтгэлтэй байгааг тайлбарлав.

Хуучин карт болох GeForce RTX 3090 нь NVIDIA-ийн өөрийн туршилтаар Titan RTX-ээс ойролцоогоор нэг хагас дахин давуу талтай болохыг харуулж байна.

NVIDIA GeForce RTX 30 цувралын хурдасгуурууд яагаад ийм өндөр гүйцэтгэлтэй байгааг тайлбарлав.

Технологийн сэтгүүлчдийн мэдээлснээр GeForce RTX 3080-ийн лавлагааны дизайны бүрэн тоймыг 14-р сарын 17-нд нийтлэх ёстой. Гурав хоногийн дараа буюу 3080-р сарын 30-нд тус компанийн түншүүдээс GeForce RTX XNUMX загваруудыг үйлдвэрлэх туршилтын мэдээллийг нийтлэхийг зөвшөөрнө. Тиймээс GeForce RTX XNUMX цувралын төлөөлөгчдийн бие даасан туршилтын үр дүн интернетэд гарч ирэхийг хүлээхэд маш бага хугацаа үлдлээ.

Эх сурвалж:



Эх сурвалж: 3dnews.ru

сэтгэгдэл нэмэх