NVIDIA نے وضاحت کی کہ GeForce RTX 30 سیریز کے ایکسلریٹر کی کارکردگی میں اتنی چھلانگ کیوں ہے

NVIDIA نے 1 ستمبر کو ایمپیئر گیمنگ گرافکس کارڈز کی نئی نسل متعارف کرائی، لیکن ابتدائی پیشکش میں تقریباً کوئی تکنیکی تفصیلات نہیں تھیں۔ اب، کچھ دنوں بعد، کمپنی نے ایسی دستاویزات جاری کی ہیں جو واضح کرتی ہیں کہ جیفورس RTX 30-سیریز کے گرافکس کارڈز کو اس کے پیشرو سے الگ کرنے والا متاثر کن کارکردگی کا فائدہ کہاں سے آتا ہے۔

NVIDIA نے وضاحت کی کہ GeForce RTX 30 سیریز کے ایکسلریٹر کی کارکردگی میں اتنی چھلانگ کیوں ہے

بہت سے لوگوں نے فوری طور پر دیکھا کہ NVIDIA ویب سائٹ پر GeForce RTX 3090, GeForce RTX 3080 اور GeForce RTX 3070 کی آفیشل وضاحتیں CUDA پروسیسرز کی حیرت انگیز طور پر بڑی تعداد کی نشاندہی کرتی ہیں۔

NVIDIA نے وضاحت کی کہ GeForce RTX 30 سیریز کے ایکسلریٹر کی کارکردگی میں اتنی چھلانگ کیوں ہے

جیسا کہ یہ پتہ چلتا ہے، ٹورنگ کے مقابلے ایمپیئر گیمنگ پروسیسرز کی FP32 کارکردگی کا دگنا ہونا واقعتاً واقع ہوتا ہے، اور اس کا تعلق GPU - سٹریم پروسیسرز (SM) کے بنیادی بلڈنگ بلاکس کے فن تعمیر میں تبدیلی سے ہے۔

NVIDIA نے وضاحت کی کہ GeForce RTX 30 سیریز کے ایکسلریٹر کی کارکردگی میں اتنی چھلانگ کیوں ہے

جب کہ ٹورنگ جنریشن GPUs میں SMs کے پاس فلوٹنگ پوائنٹ آپریشنز کے لیے ایک کمپیوٹیشنل راستہ تھا، Ampere میں ہر اسٹریم پروسیسر کو دو راستے ملے، جو مجموعی طور پر ٹورنگ کے لیے 128 کے مقابلے میں فی کلاک سائیکل 64 FMA آپریشنز انجام دے سکتے ہیں۔ ایک ہی وقت میں، دستیاب ایمپیئر ایگزیکیوشن یونٹس میں سے نصف انٹیجر (INT) آپریشنز اور 32-بٹ فلوٹنگ پوائنٹ (FP32) دونوں آپریشنز انجام دینے کی صلاحیت رکھتے ہیں، جبکہ ڈیوائسز کا دوسرا نصف صرف FP32 آپریشنز کے لیے ہے۔ یہ نقطہ نظر ٹرانزسٹر بجٹ کو بچانے کے لیے استعمال کیا گیا تھا، اس حقیقت کی بنیاد پر کہ گیمنگ لوڈ INT آپریشنز کے مقابلے میں نمایاں طور پر زیادہ FP32 پیدا کرتا ہے۔ تاہم، ٹورنگ میں کوئی مشترکہ عمل کرنے والے بالکل نہیں تھے۔


NVIDIA نے وضاحت کی کہ GeForce RTX 30 سیریز کے ایکسلریٹر کی کارکردگی میں اتنی چھلانگ کیوں ہے

اسی وقت، ڈیٹا کی ضروری مقدار کے ساتھ بہتر اسٹریم پروسیسرز فراہم کرنے کے لیے، NVIDIA نے SM میں L1 کیش کے سائز میں ایک تہائی (96 سے 128 KB تک) اضافہ کیا، اور اس کے تھرو پٹ کو بھی دوگنا کر دیا۔

ایمپیئر میں ایک اور اہم بہتری یہ ہے کہ CUDA، RT اور Tensor cores اب مکمل طور پر متوازی چل سکتے ہیں۔ یہ گرافکس انجن کو، مثال کے طور پر، ایک فریم کو پیمانہ کرنے کے لیے DLSS کا استعمال کرنے کی اجازت دیتا ہے، اور ایک ہی وقت میں CUDA اور RT cores پر اگلے فریم کا حساب لگاتا ہے، جس سے فنکشنل نوڈس کا ڈاؤن ٹائم کم ہوتا ہے اور مجموعی کارکردگی میں اضافہ ہوتا ہے۔

اس میں ہمیں یہ شامل کرنا چاہیے کہ دوسری نسل کے RT کور، جو امریرے میں لاگو ہوتے ہیں، شعاعوں کے ساتھ مثلث کے چوراہوں کا حساب لگا سکتے ہیں جتنا کہ ٹورنگ میں ہوا تھا۔ اور نئے تھرڈ جنریشن ٹینسر کور نے ویرل میٹرکس کے ساتھ کام کرتے وقت ریاضی کی کارکردگی کو دوگنا کر دیا ہے۔

اس رفتار کو دوگنا کرنے سے جس پر ایمپیئر مثلث کے چوراہوں کا حساب لگاتا ہے اس سے رے ٹریسنگ کو سپورٹ کرنے والے گیمز میں GeForce RTX 30-سیریز ایکسلریٹر کی کارکردگی پر نمایاں اثر پڑے گا۔ NVIDIA کے مطابق، یہی وہ خصوصیت تھی جس نے ٹورنگ فن تعمیر میں رکاوٹ کا کام کیا، جبکہ متوازی پائپوں کی شعاعوں کے چوراہوں کے حساب کی رفتار نے کوئی شکایت نہیں کی۔ اب ٹریسنگ میں کارکردگی کے توازن کو بہتر بنایا گیا ہے، اور مزید یہ کہ ایمپیئر میں، دونوں قسم کے شعاعوں کے آپریشن (مثلث اور متوازی پائپ کے ساتھ) متوازی طور پر کیے جا سکتے ہیں۔

اس کے علاوہ، مثلث کی پوزیشن کو انٹرپولیٹ کرنے کے لیے ایمپیئر کے RT کور میں نئی ​​فعالیت شامل کی گئی ہے۔ یہ حرکت میں موجود اشیاء کو دھندلا کرنے کے لیے استعمال کیا جا سکتا ہے جب منظر میں موجود تمام مثلث مستقل پوزیشن میں نہ ہوں۔

ان سب کو واضح کرنے کے لیے، NVIDIA نے اس بات کا براہ راست موازنہ دکھایا کہ ٹورنگ اور ایمپیئر GPU کس طرح Wolfenstein Youngblood میں 4K ریزولوشن میں رے ٹریسنگ کو ہینڈل کرتے ہیں۔ جیسا کہ پیش کی گئی مثال سے درج ذیل ہے، ایمپیئر کو فریم کی تعمیر کی رفتار دونوں میں تیزی سے ریاضیاتی FP32 کیلکولیشنز کی وجہ سے نمایاں طور پر فائدہ ہوتا ہے، دوسری نسل کے RT کور کے ساتھ ساتھ متضاد GPU وسائل کے متوازی آپریشن کی بدولت۔

NVIDIA نے وضاحت کی کہ GeForce RTX 30 سیریز کے ایکسلریٹر کی کارکردگی میں اتنی چھلانگ کیوں ہے

مزید برآں، مذکورہ بالا کو عملی طور پر تقویت دینے کے لیے، NVIDIA نے GeForce RTX 3090، GeForce RTX 3080 اور GeForce RTX 3070 کے لیے اضافی ٹیسٹ کے نتائج پیش کیے ہیں۔ ان کے مطابق، GeForce RTX 3070 تقریباً 60% آگے ہے ریزولوشن GeForce RTX2070، اور یہ تصویر RTX سپورٹ کے ساتھ گیمز میں، اور روایتی راسٹرائزیشن کے ساتھ، خاص طور پر Borderlands 1440 میں دیکھی جاتی ہے۔

NVIDIA نے وضاحت کی کہ GeForce RTX 30 سیریز کے ایکسلریٹر کی کارکردگی میں اتنی چھلانگ کیوں ہے

GeForce RTX 3080 کی کارکردگی 2080K ریزولوشن میں GeForce RTX 4 کے مقابلے میں دگنی ہے۔ سچ ہے، اس معاملے میں، RTX سپورٹ کے بغیر Borderlands 3 میں، نئے کارڈ کا فائدہ دوگنا نہیں، بلکہ تقریباً 80 فیصد ہے۔

NVIDIA نے وضاحت کی کہ GeForce RTX 30 سیریز کے ایکسلریٹر کی کارکردگی میں اتنی چھلانگ کیوں ہے

اور پرانا کارڈ، GeForce RTX 3090، NVIDIA کے اپنے ٹیسٹوں میں Titan RTX کے مقابلے میں ڈیڑھ گنا فائدہ دکھاتا ہے۔

NVIDIA نے وضاحت کی کہ GeForce RTX 30 سیریز کے ایکسلریٹر کی کارکردگی میں اتنی چھلانگ کیوں ہے

ٹیک صحافیوں کی رپورٹوں کے مطابق، GeForce RTX 3080 ریفرنس ڈیزائن کے مکمل جائزے 14 ستمبر کو شائع ہونے والے ہیں۔ تین دن بعد، 17 ستمبر کو، اسے کمپنی کے شراکت داروں سے GeForce RTX 3080 ماڈلز کی تیاری کے لیے ٹیسٹ ڈیٹا شائع کرنے کی اجازت ہوگی۔ اس طرح، انٹرنیٹ پر GeForce RTX 30 سیریز کے نمائندوں کے آزاد ٹیسٹوں کے نتائج کا انتظار کرنے کے لیے بہت کم وقت بچا ہے۔

ماخذ:



ماخذ: 3dnews.ru

نیا تبصرہ شامل کریں