NVIDIA อธิบายว่าทำไมตัวเร่งความเร็ว GeForce RTX ซีรีส์ 30 จึงมีประสิทธิภาพที่ก้าวกระโดดเช่นนี้

NVIDIA เปิดตัวกราฟิกการ์ดเกม Ampere รุ่นใหม่เมื่อวันที่ 1 กันยายน แต่การนำเสนอครั้งแรกแทบไม่มีรายละเอียดทางเทคนิคเลย ไม่กี่วันต่อมา บริษัทได้เผยแพร่เอกสารที่ชี้แจงว่าความได้เปรียบด้านประสิทธิภาพที่น่าประทับใจที่ทำให้กราฟิกการ์ด GeForce RTX ซีรีส์ 30 แตกต่างจากรุ่นก่อนมาจากไหน

NVIDIA อธิบายว่าทำไมตัวเร่งความเร็ว GeForce RTX ซีรีส์ 30 จึงมีประสิทธิภาพที่ก้าวกระโดดเช่นนี้

หลายคนสังเกตเห็นทันทีว่าข้อกำหนดอย่างเป็นทางการของ GeForce RTX 3090, GeForce RTX 3080 และ GeForce RTX 3070 บนเว็บไซต์ NVIDIA ระบุว่ามีโปรเซสเซอร์ CUDA จำนวนมากอย่างน่าตกใจ

NVIDIA อธิบายว่าทำไมตัวเร่งความเร็ว GeForce RTX ซีรีส์ 30 จึงมีประสิทธิภาพที่ก้าวกระโดดเช่นนี้

ปรากฎว่าประสิทธิภาพ FP32 เพิ่มขึ้นสองเท่าของโปรเซสเซอร์เกม Ampere เมื่อเปรียบเทียบกับทัวริงนั้นเกิดขึ้นจริงและมีความเกี่ยวข้องกับการเปลี่ยนแปลงในสถาปัตยกรรมของบล็อคการสร้างพื้นฐานของ GPU - สตรีมโปรเซสเซอร์ (SM)

NVIDIA อธิบายว่าทำไมตัวเร่งความเร็ว GeForce RTX ซีรีส์ 30 จึงมีประสิทธิภาพที่ก้าวกระโดดเช่นนี้

ในขณะที่ SM ใน GPU รุ่นทัวริงมีเส้นทางการคำนวณหนึ่งเส้นทางสำหรับการดำเนินการจุดลอยตัว ใน Ampere โปรเซสเซอร์สตรีมแต่ละตัวได้รับสองเส้นทาง ซึ่งโดยรวมแล้วสามารถดำเนินการได้สูงสุด 128 FMA ต่อรอบสัญญาณนาฬิกา เทียบกับ 64 สำหรับทัวริง ในเวลาเดียวกัน ครึ่งหนึ่งของหน่วยประมวลผล Ampere ที่มีอยู่สามารถทำงานได้ทั้งการดำเนินการจำนวนเต็ม (INT) และการดำเนินการจุดลอยตัว 32 บิต (FP32) ในขณะที่ครึ่งหลังของอุปกรณ์มีจุดประสงค์เพื่อการดำเนินงาน FP32 โดยเฉพาะ วิธีการนี้ใช้เพื่อประหยัดงบประมาณของทรานซิสเตอร์ โดยพิจารณาจากข้อเท็จจริงที่ว่าโหลดการเล่นเกมสร้าง FP32 มากกว่าการทำงานของ INT อย่างมีนัยสำคัญ อย่างไรก็ตาม ในทัวริงไม่มีแอคชูเอเตอร์แบบรวมเลย


NVIDIA อธิบายว่าทำไมตัวเร่งความเร็ว GeForce RTX ซีรีส์ 30 จึงมีประสิทธิภาพที่ก้าวกระโดดเช่นนี้

ในเวลาเดียวกันเพื่อให้โปรเซสเซอร์สตรีมที่ได้รับการปรับปรุงด้วยปริมาณข้อมูลที่จำเป็น NVIDIA ได้เพิ่มขนาดแคช L1 ใน SM ขึ้นหนึ่งในสาม (จาก 96 เป็น 128 KB) และยังเพิ่มปริมาณงานเป็นสองเท่าอีกด้วย

การปรับปรุงที่สำคัญอีกประการหนึ่งของ Ampere ก็คือ CUDA, RT และ Tensor core สามารถทำงานแบบขนานได้อย่างสมบูรณ์ ซึ่งช่วยให้เอ็นจิ้นกราฟิกใช้ DLSS เพื่อปรับขนาดหนึ่งเฟรม และในเวลาเดียวกันก็คำนวณเฟรมถัดไปบนคอร์ CUDA และ RT ซึ่งช่วยลดเวลาหยุดทำงานของโหนดการทำงานและเพิ่มประสิทธิภาพโดยรวม

เราต้องเพิ่มเติมด้วยว่าคอร์ RT รุ่นที่สองซึ่งใช้ใน Amrere สามารถคำนวณจุดตัดของสามเหลี่ยมที่มีรังสีได้เร็วเป็นสองเท่าของที่เกิดขึ้นในทัวริง และเทนเซอร์คอร์รุ่นที่สามใหม่มีประสิทธิภาพทางคณิตศาสตร์เพิ่มขึ้นเป็นสองเท่าเมื่อทำงานกับเมทริกซ์แบบเบาบาง

การเพิ่มความเร็วเป็นสองเท่าที่ Ampere คำนวณทางแยกของสามเหลี่ยมน่าจะมีผลกระทบอย่างมากต่อประสิทธิภาพของตัวเร่งความเร็ว GeForce RTX ซีรีส์ 30 ในเกมที่รองรับ Ray Tracing จากข้อมูลของ NVIDIA มันเป็นลักษณะนี้ที่ทำหน้าที่เป็นคอขวดในสถาปัตยกรรมทัวริงในขณะที่ความเร็วในการคำนวณจุดตัดของรังสีของเส้นขนานที่มีขอบเขตไม่ได้ทำให้เกิดข้อร้องเรียนใด ๆ ขณะนี้ความสมดุลของประสิทธิภาพในการติดตามได้รับการปรับให้เหมาะสมแล้ว และยิ่งไปกว่านั้นในแอมแปร์ การทำงานของรังสีทั้งสองประเภท (ที่มีสามเหลี่ยมและขนานกัน) ก็สามารถดำเนินการแบบขนานได้

นอกจากนี้ ยังมีการเพิ่มฟังก์ชันการทำงานใหม่ให้กับแกน RT ของ Ampere เพื่อประมาณตำแหน่งของรูปสามเหลี่ยม สามารถใช้เพื่อทำให้วัตถุที่กำลังเคลื่อนไหวเบลอได้เมื่อสามเหลี่ยมในฉากไม่อยู่ในตำแหน่งคงที่

เพื่ออธิบายทั้งหมดนี้ NVIDIA ได้แสดงการเปรียบเทียบโดยตรงว่า Turing และ Ampere GPU จัดการกับ Ray Tracing ใน Wolfenstein Youngblood ที่ความละเอียด 4K ได้อย่างไร ดังต่อจากภาพประกอบที่นำเสนอ Ampere ได้รับประโยชน์อย่างเห็นได้ชัดในด้านความเร็วในการสร้างเฟรมทั้งจากการคำนวณ FP32 ทางคณิตศาสตร์ที่เร็วขึ้น ต้องขอบคุณแกน RT รุ่นที่สอง เช่นเดียวกับการทำงานแบบขนานของทรัพยากร GPU ที่ต่างกัน

NVIDIA อธิบายว่าทำไมตัวเร่งความเร็ว GeForce RTX ซีรีส์ 30 จึงมีประสิทธิภาพที่ก้าวกระโดดเช่นนี้

นอกจากนี้ เพื่อเป็นการเสริมประสิทธิภาพข้างต้น NVIDIA ได้นำเสนอผลการทดสอบเพิ่มเติมสำหรับ GeForce RTX 3090, GeForce RTX 3080 และ GeForce RTX 3070 ตามที่กล่าวไว้ GeForce RTX 3070 นั้นเหนือกว่า GeForce RTX 60 ประมาณ 2070% ในความละเอียด 1440p และภาพนี้พบได้ในเกมที่รองรับ RTX และด้วยการแรสเตอร์แบบดั้งเดิม โดยเฉพาะใน Borderlands 3

NVIDIA อธิบายว่าทำไมตัวเร่งความเร็ว GeForce RTX ซีรีส์ 30 จึงมีประสิทธิภาพที่ก้าวกระโดดเช่นนี้

ประสิทธิภาพของ GeForce RTX 3080 นั้นดีเป็นสองเท่าของ GeForce RTX 2080 ที่ความละเอียด 4K จริงอยู่ ในกรณีนี้ใน Borderlands 3 ที่ไม่รองรับ RTX ข้อดีของการ์ดใหม่จะไม่เพิ่มขึ้นเป็นสองเท่า แต่ประมาณ 80 เปอร์เซ็นต์

NVIDIA อธิบายว่าทำไมตัวเร่งความเร็ว GeForce RTX ซีรีส์ 30 จึงมีประสิทธิภาพที่ก้าวกระโดดเช่นนี้

และการ์ดรุ่นเก่า GeForce RTX 3090 ในการทดสอบของ NVIDIA แสดงให้เห็นความได้เปรียบเหนือ Titan RTX ประมาณหนึ่งเท่าครึ่ง

NVIDIA อธิบายว่าทำไมตัวเร่งความเร็ว GeForce RTX ซีรีส์ 30 จึงมีประสิทธิภาพที่ก้าวกระโดดเช่นนี้

ตามรายงานจากนักข่าวเทคโนโลยี บทวิจารณ์ฉบับเต็มเกี่ยวกับการออกแบบอ้างอิง GeForce RTX 3080 มีกำหนดเผยแพร่ในวันที่ 14 กันยายน สามวันต่อมา ในวันที่ 17 กันยายน จะได้รับอนุญาตให้เผยแพร่ข้อมูลการทดสอบสำหรับรุ่น GeForce RTX 3080 ที่ใช้งานจริงจากพันธมิตรของบริษัท ดังนั้นจึงเหลือเวลาน้อยมากในการรอผลการทดสอบอิสระของตัวแทนของซีรีส์ GeForce RTX 30 ที่จะปรากฏบนอินเทอร์เน็ต

ที่มา:



ที่มา: 3dnews.ru

เพิ่มความคิดเห็น