NVIDIA DGX A100: پہلا ایمپیئر پر مبنی پلیٹ فارم کارکردگی کے پانچ پیٹا فلاپ پیش کرتا ہے

DGX A100 سسٹم، جس کی بنیاد پر حال ہی میں جین سن ہوانگ اسے تندور سے نکالا، آٹھ A100 GPUs، چھ NVLink 3.0 سوئچز، نو Mellanox نیٹ ورک کنٹرولرز، دو AMD EPYC روم جنریشن پروسیسرز 64 کور، 1 TB RAM اور 15 TB SSDs NVMe سپورٹ کے ساتھ شامل ہیں۔

NVIDIA DGX A100: پہلا ایمپیئر پر مبنی پلیٹ فارم کارکردگی کے پانچ پیٹا فلاپ پیش کرتا ہے

NVIDIA DGX A100 کمپنی کے کمپیوٹنگ سسٹمز کی تیسری نسل ہے، جو بنیادی طور پر مصنوعی ذہانت کے مسائل کو حل کرنے کے لیے ڈیزائن کیا گیا ہے۔ اب ایسے سسٹمز ایمپیئر فیملی کے جدید ترین A100 گرافکس پروسیسرز پر بنائے گئے ہیں، جس کی وجہ سے ان کی کارکردگی میں تیزی سے اضافہ ہوتا ہے، جو کہ 5 پیٹا فلاپ تک پہنچ گیا ہے۔ اس کی بدولت، DGX A100 بہت زیادہ پیچیدہ AI ماڈلز اور ڈیٹا کی بہت بڑی مقدار کو سنبھالنے کے قابل ہے۔

DGX A100 سسٹم کے لیے، NVIDIA صرف HBM2 میموری کی کل مقدار کی نشاندہی کرتا ہے، جو 320 GB تک پہنچتی ہے۔ سادہ ریاضی کے حسابات ہمیں یہ تعین کرنے کی اجازت دیتے ہیں کہ ہر GPU میں 40 GB میموری ہے، اور نئی مصنوعات کی تصاویر یہ واضح کرتی ہیں کہ یہ حجم چھ اسٹیکوں میں تقسیم کیا گیا ہے۔ گرافکس میموری بینڈوڈتھ کا بھی ذکر کیا گیا ہے - مجموعی طور پر پورے DGX A12,4 سسٹم کے لیے 100 TB/s۔

اس بات کو مدنظر رکھتے ہوئے کہ DGX-1 سسٹم نے، آٹھ Tesla V100s پر مبنی، مخلوط درستگی کے حساب سے ایک پیٹا فلاپ تیار کیا، اور DGX A100 کا دعویٰ ہے کہ وہ پانچ پیٹا فلاپ پر کارکردگی کا مظاہرہ کرے، ہم یہ فرض کر سکتے ہیں کہ مخصوص حسابات میں ایک Ampere GPU اس سے پانچ گنا تیز ہے۔ وولٹا فن تعمیر کے ساتھ اس کا پیشرو۔ بعض صورتوں میں، فائدہ بیس گنا ہو جاتا ہے.

NVIDIA DGX A100: پہلا ایمپیئر پر مبنی پلیٹ فارم کارکردگی کے پانچ پیٹا فلاپ پیش کرتا ہے

مجموعی طور پر، DGX A8 سسٹم انٹیجر آپریشنز (INT100) میں فی سیکنڈ 1016 آپریشنز کی اعلیٰ کارکردگی فراہم کرتا ہے، نصف درستگی کے فلوٹنگ پوائنٹ آپریشنز (FP16) میں - 5 petaflops، ڈبل پریسجن فلوٹنگ پوائنٹ آپریشنز (FP64) - 156 ٹیرا فلاپس۔ . مزید برآں، DGX A32 TF100 ٹینسر کمپیوٹنگ میں 2,5 petaflops کی اعلیٰ کارکردگی حاصل کرتا ہے۔ ہمیں یاد کرنے دیں کہ ایک ٹیرا فلاپ 1012 فلوٹنگ پوائنٹ آپریشن فی سیکنڈ ہے، ایک پیٹا فلاپ 1015 فلوٹنگ پوائنٹ آپریشنز فی سیکنڈ ہے۔

NVIDIA A100 ایکسلریٹر کی ایک اہم خصوصیت ایک GPU کے وسائل کو سات ورچوئل سیگمنٹس میں تقسیم کرنے کی صلاحیت ہے۔ یہ آپ کو اسی کلاؤڈ سیگمنٹ میں کنفیگریشن لچک کو نمایاں طور پر بڑھانے کی اجازت دیتا ہے۔ مثال کے طور پر، آٹھ فزیکل GPU کے ساتھ ایک DGX A100 سسٹم 56 ورچوئل GPUs کے طور پر کام کر سکتا ہے۔ ملٹی انسٹینس GPU (MIG) ٹیکنالوجی آپ کو کمپیوٹنگ کور کے درمیان اور کیش میموری اور HBM2 میموری کے حصے کے طور پر مختلف سائز کے حصوں کو منتخب کرنے کی اجازت دیتی ہے، اور وہ بینڈوتھ کے لیے ایک دوسرے سے مقابلہ نہیں کریں گے۔

NVIDIA DGX A100: پہلا ایمپیئر پر مبنی پلیٹ فارم کارکردگی کے پانچ پیٹا فلاپ پیش کرتا ہے

یہ بات قابل غور ہے کہ پچھلے DGX سسٹمز کے مقابلے DGX A100 کی اناٹومی میں کچھ تبدیلیاں آئی ہیں۔ SXM3 ماڈیولز کے ریڈی ایٹرز میں ہیٹ پائپوں کی تعداد، جن پر HBM100 میموری والے A2 گرافکس پروسیسرز نصب ہیں، وولٹا جنریشن کے Tesla V100 ماڈیولز کے مقابلے میں نمایاں اضافہ ہوا ہے، حالانکہ ان کے سرے عام آدمی کی نظروں سے پوشیدہ ہیں۔ اوپری کور کی طرف سے. اس ڈیزائن کی عملی حد 400 ڈبلیو تھرمل توانائی ہے۔ اس کی تصدیق آج شائع ہونے والے SXM100 ورژن میں A3 کی سرکاری خصوصیات سے بھی ہوتی ہے۔

مدر بورڈ پر A100 GPUs کے آگے چھ تیسری نسل کے NVLink انٹرفیس سوئچز ہیں، جو مل کر 4,8 TB/s کی رفتار سے دو طرفہ ڈیٹا ایکسچینج فراہم کرتے ہیں۔ NVIDIA نے ان کی ٹھنڈک کا بھی سنجیدگی سے خیال رکھا، ہیٹ پائپ کے ساتھ فل پروفائل ریڈی ایٹرز کے مطابق۔ ہر GPU کو NVLink انٹرفیس کے 12 چینلز مختص کیے گئے ہیں؛ پڑوسی GPUs 600 GB/s کی رفتار سے ڈیٹا کا تبادلہ کر سکتے ہیں۔

DGX A100 سسٹم میں نو Mellanox ConnectX-6 HDR نیٹ ورک کنٹرولرز بھی ہیں، جو 200 Gbit/s کی رفتار سے معلومات کی ترسیل کے قابل ہیں۔ مجموعی طور پر، DGX A100 3,6 TB/s کی رفتار سے دو طرفہ ڈیٹا کی منتقلی فراہم کرتا ہے۔ یہ نظام ملکیتی میلانوکس ٹیکنالوجیز کا بھی استعمال کرتا ہے جس کا مقصد کمپیوٹنگ سسٹمز کی اس طرح کے فن تعمیر کے ساتھ موثر پیمانے پر کرنا ہے۔ پلیٹ فارم کی سطح پر PCI ایکسپریس 4.0 سپورٹ کا تعین AMD EPYC روم جنریشن پروسیسرز کے ذریعے کیا جاتا ہے؛ نتیجتاً، یہ انٹرفیس نہ صرف A100 گرافکس ایکسلریٹر، بلکہ NVMe پروٹوکول کے ساتھ سالڈ سٹیٹ ڈرائیوز کے ذریعے بھی استعمال ہوتا ہے۔

NVIDIA DGX A100: پہلا ایمپیئر پر مبنی پلیٹ فارم کارکردگی کے پانچ پیٹا فلاپ پیش کرتا ہے

DGX A100 کے علاوہ، NVIDIA نے اپنے شراکت داروں کو HGX A100 بورڈز کی فراہمی شروع کر دی ہے، جو سرور سسٹمز کے اجزاء میں سے ایک ہیں جنہیں دوسرے مینوفیکچررز خود تیار کریں گے۔ ایک واحد HGX A100 بورڈ چار یا آٹھ NVIDIA A100 GPUs کو ایڈجسٹ کر سکتا ہے۔ اس کے علاوہ، اپنی ضروریات کے لیے، NVIDIA نے پہلے سے ہی DGX SuperPOD - 140 DGX A100 سسٹمز کا ایک کلسٹر اسمبل کر لیا ہے، جو 700 پیٹا فلاپس پر کافی معمولی مجموعی جہتوں کے ساتھ کارکردگی فراہم کرتا ہے۔ کمپنی نے DGX A100 پر مبنی اسی طرح کے کمپیوٹنگ کلسٹرز بنانے کے خواہشمند شراکت داروں کو طریقہ کار کی مدد فراہم کرنے کا وعدہ کیا۔ ویسے، NVIDIA کو DGX SuperPOD بنانے میں ایک ماہ سے زیادہ کا وقت نہیں لگا تھا بجائے اس کے کہ اس طرح کے کاموں کے لیے کئی مہینوں یا برسوں کا وقت ہو۔

NVIDIA DGX A100: پہلا ایمپیئر پر مبنی پلیٹ فارم کارکردگی کے پانچ پیٹا فلاپ پیش کرتا ہے

NVIDIA کے مطابق، DGX A100 کی ترسیل پہلے ہی $199 فی کاپی کی قیمت پر شروع ہو چکی ہے، کمپنی کے پارٹنرز پہلے ہی ان سسٹمز کو اپنے کلاؤڈ کلسٹرز میں میزبانی کر رہے ہیں، ماحولیاتی نظام پہلے ہی 000 ممالک کا احاطہ کرتا ہے، بشمول ویتنام اور UAE۔ مزید برآں، ایمپیئر فن تعمیر کے ساتھ گرافکس حل کافی حد تک پرلمٹر سپر کمپیوٹر سسٹم کا حصہ ہوں گے، جسے کرے نے امریکی محکمہ توانائی کے لیے بنایا ہے۔ یہ Zen 26 فن تعمیر کے ساتھ AMD EPYC میلان نسل کے مرکزی پروسیسرز کے ساتھ NVIDIA Ampere گرافکس پروسیسرز پر مشتمل ہوگا۔ NVIDIA Ampere پر مبنی سپر کمپیوٹر نوڈس سال کے دوسرے نصف میں صارفین تک پہنچ جائیں گے، حالانکہ پہلی کاپیاں پہلے ہی خصوصی لیبارٹری میں پہنچ چکی ہیں۔ امریکی محکمہ.



ماخذ: 3dnews.ru

نیا تبصرہ شامل کریں