NVIDIA DGX A100: أول منصة تعتمد على Ampere توفر خمسة بيتافلوب من الأداء

نظام DGX A100، الذي اعتمد عليه Jen-Hsun Huang مؤخرًا أخرجته من الفرن، يتضمن ثمانية وحدات معالجة رسوميات A100، وستة محولات NVLink 3.0، وتسع وحدات تحكم شبكة Mellanox، ومعالجين من الجيل AMD EPYC Rome مع 64 نواة، و1 تيرابايت من ذاكرة الوصول العشوائي و15 تيرابايت من محركات أقراص SSD مع دعم NVMe.

NVIDIA DGX A100: أول منصة تعتمد على Ampere توفر خمسة بيتافلوب من الأداء

NVIDIA DGX A100 هو الجيل الثالث من أنظمة الحوسبة الخاصة بالشركة، وهو مصمم بشكل أساسي لحل مشكلات الذكاء الاصطناعي. الآن هذه الأنظمة مبنية على أحدث المعالجات الرسومية A100 من عائلة Ampere، مما يسبب زيادة حادة في أدائها الذي وصل إلى 5 بيتافلوب. وبفضل هذا، فإن DGX A100 قادر على التعامل مع نماذج الذكاء الاصطناعي الأكثر تعقيدًا وكميات أكبر بكثير من البيانات.

بالنسبة لنظام DGX A100، تشير NVIDIA فقط إلى إجمالي حجم ذاكرة HBM2، والذي يصل إلى 320 جيجابايت. تتيح لنا الحسابات الحسابية البسيطة تحديد أن كل وحدة معالجة رسومات تحتوي على 40 جيجابايت من الذاكرة، وتوضح صور المنتج الجديد أن هذا الحجم موزع على ستة أكوام. تم ذكر النطاق الترددي لذاكرة الرسومات أيضًا - 12,4 تيرابايت / ثانية لنظام DGX A100 بأكمله بشكل إجمالي.

مع الأخذ في الاعتبار أن نظام DGX-1، المستند إلى ثمانية Tesla V100s، أنتج بيتافلوب واحد في حسابات مختلطة الدقة، ويُزعم أن DGX A100 يعمل عند خمسة بيتافلوب، يمكننا أن نفترض أنه في حسابات محددة يكون معالج رسوميات Ampere واحد أسرع بخمس مرات من سابقتها مع العمارة فولتا. وفي بعض الحالات، تصبح الميزة عشرين ضعفا.

NVIDIA DGX A100: أول منصة تعتمد على Ampere توفر خمسة بيتافلوب من الأداء

في المجمل، يوفر نظام DGX A8 أعلى أداء يبلغ 100 عملية في الثانية في عمليات الأعداد الصحيحة (INT1016)، في عمليات الفاصلة العائمة بنصف الدقة (FP16) - 5 بيتافلوب، في عمليات الفاصلة العائمة مزدوجة الدقة (FP64) - 156 تيرافلوب . بالإضافة إلى ذلك، يحقق DGX A32 أعلى أداء يبلغ 100 بيتافلوب في حوسبة الموتر TF2,5. دعونا نتذكر أن التيرافلوب الواحد يساوي 1012 عملية الفاصلة العائمة في الثانية، والبيتافلوب الواحد يساوي 1015 عملية الفاصلة العائمة في الثانية.

إحدى الميزات المهمة لمسرعات NVIDIA A100 هي القدرة على تقسيم موارد وحدة معالجة الرسومات (GPU) واحدة إلى سبعة أجزاء افتراضية. يتيح لك ذلك زيادة مرونة التكوين بشكل كبير في نفس قطاع السحابة. على سبيل المثال، يمكن لنظام DGX A100 واحد مزود بثماني وحدات معالجة رسومات فعلية أن يعمل بمثابة 56 وحدة معالجة رسومات افتراضية. تتيح لك تقنية Multi-Instance GPU (MIG) تحديد مقاطع ذات أحجام مختلفة بين مراكز الحوسبة وكجزء من ذاكرة التخزين المؤقت وذاكرة HBM2، ولن تتنافس مع بعضها البعض على عرض النطاق الترددي.

NVIDIA DGX A100: أول منصة تعتمد على Ampere توفر خمسة بيتافلوب من الأداء

ومن الجدير بالذكر أنه بالمقارنة مع أنظمة DGX السابقة، فقد خضع تشريح DGX A100 لبعض التغييرات. زاد عدد الأنابيب الحرارية في مشعات وحدات SXM3، والتي تم تركيب معالجات رسومية A100 بها ذاكرة HBM2، بشكل ملحوظ مقارنة بوحدات Tesla V100 من جيل فولتا، على الرغم من أن نهاياتها مخفية عن أنظار الشخص العادي بواسطة الأغطية العلوية. الحد العملي لهذا التصميم هو 400 واط من الطاقة الحرارية. وهذا ما تؤكده أيضًا الخصائص الرسمية لـ A100 في إصدار SXM3 المنشور اليوم.

بجانب وحدات معالجة الرسومات A100 على اللوحة الأم، توجد ستة محولات واجهة NVLink من الجيل الثالث، والتي توفر معًا تبادل البيانات في اتجاهين بسرعة 4,8 تيرابايت/ثانية. اهتمت NVIDIA أيضًا بتبريدها بجدية، وفقًا للمشعات ذات الحجم الكامل مع الأنابيب الحرارية. يتم تخصيص 12 قناة من واجهة NVLink لكل وحدة معالجة رسومات، ويمكن لوحدات معالجة الرسوميات المجاورة تبادل البيانات بسرعة 600 جيجابايت/ثانية.

يضم نظام DGX A100 أيضًا تسعة وحدات تحكم شبكة Mellanox ConnectX-6 HDR، قادرة على نقل المعلومات بسرعات تصل إلى 200 جيجابت/ثانية. في المجمل، يوفر DGX A100 نقل البيانات في اتجاهين بسرعة 3,6 تيرابايت/ثانية. يستخدم النظام أيضًا تقنيات Mellanox الخاصة التي تهدف إلى التوسع الفعال لأنظمة الحوسبة بمثل هذه البنية. يتم تحديد دعم PCI Express 4.0 على مستوى النظام الأساسي بواسطة معالجات الجيل AMD EPYC Rome، ونتيجة لذلك، يتم استخدام هذه الواجهة ليس فقط بواسطة مسرعات الرسومات A100، ولكن أيضًا بواسطة محركات الأقراص ذات الحالة الصلبة مع بروتوكول NVMe.

NVIDIA DGX A100: أول منصة تعتمد على Ampere توفر خمسة بيتافلوب من الأداء

بالإضافة إلى DGX A100، بدأت NVIDIA بتزويد شركائها بلوحات HGX A100، والتي تعد أحد مكونات أنظمة الخوادم التي ستنتجها الشركات المصنعة الأخرى بنفسها. يمكن للوحة HGX A100 واحدة أن تستوعب أربعة أو ثمانية وحدات معالجة رسوميات NVIDIA A100. بالإضافة إلى ذلك، لتلبية احتياجاتها الخاصة، قامت NVIDIA بالفعل بتجميع DGX SuperPOD - مجموعة من 140 نظام DGX A100، مما يوفر أداء عند 700 بيتافلوب بأبعاد إجمالية متواضعة إلى حد ما. ووعدت الشركة بتقديم المساعدة المنهجية للشركاء الراغبين في بناء مجموعات حوسبة مماثلة تعتمد على DGX A100. بالمناسبة، لم يستغرق بناء DGX SuperPOD أكثر من شهر من NVIDIA بدلاً من عدة أشهر أو حتى سنوات نموذجية لمثل هذه المهام.

NVIDIA DGX A100: أول منصة تعتمد على Ampere توفر خمسة بيتافلوب من الأداء

وفقًا لـ NVIDIA، بدأت بالفعل عمليات تسليم DGX A100 بسعر 199 دولار لكل نسخة، ويستضيف شركاء الشركة بالفعل هذه الأنظمة في مجموعاتهم السحابية، ويغطي النظام البيئي بالفعل 000 دولة، بما في ذلك فيتنام والإمارات العربية المتحدة. بالإضافة إلى ذلك، من المتوقع تمامًا أن تكون الحلول الرسومية ذات بنية Ampere جزءًا من نظام الكمبيوتر العملاق Perlmutter، الذي أنشأته شركة Cray لصالح وزارة الطاقة الأمريكية. وسيتكون من معالجات الرسوميات NVIDIA Ampere إلى جانب المعالجات المركزية من جيل AMD EPYC Milan مع معمارية Zen 26. وستصل عقد الكمبيوتر العملاق المبنية على NVIDIA Ampere إلى العميل في النصف الثاني من العام، على الرغم من أن النسخ الأولى وصلت بالفعل إلى المختبر المتخصص التابع لشركة NVIDIA Ampere. القسم الأمريكي .



المصدر: 3dnews.ru

إضافة تعليق