ملاحظة قصيرة حول حادثة ارتفاع درجة حرارة وحدة تحكم LSI RAID في خادم في مركز بيانات بارد

TL، DR. لا يضمن ضبط وضع التشغيل لنظام تبريد الخادم Supermicro Optimal التشغيل المستقر لوحدة التحكم MegaRAID 9361-8i LSI في مركز بيانات بارد.

نحن نحاول عدم استخدام وحدات تحكم RAID للأجهزة، ولكن لدينا عميل واحد يفضل تكوينات LSI MegaRAID. واجهنا اليوم ارتفاعًا في درجة حرارة بطاقة MegaRAID 9361-8i نظرًا لأن النظام الأساسي لم أشعر به ارتفاع درجة الحرارة، ووحدة تحكم RAID شعر.

يتم عرض النظام الأساسي المزود ببطاقة RAID في الأشكال أدناه:

ملاحظة قصيرة حول حادثة ارتفاع درجة حرارة وحدة تحكم LSI RAID في خادم في مركز بيانات بارد

ملاحظة قصيرة حول حادثة ارتفاع درجة حرارة وحدة تحكم LSI RAID في خادم في مركز بيانات بارد

بعض النقاط المهمة حول هذا الخادم وبيئة التشغيل:

قام المهندس الذي قام بتجميع المنصة بوضع مروحتين على وجه التحديد أمام البطاقة، لأنه يعلم أن وحدات تحكم LSI تصبح ساخنة جدًا. انتبه إلى اللوحة الأم، فهي غير مناسبة عمليًا لوحدة التحكم، وتنتهي بعد 3 سم من فتحة PCI-E.

كما ترون، جميع المراوح متصلة بشكل طبيعي باللوحة الأم Supermicro وفيها الأمثل "ضربة" اعتمادًا على المستشعرات الموجودة عليه ودرجة حرارة وحدة المعالجة المركزية.

تحتوي هذه المنصة على Xeon E-2236 - وهي وحدة معالجة مركزية باردة جدًا، ويبدو أن العميل لم يسخنها كثيرًا.

مركز البيانات الذي يوجد به هذا الخادم بارد جدًا - الممر البارد يعطي 18-20 درجة.

أدى الجمع بين هذه العوامل إلى ظاهرة مثيرة للاهتمام للغاية - ارتفاع درجة حرارة وحدة تحكم RAID.

سلسلة محتملة لكيفية حدوث ذلك

  1. أبلغ المعالج البارد واللوحة الأم المشجعين أنهم قد ينفجرون بشكل ضعيف.
  2. لم تكن هناك لوحة أم تحت RAID ولم تكن هناك أجهزة استشعار يمكنها اكتشاف ارتفاع درجة الحرارة.
  3. عند تكوينها، تنفجر المراوح بشكل ضعيف في الوضع الأمثل، وفقًا لاحتياجات اللوحة الأم ووحدة المعالجة المركزية.
  4. وحدة التحكم، لا تتلقى ما يكفي من تدفق الهواء، محموما.

ماذا فعلوا

لقد قمنا بتحويل المراوح إلى الوضع "القياسي"، وإذا لزم الأمر، فسنحولها إلى وضع أداء أعلى.

النتائج

على الأرجح، إذا لم يكن الممر البارد لمركز البيانات باردًا جدًا، أو كان العميل يستخدم وحدة المعالجة المركزية بشكل مكثف، فربما لم تحدث هذه المشكلة، نظرًا لأن المراوح ستعمل بشكل أكثر كثافة.

بالنسبة لأنفسنا، قررنا بالتأكيد تغيير وضع تشغيل المراوح على الخوادم المزودة بـ RAID من الوضع الأمثل إلى الوضع الذي يتميز بسرعة دوران متزايدة.

المصدر: www.habr.com

إضافة تعليق