Кратка бележка за инцидента с прегряване на LSI RAID контролера в сървър в студен център за данни

TL; DR; Настройката на режима на работа на системата за охлаждане на сървъра Supermicro Optimal не гарантира стабилна работа на контролера MegaRAID 9361-8i LSI в студен център за данни.

Опитваме се да не използваме хардуерни RAID контролери, но имаме един клиент, който предпочита LSI MegaRAID конфигурации. Днес се натъкнахме на прегряване на картата MegaRAID 9361-8i поради факта, че платформата не го усетих прегряване и RAID контролера чувствах.

Платформата с RAID карта е показана на фигурите по-долу:

Кратка бележка за инцидента с прегряване на LSI RAID контролера в сървър в студен център за данни

Кратка бележка за инцидента с прегряване на LSI RAID контролера в сървър в студен център за данни

Няколко важни точки относно този сървър и работна среда:

Инженерът, който сглоби платформата, специално постави два вентилатора пред картата, защото знае, че LSI контролерите се нагряват много. Обърнете внимание на дънната платка, тя практически не се побира под контролера, завършва 3 см след PCI-E слота.

Както можете да видите, всички вентилатори са свързани нормално към дънната платка Supermicro и вътре Оптимално “духа” в зависимост от сензорите по него и температурата на процесора.

Тази платформа съдържа Xeon E-2236 - много студен процесор, който клиентът очевидно не е загрявал много.

Центърът за данни, в който се намира този сървър, е много студен - студеният коридор дава 18-20 градуса.

Комбинацията от тези фактори доведе до много интересен феномен - прегряване на RAID контролера.

Вероятна верига от това как се е случило

  1. студен процесор и дънна платка информираха феновете, че могат да духат слабо.
  2. нямаше дънна платка под RAID и нямаше сензори, които да открият прегряване.
  3. Вентилаторите при настройка духаха слабо в режим Optimal, според нуждите на дънната платка и процесора.
  4. Контролерът, който не получава достатъчно въздушен поток, прегрява.

Какво направили

Превключихме вентилаторите в режим „Стандартен“, ако е необходимо, ще ги превключим в режим с по-висока производителност.

Данни

Най-вероятно, ако студената пътека на центъра за данни не беше толкова студена или клиентът използваше интензивно процесора, този проблем можеше да не се появи, тъй като вентилаторите щяха да работят по-интензивно.

За себе си решихме определено да променим режима на работа на вентилаторите на сървъри с RAID от Optimal на режим с повишена скорост на въртене.

Източник: www.habr.com

Добавяне на нов коментар