Eng kuerz Notiz iwwer den Zwëschefall mat Iwwerhëtzung vum LSI RAID Controller an engem Server an engem kale Rechenzentrum

TL; DR; настройка режима работы системы охлаждения сервера Supermicro Optimal не обеспечивает стабильность работы LSI-контроллера MegaRAID 9361-8i в холодном ЦОД-е.

Мы стараемся не использовать аппаратные контроллеры RAID, но есть у нас один клиент, который предпочитает именно конфигурации c LSI MegaRAID. Сегодня мы столкнулись с перегревом карты MegaRAID 9361-8i в связи с тем, что платформа не чувствовала перегрева, а RAID-контроллер его gefillt.

Вид платформы с RAID-картой представлен на рисунках ниже:

Eng kuerz Notiz iwwer den Zwëschefall mat Iwwerhëtzung vum LSI RAID Controller an engem Server an engem kale Rechenzentrum

Eng kuerz Notiz iwwer den Zwëschefall mat Iwwerhëtzung vum LSI RAID Controller an engem Server an engem kale Rechenzentrum

Несколько важных моментов, связанных с этим сервером и средой эксплуатации:

Инженер, собиравший платформу специально поставил напротив карты два вентилятора, поскольку знает, что LSI-контроллеры сильно греются. Обратите внимание на материнскую плату, она под контроллер практически не заходит, заканчиваясь через 3 см после слота PCI-E.

Как видите, все вентиляторы подключены штатно к материнской плате Supermicro и в режиме Optimal "дуют" в зависимости от сенсоров на ней, температуры CPU.

В данной платформе стоит Xeon E-2236 — весьма холодный CPU, который у клиента, видимо, сильно и не нагревался.

ЦОД, в котором стоит данный сервер весьма холодный — холодный коридор дает 18-20 градусов.

Совокупность этих факторов привела к весьма интересному явлению — перегреву RAID-контроллера.

Вероятная цепочка, как это произошло

  1. холодный процессор и материнская плата сообщали вентиляторам о том, что дуть можно слабо.
  2. материнская карта под RAID-ом отсутствовала и не было датчиков, которые бы фиксировали перегрев.
  3. Вентиляторы, будучи сконфигурироваными, в режиме Optimal дули слабо, согласно потребностям материнской платы и CPU.
  4. Контроллер, не получая достаточного потока воздуха перегрелся.

Что сделали

Переключили вентиляторы в режим "Standard", при необходимости переведем в более высокий режим производительности.

Conclusiounen

Скорее всего, если бы холодный коридор ЦОД-а был бы не таким холодным, или клиент бы интенсивно использовал CPU, данная проблема могла бы и не произойти, поскольку вентиляторы бы работали в более интенсивном режиме.

Для себя мы решили обязательно менять режим работы вентиляторов на серверах с RAID с Optimal на режим с повышенной частотой вращения.

Source: will.com

Setzt e Commentaire