Rövid megjegyzés az LSI RAID vezérlő túlmelegedésével járó incidensről egy hideg adatközpontban lévő szerveren

TL; DR; A Supermicro Optimal szerverhűtési rendszer működési módjának beállítása nem biztosítja a MegaRAID 9361-8i LSI vezérlő stabil működését hideg adatközpontban.

Igyekszünk nem hardveres RAID vezérlőket használni, de van egy kliensünk, aki az LSI MegaRAID konfigurációkat részesíti előnyben. Ma a MegaRAID 9361-8i kártya túlmelegedésével találkoztunk, mivel a platform nem érezte túlmelegedés, és a RAID-vezérlő filc.

A RAID-kártyás platform az alábbi ábrákon látható:

Rövid megjegyzés az LSI RAID vezérlő túlmelegedésével járó incidensről egy hideg adatközpontban lévő szerveren

Rövid megjegyzés az LSI RAID vezérlő túlmelegedésével járó incidensről egy hideg adatközpontban lévő szerveren

Néhány fontos tudnivaló a szerverről és az operációs környezetről:

A platformot összeszerelő mérnök konkrétan két ventilátort helyezett a kártya elé, mert tudja, hogy az LSI vezérlők nagyon felforrósodnak. Ügyeljen az alaplapra, gyakorlatilag nem fér el a vezérlő alá, a PCI-E foglalat után 3 cm-rel végződik.

Mint látható, minden ventilátor normálisan csatlakozik a Supermicro alaplaphoz és be Optimális „fújja” a rajta lévő érzékelőktől és a CPU hőmérsékletétől függően.

Ez a platform egy Xeon E-2236-ot tartalmaz - egy nagyon hideg CPU-t, amelyet az ügyfél láthatóan nem nagyon melegített fel.

Az adatközpont, amelyben ez a szerver található, nagyon hideg - a hideg folyosó 18-20 fokot ad.

E tényezők kombinációja egy nagyon érdekes jelenséghez vezetett - a RAID-vezérlő túlmelegedéséhez.

Valószínű láncolat, hogyan történt

  1. hideg processzor és alaplap jelezte a rajongóknak, hogy gyengén fújhatnak.
  2. RAID alatt nem volt alaplap, és nem voltak olyan szenzorok sem, amelyek érzékelnék a túlmelegedést.
  3. A ventilátorok konfigurálva gyengén fújtak Optimal módban, az alaplap és a CPU igényeinek megfelelően.
  4. A vezérlő, mivel nem kap elegendő levegőt, túlmelegedett.

Mit csináltak

A ventilátorokat „Standard” üzemmódba kapcsoltuk, ha szükséges, nagyobb teljesítményű üzemmódba kapcsoljuk.

Álláspontja

Valószínűleg ha az adatközpont hideg folyosója nem lenne olyan hideg, vagy a kliens intenzíven használja a CPU-t, akkor ez a probléma valószínűleg nem fordult volna elő, hiszen a ventilátorok intenzívebben dolgoznának.

Önmagunk érdekében úgy döntöttünk, hogy a RAID-del rendelkező szervereken a ventilátorok működési módját mindenképpen megváltoztatjuk Optimalról megnövelt forgási sebességű módra.

Forrás: will.com

Hozzászólás