Kratka napomena o incidentu sa pregrijavanjem LSI RAID kontrolera na serveru u hladnom data centru

TL; DR; Podešavanje režima rada sistema za hlađenje servera Supermicro Optimal ne obezbeđuje stabilan rad MegaRAID 9361-8i LSI kontrolera u hladnom data centru.

Trudimo se da ne koristimo hardverske RAID kontrolere, ali imamo jednog klijenta koji preferira LSI MegaRAID konfiguracije. Danas smo naišli na pregrijavanje MegaRAID 9361-8i kartice zbog činjenice da je platforma nisam osetio pregrijavanje i RAID kontroler osjetio.

Platforma sa RAID karticom prikazana je na slikama ispod:

Kratka napomena o incidentu sa pregrijavanjem LSI RAID kontrolera na serveru u hladnom data centru

Kratka napomena o incidentu sa pregrijavanjem LSI RAID kontrolera na serveru u hladnom data centru

Nekoliko važnih tačaka o ovom serveru i operativnom okruženju:

Inženjer koji je sastavio platformu je posebno postavio dva ventilatora ispred kartice, jer zna da se LSI kontroleri jako zagrevaju. Obratite pažnju na matičnu ploču, ona praktički ne stane ispod kontrolera, završava 3 cm nakon PCI-E slota.

Kao što vidite, svi ventilatori su normalno povezani na Supermicro matičnu ploču i unutra Optimalno “puhati” ovisno o senzorima na njemu i temperaturi CPU-a.

Ova platforma sadrži Xeon E-2236 - veoma hladan CPU, koji klijent očigledno nije mnogo zagrejao.

Data centar u kome se nalazi ovaj server je veoma hladan - hladan koridor daje 18-20 stepeni.

Kombinacija ovih faktora dovela je do vrlo zanimljivog fenomena - pregrijavanja RAID kontrolera.

Vjerovatni lanac kako se to dogodilo

  1. hladan procesor i matična ploča obavijestili su fanove da bi mogli slabo duvati.
  2. nije bilo matične ploče pod RAID-om i nije bilo senzora koji bi detektovali pregrijavanje.
  3. Ventilatori su, kada su konfigurisani, slabo duvali u Optimalnom režimu, u skladu sa potrebama matične ploče i CPU-a.
  4. Kontroler, koji ne prima dovoljno protoka zraka, se pregrijao.

sta si uradio

Ventilatore smo prebacili u “Standard” način rada, a ako bude potrebno, prebacit ćemo ih u režim viših performansi.

nalazi

Najvjerovatnije, da hladni prolaz data centra nije tako hladan, ili da klijent intenzivno koristi CPU, do ovog problema možda i ne bi došlo, jer bi ventilatori radili intenzivnije.

Za sebe smo odlučili da definitivno promijenimo način rada ventilatora na serverima sa RAID-om iz Optimal u režim sa povećanom brzinom rotacije.

izvor: www.habr.com

Dodajte komentar