Una breve nota sull'incidente relativo al surriscaldamento del controller RAID LSI in un server in un data center freddo

TL; DR; L'impostazione della modalità operativa del sistema di raffreddamento del server Supermicro Optimal non garantisce il funzionamento stabile del controller LSI MegaRAID 9361-8i in un data center freddo.

Cerchiamo di non utilizzare controller RAID hardware, ma abbiamo un cliente che preferisce le configurazioni LSI MegaRAID. Oggi abbiamo riscontrato un surriscaldamento della scheda MegaRAID 9361-8i dovuto al fatto che la piattaforma non l'ho sentito surriscaldamento e il controller RAID provato.

La piattaforma con una scheda RAID è mostrata nelle figure seguenti:

Una breve nota sull'incidente relativo al surriscaldamento del controller RAID LSI in un server in un data center freddo

Una breve nota sull'incidente relativo al surriscaldamento del controller RAID LSI in un server in un data center freddo

Alcuni punti importanti su questo server e ambiente operativo:

L'ingegnere che ha assemblato la piattaforma ha posizionato appositamente due ventole davanti alla scheda, perché sa che i controller LSI si surriscaldano molto. Presta attenzione alla scheda madre, praticamente non si adatta al controller, terminando 3 cm dopo lo slot PCI-E.

Come puoi vedere, tutte le ventole sono collegate normalmente alla scheda madre Supermicro e in Ottimale "soffiare" a seconda dei sensori presenti su di esso e della temperatura della CPU.

Questa piattaforma contiene uno Xeon E-2236, una CPU molto fredda, che apparentemente il client non ha riscaldato molto.

Il data center in cui si trova questo server è molto freddo: il corridoio freddo dà 18-20 gradi.

La combinazione di questi fattori ha portato ad un fenomeno molto interessante: il surriscaldamento del controller RAID.

Probabile catena di come è successo

  1. un processore e una scheda madre freddi informavano le ventole che avrebbero potuto soffiare debolmente.
  2. non c'era la scheda madre sotto RAID e non c'erano sensori che rilevassero il surriscaldamento.
  3. Le ventole, una volta configurate, soffiavano debolmente in modalità Ottimale, in base alle esigenze della scheda madre e della CPU.
  4. Il controller, non ricevendo un flusso d'aria sufficiente, si è surriscaldato.

Che cosa ha fatto

Abbiamo impostato le ventole sulla modalità "Standard", se necessario le passeremo a una modalità con prestazioni più elevate.

risultati

Molto probabilmente, se il corridoio freddo del data center non fosse così freddo, o se il client utilizzasse intensamente la CPU, questo problema potrebbe non verificarsi, poiché le ventole lavorerebbero più intensamente.

Per conto nostro, abbiamo deciso di cambiare definitivamente la modalità operativa delle ventole sui server con RAID da Ottimale a una modalità con maggiore velocità di rotazione.

Fonte: habr.com

Aggiungi un commento