TL; DR; Stabbilimentu di u modu operativu di u sistema di rinfrescamentu di u servitore Supermicro Optimal ùn assicura micca un funziunamentu stabile di u controller MegaRAID 9361-8i LSI in un centru di dati friddu.
Pruvemu micca di usà i cuntrolli RAID di hardware, ma avemu un cliente chì preferisce cunfigurazioni LSI MegaRAID. Oghje avemu scontru un surriscaldamentu di a carta MegaRAID 9361-8i per u fattu chì a piattaforma ùn hà micca sentitu surriscaldamentu, è u controller RAID sentitu.
A piattaforma cù una carta RAID hè mostrata in i figuri sottu:
Uni pochi punti impurtanti nantu à stu servitore è l'ambiente operativu:
L'ingegnere chì hà assemblatu a piattaforma specificamente pusò dui fanati davanti à a carta, perchè sapi chì i cuntrolli LSI sò assai caldi. Prestate attenzione à a scheda madre, praticamente ùn si mette micca sottu à u controller, finiscinu 3 cm dopu à u slot PCI-E.
Comu pudete vede, tutti i fan sò cunnessi nurmale à a scheda madre Supermicro è in Optimal "colpu" secondu i sensori nantu à questu è a temperatura di u CPU.
Sta piattaforma cuntene un Xeon E-2236 - un CPU assai friddu, chì u cliente apparentemente ùn hà micca riscaldatu assai.
U centru di dati in quale si trova stu servitore hè assai friddu - u corridore friddu dà gradi 18-20.
A cumminazzioni di sti fattori hà purtatu à un fenomenu assai interessante - surriscaldamentu di u controller RAID.
Probabile catena di cumu hè accadutu
- un processore friddu è a scheda madre hà infurmatu à i fanali chì puderanu soffià debbuli.
- ùn ci era micca una scheda madre sottu RAID è ùn ci era micca sensori chì detectaranu u surriscaldamentu.
- I fanali, quandu cunfigurati, soffianu debbuli in u modu ottimale, secondu i bisogni di a scheda madre è CPU.
- U controller, ùn riceve micca abbastanza flussu d'aria, surriscaldatu.
Chì hai fattu
Avemu cambiatu i fan à u modu "Standard"; se ne necessariu, i cambieremu à un modu di prestazione più altu.
scuperti
Hè assai prubabile, se u corridore friddu di u centru di dati ùn era micca cusì friddu, o u cliente usava a CPU intensivamente, stu prublema ùn puderia micca esse accadutu, postu chì i fanali anu travagliatu più intensamente.
Per noi stessi, avemu decisu di cambià definitivamente u modu di funziunamentu di i fanali nantu à i servitori cù RAID da Optimal à un modu cù a velocità di rotazione aumentata.
Source: www.habr.com