Kratek zapis o incidentu s pregrevanjem krmilnika LSI RAID v strežniku v hladnem podatkovnem centru

TL; DR; Nastavitev načina delovanja strežniškega hladilnega sistema Supermicro Optimal ne zagotavlja stabilnega delovanja krmilnika MegaRAID 9361-8i LSI v hladnem podatkovnem centru.

Trudimo se, da ne uporabljamo krmilnikov strojne opreme RAID, vendar imamo eno stranko, ki ima raje konfiguracije LSI MegaRAID. Danes smo naleteli na pregrevanje kartice MegaRAID 9361-8i zaradi dejstva, da je platforma nisem čutil pregrevanja in krmilnika RAID čutiti.

Platforma s kartico RAID je prikazana na spodnjih slikah:

Kratek zapis o incidentu s pregrevanjem krmilnika LSI RAID v strežniku v hladnem podatkovnem centru

Kratek zapis o incidentu s pregrevanjem krmilnika LSI RAID v strežniku v hladnem podatkovnem centru

Nekaj ​​pomembnih točk o tem strežniku in operacijskem okolju:

Inženir, ki je sestavljal platformo, je posebej postavil dva ventilatorja pred kartico, saj ve, da se krmilniki LSI zelo segrejejo. Bodite pozorni na matično ploščo, praktično se ne prilega pod krmilnik, konča se 3 cm po reži PCI-E.

Kot lahko vidite, so vsi ventilatorji normalno priključeni na matično ploščo Supermicro in noter Optimalno “piha” odvisno od senzorjev na njem in temperature procesorja.

Ta platforma vsebuje Xeon E-2236 - zelo hladen CPU, ki ga odjemalec očitno ni veliko segreval.

Podatkovni center, v katerem je ta strežnik, je zelo hladen - hladen koridor daje 18-20 stopinj.

Kombinacija teh dejavnikov je privedla do zelo zanimivega pojava - pregretja krmilnika RAID.

Verjetna veriga, kako se je to zgodilo

  1. hladen procesor in matična plošča sta navijače obvestila, da lahko piha šibko.
  2. ni bilo matične plošče pod RAID in ni bilo senzorjev, ki bi zaznali pregrevanje.
  3. Ventilatorji, ko so bili konfigurirani, so pihali šibko v načinu Optimal, glede na potrebe matične plošče in CPE.
  4. Krmilnik, ki ni prejel dovolj pretoka zraka, se je pregrel.

Kaj si naredil

Ventilatorje smo preklopili v način »Standard«, po potrebi jih bomo preklopili v način višje zmogljivosti.

Ugotovitve

Najverjetneje se ta težava ne bi pojavila, saj bi ventilatorji delovali bolj intenzivno, če hladen prehod podatkovnega centra ne bi bil tako hladen ali če bi odjemalec intenzivno uporabljal CPE.

Zase smo se odločili, da vsekakor spremenimo način delovanja ventilatorjev na strežnikih z RAID iz Optimal v način s povečano hitrostjo vrtenja.

Vir: www.habr.com

Dodaj komentar