Et kort notat om hendelsen med overoppheting av LSI RAID-kontrolleren i en server i et kaldt datasenter

TL; DR; Innstilling av driftsmodusen til Supermicro Optimal-serverkjølesystemet sikrer ikke stabil drift av MegaRAID 9361-8i LSI-kontrolleren i et kaldt datasenter.

Vi prøver å ikke bruke hardware RAID-kontrollere, men vi har en klient som foretrekker LSI MegaRAID-konfigurasjoner. I dag møtte vi en overoppheting av MegaRAID 9361-8i-kortet på grunn av det faktum at plattformen følte det ikke overoppheting og RAID-kontrolleren følte.

Plattformen med et RAID-kort er vist i figurene nedenfor:

Et kort notat om hendelsen med overoppheting av LSI RAID-kontrolleren i en server i et kaldt datasenter

Et kort notat om hendelsen med overoppheting av LSI RAID-kontrolleren i en server i et kaldt datasenter

Noen viktige punkter om denne serveren og driftsmiljøet:

Ingeniøren som satte sammen plattformen plasserte spesifikt to vifter foran kortet, fordi han vet at LSI-kontrollere blir veldig varme. Vær oppmerksom på hovedkortet, det passer praktisk talt ikke under kontrolleren, og slutter 3 cm etter PCI-E-sporet.

Som du kan se, er alle vifter koblet normalt til Supermicro-hovedkortet og inn Optimal "blås" avhengig av sensorene på den og CPU-temperaturen.

Denne plattformen inneholder en Xeon E-2236 - en veldig kald CPU, som klienten tilsynelatende ikke varmet opp mye.

Datasenteret som denne serveren er plassert i er veldig kaldt - den kalde korridoren gir 18-20 grader.

Kombinasjonen av disse faktorene førte til et veldig interessant fenomen - overoppheting av RAID-kontrolleren.

Sannsynlig kjede av hvordan det skjedde

  1. en kald prosessor og hovedkort informerte viftene om at de kunne blåse svakt.
  2. det var ikke noe hovedkort under RAID og det var ingen sensorer som ville oppdage overoppheting.
  3. Viftene, når de er konfigurert, blåste svakt i Optimal-modus, i henhold til behovene til hovedkortet og CPU.
  4. Kontrolleren, som ikke mottar nok luftstrøm, ble overopphetet.

Hva gjorde du

Vi byttet viftene til "Standard"-modus; om nødvendig vil vi bytte dem til en høyere ytelsesmodus.

Funn

Mest sannsynlig, hvis den kalde gangen til datasenteret ikke var så kald, eller klienten brukte CPU-en intensivt, kan dette problemet ikke ha oppstått, siden viftene ville jobbe mer intensivt.

For oss selv bestemte vi oss for å definitivt endre driftsmodusen til viftene på servere med RAID fra Optimal til en modus med økt rotasjonshastighet.

Kilde: www.habr.com

Legg til en kommentar