Trumpa pastaba apie incidentą perkaitus LSI RAID valdikliui serveryje šaltame duomenų centre

TL; DR; Supermicro Optimal serverio aušinimo sistemos darbo režimo nustatymas neužtikrina stabilaus MegaRAID 9361-8i LSI valdiklio veikimo šaltame duomenų centre.

Stengiamės nenaudoti aparatinės įrangos RAID valdiklių, tačiau turime vieną klientą, kuris teikia pirmenybę LSI MegaRAID konfigūracijoms. Šiandien susidūrėme su MegaRAID 9361-8i kortelės perkaitimu dėl to, kad platforma to nepajuto perkaitimas ir RAID valdiklis jaučiamas.

Platforma su RAID kortele parodyta toliau pateiktuose paveikslėliuose:

Trumpa pastaba apie incidentą perkaitus LSI RAID valdikliui serveryje šaltame duomenų centre

Trumpa pastaba apie incidentą perkaitus LSI RAID valdikliui serveryje šaltame duomenų centre

Keletas svarbių dalykų apie šį serverį ir operacinę aplinką:

Platformą surinkęs inžinierius priešais kortelę specialiai pastatė du ventiliatorius, nes žino, kad LSI valdikliai labai įkaista. Atkreipkite dėmesį į pagrindinę plokštę, ji praktiškai netelpa po valdikliu, baigiasi 3 cm po PCI-E lizdo.

Kaip matote, visi ventiliatoriai yra normaliai prijungti prie Supermicro pagrindinės plokštės ir įvesties Optimalus „pūsti“ priklausomai nuo ant jo esančių jutiklių ir procesoriaus temperatūros.

Šioje platformoje yra Xeon E-2236 – labai šaltas CPU, kurį klientas, matyt, nelabai įkaitino.

Duomenų centre, kuriame yra šis serveris, labai šalta – šaltas koridorius duoda 18-20 laipsnių.

Šių veiksnių derinys lėmė labai įdomų reiškinį – RAID valdiklio perkaitimą.

Tikėtina grandinė, kaip tai atsitiko

  1. šaltas procesorius ir pagrindinė plokštė pranešė gerbėjams, kad gali pūsti silpnai.
  2. nebuvo pagrindinės plokštės pagal RAID ir nebuvo jutiklių, kurie aptiktų perkaitimą.
  3. Ventiliatoriai, sukonfigūruoti, silpnai pūtė Optimal režimu, pagal pagrindinės plokštės ir procesoriaus poreikius.
  4. Valdiklis, negavęs pakankamai oro srauto, perkaito.

Ką tu padarei

Ventiliatorius perjungėme į „Standartinį“ režimą, perjungsime juos į didesnio našumo režimą.

išvados

Greičiausiai, jei duomenų centro šaltasis koridorius būtų ne toks šaltas arba klientas intensyviai naudotų CPU, šios problemos galėjo ir nebūti, nes ventiliatoriai dirbtų intensyviau.

Mes patys nusprendėme tikrai pakeisti ventiliatorių veikimo režimą serveriuose su RAID iš Optimal į režimą su padidintu sukimosi greičiu.

Šaltinis: www.habr.com

Добавить комментарий