Isang maikling tala sa insidente sa sobrang pag-init ng LSI RAID controller sa isang server sa isang malamig na data center

TL; DR; Ang pagtatakda ng operating mode ng Supermicro Optimal server cooling system ay hindi nagtitiyak ng matatag na operasyon ng MegaRAID 9361-8i LSI controller sa isang malamig na data center.

Sinusubukan naming huwag gumamit ng mga controller ng hardware RAID, ngunit mayroon kaming isang kliyente na mas gusto ang mga configuration ng LSI MegaRAID. Ngayon ay nakatagpo kami ng sobrang pag-init ng MegaRAID 9361-8i card dahil sa katotohanan na ang platform hindi naramdaman overheating, at ang RAID controller naramdaman.

Ang platform na may RAID card ay ipinapakita sa mga figure sa ibaba:

Isang maikling tala sa insidente sa sobrang pag-init ng LSI RAID controller sa isang server sa isang malamig na data center

Isang maikling tala sa insidente sa sobrang pag-init ng LSI RAID controller sa isang server sa isang malamig na data center

Ilang mahahalagang punto tungkol sa server at operating environment na ito:

Ang engineer na nag-assemble ng platform ay partikular na naglagay ng dalawang fan sa harap ng card, dahil alam niyang napakainit ng mga LSI controllers. Bigyang-pansin ang motherboard, halos hindi ito magkasya sa ilalim ng controller, na nagtatapos sa 3 cm pagkatapos ng slot ng PCI-E.

Tulad ng nakikita mo, ang lahat ng mga tagahanga ay karaniwang konektado sa Supermicro motherboard at sa Pinakamainam "pumutok" depende sa mga sensor dito at sa temperatura ng CPU.

Ang platform na ito ay naglalaman ng isang Xeon E-2236 - isang napakalamig na CPU, na tila hindi masyadong pinainit ng kliyente.

Ang data center kung saan matatagpuan ang server na ito ay napakalamig - ang malamig na koridor ay nagbibigay ng 18-20 degrees.

Ang kumbinasyon ng mga salik na ito ay humantong sa isang napaka-kagiliw-giliw na kababalaghan - overheating ng RAID controller.

Malamang na chain kung paano ito nangyari

  1. isang malamig na processor at motherboard ang nagpaalam sa mga tagahanga na maaari silang pumutok ng mahina.
  2. walang motherboard sa ilalim ng RAID at walang mga sensor na makaka-detect ng overheating.
  3. Ang mga tagahanga, kapag na-configure, ay humihip nang mahina sa Optimal mode, ayon sa mga pangangailangan ng motherboard at CPU.
  4. Ang controller, na hindi nakakatanggap ng sapat na daloy ng hangin, ay nag-overheat.

Anong ginawa mo

Inilipat namin ang mga fan sa "Standard" mode; kung kinakailangan, ililipat namin sila sa mas mataas na performance mode.

Natuklasan

Malamang, kung ang malamig na pasilyo ng data center ay hindi masyadong malamig, o ang kliyente ay gumagamit ng CPU nang masinsinan, ang problemang ito ay maaaring hindi nangyari, dahil ang mga tagahanga ay gagana nang mas masinsinang.

Para sa aming sarili, nagpasya kaming tiyak na baguhin ang operating mode ng mga tagahanga sa mga server na may RAID mula sa Optimal patungo sa isang mode na may tumaas na bilis ng pag-ikot.

Pinagmulan: www.habr.com

Magdagdag ng komento