Datu-zentro hotz bateko zerbitzari batean LSI RAID kontrolagailuaren gainberotzearen gertakariari buruzko ohar labur bat

TL: DR; Supermicro Optimal zerbitzariaren hozte-sistemaren funtzionamendu-modua ezartzeak ez du MegaRAID 9361-8i LSI kontrolagailuaren funtzionamendu egonkorra ziurtatzen datu-zentro hotz batean.

Hardware RAID kontrolagailuak ez erabiltzen saiatzen gara, baina LSI MegaRAID konfigurazioak nahiago dituen bezero bat dugu. Gaur MegaRAID 9361-8i txartelaren gehiegizko beroketarekin topo egin dugu, plataformak ez zuen sentitu gainberotzea eta RAID kontrolatzailea sentitu.

RAID txartela duen plataforma beheko irudietan ageri da:

Datu-zentro hotz bateko zerbitzari batean LSI RAID kontrolagailuaren gainberotzearen gertakariari buruzko ohar labur bat

Datu-zentro hotz bateko zerbitzari batean LSI RAID kontrolagailuaren gainberotzearen gertakariari buruzko ohar labur bat

Zerbitzari honi eta ingurune eragile honi buruzko puntu garrantzitsu batzuk:

Plataforma muntatu zuen ingeniariak espresuki bi haizagailu jarri zituen txartelaren aurrean, badakielako LSI kontrolagailuak oso berotzen direla. Kontuz plaka nagusiari, ia ez da kontrolagailuaren azpian sartzen, PCI-E zirrikituaren ondoren 3 cm-ra amaitzen da.

Ikus dezakezunez, zale guztiak normalean Supermicro plakara eta barrura konektatuta daude Optimal "kolpea" bertan dauden sentsoreen eta CPUaren tenperaturaren arabera.

Plataforma honek Xeon E-2236 bat dauka - CPU oso hotza, bezeroak itxuraz ez zuen asko berotu.

Zerbitzari hau dagoen datu-zentroa oso hotza da - korridore hotzak 18-20 gradu ematen ditu.

Faktore hauen konbinazioak fenomeno oso interesgarri bat ekarri zuen: RAID kontrolagailuaren gainberotzea.

Nola gertatu den kate segurua

  1. prozesadore hotz eta plaka batek zaleei ahul putz egin zezaketela jakinarazi zieten.
  2. ez zegoen RAID pean plakarik eta ez zegoen gehiegi berotzea detektatuko zuen sentsorerik.
  3. Haizagailuak, konfiguratu zirenean, ahul egiten zuten modu Optimalean, plaka eta CPUaren beharren arabera.
  4. Kontrolagailua, aire-fluxu nahikoa jasotzen ez zuenez, gehiegi berotu zen.

Zer egin zenuen

Haizagailuak "Estandarra" modura aldatu ditugu; behar izanez gero, errendimendu handiagoko modu batera aldatuko ditugu.

Findings

Seguruenik, datu-zentroko pasabide hotza hain hotza ez balitz, edo bezeroak PUZa intentsiboki erabiltzen ari bazen, baliteke arazo hau ez izatea gertatuko, zaleak intentsiboago lan egingo lukete eta.

Gure kabuz, RAID duten zerbitzarietako zaleen funtzionamendu-modua behin betiko aldatzea Optimaletik biraketa-abiadura handiagoko modu batera aldatzea erabaki genuen.

Iturria: www.habr.com

Gehitu iruzkin berria