Mallonga noto pri la okazaĵo kun trovarmiĝo de la LSI RAID-regilo en servilo en malvarma datumcentro

TL; DR; Agordi la operacian reĝimon de la Supermicro Optimuma servila malvarmiga sistemo ne certigas stabilan funkciadon de la MegaRAID 9361-8i LSI-regilo en malvarma datumcentro.

Ni provas ne uzi aparatajn RAID-regilojn, sed ni havas unu klienton, kiu preferas agordojn de LSI MegaRAID. Hodiaŭ ni renkontis trovarmiĝon de la karto MegaRAID 9361-8i pro la fakto, ke la platformo ne sentis ĝin trovarmiĝo, kaj la RAID-regilo sentis.

La platformo kun RAID-karto estas montrita en la malsupraj figuroj:

Mallonga noto pri la okazaĵo kun trovarmiĝo de la LSI RAID-regilo en servilo en malvarma datumcentro

Mallonga noto pri la okazaĵo kun trovarmiĝo de la LSI RAID-regilo en servilo en malvarma datumcentro

Kelkaj gravaj punktoj pri ĉi tiu servilo kaj operaciumo:

La inĝeniero kiu kunvenis la platformon specife metis du ventolilojn antaŭ la karto, ĉar li scias, ke LSI-regiloj tre varmiĝas. Atentu la baztablon, ĝi preskaŭ ne taŭgas sub la regilo, finiĝante 3 cm post la fendo PCI-E.

Kiel vi povas vidi, ĉiuj adorantoj estas normale konektitaj al la ĉeftabulo Supermicro kaj enen Optimuma "blovi" depende de la sensiloj sur ĝi kaj la CPU-temperaturo.

Ĉi tiu platformo enhavas Xeon E-2236 - tre malvarman CPU, kiun la kliento ŝajne ne multe varmigis.

La datumcentro, en kiu ĉi tiu servilo troviĝas, estas tre malvarma - la malvarma koridoro donas 18-20 gradojn.

La kombinaĵo de ĉi tiuj faktoroj kondukis al tre interesa fenomeno - trovarmiĝo de la RAID-regilo.

Verŝajna ĉeno de kiel ĝi okazis

  1. malvarma procesoro kaj baztabulo informis la adorantojn, ke ili povas malforte blovi.
  2. ekzistis neniu baztabulo sub RAID kaj ekzistis neniuj sensiloj kiuj detektus trovarmiĝon.
  3. La ventoliloj, kiam agordis, malforte blovis en Optimuma reĝimo, laŭ la bezonoj de la baztabulo kaj CPU.
  4. La regilo, ne ricevante sufiĉe da aerfluo, trovarmiĝis.

Kion vi faris

Ni ŝanĝis la ventolilojn al la "Norma" reĝimo; se necese, ni ŝanĝos ilin al pli alta rendimenta reĝimo.

trovoj

Plej verŝajne, se la malvarma koridoro de la datumcentro ne estus tiel malvarma, aŭ la kliento uzus la CPU intense, ĉi tiu problemo eble ne okazis, ĉar la adorantoj laborus pli intense.

Por ni mem, ni decidis definitive ŝanĝi la operacian reĝimon de la ventoliloj sur serviloj kun RAID de Optimuma al reĝimo kun pliigita rotacia rapideco.

fonto: www.habr.com

Aldoni komenton