Nota ringkas mengenai kejadian dengan terlalu panas pengawal LSI RAID dalam pelayan di pusat data sejuk

TL; DR; Menetapkan mod pengendalian sistem penyejukan pelayan Supermicro Optimal tidak memastikan operasi stabil pengawal MegaRAID 9361-8i LSI dalam pusat data sejuk.

Kami cuba untuk tidak menggunakan pengawal RAID perkakasan, tetapi kami mempunyai satu pelanggan yang memilih konfigurasi LSI MegaRAID. Hari ini kami mengalami terlalu panas pada kad MegaRAID 9361-8i disebabkan oleh fakta bahawa platform tidak merasakannya terlalu panas, dan pengawal RAID terasa.

Platform dengan kad RAID ditunjukkan dalam rajah di bawah:

Nota ringkas mengenai kejadian dengan terlalu panas pengawal LSI RAID dalam pelayan di pusat data sejuk

Nota ringkas mengenai kejadian dengan terlalu panas pengawal LSI RAID dalam pelayan di pusat data sejuk

Beberapa perkara penting tentang pelayan dan persekitaran operasi ini:

Jurutera yang memasang platform secara khusus meletakkan dua kipas di hadapan kad, kerana dia tahu bahawa pengawal LSI menjadi sangat panas. Perhatikan papan induk, ia boleh dikatakan tidak sesuai di bawah pengawal, berakhir 3 cm selepas slot PCI-E.

Seperti yang anda lihat, semua peminat disambungkan secara normal ke papan induk Supermicro dan masuk Optimum "tiup" bergantung pada penderia padanya dan suhu CPU.

Platform ini mengandungi Xeon E-2236 - CPU yang sangat sejuk, yang pelanggan nampaknya tidak terlalu panas.

Pusat data di mana pelayan ini terletak sangat sejuk - koridor sejuk memberikan 18-20 darjah.

Gabungan faktor-faktor ini membawa kepada fenomena yang sangat menarik - terlalu panas pengawal RAID.

Rantaian kemungkinan bagaimana ia berlaku

  1. pemproses sejuk dan papan induk memaklumkan peminat bahawa mereka boleh meniup lemah.
  2. tiada papan induk di bawah RAID dan tiada penderia yang akan mengesan terlalu panas.
  3. Peminat, apabila dikonfigurasikan, bertiup lemah dalam mod Optimum, mengikut keperluan papan induk dan CPU.
  4. Pengawal, tidak menerima aliran udara yang mencukupi, menjadi terlalu panas.

Apa yang awak buat

Kami menukar peminat kepada mod "Standard"; jika perlu, kami akan menukarnya kepada mod prestasi yang lebih tinggi.

Penemuan

Kemungkinan besar, jika lorong sejuk pusat data tidak begitu sejuk, atau pelanggan menggunakan CPU secara intensif, masalah ini mungkin tidak berlaku, kerana peminat akan bekerja dengan lebih intensif.

Bagi diri kami sendiri, kami memutuskan untuk menukar mod operasi peminat pada pelayan dengan RAID daripada Optimal kepada mod dengan kelajuan putaran yang meningkat.

Sumber: www.habr.com

Tambah komen