Catatan singkat tentang kejadian overheating pada pengontrol LSI RAID di server di pusat data yang dingin

TL; DR; Menyetel mode pengoperasian sistem pendingin server Supermicro Optimal tidak menjamin pengoperasian pengontrol LSI MegaRAID 9361-8i yang stabil di pusat data yang dingin.

Kami mencoba untuk tidak menggunakan pengontrol RAID perangkat keras, tetapi kami memiliki satu klien yang lebih menyukai konfigurasi LSI MegaRAID. Hari ini kami mengalami panas berlebih pada kartu MegaRAID 9361-8i karena platformnya tidak merasakannya terlalu panas, dan pengontrol RAID dirasakan.

Platform dengan kartu RAID ditunjukkan pada gambar di bawah ini:

Catatan singkat tentang kejadian overheating pada pengontrol LSI RAID di server di pusat data yang dingin

Catatan singkat tentang kejadian overheating pada pengontrol LSI RAID di server di pusat data yang dingin

Beberapa poin penting tentang server dan lingkungan operasi ini:

Insinyur yang merakit platform secara khusus menempatkan dua kipas di depan kartu, karena dia tahu bahwa pengontrol LSI menjadi sangat panas. Perhatikan motherboardnya, praktis tidak muat di bawah pengontrol, berakhir 3 cm setelah slot PCI-E.

Seperti yang Anda lihat, semua kipas terhubung secara normal ke motherboard Supermicro dan masuk Optimal "meniup" tergantung pada sensor di dalamnya dan suhu CPU.

Platform ini berisi Xeon E-2236 - CPU yang sangat dingin, yang tampaknya tidak terlalu panas bagi klien.

Pusat data tempat server ini berada sangat dingin - koridor dingin menghasilkan suhu 18-20 derajat.

Kombinasi faktor-faktor ini menghasilkan fenomena yang sangat menarik - pengontrol RAID terlalu panas.

Kemungkinan rangkaian bagaimana hal itu terjadi

  1. prosesor dan motherboard yang dingin memberi tahu para penggemar bahwa mereka dapat bertiup dengan lemah.
  2. tidak ada motherboard di bawah RAID dan tidak ada sensor yang mendeteksi panas berlebih.
  3. Kipas, ketika dikonfigurasi, bertiup lemah dalam mode Optimal, sesuai dengan kebutuhan motherboard dan CPU.
  4. Pengontrol, karena tidak menerima aliran udara yang cukup, menjadi terlalu panas.

Apa yang mereka lakukan

Kami mengalihkan kipas ke mode "Standar"; jika perlu, kami akan mengalihkannya ke mode performa lebih tinggi.

Temuan

Kemungkinan besar, jika lorong dingin di pusat data tidak terlalu dingin, atau klien menggunakan CPU secara intensif, masalah ini mungkin tidak terjadi, karena kipas akan bekerja lebih intensif.

Bagi kami sendiri, kami memutuskan untuk mengubah mode pengoperasian kipas di server dengan RAID dari Optimal ke mode dengan kecepatan rotasi yang ditingkatkan.

Sumber: www.habr.com

Tambah komentar