Soğuk bir veri merkezindeki bir sunucudaki LSI RAID denetleyicisinin aşırı ısınmasıyla ilgili olay hakkında kısa bir not

TL; DR; Supermicro Optimal sunucu soğutma sisteminin çalışma modunun ayarlanması, MegaRAID 9361-8i LSI denetleyicisinin soğuk bir veri merkezinde kararlı çalışmasını garanti etmez.

Donanımsal RAID denetleyicilerini kullanmamaya çalışıyoruz ancak LSI MegaRAID yapılandırmalarını tercih eden bir istemcimiz var. Bugün platformun aşırı ısınması nedeniyle MegaRAID 9361-8i kartının aşırı ısınmasıyla karşılaştık. hissetmedim aşırı ısınma ve RAID denetleyicisi keçe.

RAID kartına sahip platform aşağıdaki şekillerde gösterilmektedir:

Soğuk bir veri merkezindeki bir sunucudaki LSI RAID denetleyicisinin aşırı ısınmasıyla ilgili olay hakkında kısa bir not

Soğuk bir veri merkezindeki bir sunucudaki LSI RAID denetleyicisinin aşırı ısınmasıyla ilgili olay hakkında kısa bir not

Bu sunucu ve işletim ortamıyla ilgili birkaç önemli nokta:

Platformu kuran mühendis, LSI denetleyicilerin çok ısındığını bildiği için kartın önüne özel olarak iki fan yerleştirdi. Anakarta dikkat edin, pratik olarak denetleyicinin altına sığmıyor ve PCI-E yuvasından 3 cm sonra bitiyor.

Gördüğünüz gibi tüm fanlar Supermicro anakartına normal şekilde bağlı ve Optimum Üzerindeki sensörlere ve CPU sıcaklığına bağlı olarak “darbe”.

Bu platform, görünüşe göre istemcinin fazla ısınmadığı çok soğuk bir CPU olan Xeon E-2236'yı içeriyor.

Bu sunucunun bulunduğu veri merkezi çok soğuk - soğuk koridor 18-20 derece veriyor.

Bu faktörlerin birleşimi çok ilginç bir olguya yol açtı: RAID denetleyicisinin aşırı ısınması.

Nasıl olduğuna dair olası zincir

  1. soğuk bir işlemci ve anakart, fanlara zayıf bir şekilde üfleyebileceklerini bildirdi.
  2. RAID altında anakart yoktu ve aşırı ısınmayı algılayacak sensörler yoktu.
  3. Fanlar, yapılandırıldığında anakartın ve CPU'nun ihtiyaçlarına göre Optimal modda zayıf bir şekilde patladı.
  4. Yeterli hava akışı alamayan kontrolör aşırı ısındı.

Ne yaptı

Fanları “Standart” moda geçirdik, gerekirse daha yüksek performans moduna geçireceğiz.

Bulgular

Büyük olasılıkla, veri merkezinin soğuk koridoru bu kadar soğuk olmasaydı veya müşteri CPU'yu yoğun bir şekilde kullanıyor olsaydı, fanlar daha yoğun çalışacağından bu sorun ortaya çıkmayabilirdi.

Kendimiz için, RAID'li sunuculardaki fanların çalışma modunu kesinlikle Optimal'den artan dönüş hızına sahip bir moda değiştirmeye karar verdik.

Kaynak: habr.com

Yorum ekle