TL; DR; การตั้งค่าโหมดการทำงานของระบบระบายความร้อนเซิร์ฟเวอร์ Supermicro Optimal ไม่รับประกันการทำงานที่เสถียรของตัวควบคุม MegaRAID 9361-8i LSI ในศูนย์ข้อมูลที่เย็น
เราพยายามที่จะไม่ใช้ตัวควบคุม RAID ของฮาร์ดแวร์ แต่เรามีไคลเอ็นต์หนึ่งเครื่องที่ชอบการกำหนดค่า LSI MegaRAID วันนี้เราพบว่าการ์ด MegaRAID 9361-8i มีความร้อนสูงเกินไปเนื่องจากแพลตฟอร์มดังกล่าว ไม่รู้สึกถึงมัน มีความร้อนสูงเกินไป และตัวควบคุม RAID รู้สึก.
แพลตฟอร์มที่มีการ์ด RAID แสดงในรูปด้านล่าง:
ประเด็นสำคัญบางประการเกี่ยวกับเซิร์ฟเวอร์นี้และสภาพแวดล้อมการทำงาน:
วิศวกรที่ประกอบแพลตฟอร์มได้วางพัดลมสองตัวไว้ด้านหน้าการ์ดโดยเฉพาะ เพราะเขารู้ว่าตัวควบคุม LSI มีความร้อนสูงมาก ให้ความสนใจกับเมนบอร์ดจริง ๆ แล้วมันไม่พอดีกับคอนโทรลเลอร์โดยสิ้นสุดที่ 3 ซม. หลังจากสล็อต PCI-E
อย่างที่คุณเห็น พัดลมทั้งหมดเชื่อมต่อตามปกติกับเมนบอร์ด Supermicro และใน ดีที่สุด “ระเบิด” ขึ้นอยู่กับเซ็นเซอร์และอุณหภูมิของ CPU
แพลตฟอร์มนี้ประกอบด้วย Xeon E-2236 ซึ่งเป็น CPU ที่เย็นมาก ซึ่งเห็นได้ชัดว่าไคลเอนต์ไม่ได้ร้อนมากนัก
ศูนย์ข้อมูลที่เซิร์ฟเวอร์นี้ตั้งอยู่เย็นมาก - ทางเดินเย็นมีอุณหภูมิ 18-20 องศา
การรวมกันของปัจจัยเหล่านี้ทำให้เกิดปรากฏการณ์ที่น่าสนใจมาก - คอนโทรลเลอร์ RAID ร้อนเกินไป
ห่วงโซ่ที่น่าจะเป็นว่ามันเกิดขึ้นได้อย่างไร
- โปรเซสเซอร์เย็นและมาเธอร์บอร์ดแจ้งให้แฟน ๆ ทราบว่าอาจระเบิดได้ไม่ดี
- ไม่มีมาเธอร์บอร์ดภายใต้ RAID และไม่มีเซ็นเซอร์ที่จะตรวจจับความร้อนสูงเกินไป
- เมื่อกำหนดค่าแล้ว พัดลมจะเป่าอย่างอ่อนในโหมด Optimal ตามความต้องการของเมนบอร์ดและ CPU
- ตัวควบคุมไม่ได้รับการไหลของอากาศเพียงพอ เกิดความร้อนมากเกินไป
คุณทำอะไรลงไป
เราเปลี่ยนพัดลมเป็นโหมด "มาตรฐาน" หากจำเป็น เราจะสลับเป็นโหมดประสิทธิภาพที่สูงขึ้น
ผลการวิจัย
เป็นไปได้มากว่าหากช่องทางเย็นของศูนย์ข้อมูลไม่เย็นนัก หรือไคลเอ็นต์ใช้ CPU อย่างเข้มข้น ปัญหานี้อาจไม่เกิดขึ้น เนื่องจากพัดลมจะทำงานอย่างเข้มข้นมากขึ้น
สำหรับตัวเราเอง เราตัดสินใจเปลี่ยนโหมดการทำงานของพัดลมบนเซิร์ฟเวอร์ที่มี RAID จาก Optimal เป็นโหมดที่มีความเร็วในการหมุนเพิ่มขึ้นอย่างแน่นอน
ที่มา: will.com