Μια σύντομη σημείωση για το περιστατικό με την υπερθέρμανση του ελεγκτή LSI RAID σε διακομιστή σε ένα ψυχρό κέντρο δεδομένων

TL · DR; Η ρύθμιση του τρόπου λειτουργίας του συστήματος ψύξης διακομιστή Supermicro Optimal δεν διασφαλίζει τη σταθερή λειτουργία του ελεγκτή MegaRAID 9361-8i LSI σε ένα ψυχρό κέντρο δεδομένων.

Προσπαθούμε να μην χρησιμοποιούμε ελεγκτές RAID υλικού, αλλά έχουμε έναν πελάτη που προτιμά τις διαμορφώσεις LSI MegaRAID. Σήμερα αντιμετωπίσαμε υπερθέρμανση της κάρτας MegaRAID 9361-8i λόγω του ότι η πλατφόρμα δεν το ένιωθε υπερθέρμανση και τον ελεγκτή RAID ένιωσα.

Η πλατφόρμα με κάρτα RAID φαίνεται στα παρακάτω σχήματα:

Μια σύντομη σημείωση για το περιστατικό με την υπερθέρμανση του ελεγκτή LSI RAID σε διακομιστή σε ένα ψυχρό κέντρο δεδομένων

Μια σύντομη σημείωση για το περιστατικό με την υπερθέρμανση του ελεγκτή LSI RAID σε διακομιστή σε ένα ψυχρό κέντρο δεδομένων

Μερικά σημαντικά σημεία σχετικά με αυτόν τον διακομιστή και το λειτουργικό περιβάλλον:

Ο μηχανικός που συναρμολόγησε την πλατφόρμα τοποθέτησε συγκεκριμένα δύο ανεμιστήρες μπροστά από την κάρτα, επειδή γνωρίζει ότι οι ελεγκτές LSI ζεσταίνονται πολύ. Δώστε προσοχή στη μητρική πλακέτα, πρακτικά δεν χωράει κάτω από τον ελεγκτή, τελειώνοντας 3 cm μετά την υποδοχή PCI-E.

Όπως μπορείτε να δείτε, όλοι οι ανεμιστήρες συνδέονται κανονικά στη μητρική πλακέτα Supermicro και μέσα Βέλτιστη “blow” ανάλογα με τους αισθητήρες σε αυτό και τη θερμοκρασία της CPU.

Αυτή η πλατφόρμα περιέχει μια Xeon E-2236 - μια πολύ κρύα CPU, την οποία ο πελάτης προφανώς δεν θερμάνθηκε πολύ.

Το κέντρο δεδομένων στο οποίο βρίσκεται αυτός ο διακομιστής είναι πολύ κρύο - ο ψυχρός διάδρομος δίνει 18-20 μοίρες.

Ο συνδυασμός αυτών των παραγόντων οδήγησε σε ένα πολύ ενδιαφέρον φαινόμενο - την υπερθέρμανση του ελεγκτή RAID.

Πιθανή αλυσίδα για το πώς συνέβη

  1. ένας ψυχρός επεξεργαστής και μια μητρική πλακέτα ενημέρωσαν τους θαυμαστές ότι θα μπορούσαν να φυσήξουν αδύναμα.
  2. δεν υπήρχε μητρική πλακέτα κάτω από το RAID και δεν υπήρχαν αισθητήρες που θα ανίχνευαν την υπερθέρμανση.
  3. Οι ανεμιστήρες, όταν ρυθμίστηκαν, φυσούσαν ασθενώς στη λειτουργία Optimal, σύμφωνα με τις ανάγκες της μητρικής πλακέτας και της CPU.
  4. Ο ελεγκτής, μη δεχόμενος αρκετή ροή αέρα, υπερθερμάνθηκε.

Τι έκαναν

Αλλάξαμε τους ανεμιστήρες στη λειτουργία "Standard", εάν χρειαστεί, θα τους αλλάξουμε σε λειτουργία υψηλότερης απόδοσης.

Ευρήματα

Πιθανότατα, εάν ο ψυχρός διάδρομος του κέντρου δεδομένων δεν ήταν τόσο κρύος ή ο πελάτης χρησιμοποιούσε εντατικά την CPU, αυτό το πρόβλημα μπορεί να μην είχε παρουσιαστεί, καθώς οι ανεμιστήρες θα λειτουργούσαν πιο εντατικά.

Για εμάς, αποφασίσαμε να αλλάξουμε οπωσδήποτε τον τρόπο λειτουργίας των ανεμιστήρων σε διακομιστές με RAID από Optimal σε λειτουργία με αυξημένη ταχύτητα περιστροφής.

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο