Μειώστε τους κινδύνους διακοπής λειτουργίας με την αρχιτεκτονική του Shared Nothing

Το θέμα της ανοχής σφαλμάτων στα συστήματα αποθήκευσης δεδομένων είναι πάντα επίκαιρο, καθώς στην εποχή μας της εκτεταμένης εικονικοποίησης και ενοποίησης πόρων, τα συστήματα αποθήκευσης είναι ο σύνδεσμος του οποίου η αποτυχία θα οδηγήσει όχι μόνο σε ένα συνηθισμένο ατύχημα, αλλά σε μακροχρόνιο χρόνο διακοπής των υπηρεσιών. Επομένως, τα σύγχρονα συστήματα αποθήκευσης περιέχουν πολλά διπλά εξαρτήματα (ακόμη και ελεγκτές). Είναι όμως επαρκής μια τέτοια προστασία;

Μειώστε τους κινδύνους διακοπής λειτουργίας με την αρχιτεκτονική του Shared Nothing

Απολύτως όλοι οι πωλητές, όταν απαριθμούν τα χαρακτηριστικά των συστημάτων αποθήκευσης, αναφέρουν πάντα την υψηλή ανοχή σφαλμάτων των λύσεών τους, προσθέτοντας πάντα τον όρο «χωρίς ούτε ένα σημείο αστοχίας». Ας ρίξουμε μια πιο προσεκτική ματιά σε ένα τυπικό σύστημα αποθήκευσης. Για να αποφευχθεί η διακοπή λειτουργίας στη συντήρηση, το σύστημα αποθήκευσης αντιγράφει τροφοδοτικά, μονάδες ψύξης, θύρες εισόδου/εξόδου, μονάδες δίσκου (εννοούμε RAID) και, φυσικά, ελεγκτές. Αν κοιτάξετε προσεκτικά αυτήν την αρχιτεκτονική, θα παρατηρήσετε τουλάχιστον δύο πιθανά σημεία αποτυχίας, τα οποία τηρούνται συγκρατημένα σιωπηλά:

  1. Διαθεσιμότητα ενός μόνο backplane
  2. Έχοντας ένα αντίγραφο των δεδομένων

Το backplane είναι μια τεχνικά πολύπλοκη συσκευή που πρέπει να υποβληθεί σε σοβαρές δοκιμές κατά την παραγωγή. Και επομένως, υπάρχουν εξαιρετικά σπάνιες περιπτώσεις που αποτυγχάνει εντελώς. Ωστόσο, ακόμη και σε περίπτωση μερικών προβλημάτων, όπως η μη λειτουργική υποδοχή μονάδας δίσκου, θα πρέπει να αντικατασταθεί με πλήρη διακοπή λειτουργίας του συστήματος αποθήκευσης.

Η δημιουργία πολλαπλών αντιγράφων δεδομένων δεν αποτελεί επίσης πρόβλημα με την πρώτη ματιά. Για παράδειγμα, η λειτουργία Clone στα συστήματα αποθήκευσης, η οποία σας επιτρέπει να ενημερώνετε ένα πλήρες αντίγραφο δεδομένων σε ορισμένα διαστήματα, είναι αρκετά διαδεδομένη. Ωστόσο, σε περίπτωση προβλημάτων με το ίδιο backplay, το αντίγραφο θα είναι εξίσου μη διαθέσιμο με το πρωτότυπο.

Μια εντελώς προφανής λύση για να ξεπεραστούν αυτές οι ελλείψεις είναι η αναπαραγωγή σε άλλο σύστημα αποθήκευσης. Εάν κλείσουμε τα μάτια μας στον αναμενόμενο διπλασιασμό του κόστους του υλικού (εξακολουθούμε να υποθέτουμε ότι οι άνθρωποι που επιλέγουν μια τέτοια απόφαση σκέφτονται επαρκώς και αποδέχονται αυτό το γεγονός εκ των προτέρων), θα εξακολουθήσουν να υπάρχουν πιθανά κόστη για την οργάνωση της αναπαραγωγής με τη μορφή αδειών, επιπλέον λογισμικού και υλικού. Και το πιο σημαντικό, θα χρειαστεί να διασφαλίσετε με κάποιο τρόπο τη συνέπεια των αναπαραγόμενων δεδομένων. Εκείνοι. δημιουργήστε έναν εικονικοποιητή αποθήκευσης/vSAN/κ.λπ., ο οποίος απαιτεί επίσης χρήματα και πόρους χρόνου.

AccelStor Κατά τη δημιουργία των συστημάτων μας Υψηλής Διαθεσιμότητας, θέσαμε ως στόχο να απαλλαγούμε από τις προαναφερθείσες ελλείψεις. Κάπως έτσι εμφανίστηκε η ερμηνεία της τεχνολογίας Shared Nothing, η οποία μεταφράζεται χαλαρά σημαίνει «χωρίς τη χρήση κοινόχρηστων συσκευών».

Έννοια Κοινόχρηστο τίποτα Η αρχιτεκτονική αντιπροσωπεύει τη χρήση δύο ανεξάρτητων κόμβων (ελεγκτών), καθένας από τους οποίους έχει το δικό του σύνολο δεδομένων. Η σύγχρονη αναπαραγωγή λαμβάνει χώρα μεταξύ κόμβων μέσω της διεπαφής InfiniBand 56G, εντελώς διαφανής στο λογισμικό που τρέχει πάνω από το σύστημα αποθήκευσης. Ως αποτέλεσμα, δεν απαιτείται η χρήση εικονικοποιητών αποθήκευσης, πρακτόρων λογισμικού κ.λπ.

Φυσικά, η λύση δύο κόμβων από το AccelStor μπορεί να εφαρμοστεί σε δύο μοντέλα:

  • H510 — βασίζεται σε διακομιστές Twin σε θήκη 2U, εάν απαιτείται μέτρια απόδοση και χωρητικότητα έως 22 TB.
  • H710 — βασίζεται σε μεμονωμένους διακομιστές 2U, εάν απαιτούνται υψηλή απόδοση και μεγάλη χωρητικότητα (έως 57 TB).

Μειώστε τους κινδύνους διακοπής λειτουργίας με την αρχιτεκτονική του Shared Nothing

Το μοντέλο H510 βασίζεται σε διακομιστή Twin

Μειώστε τους κινδύνους διακοπής λειτουργίας με την αρχιτεκτονική του Shared Nothing

Το μοντέλο H710 βασίζεται σε μεμονωμένους διακομιστές

Η χρήση διαφορετικών παραγόντων μορφής οφείλεται στην ανάγκη για διαφορετικούς αριθμούς SSD για να επιτευχθεί ένας δεδομένος όγκος και απόδοση. Επιπλέον, η πλατφόρμα Twin είναι φθηνότερη και σας επιτρέπει να προσφέρετε πιο προσιτές λύσεις, αν και με κάποιο υπό όρους «μειονέκτημα» με τη μορφή ενός μόνο backplane. Όλα τα άλλα, συμπεριλαμβανομένων των αρχών λειτουργίας, είναι πανομοιότυπα και για τα δύο μοντέλα.

Το σύνολο δεδομένων για κάθε κόμβο έχει δύο ομάδες FlexiRemap, συν 2 ζεστά ανταλλακτικά. Κάθε ομάδα μπορεί να αντέξει την αποτυχία ενός SSD. Όλες οι εισερχόμενες αιτήσεις για εγγραφή κόμβου σύμφωνα με ιδεολογία Το FlexiRemap αναδομεί μπλοκ 4KB σε διαδοχικές αλυσίδες, οι οποίες στη συνέχεια γράφονται στο SSD με την πιο άνετη λειτουργία για αυτούς (διαδοχική εγγραφή). Επιπλέον, ο κεντρικός υπολογιστής λαμβάνει μια επιβεβαίωση εγγραφής μόνο αφού τα δεδομένα τοποθετηθούν φυσικά στο SSD, δηλ. χωρίς αποθήκευση στη μνήμη RAM. Το αποτέλεσμα είναι πολύ εντυπωσιακή απόδοση εγγραφής έως και 600K IOPS και ανάγνωσης 1M+ IOPS (μοντέλο H710).

Όπως αναφέρθηκε προηγουμένως, τα σύνολα δεδομένων συγχρονίζονται σε πραγματικό χρόνο μέσω της διεπαφής InfiniBand 56G, η οποία έχει υψηλή απόδοση και χαμηλή καθυστέρηση. Για την αποτελεσματικότερη χρήση του καναλιού επικοινωνίας κατά τη μετάδοση μικρών πακέτων. Επειδή υπάρχει μόνο ένα κανάλι επικοινωνίας· μια αποκλειστική σύνδεση 1 GbE χρησιμοποιείται για πρόσθετο έλεγχο καρδιακού παλμού. Μόνο ο καρδιακός παλμός μεταδίδεται μέσω αυτού, επομένως δεν υπάρχουν απαιτήσεις για χαρακτηριστικά ταχύτητας.

Σε περίπτωση αύξησης της χωρητικότητας του συστήματος (έως 400+TB) λόγω ράφια επέκτασης Συνδέονται επίσης σε ζευγάρια για να διατηρήσουν την έννοια «κανένα σημείο αποτυχίας».

Για πρόσθετη προστασία δεδομένων (πέρα από το γεγονός ότι το AccelStor έχει ήδη δύο αντίγραφα), χρησιμοποιείται ένας ειδικός αλγόριθμος συμπεριφοράς σε περίπτωση βλάβης οποιουδήποτε SSD. Εάν ο SSD αποτύχει, ο κόμβος θα αρχίσει να αναδημιουργεί δεδομένα σε μία από τις καυτές εφεδρικές μονάδες δίσκου. Η ομάδα FlexiRemap, η οποία βρίσκεται σε υποβαθμισμένη κατάσταση, θα μεταβεί σε λειτουργία μόνο για ανάγνωση. Αυτό γίνεται για να εξαλειφθούν οι παρεμβολές μεταξύ των λειτουργιών εγγραφής και αναδόμησης στον δίσκο αντιγράφων ασφαλείας, που τελικά επιταχύνει τη διαδικασία ανάκτησης και μειώνει τον χρόνο που το σύστημα είναι δυνητικά ευάλωτο. Με την ολοκλήρωση της ανακατασκευής, ο κόμβος επιστρέφει στην κανονική λειτουργία ανάγνωσης-εγγραφής.

Μειώστε τους κινδύνους διακοπής λειτουργίας με την αρχιτεκτονική του Shared Nothing

Φυσικά, όπως και άλλα συστήματα, κατά την ανακατασκευή η συνολική απόδοση μειώνεται (εξάλλου, μια από τις ομάδες FlexiRemap δεν λειτουργεί για εγγραφή). Αλλά η ίδια η διαδικασία ανάκτησης πραγματοποιείται όσο το δυνατόν γρηγορότερα, γεγονός που διακρίνει τα συστήματα AccelStor από λύσεις άλλων προμηθευτών.

Μια άλλη χρήσιμη ιδιότητα της τεχνολογίας Nothing Shared αρχιτεκτονικής είναι η λειτουργία των κόμβων στη λεγόμενη πραγματική ενεργή-ενεργή λειτουργία. Σε αντίθεση με την «κλασική» αρχιτεκτονική, όπου μόνο ένας ελεγκτής κατέχει συγκεκριμένο όγκο/δεξαμενή και ο δεύτερος απλώς εκτελεί λειτουργίες I/O, σε συστήματα AccelStor κάθε κόμβος λειτουργεί με το δικό του σύνολο δεδομένων και δεν μεταδίδει αιτήματα στον «γείτονά» του. Ως αποτέλεσμα, η συνολική απόδοση του συστήματος βελτιώνεται λόγω της παράλληλης επεξεργασίας των αιτημάτων εισόδου/εξόδου από κόμβους και της πρόσβασης σε μονάδες δίσκου. Επίσης, ουσιαστικά δεν υπάρχει τέτοιο πράγμα όπως failover, αφού απλά δεν χρειάζεται να μεταφέρετε τον έλεγχο των τόμων σε άλλον κόμβο σε περίπτωση αποτυχίας.

Εάν συγκρίνουμε την τεχνολογία Nothing Shared αρχιτεκτονικής με την πλήρη αντιγραφή συστήματος αποθήκευσης, τότε, εκ πρώτης όψεως, θα είναι ελαφρώς κατώτερη από την πλήρη εφαρμογή της ανάκτησης καταστροφών στην ευελιξία. Αυτό ισχύει ιδιαίτερα για την οργάνωση μιας γραμμής επικοινωνίας μεταξύ συστημάτων αποθήκευσης. Έτσι, στο μοντέλο H710 είναι δυνατή η εξάπλωση κόμβων σε απόσταση έως και 100 μέτρων μέσω της χρήσης όχι πολύ φθηνών ενεργών οπτικών καλωδίων InfiniBand. Αλλά ακόμα και αν συγκριθεί με τη συνήθη εφαρμογή της σύγχρονης αναπαραγωγής από άλλους προμηθευτές μέσω ενός διαθέσιμου FibreChannel, ακόμη και σε μεγαλύτερες αποστάσεις, η λύση από το AccelStor θα είναι φθηνότερη και ευκολότερη στην εγκατάσταση/λειτουργία, επειδή δεν υπάρχει ανάγκη εγκατάστασης εικονικοποιητών αποθήκευσης ή/και ενσωμάτωσης με λογισμικό (κάτι που δεν είναι πάντα δυνατό κατ' αρχήν). Επιπλέον, μην ξεχνάτε ότι οι λύσεις AccelStor είναι όλες οι συστοιχίες Flash με απόδοση υψηλότερη από αυτή των «κλασικών» συστημάτων αποθήκευσης μόνο με SSD.

Μειώστε τους κινδύνους διακοπής λειτουργίας με την αρχιτεκτονική του Shared Nothing

Όταν χρησιμοποιείτε την αρχιτεκτονική Nothing Shared του AccelStor, μπορείτε να επιτύχετε 99.9999% διαθεσιμότητα του συστήματος αποθήκευσης με πολύ λογικό κόστος. Μαζί με την υψηλή αξιοπιστία της λύσης, συμπεριλαμβανομένης της χρήσης δύο αντιγράφων δεδομένων, και την εντυπωσιακή απόδοση χάρη στους ιδιόκτητους αλγόριθμους FlexiRemap, λύσεις από AccelStor είναι εξαιρετικοί υποψήφιοι για βασικές θέσεις κατά την κατασκευή ενός σύγχρονου κέντρου δεδομένων.

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο