Huawei Dorado V6: θερμότητα Sichuan

Huawei Dorado V6: θερμότητα Sichuan
Το φετινό καλοκαίρι στη Μόσχα δεν ήταν, για να είμαι ειλικρινής, πολύ καλό. Ξεκίνησε πολύ νωρίς και γρήγορα, δεν είχαν όλοι χρόνο να αντιδράσουν σε αυτό, και τελείωσε ήδη στα τέλη Ιουνίου. Επομένως, όταν η Huawei με κάλεσε να πάω στην Κίνα, στην πόλη Chengdu, όπου βρίσκεται το κέντρο RnD της, αφού κοίταξα την πρόγνωση του καιρού +34 βαθμών στη σκιά, συμφώνησα αμέσως. Άλλωστε, δεν είμαι πια στην ίδια ηλικία και πρέπει να ζεστάνω λίγο τα κόκαλά μου. Αλλά θα ήθελα να σημειώσω ότι ήταν δυνατό να ζεσταθούν όχι μόνο τα κόκαλα, αλλά και τα εσωτερικά, επειδή η επαρχία Σιτσουάν, στην οποία βρίσκεται στην πραγματικότητα το Τσενγκντού, φημίζεται για την αγάπη της για τα πικάντικα τρόφιμα. Ωστόσο, αυτό δεν είναι ένα ιστολόγιο για ταξίδια, οπότε ας επιστρέψουμε στον κύριο στόχο του ταξιδιού μας - μια νέα σειρά συστημάτων αποθήκευσης - Huawei Dorado V6. Αυτό το άρθρο θα σας παρασύρει λίγο από το παρελθόν, γιατί... γράφτηκε πριν από την επίσημη ανακοίνωση, αλλά δημοσιεύτηκε μόνο μετά την κυκλοφορία. Και έτσι, σήμερα θα ρίξουμε μια πιο προσεκτική ματιά σε όλα τα ενδιαφέροντα και νόστιμα που έχει ετοιμάσει η Huawei για εμάς.

Huawei Dorado V6: θερμότητα Sichuan
Στη νέα σειρά θα υπάρχουν 5 μοντέλα. Όλα τα μοντέλα εκτός από το 3000V6 μπορούν να διατεθούν σε δύο εκδόσεις - SAS και NVMe. Η επιλογή καθορίζει τη διεπαφή των δίσκων που μπορείτε να χρησιμοποιήσετε σε αυτό το σύστημα, τις θύρες Back-End και τον αριθμό των μονάδων δίσκου που μπορείτε να εγκαταστήσετε στο σύστημα. Για το NVMe, χρησιμοποιούνται SSD μεγέθους παλάμης, οι οποίοι είναι πιο λεπτοί από τους κλασικούς SAS SAS 2.5" και μπορούν να εγκατασταθούν σε έως και 36 κομμάτια. Η νέα γραμμή είναι All Flash και δεν υπάρχουν διαμορφώσεις με δίσκους.

Huawei Dorado V6: θερμότητα Sichuan
Palm NVMe SSD

Κατά τη γνώμη μου, τα Dorado 8000 και 18000 μοιάζουν με τα πιο ενδιαφέροντα μοντέλα. Η Huawei τα τοποθετεί ως συστήματα υψηλής τεχνολογίας και, χάρη στην τιμολογιακή πολιτική της Huawei, έρχεται σε αντίθεση με αυτά τα μοντέλα μεσαίας κατηγορίας με το ανταγωνιστικό τμήμα. Σε αυτά τα μοντέλα θα εστιάσω στη σημερινή μου κριτική. Θα σημειώσω αμέσως ότι λόγω των σχεδιαστικών τους χαρακτηριστικών, τα junior συστήματα διπλού ελεγκτή έχουν ελαφρώς διαφορετική αρχιτεκτονική, διαφορετική από το Dorado 8000 και το 18000, επομένως δεν ισχύουν όλα όσα θα μιλήσω σήμερα για τα junior μοντέλα.

Ένα από τα κύρια χαρακτηριστικά των νέων συστημάτων ήταν η χρήση πολλών τσιπ, που αναπτύχθηκαν εσωτερικά, καθένα από τα οποία σας επιτρέπει να διανείμετε το λογικό φορτίο από τον κεντρικό επεξεργαστή του ελεγκτή και να προσθέσετε λειτουργικότητα σε διαφορετικά εξαρτήματα.
Huawei Dorado V6: θερμότητα Sichuan

Η καρδιά των νέων συστημάτων είναι οι επεξεργαστές Kunpeng 920, που αναπτύχθηκαν σε τεχνολογίες ARM και κατασκευάζονται από την Huawei ανεξάρτητα. Ανάλογα με το μοντέλο, ο αριθμός των πυρήνων, η συχνότητά τους και ο αριθμός των εγκατεστημένων επεξεργαστών σε κάθε ελεγκτή ποικίλλει:
Huawei Dorado V6 8000 – 2CPU, 64 πυρήνων
Huawei Dorado V6 18000 – 4CPU, 48 πυρήνων
Huawei Dorado V6: θερμότητα Sichuan

Η Huawei ανέπτυξε αυτόν τον επεξεργαστή στην αρχιτεκτονική ARM και από όσο γνωρίζω, αρχικά σχεδίαζε να τον εγκαταστήσει μόνο στα παλαιότερα μοντέλα Dorado 8000 και 18000, όπως συνέβαινε ήδη με ορισμένα μοντέλα V5, αλλά οι κυρώσεις έκαναν προσαρμογές σε αυτήν την ιδέα. Φυσικά, η ARM μίλησε και για άρνηση συνεργασίας με την Huawei κατά την επιβολή κυρώσεων, αλλά εδώ η κατάσταση είναι διαφορετική από την Intel. Η Huawei παράγει αυτά τα τσιπ ανεξάρτητα και καμία κύρωση δεν μπορεί να σταματήσει αυτή τη διαδικασία. Η διακοπή των σχέσεων με την ARM απειλεί μόνο την απώλεια πρόσβασης σε νέες εξελίξεις. Όσον αφορά την απόδοση, θα είναι δυνατό να κριθεί μόνο μετά τη διεξαγωγή ανεξάρτητων δοκιμών. Αν και είδα πώς αφαιρέθηκε το 18000M IOPS από το σύστημα Dorado 1 χωρίς κανένα πρόβλημα, μέχρι να το επαναλάβω με τα χέρια μου στο ράφι μου, δεν θα το πιστέψω. Αλλά υπάρχει πραγματικά πολλή δύναμη στα χειριστήρια. Τα παλαιότερα μοντέλα είναι εξοπλισμένα με 4 ελεγκτές, το καθένα με 4 επεξεργαστές, δίνοντας συνολικά 768 πυρήνες.
Huawei Dorado V6: θερμότητα Sichuan

Αλλά θα μιλήσω για τους πυρήνες ακόμα αργότερα, όταν δούμε την αρχιτεκτονική των νέων συστημάτων, αλλά προς το παρόν ας επιστρέψουμε σε ένα άλλο τσιπ που είναι εγκατεστημένο στο σύστημα. Το τσιπ μοιάζει με μια εξαιρετικά ενδιαφέρουσα λύση Άνοδος 310 (Από όσο καταλαβαίνω, ο μικρότερος αδερφός του Ascend 910, που παρουσιάστηκε πρόσφατα στο κοινό). Το καθήκον του είναι να αναλύει μπλοκ δεδομένων που εισέρχονται στο σύστημα για να αυξήσει την αναλογία επιτυχίας ανάγνωσης. Είναι δύσκολο να πούμε πώς θα αποδώσει στη δουλειά, γιατί... Σήμερα λειτουργεί μόνο σύμφωνα με ένα δεδομένο πρότυπο και δεν έχει τη δυνατότητα να μάθει σε έξυπνη λειτουργία. Η εμφάνιση μιας έξυπνης λειτουργίας υπόσχεται στο μελλοντικό υλικολογισμικό, πιθανότατα στις αρχές του επόμενου έτους.

Ας περάσουμε στην αρχιτεκτονική. Η Huawei συνέχισε να αναπτύσσει τη δική της τεχνολογία Smart Matrix, η οποία εφαρμόζει μια προσέγγιση πλήρους πλέγματος στη σύνδεση εξαρτημάτων. Αλλά αν στο V5 αυτό ήταν μόνο για πρόσβαση από ελεγκτές σε δίσκους, τώρα όλοι οι ελεγκτές έχουν πρόσβαση σε όλες τις θύρες τόσο στο Back-End όσο και στο Front-End.
Huawei Dorado V6: θερμότητα Sichuan

Χάρη στη νέα αρχιτεκτονική microservice, αυτό επιτρέπει επίσης την εξισορρόπηση φορτίου μεταξύ όλων των ελεγκτών, ακόμη και αν υπάρχει μόνο ένα lun. Το λειτουργικό σύστημα για αυτήν τη σειρά συστοιχιών αναπτύχθηκε από την αρχή και όχι απλώς βελτιστοποιήθηκε για τη χρήση μονάδων Flash. Λόγω του γεγονότος ότι όλοι οι ελεγκτές μας έχουν πρόσβαση στις ίδιες θύρες, σε περίπτωση αποτυχίας ή επανεκκίνησης του ελεγκτή, ο κεντρικός υπολογιστής δεν χάνει ούτε μία διαδρομή προς το σύστημα αποθήκευσης και η εναλλαγή διαδρομής πραγματοποιείται σε επίπεδο συστήματος αποθήκευσης. Ωστόσο, η χρήση του UltraPath στον κεντρικό υπολογιστή δεν είναι απολύτως απαραίτητη. Μια άλλη «εξοικονόμηση» κατά την εγκατάσταση του συστήματος είναι ο μικρότερος αριθμός απαραίτητων συνδέσμων. Και αν με την "κλασική" προσέγγιση για 4 ελεγκτές θα χρειαστούμε 8 συνδέσμους από 2 εργοστάσια, τότε στην περίπτωση της Huawei ακόμη και 2 θα είναι αρκετές (δεν μιλάω τώρα για την επάρκεια της απόδοσης ενός συνδέσμου).
Huawei Dorado V6: θερμότητα Sichuan

Όπως και στην προηγούμενη έκδοση, χρησιμοποιείται μια καθολική κρυφή μνήμη με κατοπτρισμό. Αυτό σας επιτρέπει να χάσετε έως και δύο ελεγκτές ταυτόχρονα ή τρεις ελεγκτές διαδοχικά χωρίς να επηρεαστεί η διαθεσιμότητα. Αξίζει όμως να σημειωθεί ότι δεν είδαμε πλήρη εξισορρόπηση φορτίου μεταξύ των υπόλοιπων 3 ελεγκτών σε περίπτωση μίας βλάβης στο επίδειξης. Το φορτίο του αποτυχημένου ελεγκτή ανέλαβε εξ ολοκλήρου ένας από τους υπόλοιπους. Είναι πιθανό για αυτό να είναι απαραίτητο να αφήσετε το σύστημα να λειτουργήσει περισσότερο σε αυτήν τη διαμόρφωση. Σε κάθε περίπτωση, θα το ελέγξω λεπτομερέστερα χρησιμοποιώντας τα δικά μου τεστ.
Η Huawei τοποθετεί τα νέα συστήματα ως συστήματα End-to-End NVMe, αλλά σήμερα το NVMeOF δεν υποστηρίζεται ακόμη στο μπροστινό μέρος, μόνο FC, iSCSI ή NFS. Στο τέλος αυτού ή στην αρχή του επόμενου, όπως και σε άλλες δυνατότητες, μας υποσχέθηκε υποστήριξη RoCE.
Huawei Dorado V6: θερμότητα Sichuan

Τα ράφια συνδέονται επίσης με τους ελεγκτές χρησιμοποιώντας RoCE και υπάρχει ένα μειονέκτημα που σχετίζεται με αυτό - η απουσία σύνδεσης "loopback" των ραφιών, όπως συνέβη με το SAS. Κατά τη γνώμη μου, αυτό εξακολουθεί να είναι ένα αρκετά μεγάλο μειονέκτημα εάν σχεδιάζετε ένα αρκετά μεγάλο σύστημα. Το γεγονός είναι ότι όλα τα ράφια είναι συνδεδεμένα σε σειρά και η αστοχία ενός από τα ράφια έχει ως αποτέλεσμα την πλήρη αδυναμία πρόσβασης όλων των άλλων που το ακολουθούν. Σε αυτήν την περίπτωση, για να διασφαλίσουμε την ανοχή σφαλμάτων, θα πρέπει να συνδέσουμε όλα τα ράφια στους ελεγκτές, γεγονός που συνεπάγεται αύξηση του απαιτούμενου αριθμού θυρών υποστήριξης στο σύστημα.

Και ένα ακόμη πράγμα που αξίζει να αναφερθεί είναι η μη ανατρεπτική ενημέρωση (NDU). Όπως είπα παραπάνω, η Huawei έχει εφαρμόσει μια προσέγγιση κοντέινερ για τη λειτουργία του λειτουργικού συστήματος για τη νέα σειρά Dorado, η οποία σας επιτρέπει να ενημερώσετε και να επανεκκινήσετε τις υπηρεσίες χωρίς να χρειάζεται να κάνετε πλήρη επανεκκίνηση του ελεγκτή. Αξίζει να αναφέρουμε αμέσως ότι ορισμένες ενημερώσεις θα περιέχουν ενημερώσεις πυρήνα και σε αυτήν την περίπτωση, μερικές φορές θα εξακολουθεί να απαιτείται μια κλασική επανεκκίνηση ελεγκτών κατά τη διάρκεια της ενημέρωσης, αλλά όχι πάντα. Αυτό θα μειώσει τον αντίκτυπο αυτής της λειτουργίας στο παραγωγικό σύστημα.

Στο οπλοστάσιό μας, η συντριπτική πλειοψηφία των συστοιχιών είναι από το NetApp. Επομένως, νομίζω ότι θα είναι πολύ λογικό να κάνω μια μικρή σύγκριση με συστήματα με τα οποία πρέπει να δουλέψω αρκετά. Αυτό δεν είναι μια προσπάθεια να προσδιοριστεί ποιος είναι καλύτερος και ποιος είναι χειρότερος ή ποια αρχιτεκτονική είναι πιο συμφέρουσα. Θα προσπαθήσω να συγκρίνω νηφάλια και χωρίς φανατισμό δύο διαφορετικές προσεγγίσεις για την επίλυση του ίδιου προβλήματος από διαφορετικούς προμηθευτές. Ναι, φυσικά, σε αυτή την περίπτωση θα εξετάσουμε τα συστήματα Huawei στη «θεωρία» και θα σημειώσω επίσης ξεχωριστά εκείνα τα σημεία που σχεδιάζεται να εφαρμοστούν σε μελλοντικές εκδόσεις υλικολογισμικού. Ποια πλεονεκτήματα βλέπω αυτή τη στιγμή:

  1. Αριθμός υποστηριζόμενων μονάδων NVMe. Το NetApp έχει αυτή τη στιγμή 288 από αυτά, ενώ η Huawei έχει 1600-6400, ανάλογα με το μοντέλο. Ταυτόχρονα, η ωφέλιμη χωρητικότητα Max της Huawei είναι 32PBe, όπως και τα συστήματα NetApp (για την ακρίβεια έχουν 31.64PBe). Και αυτό παρά το γεγονός ότι υποστηρίζονται δίσκοι ίδιου όγκου (έως 15 Tb). Η Huawei εξηγεί αυτό το γεγονός ως εξής: δεν είχαν την ευκαιρία να συναρμολογήσουν μεγαλύτερη βάση. Θεωρητικά, δεν έχουν περιορισμό όγκου, αλλά απλώς δεν έχουν καταφέρει να δοκιμάσουν αυτό το γεγονός ακόμα. Αλλά εδώ αξίζει να σημειωθεί ότι οι δυνατότητες των μονάδων flash σήμερα είναι πολύ υψηλές και στην περίπτωση των συστημάτων NVMe βρισκόμαστε αντιμέτωποι με το γεγονός ότι αρκούν 24 μονάδες για να χρησιμοποιήσουμε ένα κορυφαίο σύστημα 2 ελεγκτών. Αντίστοιχα, μια περαιτέρω αύξηση του αριθμού των δίσκων στο σύστημα όχι μόνο δεν θα προσφέρει αύξηση της απόδοσης, αλλά θα έχει και άσχημη επίδραση στην αναλογία IOPS/Tb. Φυσικά, αξίζει να δούμε πόσες μονάδες δίσκου μπορούν να χειριστούν τα συστήματα 4 ελεγκτών 8000 και 16000, γιατί... Οι δυνατότητες και οι δυνατότητες του Kunpeng 920 δεν είναι ακόμα εντελώς ξεκάθαρες.
  2. Η παρουσία του Lun ως ιδιοκτήτη των συστημάτων NetApp. Εκείνοι. Μόνο ένας ελεγκτής μπορεί να εκτελέσει λειτουργίες με το φεγγάρι, ενώ ο δεύτερος περνάει μόνο IO μέσω του εαυτού του. Τα συστήματα Huawei, αντίθετα, δεν έχουν ιδιοκτήτες και οι λειτουργίες με μπλοκ δεδομένων (συμπίεση, αφαίρεση διπλότυπων) μπορούν να εκτελεστούν από οποιονδήποτε από τους ελεγκτές, καθώς και να εγγραφούν σε δίσκους.
  3. Καμία θύρα δεν πέφτει όταν ένας από τους ελεγκτές αποτύχει. Για κάποιους, αυτή η στιγμή μοιάζει εξαιρετικά κρίσιμη. Η ουσία είναι ότι η εναλλαγή στο εσωτερικό του συστήματος αποθήκευσης θα πρέπει να γίνεται πιο γρήγορα από ό,τι στην πλευρά του κεντρικού υπολογιστή. Και αν στην περίπτωση του ίδιου NetApp, στην πράξη διαπιστώσαμε ένα πάγωμα περίπου 5 δευτερολέπτων κατά την αφαίρεση του ελεγκτή και την εναλλαγή διαδρομών, τότε με τη μετάβαση στο Huawei πρέπει ακόμα να εξασκηθούμε.
  4. Δεν χρειάζεται να κάνετε επανεκκίνηση του ελεγκτή κατά την ενημέρωση. Αυτό άρχισε να με ανησυχεί ιδιαίτερα με την αρκετά συχνή κυκλοφορία νέων εκδόσεων και υποκαταστημάτων υλικολογισμικού για το NetApps. Ναι, ορισμένες ενημερώσεις για τη Huawei θα απαιτούν επανεκκίνηση, αλλά όχι όλες.
  5. 4 χειριστήρια Huawei στην τιμή δύο ελεγκτών NetApp. Όπως είπα παραπάνω, χάρη στην τιμολογιακή πολιτική της Huawei, μπορεί να ανταγωνιστεί τη Mid-range με τα high-end μοντέλα της.
  6. Η παρουσία πρόσθετων τσιπ σε ελεγκτές ραφιών και κάρτες θυρών, τα οποία δυνητικά προορίζονται να βελτιώσουν την απόδοση του συστήματος.

Μειονεκτήματα και ανησυχίες γενικά:

  1. Απευθείας σύνδεση ραφιών με ελεγκτές ή ανάγκη για μεγάλο αριθμό θυρών back-end για τη σύνδεση όλων των ραφιών στους ελεγκτές.
  2. Αρχιτεκτονική ARM και παρουσία μεγάλου αριθμού τσιπ - πόσο αποτελεσματικά θα λειτουργήσει και θα είναι αρκετή η απόδοση;

Οι περισσότερες ανησυχίες και φόβοι μπορούν να διαλυθούν με προσωπική δοκιμή της νέας σειράς. Ελπίζω ότι σύντομα μετά την κυκλοφορία θα εμφανιστούν στη Μόσχα και θα είναι αρκετοί για να πάρετε γρήγορα ένα για τις δικές σας δοκιμές. Μέχρι στιγμής, μπορούμε να πούμε ότι γενικά η προσέγγιση της εταιρείας φαίνεται ενδιαφέρουσα και η νέα σειρά φαίνεται πολύ καλή σε σύγκριση με τους ανταγωνιστές της. Η τελική υλοποίηση εγείρει πολλά ερωτήματα, γιατί Θα δούμε πολλά πράγματα μόνο στο τέλος της χρονιάς, και ίσως μόνο το 2020.

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο