Huawei Dorado V6: Panas Sichuan

Huawei Dorado V6: Panas Sichuan
Musim panas di Moskow tahun ini, sejujurnya, tidak terlalu bagus. Ini dimulai terlalu dini dan cepat, tidak semua orang punya waktu untuk bereaksi, dan sudah berakhir pada akhir Juni. Oleh karena itu, ketika Huawei mengajak saya pergi ke China, ke kota Chengdu, tempat pusat RnD mereka berada, setelah melihat ramalan cuaca +34 derajat di tempat teduh, saya langsung setuju. Lagipula, usiaku sudah tidak sama lagi dan aku perlu sedikit menghangatkan tulangku. Namun saya ingin mencatat bahwa tidak hanya tulang yang bisa dihangatkan, tetapi juga bagian dalamnya, karena provinsi Sichuan, tempat Chengdu sebenarnya berada, terkenal dengan kecintaannya pada makanan pedas. Tapi tetap saja, ini bukan blog tentang perjalanan, jadi mari kembali ke tujuan utama perjalanan kita - lini sistem penyimpanan baru - Huawei Dorado V6. Artikel ini akan sedikit mengingatkan Anda dari masa lalu, karena... itu ditulis sebelum pengumuman resmi, tetapi diterbitkan hanya setelah rilis. Jadi, hari ini kita akan melihat lebih dekat semua hal menarik dan lezat yang telah disiapkan Huawei untuk kita.

Huawei Dorado V6: Panas Sichuan
Akan ada 5 model di baris baru. Semua model kecuali 3000V6 tersedia dalam dua versi - SAS dan NVMe. Pilihannya menentukan antarmuka disk yang dapat Anda gunakan dalam sistem ini, port Back-End, dan jumlah drive disk yang dapat Anda instal di sistem. Untuk NVMe, digunakan SSD seukuran telapak tangan, yang lebih tipis dibandingkan SSD SAS 2.5" klasik dan dapat dipasang hingga 36 buah. Baris baru adalah All Flash dan tidak ada konfigurasi dengan disk.

Huawei Dorado V6: Panas Sichuan
SSD NVMe Palm

Menurut pendapat saya, Dorado 8000 dan 18000 terlihat seperti model yang paling menarik. Huawei memposisikan mereka sebagai sistem kelas atas, dan berkat kebijakan harga Huawei, model kelas menengah ini kontras dengan segmen pesaing. Model inilah yang akan saya fokuskan dalam ulasan saya hari ini. Saya akan segera mencatat bahwa karena fitur desainnya, sistem pengontrol ganda junior memiliki arsitektur yang sedikit berbeda, berbeda dari Dorado 8000 dan 18000, jadi tidak semua yang akan saya bicarakan hari ini berlaku untuk model junior.

Salah satu fitur utama dari sistem baru ini adalah penggunaan beberapa chip, yang dikembangkan sendiri, yang masing-masing memungkinkan Anda mendistribusikan beban logis dari prosesor pusat pengontrol dan menambahkan fungsionalitas ke berbagai komponen.
Huawei Dorado V6: Panas Sichuan

Inti dari sistem baru ini adalah prosesor Kunpeng 920, yang dikembangkan menggunakan teknologi ARM dan diproduksi oleh Huawei secara mandiri. Tergantung pada modelnya, jumlah inti, frekuensinya, dan jumlah prosesor yang terpasang di setiap pengontrol bervariasi:
Huawei Dorado V6 8000 – 2CPU, 64 inti
Huawei Dorado V6 18000 – 4CPU, 48 inti
Huawei Dorado V6: Panas Sichuan

Huawei mengembangkan prosesor ini pada arsitektur ARM, dan sejauh yang saya tahu, awalnya berencana untuk menginstalnya hanya pada model Dorado 8000 dan 18000 yang lebih lama, seperti yang telah terjadi pada beberapa model V5, tetapi sanksi membuat penyesuaian terhadap gagasan ini. Tentu saja, ARM juga berbicara tentang penolakan bekerja sama dengan Huawei selama penerapan sanksi, namun di sini situasinya berbeda dibandingkan dengan Intel. Huawei memproduksi chip ini secara mandiri dan tidak ada sanksi yang dapat menghentikan proses ini. Memutuskan hubungan dengan ARM hanya mengancam hilangnya akses terhadap perkembangan baru. Mengenai kinerja, baru dapat dinilai setelah melakukan pengujian independen. Meskipun saya melihat bagaimana 18000M IOPS dihapus dari sistem Dorado 1 tanpa masalah apa pun, sampai saya mengulanginya dengan tangan saya sendiri di rak saya, saya tidak akan mempercayainya. Tapi sebenarnya ada banyak kekuatan di pengontrol. Model lama dilengkapi dengan 4 pengontrol, masing-masing dengan 4 prosesor, sehingga menghasilkan total 768 core.
Huawei Dorado V6: Panas Sichuan

Tetapi saya akan membicarakan inti nanti, ketika kita melihat arsitektur sistem baru, tetapi untuk saat ini mari kita kembali ke chip lain yang terpasang di sistem. Chip ini sepertinya merupakan solusi yang sangat menarik Naik 310 (Setahu saya, adik dari Ascend 910 yang baru-baru ini dihadirkan ke publik). Tugasnya adalah menganalisis blok data yang masuk ke sistem untuk meningkatkan rasio Read hit. Sulit untuk mengatakan bagaimana kinerjanya di tempat kerja, karena... Saat ini ia hanya berfungsi sesuai dengan templat yang diberikan dan tidak memiliki kemampuan untuk belajar dalam mode cerdas. Kemunculan mode cerdas dijanjikan pada firmware masa depan, kemungkinan besar awal tahun depan.

Mari beralih ke arsitektur. Huawei terus mengembangkan teknologi Smart Matrix miliknya, yang menerapkan pendekatan full mesh untuk menghubungkan komponen. Namun jika di V5 hanya untuk akses dari controller ke disk, kini semua controller memiliki akses ke semua port baik di Back-End maupun Front-End.
Huawei Dorado V6: Panas Sichuan

Berkat arsitektur layanan mikro yang baru, hal ini juga memungkinkan penyeimbangan beban antara semua pengontrol, meskipun hanya ada satu lun. OS untuk rangkaian array ini dikembangkan dari awal, dan tidak hanya dioptimalkan untuk penggunaan Flash drive. Karena kenyataan bahwa semua pengontrol kami memiliki akses ke port yang sama, jika terjadi kegagalan pengontrol atau reboot, host tidak kehilangan satu jalur pun ke sistem penyimpanan, dan peralihan jalur dilakukan di tingkat sistem penyimpanan. Namun, menggunakan UltraPath pada host tidak sepenuhnya diperlukan. β€œPenghematan” lainnya saat menginstal sistem adalah jumlah tautan yang diperlukan lebih sedikit. Dan jika dengan pendekatan "klasik" untuk 4 pengontrol kita memerlukan 8 tautan dari 2 pabrik, maka dalam kasus Huawei bahkan 2 sudah cukup (saya tidak berbicara sekarang tentang kecukupan throughput satu tautan).
Huawei Dorado V6: Panas Sichuan

Seperti pada versi sebelumnya, cache global dengan mirroring digunakan. Hal ini memungkinkan Anda kehilangan hingga dua pengontrol secara bersamaan atau tiga pengontrol secara berurutan tanpa memengaruhi ketersediaan. Namun perlu dicatat bahwa kami tidak melihat penyeimbangan beban yang lengkap antara 3 pengontrol yang tersisa jika terjadi satu kegagalan di stand demo. Beban pengontrol yang gagal diambil alih seluruhnya oleh salah satu pengontrol yang tersisa. Ada kemungkinan bahwa untuk ini sistem perlu dibiarkan bekerja lebih lama dalam konfigurasi ini. Bagaimanapun, saya akan memeriksanya lebih detail menggunakan pengujian saya sendiri.
Huawei memposisikan sistem baru ini sebagai sistem NVMe End-to-End, namun saat ini NVMeOF belum didukung di front end, hanya FC, iSCSI atau NFS. Di akhir ini atau di awal berikutnya, seperti fitur lainnya, kami dijanjikan dukungan RoCE.
Huawei Dorado V6: Panas Sichuan

Rak juga terhubung ke pengontrol menggunakan RoCE, dan ada satu kelemahan yang terkait dengan ini - tidak adanya koneksi "loopback" pada rak, seperti yang terjadi pada SAS. Menurut pendapat saya, ini masih merupakan kelemahan yang cukup besar jika Anda merencanakan sistem yang cukup besar. Faktanya adalah bahwa semua rak dihubungkan secara seri, dan kegagalan salah satu rak mengakibatkan tidak dapat diaksesnya rak lain yang mengikutinya. Dalam hal ini, untuk memastikan toleransi kesalahan, kita harus menghubungkan semua rak ke pengontrol, yang memerlukan peningkatan jumlah port backend yang diperlukan dalam sistem.

Dan satu hal lagi yang patut disebutkan adalah pembaruan non-disruptif (NDU). Seperti yang saya katakan di atas, Huawei telah menerapkan pendekatan kontainer untuk mengoperasikan OS untuk lini Dorado baru, ini memungkinkan Anda memperbarui dan memulai ulang layanan tanpa perlu me-reboot pengontrol sepenuhnya. Perlu segera disebutkan bahwa beberapa pembaruan akan berisi pembaruan kernel, dan dalam hal ini, reboot klasik pengontrol terkadang masih diperlukan selama pembaruan, tetapi tidak selalu. Hal ini akan mengurangi dampak operasi ini pada sistem produktif.

Di gudang senjata kami, sebagian besar array berasal dari NetApp. Oleh karena itu, menurut saya akan cukup logis jika saya membuat perbandingan kecil dengan sistem yang sering saya gunakan. Ini bukan upaya untuk menentukan siapa yang lebih baik dan siapa yang lebih buruk atau arsitektur siapa yang lebih menguntungkan. Saya akan mencoba dengan bijaksana dan tanpa fanatisme membandingkan dua pendekatan berbeda untuk memecahkan masalah yang sama dari vendor yang berbeda. Ya, tentu saja, dalam hal ini kami akan mempertimbangkan sistem Huawei dalam "teori" dan saya juga akan mencatat secara terpisah poin-poin yang rencananya akan diterapkan pada versi firmware mendatang. Keuntungan apa yang saya lihat saat ini:

  1. Jumlah drive NVMe yang didukung. NetApp saat ini memiliki 288 unit, sedangkan Huawei memiliki 1600-6400, tergantung modelnya. Pada saat yang sama, kapasitas Max yang dapat digunakan Huawei adalah 32PBe, sama seperti sistem NetApp (lebih tepatnya, mereka memiliki 31.64PBe). Dan ini terlepas dari kenyataan bahwa drive dengan volume yang sama didukung (hingga 15Tb). Huawei menjelaskan fakta ini sebagai berikut: mereka tidak memiliki kesempatan untuk membangun stand yang lebih besar. Secara teori, mereka tidak memiliki batasan volume, namun mereka belum bisa menguji fakta ini. Namun di sini perlu dicatat bahwa kemampuan flash drive saat ini sangat tinggi, dan dalam kasus sistem NVMe kita dihadapkan pada kenyataan bahwa 24 drive cukup untuk memanfaatkan sistem 2 pengontrol kelas atas. Oleh karena itu, peningkatan lebih lanjut dalam jumlah disk dalam sistem tidak hanya tidak akan memberikan peningkatan kinerja, tetapi juga akan berdampak buruk pada rasio IOPS/Tb. Tentu saja, ada baiknya melihat berapa banyak drive yang dapat ditangani oleh sistem 4-pengontrol 8000 dan 16000, karena... Kemampuan dan potensi Kunpeng 920 masih belum jelas sepenuhnya.
  2. Kehadiran Lun sebagai pemilik sistem NetApp. Itu. Hanya satu pengontrol yang dapat melakukan operasi dengan bulan, sedangkan pengontrol kedua hanya meneruskan IO melalui dirinya sendiri. Sebaliknya, sistem Huawei tidak memiliki pemilik apa pun dan operasi dengan blok data (kompresi, deduplikasi) dapat dilakukan oleh pengontrol mana pun, serta ditulis ke disk.
  3. Tidak ada port yang turun ketika salah satu pengontrol gagal. Bagi sebagian orang, momen ini terlihat sangat kritis. Intinya adalah peralihan di dalam sistem penyimpanan akan terjadi lebih cepat dibandingkan di sisi host. Dan jika dalam kasus NetApp yang sama, dalam praktiknya kami menemukan penghentian sekitar 5 detik saat mengeluarkan pengontrol dan berpindah jalur, maka dengan beralih ke Huawei kami masih harus berlatih.
  4. Tidak perlu me-restart pengontrol saat memperbarui. Hal ini terutama membuat saya khawatir dengan seringnya rilis versi baru dan cabang firmware untuk NetApps. Ya, beberapa pembaruan untuk Huawei masih memerlukan restart, tapi tidak semua.
  5. 4 pengontrol Huawei seharga dua pengontrol NetApp. Seperti yang saya katakan di atas, berkat kebijakan harga Huawei, ia dapat bersaing dengan kelas menengah dengan model kelas atas.
  6. Kehadiran chip tambahan di rak pengontrol dan kartu port, yang berpotensi dimaksudkan untuk meningkatkan efisiensi sistem.

Kontra dan kekhawatiran secara umum:

  1. Koneksi langsung rak ke pengontrol atau kebutuhan port back-end dalam jumlah besar untuk menghubungkan semua rak ke pengontrol.
  2. Arsitektur ARM dan kehadiran chip dalam jumlah besar - seberapa efisien kerjanya, dan apakah kinerjanya cukup?

Sebagian besar kekhawatiran dan ketakutan dapat dihilangkan dengan pengujian pribadi terhadap produk baru tersebut. Saya berharap segera setelah rilis mereka akan muncul di Moskow dan jumlahnya akan cukup untuk segera mendapatkannya untuk pengujian Anda sendiri. Sejauh ini, kami dapat mengatakan bahwa secara umum pendekatan perusahaan terlihat menarik, dan lini barunya terlihat sangat bagus dibandingkan pesaingnya. Implementasi akhir menimbulkan banyak pertanyaan, karena Banyak hal yang baru kita lihat di akhir tahun, dan mungkin baru di tahun 2020.

Sumber: www.habr.com

Tambah komentar