Kurangi risiko waktu henti dengan arsitektur Shared Nothing

Topik toleransi kesalahan dalam sistem penyimpanan data selalu relevan, karena di era virtualisasi dan konsolidasi sumber daya yang meluas, sistem penyimpanan adalah penghubung yang kegagalannya tidak hanya akan menyebabkan kecelakaan biasa, tetapi juga downtime layanan dalam jangka panjang. Oleh karena itu, sistem penyimpanan modern mengandung banyak komponen duplikat (bahkan pengontrol). Namun apakah perlindungan seperti itu cukup?

Kurangi risiko waktu henti dengan arsitektur Shared Nothing

Benar-benar semua vendor, ketika membuat daftar karakteristik sistem penyimpanan, selalu menyebutkan toleransi kesalahan yang tinggi dari solusi mereka, selalu menambahkan istilah “tanpa satu titik kegagalan pun.” Mari kita lihat lebih dekat sistem penyimpanan pada umumnya. Untuk menghindari downtime dalam pemeliharaan, sistem penyimpanan menduplikasi pasokan listrik, modul pendingin, port input/output, drive (yang kami maksud adalah RAID) dan, tentu saja, pengontrol. Jika Anda mencermati arsitektur ini, Anda akan melihat setidaknya dua titik kegagalan potensial, yang tidak banyak diketahui:

  1. Ketersediaan satu backplane
  2. Memiliki satu salinan data

Backplane adalah perangkat yang secara teknis rumit dan harus menjalani pengujian serius selama produksi. Oleh karena itu, sangat jarang terjadi kegagalan total. Namun, meskipun terjadi masalah parsial, seperti slot drive yang tidak berfungsi, slot tersebut perlu diganti dengan sistem penyimpanan yang dimatikan sepenuhnya.

Sekilas membuat banyak salinan data juga tidak menjadi masalah. Misalnya, fungsionalitas Klon dalam sistem penyimpanan, yang memungkinkan Anda memperbarui salinan data lengkap pada interval tertentu, cukup luas. Namun, jika terjadi masalah dengan pemutaran ulang yang sama, salinannya tidak akan tersedia seperti aslinya.

Solusi yang sangat jelas untuk mengatasi kekurangan ini adalah replikasi ke sistem penyimpanan lain. Jika kita menutup mata terhadap perkiraan kenaikan biaya perangkat keras (kita masih berasumsi bahwa orang yang memilih keputusan seperti itu berpikir secara matang dan menerima fakta ini sebelumnya), masih ada kemungkinan biaya untuk mengatur replikasi dalam bentuk lisensi, tambahan perangkat lunak dan perangkat keras. Dan yang paling penting, Anda perlu memastikan konsistensi data yang direplikasi. Itu. membangun virtualizer penyimpanan/vSAN/dll., yang juga membutuhkan sumber daya uang dan waktu.

AccelStor Saat membuat sistem Ketersediaan Tinggi, kami menetapkan tujuan untuk menghilangkan kekurangan yang disebutkan di atas. Dari sinilah muncul penafsiran teknologi Shared Nothing, yang jika diterjemahkan secara longgar berarti “tanpa menggunakan perangkat bersama”.

Konsep Tidak Membagikan Apa pun arsitektur mewakili penggunaan dua node independen (pengontrol), yang masing-masing memiliki kumpulan datanya sendiri. Replikasi sinkron terjadi antar node melalui antarmuka InfiniBand 56G, sepenuhnya transparan terhadap perangkat lunak yang berjalan di atas sistem penyimpanan. Oleh karena itu, penggunaan virtualizer penyimpanan, agen perangkat lunak, dll. tidak diperlukan.

Secara fisik, solusi dua node dari AccelStor dapat diimplementasikan dalam dua model:

  • H510 — berdasarkan server Twin dalam wadah 2U, jika diperlukan kinerja sedang dan kapasitas hingga 22TB;
  • H710 — berdasarkan server 2U individual, jika diperlukan kinerja tinggi dan kapasitas besar (hingga 57TB).

Kurangi risiko waktu henti dengan arsitektur Shared Nothing

Model H510 berdasarkan server Twin

Kurangi risiko waktu henti dengan arsitektur Shared Nothing

Model H710 berdasarkan server individual

Penggunaan faktor bentuk yang berbeda disebabkan oleh kebutuhan jumlah SSD yang berbeda untuk mencapai volume dan kinerja tertentu. Selain itu, platform Twin lebih murah dan memungkinkan Anda menawarkan solusi yang lebih terjangkau, meskipun dengan beberapa “kerugian” bersyarat dalam bentuk backplane tunggal. Segala sesuatu yang lain, termasuk prinsip pengoperasian, sepenuhnya identik untuk kedua model.

Kumpulan data untuk setiap node memiliki dua grup FlexiRemap, ditambah 2 suku cadang panas. Setiap kelompok mampu menahan kegagalan satu SSD. Semua permintaan masuk untuk mencatat node sesuai dengan ideologi FlexiRemap membangun kembali blok 4KB menjadi rantai berurutan, yang kemudian ditulis ke SSD dalam mode paling nyaman bagi blok tersebut (perekaman berurutan). Selain itu, host menerima konfirmasi perekaman hanya setelah data ditempatkan secara fisik pada SSD, yaitu. tanpa caching di RAM. Hasilnya adalah performa yang sangat mengesankan hingga 600 ribu IOPS tulis dan 1 juta+ IOPS baca (model H710).

Seperti disebutkan sebelumnya, kumpulan data disinkronkan secara real time melalui antarmuka InfiniBand 56G, yang memiliki throughput tinggi dan latensi rendah. Untuk memanfaatkan saluran komunikasi seefisien mungkin saat mengirimkan paket kecil. Karena hanya ada satu saluran komunikasi; tautan 1GbE khusus digunakan untuk pemeriksaan detak jantung tambahan. Hanya detak jantung yang ditransmisikan melaluinya, jadi tidak ada persyaratan untuk karakteristik kecepatan.

Jika terjadi peningkatan kapasitas sistem (hingga 400+TB) karena rak ekspansi mereka juga terhubung berpasangan untuk mempertahankan konsep “tidak ada satu titik kegagalan”.

Untuk perlindungan data tambahan (selain fakta bahwa AccelStor sudah memiliki dua salinan), algoritma perilaku khusus digunakan jika terjadi kegagalan pada SSD apa pun. Jika SSD gagal, node akan mulai membangun kembali data ke salah satu drive cadangan panas. Grup FlexiRemap, yang berada dalam kondisi terdegradasi, akan beralih ke mode hanya baca. Hal ini dilakukan untuk menghilangkan gangguan antara operasi penulisan dan pembangunan kembali pada disk cadangan, yang pada akhirnya mempercepat proses pemulihan dan mengurangi waktu ketika sistem berpotensi rentan. Setelah pembangunan kembali selesai, node kembali ke mode baca-tulis normal.

Kurangi risiko waktu henti dengan arsitektur Shared Nothing

Tentu saja, seperti sistem lain, selama pembangunan kembali, kinerja keseluruhan menurun (lagipula, salah satu grup FlexiRemap tidak berfungsi untuk merekam). Namun proses pemulihannya sendiri terjadi secepat mungkin, yang membedakan sistem AccelStor dengan solusi dari vendor lain.

Properti lain yang berguna dari teknologi arsitektur Nothing Shared adalah pengoperasian node dalam apa yang disebut mode aktif-aktif sebenarnya. Berbeda dengan arsitektur “klasik”, di mana hanya satu pengontrol yang memiliki volume/kumpulan tertentu, dan pengontrol kedua hanya melakukan operasi I/O, dalam sistem AccelStor setiap node bekerja dengan kumpulan datanya sendiri dan tidak mengirimkan permintaan ke “tetangganya”. Hasilnya, kinerja sistem secara keseluruhan ditingkatkan karena pemrosesan paralel permintaan I/O oleh node dan akses ke drive. Sebenarnya tidak ada yang namanya failover, karena tidak ada kebutuhan untuk mentransfer kendali volume ke node lain jika terjadi kegagalan.

Jika kita membandingkan teknologi arsitektur Nothing Shared dengan duplikasi sistem penyimpanan penuh, maka, pada pandangan pertama, ini akan sedikit lebih rendah daripada implementasi penuh pemulihan bencana dalam hal fleksibilitas. Hal ini terutama berlaku untuk mengatur jalur komunikasi antar sistem penyimpanan. Jadi, pada model H710 dimungkinkan untuk menyebarkan node pada jarak hingga 100m melalui penggunaan kabel optik aktif InfiniBand yang tidak terlalu murah. Namun meskipun dibandingkan dengan penerapan replikasi sinkron biasa dari vendor lain melalui FibreChannel yang tersedia, bahkan dalam jarak yang lebih jauh, solusi dari AccelStor akan lebih murah dan mudah dipasang/dioperasikan, karena tidak perlu menginstal virtualisasi penyimpanan dan/atau berintegrasi dengan perangkat lunak (yang pada prinsipnya tidak selalu memungkinkan). Selain itu, jangan lupa bahwa solusi AccelStor adalah semua rangkaian Flash dengan kinerja lebih tinggi dibandingkan sistem penyimpanan “klasik” dengan SSD saja.

Kurangi risiko waktu henti dengan arsitektur Shared Nothing

Saat menggunakan arsitektur Nothing Shared AccelStor, ketersediaan sistem penyimpanan 99.9999% dapat dicapai dengan biaya yang sangat wajar. Seiring dengan keandalan solusi yang tinggi, termasuk melalui penggunaan dua salinan data, dan kinerja yang mengesankan berkat algoritme berpemilik FlexiRemap, solusi dari AccelStor adalah kandidat yang sangat baik untuk posisi kunci ketika membangun pusat data modern.

Sumber: www.habr.com

Tambah komentar