Kurangkan risiko masa henti dengan seni bina Shared Nothing

Topik toleransi kesalahan dalam sistem storan data sentiasa relevan, memandangkan pada zaman kita yang meluaskan maya dan penyatuan sumber, sistem storan adalah pautan yang kegagalannya akan membawa bukan sahaja kepada kemalangan biasa, tetapi kepada masa henti perkhidmatan jangka panjang. Oleh itu, sistem storan moden mengandungi banyak komponen pendua (malah pengawal). Tetapi adakah perlindungan sedemikian mencukupi?

Kurangkan risiko masa henti dengan seni bina Shared Nothing

Benar-benar semua vendor, apabila menyenaraikan ciri-ciri sistem storan, sentiasa menyebut toleransi kesalahan yang tinggi bagi penyelesaian mereka, sentiasa menambah istilah "tanpa satu titik kegagalan." Mari kita lihat lebih dekat pada sistem storan biasa. Untuk mengelakkan masa henti dalam penyelenggaraan, sistem storan menduplikasi bekalan kuasa, modul penyejukan, port input/output, pemacu (maksud kami RAID) dan, sudah tentu, pengawal. Jika anda melihat dengan teliti pada seni bina ini, anda akan melihat sekurang-kurangnya dua titik kegagalan yang berpotensi, yang didiamkan secara sederhana:

  1. Ketersediaan pesawat belakang tunggal
  2. Mempunyai satu salinan data

Pesawat belakang ialah peranti teknikal yang kompleks yang mesti menjalani ujian serius semasa pengeluaran. Oleh itu, terdapat kes yang sangat jarang berlaku apabila ia gagal sepenuhnya. Walau bagaimanapun, walaupun dalam kes masalah separa, seperti slot pemacu tidak berfungsi, ia perlu diganti dengan penutupan sepenuhnya sistem storan.

Mencipta berbilang salinan data juga tidak menjadi masalah pada pandangan pertama. Sebagai contoh, fungsi Klon dalam sistem storan, yang membolehkan anda mengemas kini salinan lengkap data pada beberapa selang, agak meluas. Walau bagaimanapun, sekiranya terdapat masalah dengan main belakang yang sama, salinan akan sama tidak tersedia seperti yang asal.

Penyelesaian yang jelas untuk mengatasi kelemahan ini ialah replikasi kepada sistem storan lain. Jika kita menutup mata terhadap jangkaan penggandaan kos perkakasan (kita masih menganggap bahawa orang yang memilih keputusan sedemikian berfikir dengan secukupnya dan menerima fakta ini terlebih dahulu), masih terdapat kemungkinan kos untuk menganjurkan replikasi dalam bentuk lesen, tambahan perisian dan perkakasan. Dan yang paling penting, anda perlu memastikan konsistensi data yang direplikasi. Itu. membina virtualizer storan/vSAN/etc., yang juga memerlukan wang dan sumber masa.

AccelStor Apabila mencipta sistem Ketersediaan Tinggi kami, kami menetapkan matlamat untuk menyingkirkan kelemahan yang disebutkan di atas. Beginilah cara tafsiran teknologi Shared Nothing muncul, yang diterjemahkan secara longgar bermaksud "tanpa menggunakan peranti kongsi."

Konsep Tidak Dikongsi seni bina mewakili penggunaan dua nod bebas (pengawal), yang setiap satunya mempunyai set data sendiri. Replikasi segerak berlaku antara nod melalui antara muka InfiniBand 56G, telus sepenuhnya kepada perisian yang berjalan di atas sistem storan. Akibatnya, penggunaan virtualizer storan, ejen perisian, dll. tidak diperlukan.

Secara fizikal, penyelesaian dua nod daripada AccelStor boleh dilaksanakan dalam dua model:

  • H510 β€” berdasarkan pelayan Berkembar dalam kes 2U, jika prestasi dan kapasiti sederhana sehingga 22TB diperlukan;
  • H710 β€” berdasarkan pelayan 2U individu, jika prestasi tinggi dan kapasiti besar (sehingga 57TB) diperlukan.

Kurangkan risiko masa henti dengan seni bina Shared Nothing

Model H510 berdasarkan pelayan Berkembar

Kurangkan risiko masa henti dengan seni bina Shared Nothing

Model H710 berdasarkan pelayan individu

Penggunaan faktor bentuk yang berbeza adalah disebabkan oleh keperluan untuk bilangan SSD yang berbeza untuk mencapai volum dan prestasi tertentu. Selain itu, platform Berkembar adalah lebih murah dan membolehkan anda menawarkan penyelesaian yang lebih berpatutan, walaupun dengan beberapa "kelemahan" bersyarat dalam bentuk pesawat belakang tunggal. Segala-galanya, termasuk prinsip operasi, adalah sama sepenuhnya untuk kedua-dua model.

Set data untuk setiap nod mempunyai dua kumpulan FlexiRemap, ditambah 2 alat ganti panas. Setiap kumpulan mampu menahan kegagalan satu SSD. Semua permintaan masuk untuk merekodkan nod mengikut ideologi FlexiRemap membina semula blok 4KB ke dalam rantai berjujukan, yang kemudiannya ditulis ke SSD dalam mod paling selesa untuknya (rakaman berjujukan). Selain itu, hos menerima pengesahan rakaman hanya selepas data diletakkan secara fizikal pada SSD, i.e. tanpa caching dalam RAM. Hasilnya adalah prestasi yang sangat mengagumkan sehingga 600K IOPS menulis dan 1M+ IOPS membaca (model H710).

Seperti yang dinyatakan sebelum ini, set data disegerakkan dalam masa nyata melalui antara muka InfiniBand 56G, yang mempunyai daya pemprosesan tinggi dan kependaman rendah. Untuk menggunakan saluran komunikasi yang paling cekap semasa menghantar paket kecil. Kerana hanya terdapat satu saluran komunikasi; pautan 1GbE khusus digunakan untuk pemeriksaan kadar jantung tambahan. Hanya degupan jantung yang dihantar melaluinya, jadi tiada keperluan untuk ciri kelajuan.

Dalam kes peningkatan kapasiti sistem (sehingga 400+TB) disebabkan oleh rak pengembangan mereka juga disambungkan secara berpasangan untuk mengekalkan konsep "tiada titik kegagalan tunggal".

Untuk perlindungan data tambahan (sebagai tambahan kepada fakta bahawa AccelStor sudah mempunyai dua salinan), algoritma tingkah laku khas digunakan sekiranya berlaku kegagalan mana-mana SSD. Jika SSD gagal, nod akan mula membina semula data pada salah satu pemacu ganti panas. Kumpulan FlexiRemap, yang berada dalam keadaan terdegradasi, akan bertukar kepada mod baca sahaja. Ini dilakukan untuk menghapuskan gangguan antara operasi tulis dan bina semula pada cakera sandaran, yang akhirnya mempercepatkan proses pemulihan dan mengurangkan masa apabila sistem berpotensi terdedah. Setelah selesai membina semula, nod kembali ke mod baca-tulis biasa.

Kurangkan risiko masa henti dengan seni bina Shared Nothing

Sudah tentu, seperti sistem lain, semasa membina semula prestasi keseluruhan menurun (lagipun, salah satu kumpulan FlexiRemap tidak berfungsi untuk rakaman). Tetapi proses pemulihan itu sendiri berlaku secepat mungkin, yang membezakan sistem AccelStor daripada penyelesaian daripada vendor lain.

Satu lagi sifat berguna teknologi seni bina Nothing Shared ialah pengendalian nod dalam apa yang dipanggil mod aktif-aktif sebenar. Tidak seperti seni bina "klasik", di mana hanya satu pengawal memiliki volum/kolam tertentu, dan yang kedua hanya menjalankan operasi I/O, dalam sistem AccelStor setiap nod berfungsi dengan set datanya sendiri dan tidak menghantar permintaan kepada "jirannya". Akibatnya, prestasi sistem keseluruhan dipertingkatkan disebabkan oleh pemprosesan selari permintaan I/O oleh nod dan akses kepada pemacu. Terdapat juga hampir tiada perkara seperti failover, kerana tiada keperluan untuk memindahkan kawalan volum ke nod lain sekiranya berlaku kegagalan.

Jika kita membandingkan teknologi seni bina Nothing Shared dengan pertindihan sistem storan sepenuhnya, maka, pada pandangan pertama, ia akan menjadi lebih rendah sedikit daripada pelaksanaan penuh pemulihan bencana dalam fleksibiliti. Ini adalah benar terutamanya untuk mengatur talian komunikasi antara sistem storan. Oleh itu, dalam model H710 adalah mungkin untuk menyebarkan nod pada jarak sehingga 100m melalui penggunaan kabel optik aktif InfiniBand yang tidak begitu murah. Tetapi walaupun jika dibandingkan dengan pelaksanaan biasa replikasi segerak daripada vendor lain melalui FibreChannel yang tersedia, walaupun dalam jarak yang lebih jauh, penyelesaian daripada AccelStor akan lebih murah dan lebih mudah untuk dipasang/dioperasikan, kerana tidak perlu memasang pemasang maya storan dan/atau berintegrasi dengan perisian (yang pada dasarnya tidak selalu boleh dilakukan). Selain itu, jangan lupa bahawa penyelesaian AccelStor ialah Semua tatasusunan Flash dengan prestasi lebih tinggi daripada sistem storan "klasik" dengan SSD sahaja.

Kurangkan risiko masa henti dengan seni bina Shared Nothing

Apabila menggunakan seni bina Nothing Shared AccelStor, adalah mungkin untuk mencapai ketersediaan sistem storan 99.9999% pada kos yang sangat berpatutan. Bersama dengan kebolehpercayaan penyelesaian yang tinggi, termasuk melalui penggunaan dua salinan data, dan prestasi yang mengagumkan terima kasih kepada algoritma proprietari FlexiRemap, penyelesaian daripada AccelStor adalah calon yang sangat baik untuk jawatan penting apabila membina pusat data moden.

Sumber: www.habr.com

Tambah komen