Ngurangi risiko downtime karo arsitektur Shared Nothing

Topik toleransi kesalahan ing sistem panyimpenan data tansah relevan, amarga ing jaman virtualisasi lan konsolidasi sumber daya sing nyebar, sistem panyimpenan minangka link sing gagal bakal mimpin ora mung kanggo kacilakan biasa, nanging kanggo downtime layanan jangka panjang. Mulane, sistem panyimpenan modern ngemot akeh komponen duplikat (malah pengontrol). Nanging apa perlindungan kuwi cukup?

Ngurangi risiko downtime karo arsitektur Shared Nothing

Pancen kabeh vendor, nalika ndhaptar karakteristik sistem panyimpenan, mesthi nyebutake toleransi kesalahan sing dhuwur saka solusi kasebut, mesthi nambah istilah "tanpa titik gagal." Ayo goleki kanthi luwih rinci babagan sistem panyimpenan sing khas. Kanggo ngindhari downtime ing pangopènan, sistem panyimpenan duplikat sumber daya, modul cooling, port input / output, drive (maksudku RAID) lan, mesthi, pengontrol. Yen sampeyan ndeleng kanthi teliti ing arsitektur iki, sampeyan bakal weruh paling ora rong titik potensial kegagalan, sing ora bisu:

  1. Kasedhiyan backplane siji
  2. Duwe salinan data siji

Backplane minangka piranti rumit kanthi teknis sing kudu ngalami tes serius sajrone produksi. Lan mulane, ana kasus sing arang banget nalika gagal rampung. Nanging, sanajan ana masalah sebagean, kayata slot drive sing ora bisa digunakake, kudu diganti karo sistem panyimpenan mateni lengkap.

Nggawe pirang-pirang salinan data uga ora dadi masalah sepisanan. Contone, fungsi Klone ing sistem panyimpenan, sing ngidini sampeyan nganyari salinan lengkap data ing sawetara interval, cukup nyebar. Nanging, yen ana masalah karo backplay sing padha, salinan kasebut ora kasedhiya kaya asline.

Solusi sing jelas kanggo ngatasi kekurangan kasebut yaiku replikasi menyang sistem panyimpenan liyane. Yen kita nutup mata kanggo dobel samesthine saka biaya hardware (kita isih nganggep yen wong milih kaputusan kuwi mikir cekap lan nampa kasunyatan iki ing advance), isih bakal ana biaya kanggo ngatur replikasi ing wangun lisensi, tambahan. piranti lunak lan hardware. Lan sing paling penting, sampeyan kudu njamin konsistensi data sing ditiru. Sing. mbangun virtualizer panyimpenan / vSAN / etc., kang uga mbutuhake dhuwit lan sumber daya wektu.

AccelStor Nalika nggawe sistem Kasedhiyan Dhuwur, kita nemtokake tujuan kanggo nyingkirake kekurangan sing kasebut ing ndhuwur. Iki minangka interpretasi teknologi Shared Nothing, sing diterjemahake kanthi bebas tegese "tanpa nggunakake piranti sing dienggo bareng."

Konsep Ora Dibagi arsitektur nggantosi nggunakake rong simpul independen (pengontrol), saben kang wis pesawat dhewe saka data. Replikasi sinkron dumadi ing antarane simpul liwat antarmuka InfiniBand 56G, kanthi transparan kanggo piranti lunak sing mlaku ing ndhuwur sistem panyimpenan. Akibaté, panggunaan virtualizer panyimpenan, agen piranti lunak, lan liya-liyane ora dibutuhake.

Secara fisik, solusi rong simpul saka AccelStor bisa ditindakake ing rong model:

  • H510 - adhedhasar server Twin ing kasus 2U, yen kinerja moderat lan kapasitas nganti 22TB dibutuhake;
  • H710 - adhedhasar server 2U individu, yen kinerja dhuwur lan kapasitas gedhe (nganti 57TB) dibutuhake.

Ngurangi risiko downtime karo arsitektur Shared Nothing

Model H510 adhedhasar Twin server

Ngurangi risiko downtime karo arsitektur Shared Nothing

Model H710 adhedhasar server individu

Panggunaan faktor wangun beda amarga perlu kanggo macem-macem nomer SSD kanggo entuk volume tartamtu lan kinerja. Kajaba iku, platform Twin luwih murah lan ngidini sampeyan nawakake solusi sing luwih terjangkau, sanajan ana "kekurangan" kondisional ing wangun backplane siji. Kabeh liya, kalebu prinsip operasi, meh padha kanggo model kasebut.

Set data kanggo saben simpul duwe rong klompok FlexiRemap, plus 2 spare panas. Saben klompok bisa nahan kegagalan siji SSD. Kabeh panjalukan mlebu kanggo ngrekam simpul sesuai karo ideologi FlexiRemap mbangun maneh pamblokiran 4KB menyang rantai urutan, sing banjur ditulis menyang SSD ing mode paling nyaman kanggo wong-wong mau (rekaman urut-urutan). Menapa malih, inang nampa konfirmasi rekaman mung sawise data fisik diselehake ing SSD, i.e. tanpa caching ing RAM. Asil kinerja banget nyengsemaken nganti 600K IOPS nulis lan 1M + IOPS maca (model H710).

Kaya sing wis kasebut sadurunge, set data disinkronake ing wektu nyata liwat antarmuka InfiniBand 56G, sing nduweni throughput dhuwur lan latency kurang. Supaya nggunakake paling efisien saluran komunikasi nalika ngirim paket cilik. Amarga Mung ana siji saluran komunikasi; link 1GbE khusus digunakake kanggo mriksa detak jantung tambahan. Mung deg-degan sing ditularake, saengga ora ana syarat kanggo karakteristik kacepetan.

Ing kasus nambah kapasitas sistem (nganti 400+TB) amarga rak expansion padha uga disambungake ing pasangan kanggo njaga "ora ana titik siji saka Gagal" konsep.

Kanggo pangayoman data tambahan (saliyane kasunyatan sing AccelStor wis loro salinan), algoritma prilaku khusus digunakake ing acara saka Gagal SSD sembarang. Yen SSD gagal, simpul bakal miwiti mbangun data menyang salah sawijining drive cadangan sing panas. Klompok FlexiRemap, sing ana ing negara sing rusak, bakal ngalih menyang mode mung diwaca. Iki ditindakake kanggo ngilangi gangguan ing antarane operasi nulis lan mbangun maneh ing disk serep, sing pungkasane nyepetake proses pemulihan lan nyuda wektu nalika sistem bisa rawan. Sawise rampung mbangun maneh, simpul bali menyang mode maca-tulis normal.

Ngurangi risiko downtime karo arsitektur Shared Nothing

Mesthi, kaya sistem liyane, nalika mbangun maneh kinerja sakabèhé suda (sawise kabeh, salah siji saka grup FlexiRemap ora bisa kanggo ngrekam). Nanging proses pemulihan dhewe kedadeyan kanthi cepet, sing mbedakake sistem AccelStor saka solusi saka vendor liyane.

Properti migunani liyane saka teknologi arsitektur Nothing Shared yaiku operasi node ing mode aktif-aktif sing bener. Ora kaya arsitektur "klasik", ing ngendi mung siji pengontrol sing duwe volume / blumbang tartamtu, lan sing kapindho mung nindakake operasi I / O, ing sistem. AccelStor saben simpul dianggo karo pesawat dhewe saka data lan ora ngirimaken panjalukan kanggo "petang". Akibaté, kinerja sistem sakabèhé luwih apik amarga pangolahan paralel panjalukan I/O dening simpul lan akses menyang drive. Ana uga sakbenere ora kaya failover, amarga ana mung ora perlu kanggo nransfer kontrol volume kanggo simpul liyane ing acara saka Gagal.

Yen kita mbandhingake teknologi arsitektur Nothing Shared karo duplikasi sistem panyimpenan sing lengkap, mula, sepisanan, bakal rada kalah karo implementasine pemulihan bencana kanthi keluwesan. Iki utamané bener kanggo ngatur baris komunikasi antarane sistem panyimpenan. Mangkono, ing model H710 bisa nyebar simpul liwat kadohan nganti 100m liwat nggunakake kabel optik aktif InfiniBand ora murah banget. Nanging sanajan dibandhingake karo implementasine replikasi sinkron saka vendor liyane liwat FibreChannel sing kasedhiya, sanajan ing jarak sing luwih dawa, solusi saka AccelStor bakal luwih murah lan luwih gampang diinstal / dioperasikake, amarga ora perlu kanggo nginstal virtualizers panyimpenan lan / utawa nggabungake karo piranti lunak (sing ora tansah bisa ing asas). Kajaba iku, aja lali manawa solusi AccelStor yaiku Kabeh susunan Flash kanthi kinerja sing luwih dhuwur tinimbang sistem panyimpenan "klasik" mung nganggo SSD.

Ngurangi risiko downtime karo arsitektur Shared Nothing

Nalika nggunakake arsitektur Nothing Shared AccelStor, bisa entuk 99.9999% kasedhiyan sistem panyimpenan kanthi biaya sing cukup. Bebarengan karo keandalan solusi sing dhuwur, kalebu nggunakake rong salinan data, lan kinerja sing apik banget amarga algoritma kepemilikan. FlexiRemap, solusi saka AccelStor minangka calon sing apik kanggo posisi kunci nalika mbangun pusat data modern.

Source: www.habr.com

Add a comment