Cara milih panyimpenan tanpa njupuk dhewe ing sikil

Pambuka

Iku wektu kanggo tuku panyimpenan. Kang siji kanggo njupuk, sing kanggo ngrungokake? Vendor A ngomong bab vendor B, lan banjur ana integrator C, sing ngandhani ngelawan lan menehi saran vendor D. Ing kahanan kaya mengkono, malah sirah arsitek panyimpenan experienced bakal muter, utamané karo kabeh vendor anyar lan SDS lan hyperconvergence sing modern. dina iki.

Dadi, kepiye sampeyan ngerteni kabeh lan ora dadi bodho? kita (AntonVirtual Anton Zhbankov lan corp Evgeniy Elizarov) ayo nyoba ngomong babagan iki ing basa Rusia.
Artikel kasebut nduweni akeh persamaan lan sejatine minangka extension saka "Desain pusat data virtual"ing babagan milih sistem panyimpenan lan mriksa teknologi panyimpenan. Kita bakal nliti teori umum kanthi ringkes, nanging disaranake sampeyan uga maca artikel iki.

Napa

Sampeyan kerep bisa ndeleng kahanan nalika wong anyar teka ing forum utawa obrolan khusus, kayata Diskusi Panyimpenan, lan takon pitakonan: "Ing kene dheweke menehi rong pilihan panyimpenan - ABC SuperStorage S600 lan XYZ HyperOcean 666v4, apa sing disaranake. ?”

Lan kebingungan wiwit babagan sing duwe fitur apa saka implementasine fitur elek lan dingerteni, kang kanggo wong unprepared rampung Cina.

Dadi, kunci lan pitakonan pisanan sing kudu sampeyan takon dhewe sadurunge mbandhingake spesifikasi ing proposal komersial yaiku KENAPA? Napa sistem panyimpenan iki dibutuhake?

Cara milih panyimpenan tanpa njupuk dhewe ing sikil

Jawaban bakal ora dikarepke, lan banget Tony Robbins gaya - kanggo nyimpen data. Matur nuwun, kapten! Nanging, kadhangkala kita bisa mbandhingake rincian nganti lali kenapa kita nindakake kabeh iki ing wiwitan.

Dadi, tugas sistem panyimpenan data yaiku kanggo nyimpen lan nyedhiyakake akses menyang DATA kanthi kinerja sing diwenehake. Kita bakal miwiti karo data.

data

Jinis data

Apa jenis data sing arep disimpen? Pitakonan sing penting banget sing bisa ngilangi akeh sistem panyimpenan saka pertimbangan. Contone, sampeyan arep nyimpen video lan foto. Sampeyan bisa langsung nyabrang sistem sing dirancang kanggo akses acak ing blok cilik, utawa sistem kanthi fitur eksklusif ing kompresi / deduplikasi. Iki mung bisa dadi sistem sing apik banget, kita ora pengin ngomong sing ala. Nanging ing kasus iki, kekuwatane bakal dadi lemah (video lan foto ora dikompres) utawa mung nambah biaya sistem kasebut.

Kosok baline, yen tujuane nggunakake DBMS transaksional sing sibuk, sistem streaming multimedia sing apik banget sing bisa ngirim gigabyte per detik bakal dadi pilihan sing ora apik.

Volume data

Pira data sing arep disimpen? Kuantitas tansah berkembang dadi kualitas; iki ora kudu dilalekake, utamane ing wektu pertumbuhan eksponensial ing volume data. Sistem kelas petabyte wis ora umum maneh, nanging luwih gedhe kapasitas petabyte, sistem dadi luwih spesifik, fungsi sing biasane kurang bisa diakses saka sistem akses acak ukuran cilik lan medium. Iku ora pati penting amarga tabel statistik akses pemblokiran piyambak dadi luwih gedhe saka jumlah kasedhiya saka RAM ing pengontrol. Ora kanggo sebutno komprèsi / tiering. Contone, kita pengin ngganti algoritma kompresi menyang algoritma sing luwih kuat lan ngompres data 20 petabyte. Suwene suwene: nem sasi, setahun?

Ing sisih liya, kenapa repot yen sampeyan kudu nyimpen lan ngolah data 500 GB? Mung 500. Kluwarga SSDs (karo kurang DWPD) ukuran iki ora biaya. Napa mbangun pabrik Fiber Channel lan tuku sistem panyimpenan eksternal dhuwur sing regane padha karo jembatan wesi?

Apa persentasi saka total data panas? Sepira ora rata beban ing babagan volume data? Iki ngendi teknologi panyimpenan bertingkat utawa Flash Cache bisa mbiyantu banget yen jumlah data panas cilik dibandhingake karo total. Utawa kosok balene, kanthi beban seragam ing kabeh volume, sing asring ditemokake ing sistem streaming (pengawasan video, sawetara sistem analytics), teknologi kasebut ora bakal nyedhiyakake apa-apa lan mung bakal nambah biaya / kerumitan sistem.

IP

Sisih liya saka data yaiku sistem informasi sing nggunakake data. IS nduweni seperangkat syarat sing menehi warisan data. Kanggo informasi luwih lengkap babagan IS, deleng "Desain Pusat Data Virtual."

Resiliensi / Kasedhiyan Requirements

Keperluan kanggo toleransi kesalahan / kasedhiyan data diwarisake saka IS nggunakake lan ditulis ing telung nomer - RPO, OTR, kasedhiyan.

Kasedhiyan - bagean kanggo wektu tartamtu nalika data kasedhiya kanggo nggarap. Biasane ditulis minangka nomer 9. Contone, rong sangang saben taun tegese kasedhiyan 99%, utawa digunakake 95 jam ora kasedhiya saben taun diijini. Telung sangang - 9,5 jam saben taun.

RPO / RTO dudu indikator total, nanging kanggo saben kedadeyan (kacilakan), beda karo kasedhiyan.

RPO — jumlah data ilang sak Laka (ing jam). Contone, yen serep kedadeyan sapisan dina, banjur RPO = 24 jam. Sing. Yen ana bilai lan mundhut lengkap sistem panyimpenan, data nganti 24 jam bisa ilang (saka wayahe serep). Adhedhasar RPO sing ditemtokake kanggo IS, contone, peraturan serep ditulis. Uga, adhedhasar RPO, sampeyan bisa ngerti carane akeh replikasi data sinkron / asinkron dibutuhake.

OTR — wektu kanggo mulihake layanan (akses data) sawise bilai. Adhedhasar nilai RTO sing diwènèhaké, kita bisa ngerti apa kluster metro dibutuhake, utawa apa réplikasi unidirectional cukup. Apa sampeyan butuh sistem panyimpenan multi-kontroler kelas hi-end?

Cara milih panyimpenan tanpa njupuk dhewe ing sikil

Persyaratan Kinerja

Sanajan iki minangka pitakonan sing jelas banget, nanging ana akeh kesulitan. Gumantung apa sampeyan wis duwe sawetara prasarana utawa ora, cara kanggo ngumpulake statistik sing dibutuhake bakal dibangun.

Sampeyan wis duwe sistem panyimpenan lan looking for a panggantos utawa pengin tuku liyane kanggo expansion. Kabeh iku prasaja ing kene. Sampeyan ngerti layanan apa sing wis sampeyan duwe lan sing arep ditindakake ing mangsa ngarep. Adhedhasar layanan saiki, sampeyan duwe kesempatan kanggo ngumpulake statistik kinerja. Temtokake jumlah IOPS saiki lan latensi saiki - apa indikator kasebut lan cukup kanggo tugas sampeyan? Iki bisa ditindakake ing sistem panyimpenan data dhewe lan saka host sing disambungake.

Menapa malih, sampeyan kudu katon ora mung ing mbukak saiki, nanging liwat wektu tartamtu (luwih sasi). Deleng apa puncak maksimal sajrone awan, apa beban sing digawe serep, lsp. Yen sistem panyimpenan utawa piranti lunak ora nyedhiyani sampeyan karo pesawat lengkap data iki, sampeyan bisa nggunakake RRDtool free, kang bisa digunakake karo paling saka sistem panyimpenan paling populer lan ngalih lan bisa nyedhiyani sampeyan karo statistik kinerja rinci. Iku uga worth dipikir ing mbukak ing sarwa dumadi sing bisa karo sistem panyimpenan iki, kanggo mesin virtual tartamtu, utawa apa persis mlaku ing inang iki.

Cara milih panyimpenan tanpa njupuk dhewe ing sikil

Wigati dicathet kanthi kapisah yen telat ing volume lan datastore sing ana ing volume iki beda-beda sacara signifikan, sampeyan kudu menehi perhatian menyang jaringan SAN sampeyan, ana kemungkinan gedhe ana masalah lan sadurunge tuku sing anyar. sistem, iku worth looking menyang Jeksa Agung bisa ngetokake iki , amarga ana kemungkinan dhuwur banget kanggo nambah kinerja sistem saiki.

Sampeyan lagi mbangun infrastruktur saka ngeruk, utawa tuku sistem kanggo sawetara layanan anyar, kathah sing ora ngerti. Ana sawetara opsi: komunikasi karo rekan kerja babagan sumber daya khusus kanggo nyoba ngerteni lan prédhiksi beban kasebut, hubungi integrator sing duwe pengalaman ngetrapake layanan sing padha lan sing bisa ngetung beban kanggo sampeyan. Lan pilihan katelu (biasane sing paling angel, utamane yen ana aplikasi sing ditulis ing omah utawa langka) yaiku nyoba ngerteni syarat kinerja saka pangembang sistem.

Lan, elinga, pilihan sing paling bener saka sudut pandang aplikasi praktis yaiku pilot ing peralatan saiki, utawa peralatan sing disedhiyakake kanggo testing dening vendor / integrator.

Syarat khusus

Syarat khusus yaiku kabeh sing ora ana ing syarat kinerja, toleransi kesalahan lan fungsionalitas kanggo pangolahan langsung lan panyedhiya data.

Salah sawijining syarat khusus sing paling gampang kanggo sistem panyimpenan data bisa diarani "media panyimpenan sing bisa dialihake". Lan langsung dadi cetha yen sistem panyimpenan data iki kudu kalebu perpustakaan tape utawa mung tape drive dhateng kang salinan serep dibuwang. Sawise wong sing dilatih khusus mlebu tape kasebut lan kanthi bangga nggawa menyang brankas khusus.
Conto liyane saka syarat khusus yaiku desain shockproof sing dilindhungi.

Ngendi

Komponen utama kaloro ing milih sistem panyimpenan tartamtu yaiku informasi babagan WHERE sistem panyimpenan iki bakal dumunung. Diwiwiti saka geografi utawa kahanan iklim, lan pungkasan karo personel.

Pelanggan

Kanggo sapa sistem panyimpenan iki direncanakake? Pitakonan nduweni alasan ing ngisor iki:

Pelanggan pemerintah / komersial.
Pelanggan komersial ora duwe watesan lan ora kudu nindakake tender, kajaba miturut peraturan internal dhewe.

Pelanggan pemerintah minangka perkara sing beda. 44 Hukum Federal lan seneng liyane karo tender lan specifications technical sing bisa tantangan.

Pelanggan ana ing sanksi
Inggih, pitakonan ing kene gampang banget - pilihan mung diwatesi dening tawaran sing kasedhiya kanggo pelanggan tartamtu.

Peraturan internal / vendor / model sing diidini tuku
Pitakonan uga arang banget prasaja, nanging sampeyan kudu ngelingi.

Ing ngendi fisik

Ing bagean iki kita nimbang kabeh masalah karo geografi, saluran komunikasi, lan microclimate ing panggonan akomodasi.

Staff

Sapa sing bakal nggarap sistem panyimpenan iki? Iki ora kurang penting tinimbang apa sing bisa ditindakake dening sistem panyimpenan.
Ora ketompo carane janjeni, kelangan lan apik sistem panyimpenan saka vendor A, ana mbokmenawa sethitik titik ing nginstal yen Staff mung ngerti carane bisa karo vendor B, lan ora ana plans kanggo tumbas luwih lan kerjasama karo A.

Lan mesthi, sisih liyane saka pitakonan carane kasedhiya personel dilatih ing lokasi geografis tartamtu langsung ing perusahaan lan duweni potensi ing pasar tenaga kerja. Kanggo wilayah, milih sistem panyimpenan kanthi antarmuka sing prasaja utawa kemampuan kanggo ngatur pusat saka jarak adoh bisa nggawe akeh akal. Yen ora, ing sawetara titik bisa dadi lara banget. Internet kebak crita babagan carane karyawan anyar sing teka, mahasiswa wingi, ngatur bab sing kabeh kantor mati.

Cara milih panyimpenan tanpa njupuk dhewe ing sikil

Lingkungan

Lan mesthi, pitakonan penting ing lingkungan apa sistem panyimpenan iki bakal operate.

  • Apa bab sumber daya / cooling?
  • Apa sambungan
  • Ing endi bakal dipasang?
  • lsp.

Asring pitakonan iki dijupuk kanggo diwenehake lan ora utamané dianggep, nanging kadhangkala padha sing bisa nguripake kabeh.

Apa

Vendor

Saiki (pertengahan 2019), pasar panyimpenan Rusia bisa dipérang dadi 5 kategori:

  1. Divisi paling dhuwur yaiku perusahaan sing mapan kanthi macem-macem rak disk saka sing paling gampang nganti paling dhuwur (HPE, DellEMC, Hitachi, NetApp, IBM / Lenovo)
  2. Divisi kapindho - perusahaan kanthi garis winates, pemain ceruk, vendor SDS serius utawa pendatang anyar (Fujitsu, Datacore, Infinidat, Huawei, Pure, lsp.)
  3. Divisi katelu - solusi niche ing peringkat rendah, SDS murah, produk canggih adhedhasar ceph lan proyek mbukak liyane (Infortrend, Starwind, lsp.)
  4. Segmen SOHO - sistem panyimpenan cilik lan ultra-cilik ing tingkat omah/kantor cilik (Synology, QNAP, lsp.)
  5. Sistem panyimpenan sing diganti impor - iki kalebu loro hardware saka divisi pisanan kanthi label label maneh, lan wakil langka saka kaloro (RAIDIX, kita bakal menehi nomer loro sadurunge), nanging utamane iki minangka divisi katelu (Aerodisk, Baum, Depo, lsp.)

Divisi kasebut cukup sewenang-wenang, lan ora ateges bagean katelu utawa SOHO iku ala lan ora bisa digunakake. Ing proyek tartamtu kanthi set data sing jelas lan profil beban, bisa kerja kanthi apik, ngluwihi divisi pertama babagan rasio rega / kualitas. Penting kanggo mutusake tujuan sampeyan, prospek pertumbuhan, lan fungsi sing dibutuhake - banjur Synology bakal nglayani sampeyan kanthi setya, lan rambut sampeyan bakal dadi alus lan sutra.

Salah sawijining faktor penting nalika milih vendor yaiku lingkungan saiki. Pira sistem panyimpenan sing wis sampeyan duwe lan sistem panyimpenan apa sing bisa digunakake dening insinyur sampeyan. Apa sampeyan butuh vendor liyane, titik kontak liyane, sampeyan bakal migrasi kabeh beban saka vendor A menyang vendor B?

Siji ngirim ora ngasilake entitas ngluwihi apa sing dibutuhake.

iSCSI/FC/File

Ora ana konsensus ing antarane insinyur babagan masalah protokol akses, lan debat kasebut meh padha karo diskusi teologis tinimbang rekayasa. Nanging ing umum, titik ing ngisor iki bisa dicathet:

FCoE luwih mati tinimbang urip.

FC vs iSCSI. Salah sawijining kaluwihan utama FC ing taun 2019 babagan panyimpenan IP, pabrik khusus kanggo akses data, diimbangi dening jaringan IP khusus. FC ora duwe kaluwihan global liwat jaringan IP, lan IP bisa digunakake kanggo mbangun sistem panyimpenan saka sembarang tingkat mbukak, nganti sistem kanggo DBMS abot kanggo sistem banking inti saka bank gedhe. Ing sisih liya, pati FC wis diramalake nganti pirang-pirang taun, nanging ana sing nyegah. Saiki, contone, sawetara pemain ing pasar panyimpenan aktif ngembangake standar NVMEoF. Apa dheweke bakal nuduhake nasib FCoE - wektu bakal ngomong.

Akses berkas uga dudu bab sing ora pantes digatekake. NFS / CIFS nindakake kanthi apik ing lingkungan produktivitas lan, yen dirancang kanthi bener, ora ana keluhan luwih saka protokol pamblokiran.

Sato / Kabeh Flash Array

Sistem panyimpenan klasik kasedhiya ing 2 jinis:

  1. AFA (Kabeh Flash Array) - sistem optimized kanggo SSD nggunakake.
  2. Sato - ngidini sampeyan nggunakake HDD lan SSD utawa kombinasi.

Bentenane utamane yaiku teknologi efisiensi panyimpenan sing didhukung lan tingkat kinerja maksimal (IOPS dhuwur lan latency kurang). Loro-lorone sistem (ing umume modele, ora ngetung segmen low-end) bisa digunakake minangka piranti pamblokiran lan file. Fungsi sing didhukung gumantung ing tingkat sistem, lan kanggo model sing luwih enom asring dikurangi dadi tingkat minimal. Iki kudu digatekake nalika sampeyan sinau karakteristik model tartamtu, lan ora mung kemampuan kabeh baris kanthi sakabehe. Uga, mesthi, karakteristik teknis, kayata prosesor, jumlah memori, cache, nomer lan jinis port, lan sapiturute, uga gumantung ing tingkat sistem. Saka sudut pandang manajemen, AFA beda karo sistem hibrida (disk) mung ing implementasine mekanisme kanggo nggarap drive SSD, lan sanajan sampeyan nggunakake SSD ing sistem hibrida, iki ora ateges sampeyan bakal bisa. kanggo nggayuh tingkat kinerja ing tingkat sistem AFA. Uga, ing sawetara kasus, mekanisme panyimpenan efisien inline dipateni ing sistem hibrida, lan inklusi kasebut nyebabake mundhut kinerja.

Sistem panyimpenan khusus

Saliyane sistem panyimpenan umum, fokus utamane ing pangolahan data operasional, ana sistem panyimpenan khusus kanthi prinsip utama sing beda-beda dhasar saka biasane (latency kurang, IOPS dhuwur):

Media.

Sistem iki dirancang kanggo nyimpen lan ngolah file media gedhe. Resp. wektu tundha dadi sacoro prakteke ora penting, lan kemampuan kanggo ngirim lan nampa data ing band sudhut ing akeh aliran podo teka menyang ngarep.

Sistem panyimpenan deduplikat kanggo serep.

Wiwit salinan serep dibedakake kanthi mirip karo saben liyane, sing arang banget ing kahanan normal (salinan serep rata-rata beda karo salinan wingi kanthi 1-2%), sistem kelas iki kanthi efisien ngempalaken data sing direkam ing wektu sing cukup cilik. nomer media fisik. Contone, ing sawetara kasus, rasio kompresi data bisa tekan 200 nganti 1.

Sistem panyimpenan obyek.

Sistem panyimpenan iki ora duwe volume blok-akses biasa lan enggo bareng file, lan sing paling umum padha karo database gedhe. Akses menyang obyek sing disimpen ing sistem kasebut ditindakake kanthi pengenal unik utawa metadata (contone, kabeh obyek format JPEG kanthi tanggal nggawe antarane XX-XX-XXXX lan YY-YY-YYYY).

Sistem kepatuhan.

Padha ora dadi umum ing Rusia dina, nanging padha worth mentioning. Tujuan saka sistem panyimpenan kuwi dijamin panyimpenan data kanggo tundhuk karo kabijakan keamanan utawa syarat peraturan. Sawetara sistem (umpamane EMC Centera) wis ngetrapake fungsi kanggo nglarang pambusakan data - sanalika tombol diuripake lan sistem mlebu mode iki, administrator utawa wong liya ora bisa mbusak data sing wis direkam.

Teknologi proprietary

Cache lampu kilat

Flash Cache minangka jeneng umum kanggo kabeh teknologi eksklusif kanggo nggunakake memori lampu kilat minangka cache tingkat kapindho. Nalika nggunakake cache lampu kilat, sistem panyimpenan biasane diwilang kanggo nyedhiyakake beban sing tetep saka disk magnetik, nalika puncak dilayani dening cache.

Ing kasus iki, perlu kanggo mangerteni profil beban lan tingkat lokalisasi akses menyang blok volume panyimpenan. Cache lampu kilat minangka teknologi kanggo beban kerja kanthi pitakon sing dilokalisasi banget, lan praktis ora bisa ditrapake kanggo volume sing dimuat kanthi seragam (kayata kanggo sistem analitik).

Ana rong implementasi cache lampu kilat sing kasedhiya ing pasar:

  • Namung diwaca. Ing kasus iki, mung data maca cache, lan nulis langsung menyang disk. Sawetara manufaktur, kayata NetApp, percaya yen nulis menyang sistem panyimpenan wis optimal, lan cache ora bakal mbantu.
  • Maca / Nulis. Ora mung maca, nanging uga nulis cached, sing ngijini sampeyan kanggo buffer stream lan nyuda impact saka RAID Hukuman, lan minangka asil nambah kinerja sakabèhé kanggo sistem panyimpenan karo mekanisme nulis kurang optimal.

Tiering

Panyimpenan multi-level (tiring) minangka teknologi kanggo nggabungake level kanthi tingkat kinerja sing beda, kayata SSD lan HDD, dadi blumbang disk tunggal. Yen ora rata akses menyang blok data, sistem bakal bisa kanthi otomatis ngimbangi pamblokiran data, mindhah sing dimuat menyang tingkat kinerja dhuwur, lan sing adhem, sebaliknya, dadi luwih alon.

Sistem hibrida saka kelas ngisor lan menengah nggunakake panyimpenan multi-level kanthi data obah ing antarane level kanthi jadwal. Ing wektu sing padha, ukuran blok panyimpenan multi-level kanggo model paling apik yaiku 256 MB. Fitur kasebut ora ngidini kita nganggep teknologi panyimpenan bertingkat minangka teknologi kanggo nambah produktivitas, amarga akeh wong sing salah percaya. Panyimpenan multi-tingkat ing sistem kelas rendah lan tengah yaiku teknologi kanggo ngoptimalake biaya panyimpenan kanggo sistem kanthi beban sing ora rata.

gambar asli seko

Ora ketompo carane akeh kita ngomong babagan linuwih sistem panyimpenan, ana akeh kesempatan kanggo ilang data sing ora gumantung ing masalah hardware. Iki bisa uga virus, peretas utawa pambusakan/korupsi data liyane sing ora disengaja. Mulane, gawe serep data produksi minangka bagean integral saka proyek insinyur.

Potret minangka gambar saka volume ing sawetara wektu. Nalika nggarap umume sistem, kayata virtualisasi, database, lsp. kita kudu njupuk gambar asli saka ngendi kita bakal nyalin data menyang salinan serep, nalika IS kita bakal bisa kanthi aman terus nggarap volume iki. Nanging kudu eling yen ora kabeh jepretan sing padha migunani. Vendor sing beda duwe pendekatan sing beda kanggo nggawe gambar sing ana gandhengane karo arsitektur.

CoW (Copy-On-Write). Nalika sampeyan nyoba nulis blok data, isi asline disalin menyang area khusus, sawise nulis kasebut diterusake kanthi normal. Iki nyegah korupsi data ing snapshot. Alami, kabeh manipulasi data "parasit" iki nyebabake beban tambahan ing sistem panyimpenan lan amarga alasan iki, vendor kanthi implementasine sing padha ora nyaranake nggunakake luwih saka selusin jepretan, lan ora digunakake ing volume sing akeh banget.

RoW (Redirect-on-Write). Ing kasus iki, volume asli kanthi alami beku, lan nalika nyoba nulis blok data, sistem panyimpenan nulis data menyang area khusus ing ruang bebas, ngganti lokasi blok iki ing tabel metadata. Iki ngidini sampeyan nyuda jumlah operasi nulis ulang, sing pungkasane ngilangi penurunan kinerja lan mbusak watesan ing jepretan lan jumlahe.

Snapshot uga ana rong jinis ing hubungane karo aplikasi:

Konsistensi aplikasi. Ing wayahe nggawe gambar asli, sistem panyimpenan narik agen ing sistem operasi konsumen, kang meksa siram cache disk saka memori kanggo disk lan meksa aplikasi kanggo nindakake iki. Ing kasus iki, nalika mulihake saka snapshot, data bakal konsisten.

Kacilakan konsisten. Ing kasus iki, ora ana sing kedadeyan lan gambar kasebut digawe kaya apa wae. Ing kasus Recovery saka gambar asli seko kuwi, gambar identik karo apa sing bakal kelakon yen daya dumadakan dipateni lan sawetara mundhut data bisa, macet ing caches lan ora tekan disk. Gambar kasebut luwih gampang dileksanakake lan ora nyebabake degradasi kinerja ing aplikasi, nanging kurang dipercaya.

Napa snapshot dibutuhake ing sistem panyimpenan?

  • Serep tanpa agen langsung saka sistem panyimpenan
  • Nggawe lingkungan test adhedhasar data nyata
  • Ing kasus sistem panyimpenan file, bisa digunakake kanggo nggawe lingkungan VDI liwat nggunakake snapshot sistem panyimpenan tinimbang hypervisor.
  • Priksa manawa RPO kurang kanthi nggawe gambar sing dijadwal kanthi frekuensi sing luwih dhuwur tinimbang frekuensi serep

Kloning

Kloning volume - kerjane kanthi prinsip sing padha karo gambar, nanging digunakake ora mung kanggo maca data, nanging kanggo nggarap kanthi lengkap. Kita bisa entuk salinan volume sing tepat, kanthi kabeh data, tanpa nggawe salinan fisik, sing bakal ngirit ruang. Biasane, kloning volume digunakake ing Test&Dev utawa yen sampeyan pengin mriksa fungsi sawetara nganyari ing IS sampeyan. Kloning bakal ngidini sampeyan nindakake iki kanthi cepet lan ekonomis babagan sumber daya disk, amarga Mung pamblokiran data sing diganti bakal ditulis.

Replikasi / Jurnal

Replikasi minangka mekanisme kanggo nggawe salinan data ing sistem panyimpenan fisik liyane. Biasane, saben vendor duwe teknologi kepemilikan sing mung dianggo ing baris dhewe. Nanging ana uga solusi pihak katelu, kalebu sing bisa digunakake ing tingkat hypervisor, kayata VMware vSphere Replication.

Fungsi teknologi kepemilikan lan gampang digunakake biasane luwih unggul tinimbang sing universal, nanging ora bisa ditrapake nalika, contone, kudu nggawe replika saka NetApp menyang HP MSA.

Replikasi dipérang dadi rong subtipe:

Sinkron. Ing kasus replikasi sinkron, operasi nulis langsung dikirim menyang sistem panyimpenan kapindho lan eksekusi ora dikonfirmasi nganti sistem panyimpenan remot konfirmasi. Amarga iki, wektu tundha akses mundhak, nanging kita duwe salinan pangilon sing tepat saka data kasebut. Sing. RPO = 0 ing kasus mundhut saka sistem panyimpenan utama.

ora sinkron. Nulis operasi kaleksanan mung ing sistem panyimpenan utama lan dikonfirmasi langsung, nalika bebarengan accumulating ing buffer kanggo transmisi kumpulan kanggo sistem panyimpenan remot. Replikasi jinis iki cocog kanggo data sing kurang aji, utawa kanggo saluran kanthi bandwidth kurang utawa latensi dhuwur (khas kanggo jarak luwih saka 100 km). Dadi, RPO = frekuensi pengiriman paket.

Asring, bebarengan karo replikasi, ana mekanisme logging operasi disk. Ing kasus iki, wilayah khusus diparengake kanggo logging lan ngrekam operasi saka ambane tartamtu ing wektu, utawa diwatesi dening volume log, disimpen. Kanggo teknologi kepemilikan tartamtu, kayata EMC RecoverPoint, ana integrasi karo piranti lunak sistem sing ngidini sampeyan nyambungake tetenger tartamtu menyang entri log tartamtu. Thanks kanggo iki, iku bisa kanggo muter maneh negara volume (utawa nggawe Klone) ora mung kanggo April 23, 11 jam 59 detik 13 milliseconds, nanging kanggo wayahe sadurunge "DROP ALL TABLES; KOMIT.”

Kluster Metro

Kluster Metro minangka teknologi sing ngidini sampeyan nggawe replikasi sinkron bidirectional ing antarane rong sistem panyimpenan kanthi cara sing saka njaba pasangan iki katon kaya siji sistem panyimpenan. Iki digunakake kanggo nggawe kluster kanthi senjata sing dipisahake sacara geografis ing jarak metro (kurang saka 100 km).

Adhedhasar conto panggunaan ing lingkungan virtualisasi, metrocluster ngidini sampeyan nggawe datastore karo mesin virtual, bisa diakses kanggo ngrekam saka rong pusat data bebarengan. Ing kasus iki, kluster digawe ing tingkat hypervisor, dumadi saka host ing pusat data fisik beda, disambungake menyang datastore iki. Sing ngidini sampeyan nindakake ing ngisor iki:

  • Automasi lengkap proses pemulihan sawise mati salah sawijining pusat data. Tanpa dana tambahan, kabeh VM sing mlaku ing pusat data sing wis mati bakal diwiwiti maneh kanthi otomatis ing sing isih ana. RTO = kasedhiyan dhuwur kluster wektu entek (15 detik kanggo VMware) + wektu kanggo mbukak sistem operasi lan miwiti layanan.
  • Nyingkiri bencana utawa, ing basa Rusia, nyingkiri bencana. Yen karya sumber daya wis direncanakake ing pusat data 1, mula kita duwe kesempatan kanggo migrasi kabeh beban penting menyang pusat data 2 tanpa mandheg sadurunge, sadurunge karya diwiwiti.

Virtualisasi

Virtualisasi panyimpenan sacara teknis nggunakake volume saka sistem panyimpenan liyane minangka disk. A virtualizer panyimpenan mung bisa nransfer volume wong liya kanggo konsumen minangka dhewe, bebarengan kaca menyang sistem panyimpenan liyane, utawa malah nggawe RAID saka volume external.
Perwakilan klasik ing kelas virtualisasi panyimpenan yaiku EMC VPLEX lan IBM SVC. Lan mesthi, sistem panyimpenan kanthi fungsi virtualisasi - NetApp, Hitachi, IBM / Lenovo Storwize.

Apa bisa uga dibutuhake?

  • Redundansi ing tingkat sistem panyimpenan. Pangilon digawe ing antarane volume, lan siji setengah bisa ing HP 3Par, lan liyane ing NetApp. Lan virtualizer saka EMC.
  • Pindhah data kanthi downtime minimal antarane sistem panyimpenan saka manufaktur beda. Ayo nganggep yen data kudu dipindhah saka 3Par lawas, sing bakal dibusak, menyang Dell anyar. Ing kasus iki, konsumen dicopot saka 3Par, volume ditransfer ing VPLEX lan diwenehi maneh menyang konsumen. Amarga volume ora owah, mula kerja terus. Proses pangilon volume kanggo Dell anyar diwiwiti ing latar mburi, lan sawise rampung, pangilon rusak lan 3Par dipatèni.
  • Organisasi metrocluster.

Kompresi / deduplikasi

Kompresi lan deduplikasi minangka teknologi sing ngidini sampeyan ngirit ruang disk ing sistem panyimpenan. Iku worth mentioning langsung sing ora kabeh data tundhuk komprèsi lan / utawa deduplication ing asas, nalika sawetara jinis data sing dikompres lan deduplicated luwih apik, lan sawetara - kosok balene.

Ana 2 jinis kompresi lan deduplikasi:

inline - komprèsi lan deduplikasi pamblokiran data dumadi sadurunge nulis data iki menyang disk. Mangkono, sistem mung ngetung hash blok lan mbandhingake ing tabel karo sing wis ana. Kaping pisanan, luwih cepet tinimbang mung nulis menyang disk, lan nomer loro, kita ora mbuwang ruang disk ekstra.

Kirim - nalika operasi kasebut ditindakake ing data sing wis direkam sing ana ing disk. Patut, data pisanan ditulis menyang disk, lan mung banjur hash diwilang lan pamblokiran sing ora perlu dibusak lan sumber daya disk dibebasake.

Iku worth ngomong sing paling vendor nggunakake loro jinis, sing ngidini kanggo ngoptimalake pangolahan iki lan kanthi mangkono nambah efficiency. Umume vendor panyimpenan duwe utilitas sing ngidini sampeyan nganalisa set data. Utilitas kasebut bisa digunakake miturut logika sing padha sing diimplementasikake ing sistem panyimpenan, saengga tingkat efisiensi bakal padha. Uga, elinga manawa akeh vendor duwe program jaminan kinerja sing njanjeni paling ora kinerja sing apik kanggo jinis data tartamtu (utawa kabeh). Lan sampeyan ora kudu nglirwakake program iki, amarga kanthi ngitung sistem kanggo tugas sampeyan, kanthi nganggep koefisien efisiensi sistem tartamtu, sampeyan bisa ngirit volume. Iku uga worth considering sing program iki dirancang kanggo sistem AFA, nanging thanks kanggo tuku volume cilik SSD saka HDDs ing sistem klasik, iki bakal ngurangi biaya, lan yen ora padha karo biaya saka sistem disk, banjur. nyedhaki iku.

Modele

Lan ing kene kita teka menyang pitakonan sing bener.

"Dheweke nawakake rong pilihan panyimpenan - ABC SuperStorage S600 lan XYZ HyperOcean 666v4, apa sing disaranake?"

Dadi "Ing kene dheweke nawakake rong pilihan panyimpenan - ABC SuperStorage S600 lan XYZ HyperOcean 666v4, apa sing disaranake?

Beban target yaiku mesin virtual VMware campuran karo produksi / tes / puteran pangembangan. Tes = produktif. 150 TB saben kanthi kinerja puncak 80 IOPS blok 000kb 8% akses acak 50/80 maca-nulis. 20 TB kanggo pembangunan, 300 IOPS cukup, 50 acak, 000 nulis.

Produktivitas bisa uga ing metrocluster RPO = 15 menit RTO = 1 jam, pangembangan ing replikasi asinkron RPO = 3 jam, tes ing siji situs.

Bakal ana DBMS 50TB, logging bakal apik kanggo dheweke.

Kita duwe server Dell ing endi wae, sistem panyimpenan Hitachi lawas, meh ora bisa ngatasi, kita rencana nambah beban kanthi 50% babagan volume lan kinerja.

Kaya sing dikandhakake, pitakonan sing dirumusake kanthi bener ngemot 80% jawaban.

informasi tambahan

Apa sampeyan kudu maca tambahan miturut penulis

Buku

  • Olifer lan Olifer "Jaringan komputer". Buku kasebut bakal mbantu nggawe sistematis lan bisa uga luwih ngerti cara kerja media transmisi data kanggo sistem panyimpenan IP / Ethernet
  • "Panyimpenan lan Manajemen Informasi EMC." Buku sing apik banget babagan dhasar sistem panyimpenan, whys, hows and wherefores.

Forum lan obrolan

Rekomendasi umum

Dhaptar rega

Saiki, minangka kanggo prices - ing umum, yen ana prices kanggo sistem panyimpenan, padha biasane List prices, saka kang saben customer nampa diskon individu. Ukuran diskon kalebu akeh paramèter, saéngga ora bisa prédhiksi rega pungkasan sing bakal ditampa perusahaan sampeyan tanpa takon karo distributor. Nanging ing wektu sing padha, model sing paling murah wis wiwit katon ing toko komputer biasa, kayata, contone. nix.ru utawa xcom-shop.ru. Ing kene sampeyan bisa langsung tuku sistem sing sampeyan minati kanthi rega tetep, kaya komponen komputer.

Nanging aku langsung nyathet yen perbandingan langsung dening TB/$ ora bener. Yen kita nyedhaki saka sudut pandang iki, solusi sing paling murah bakal dadi server JBOD + sing prasaja, sing ora bakal nyedhiyakake keluwesan utawa keandalan sing diwenehake dening sistem panyimpenan dual-controller lengkap. Iki ora ateges JBOD njijiki lan trick reged njijiki, sampeyan mung kudu maneh banget cetha ngerti carane lan kanggo maksud apa sampeyan bakal nggunakake solusi iki. Sampeyan bisa kerep krungu sing ora ana apa-apa kanggo break ing JBOD, mung ana siji backplane. Nanging, backplanes uga kadhangkala gagal. Kabeh cepet utawa mengko.

Total

Iku perlu kanggo mbandhingaké sistem karo saben liyane ora mung dening rega, utawa ora mung dening kinerja, nanging saka total kabeh pratondho.

Tuku HDD mung yen sampeyan yakin yen sampeyan butuh HDD. Kanggo momotan sing kurang lan jinis data sing ora bisa dikompres, yen ora, kudu diuripake menyang program jaminan efisiensi panyimpenan SSD, sing paling akeh vendor saiki (lan pancen bisa digunakake, sanajan ing Rusia), nanging kabeh gumantung saka aplikasi lan data sing bakal ditemokake. ing sistem panyimpenan iki.

Aja nganti murah. Kadhangkala iki ndhelikake akeh wektu sing ora nyenengake, salah sijine Evgeniy Elizarov diterangake ing artikel babagan Infortrend. Lan pungkasane, murah iki bisa nyebabake sampeyan. Aja lali - "wong kikir mbayar kaping pindho."

Sumber: www.habr.com

Add a comment