Kiel elekti stokadon sen pafi vin en la piedon

Enkonduko

Estas tempo aĉeti stokadon. Kiun preni, kiun aŭskulti? Vendisto A parolas pri vendisto B, kaj tiam estas integristo C, kiu diras la malon kaj konsilas vendiston D. En tia situacio, eĉ sperta stokada arkitekto turniĝos, precipe kun ĉiuj novaj vendistoj kaj SDS kaj hiperkonverĝo kiuj estas modaj. hodiaŭ.

Do, kiel vi eltrovi ĉion kaj ne fini esti malsaĝulo? Ni (AntonVirtual Anton Ĵbankov kaj korp Evgenij Elizarov) ni provu paroli pri tio en simpla rusa lingvo.
La artikolo havas multajn similecojn kaj fakte estas etendaĵo de "Virtualigita datencentro-dezajno” rilate al elekto de stokaj sistemoj kaj reviziado de stokaj teknologioj. Ni mallonge rigardos la ĝeneralan teorion, sed ni rekomendas, ke vi ankaŭ legu ĉi tiun artikolon.

Kial

Vi ofte povas vidi situacion, kie nova persono venas al forumo aŭ faka babilejo, kiel Storage Discussions, kaj faras la demandon: "ĉi tie ili ofertas al mi du stokadopciojn - ABC SuperStorage S600 kaj XYZ HyperOcean 666v4, kion vi rekomendas ?”

Kaj komenciĝas la konfuzo pri kiu havas kiajn trajtojn de la efektivigo de teruraj kaj nekompreneblaj trajtoj, kiuj por nepreparita persono estas tute ĉinaj.

Do, la ŝlosila kaj unua demando, kiun vi devas demandi al vi longe antaŭ ol kompari specifojn en komercaj proponoj, estas KIAL? Kial ĉi tiu konserva sistemo bezonas?

Kiel elekti stokadon sen pafi vin en la piedon

La respondo estos neatendita, kaj tre Tony Robbins stilo - stoki datumojn. Dankon, kapitano! Kaj tamen, foje ni tiom profundiĝas en komparadon de detaloj, ke ni forgesas kial ni faras ĉion ĉi unue.

Do, la tasko de datuma stokado sistemo estas stoki kaj provizi aliron al DATUMO kun donita agado. Ni komencos kun datumoj.

datumoj

Datumtipo

Kiajn datumojn ni planas konservi? Tre grava demando, kiu povas forigi multajn stokadsistemojn de eĉ konsidero. Ekzemple, vi planas stoki filmetojn kaj fotojn. Vi povas tuj forstreki sistemojn desegnitajn por hazarda aliro en malgrandaj blokoj, aŭ sistemojn kun proprietaj funkcioj en kunpremado / maldupliko. Ĉi tiuj simple povas esti bonegaj sistemoj, ni ne volas diri ion malbonan. Sed en ĉi tiu kazo, iliaj fortoj aŭ malfortiĝos (video kaj fotoj ne estas kunpremitaj) aŭ simple signife pliigos la koston de la sistemo.

Male, se la celita uzo estas okupata transakcia DBMS, tiam bonegaj plurmediaj flusistemoj kapablaj liveri gigabajtojn je sekundo estos malbona elekto.

Volumo de datumoj

Kiom da datumoj ni planas stoki? Kvanto ĉiam evoluas al kvalito; ĉi tio neniam devas esti forgesita, precipe en nia tempo de eksponenta kresko de la volumo de datumoj. Petabajtaj sistemoj ne plu estas maloftaj, sed ju pli granda la petabajta kapacito, des pli specifa fariĝos la sistemo, des malpli alirebla estos la kutima funkcieco de malgrandaj kaj mezgrandaj hazardaj alirsistemoj. Ĝi estas bagatela ĉar la blokaj alirstatistikaj tabeloj sole fariĝas pli grandaj ol la disponebla kvanto de RAM sur la regiloj. Sen mencii kunpremadon/tiering. Ni diru, ke ni volas ŝanĝi la kunpreman algoritmon al pli potenca kaj kunpremi 20 petabajtojn da datumoj. Kiom da tempo daŭros: ses monatoj, unu jaro?

Aliflanke, kial ĝeni se vi bezonas stoki kaj prilabori 500 GB da datumoj? Nur 500. Hejmaj SSD-oj (kun malalta DWPD) de ĉi tiu grandeco kostas nenion. Kial konstrui Fibre Channel-fabrikon kaj aĉeti altkvalitajn eksterajn stokadsistemojn, kiuj kostas la ekvivalenton de gisfera ponto?

Kio procento de la totalo estas varmaj datumoj? Kiom malebena estas la ŝarĝo laŭ datumvolumo? Ĉi tie estas kie gradigita stokada teknologio aŭ Flash Cache povas esti tre helpema se la kvanto de varmaj datumoj estas eta kompare kun la tuta. Aŭ inverse, kun unuforma ŝarĝo tra la tuta volumo, kiu ofte troviĝas en streaming-sistemoj (videogvatado, iuj analizaj sistemoj), tiaj teknologioj ne provizos ion kaj nur pliigos la koston/kompleksecon de la sistemo.

IP

La alia flanko de la datumoj estas la informsistemo, kiu uzas la datumojn. IS havas aron da postuloj, kiuj heredas datumojn. Por pliaj informoj pri la IS, vidu "Virtualigita Datuma Centro-Dezajno."

Kondiĉoj pri rezisteco/Havebleco

Postuloj por erartoleremo / datumhavebleco estas hereditaj de la IS uzante ilin kaj estas esprimitaj per tri nombroj - RPO, OTR, havebleco.

Disponibilidad — la parto por difinita tempodaŭro dum kiu datumoj estas disponeblaj por labori kun ili. Kutime esprimita kiel nombro de 9. Ekzemple, du naŭ jare signifas ke havebleco estas 99%, aŭ alie 95 horoj da nehavebleco jare estas permesitaj. Tri naŭoj - 9,5 horojn jare.

RPO / RTO ne estas totalaj indikiloj, sed por ĉiu okazaĵo (akcidento), kontraste al havebleco.

RPO — la kvanto da datumoj perditaj dum akcidento (en horoj). Ekzemple, se sekurkopioj okazas unufoje tage, tiam RPO = 24 horoj. Tiuj. En la okazo de katastrofo kaj kompleta perdo de la konserva sistemo, datumoj povas esti perditaj ĝis 24 horoj (de la momento de la sekurkopio). Surbaze de la RPO specifita por la IS, ekzemple, rezerva regularoj estas skribitaj. Ankaŭ, surbaze de RPO, vi povas kompreni kiom da sinkrona/nesinkrona datuma reproduktado bezonas.

OTR — tempo por restarigi servon (datumaliro) post katastrofo. Surbaze de la donita RTO-valoro, ni povas kompreni ĉu metrocluster estas necesa, aŭ ĉu unudirekta reproduktado sufiĉas. Ĉu vi bezonas altnivelan klasan multregilan stoksistemon?

Kiel elekti stokadon sen pafi vin en la piedon

Efikeckondiĉoj

Kvankam ĉi tio estas tre evidenta demando, ĝi estas kie la plej multaj el la malfacilaĵoj ekestas. Depende de ĉu vi jam havas ian infrastrukturon aŭ ne, manieroj kolekti la necesajn statistikojn estos konstruitaj.

Vi jam havas stoksistemon kaj serĉas anstataŭaĵon aŭ volas aĉeti alian por ekspansio. Ĉio estas simpla ĉi tie. Vi komprenas, kiajn servojn vi jam havas kaj kiujn vi planas efektivigi en proksima estonteco. Surbaze de aktualaj servoj, vi havas la ŝancon kolekti rendimentajn statistikojn. Decidu pri la nuna nombro da IOPS kaj nuna latencia - kio estas ĉi tiuj indikiloj kaj ĉu ili sufiĉas por viaj taskoj? Ĉi tio povas esti farita ambaŭ sur la datuma stokado-sistemo mem kaj de la gastigantoj, kiuj estas konektitaj al ĝi.

Krome, vi devas rigardi ne nur la nunan ŝarĝon, sed dum certa periodo (prefere unu monato). Vidu, kiaj estas la maksimumaj pintoj dum la tago, kian ŝarĝon kreas la sekurkopio, ktp. Se via stoksistemo aŭ ĝia programaro ne provizas al vi kompletan aron de ĉi tiuj datumoj, vi povas uzi la senpagan RRD-ilo, kiu povas funkcii kun la plej multaj el la plej popularaj stokadsistemoj kaj ŝaltiloj kaj povas provizi al vi detalajn agado-statistikojn. Ankaŭ indas rigardi la ŝarĝon de la gastigantoj, kiuj funkcias kun ĉi tiu stokada sistemo, por specifaj virtualaj maŝinoj, aŭ kio ĝuste funkcias sur ĉi tiu gastiganto.

Kiel elekti stokadon sen pafi vin en la piedon

Indas noti aparte, ke se la prokrastoj en la volumo kaj la datumvendejo, kiu troviĝas sur ĉi tiu volumo, diferencas sufiĉe signife, vi devas atenti vian SAN-reton, estas alta probablo, ke estas problemoj kun ĝi kaj antaŭ ol aĉeti novan. sistemo, indas rigardi ĉi tiun aferon, ĉar estas tre alta probablo pliigi la rendimenton de la nuna sistemo.

Vi konstruas infrastrukturon de nulo, aŭ aĉetas sistemon por iu nova servo, pri kies ŝarĝoj vi ne konscias. Estas pluraj ebloj: komuniki kun kolegoj pri specialaj rimedoj por provi ekscii kaj antaŭdiri la ŝarĝon, kontakti integriston, kiu havas sperton pri efektivigo de similaj servoj kaj kiu povas kalkuli la ŝarĝon por vi. Kaj la tria opcio (kutime la plej malfacila, precipe se temas pri hejmaj skribitaj aŭ maloftaj aplikoj) estas provi ekscii la rendimentajn postulojn de la sistemprogramistoj.

Kaj, bonvolu noti, la plej ĝusta opcio el la vidpunkto de praktika aplikado estas piloto sur aktuala ekipaĵo, aŭ ekipaĵo provizita por testado de vendisto/integranto.

Specialaj postuloj

Specialaj postuloj estas ĉio, kio ne kategoriiĝas sub la postuloj por agado, misfunkciado kaj funkcieco por rekta prilaborado kaj liverado de datumoj.

Unu el la plej simplaj specialaj postuloj por datumstokado-sistemo povas esti nomita "forigebla stokado-medio." Kaj tuj evidentiĝas, ke ĉi tiu datuma stokado-sistemo devas inkluzivi bendbibliotekon aŭ simple benddiskon sur kiun la rezerva kopio estas forĵetita. Post tio speciale trejnita persono subskribas la bendon kaj fiere portas ĝin al speciala monŝranko.
Alia ekzemplo de speciala postulo estas protektita ŝokrezista dezajno.

Kie

La dua ĉefa komponanto en elektado de aparta stokada sistemo estas informoj pri KIE ĉi tiu stokada sistemo estos lokita. Komencante de geografio aŭ klimataj kondiĉoj, kaj finiĝante kun personaro.

Kliento

Por kiu ĉi tiu konserva sistemo estas planita? La demando havas la jenajn kialojn:

Registara kliento/komerco.
La komerca kliento ne havas limigojn kaj eĉ ne estas devigata fari ofertojn, krom laŭ siaj propraj internaj regularoj.

Registara kliento estas malsama afero. 44 Federacia Juro kaj aliaj ĝojoj kun ofertoj kaj teknikaj specifoj kiuj povas esti defiitaj.

La kliento estas sub sankcioj
Nu, la demando ĉi tie estas tre simpla - la elekto estas limigita nur de la ofertoj disponeblaj al difinita kliento.

Internaj regularoj / vendistoj / modeloj permesis aĉeton
La demando ankaŭ estas ekstreme simpla, sed vi devas memori ĝin.

Kie fizike

En ĉi tiu parto ni konsideras ĉiujn problemojn pri geografio, komunikaj kanaloj kaj mikroklimato en la loĝejaj ejoj.

La bastono

Kiu laboros kun ĉi tiu konserva sistemo? Ĉi tio ne estas malpli grava ol tio, kion la stokada sistemo mem povas fari.
Kiom ajn promesplena, mojosa kaj mirinda estas la stokada sistemo de la vendisto A, verŝajne estas malmulte da signifo instali ĝin se la dungitaro nur scias kiel labori kun la vendisto B, kaj ne estas planoj por pliaj aĉetoj kaj daŭra kunlaboro kun A.

Kaj kompreneble, la alia flanko de la demando estas kiom disponeblaj trejnitaj dungitoj estas en difinita geografia loko rekte en la kompanio kaj eble sur la labormerkato. Por regionoj, elekti stokadsistemojn kun simplaj interfacoj aŭ la kapablo malproksime centralizi administradon povas havi multan sencon. Alie, iam ĝi povas fariĝi terure dolora. Interreto estas plena de rakontoj pri kiel nova dungito, kiu alvenis, la hieraŭa studento, agordis tian aferon, ke la tuta oficejo estis detruita.

Kiel elekti stokadon sen pafi vin en la piedon

La medio

Kaj kompreneble, grava demando estas en kiu medio ĉi tiu stokada sistemo funkcios.

  • Kio pri elektroprovizo/malvarmigo?
  • Kia rilato
  • Kie ĝi estos instalita?
  • Ktp.

Ofte ĉi tiuj demandoj estas konsiderataj kaj ne precipe konsiderataj, sed foje ili estas tiuj, kiuj povas renversi ĉion.

Kio

Vendisto

Ekde hodiaŭ (meze de 2019), la rusa stokada merkato povas esti dividita en 5 kategoriojn:

  1. La plej alta divido estas establitaj kompanioj kun larĝa gamo de diskobretoj de la plej simpla ĝis altnivela (HPE, DellEMC, Hitachi, NetApp, IBM / Lenovo)
  2. Dua divizio - kompanioj kun limigita linio, niĉaj ludantoj, seriozaj SDS-vendistoj aŭ kreskantaj novuloj (Fujitsu, Datacore, Infinidat, Huawei, Pure, ktp.)
  3. Tria divido - niĉaj solvoj en la malalta rango, malmultekosta SDS, altnivelaj produktoj bazitaj sur ceph kaj aliaj malfermitaj projektoj (Infortrend, Starwind, ktp.)
  4. SOHO-segmento - malgrandaj kaj ultra-malgrandaj stokadsistemoj de la hejmo/malgranda oficeja nivelo (Sinologio, QNAP, ktp.)
  5. Import-anstataŭigitaj stokadsistemoj - ĉi tio inkluzivas kaj aparataron de la unua divido kun re-etikeditaj etikedoj, kaj maloftajn reprezentantojn de la dua (RAIDIX, ni donos al ili la duan anticipe), sed ĉefe ĉi tiu estas la tria divido (Aerodisk, Baum, Depo, ktp.)

La divido estas sufiĉe arbitra, kaj tute ne signifas, ke la tria aŭ SOHO-segmento estas malbona kaj ne povas esti uzata. En specifaj projektoj kun klare difinita datumaro kaj ŝarĝa profilo, ili povas funkcii tre bone, multe superante la unuan dividadon laŭ prezo/kvalita rilatumo. Gravas unue decidi pri viaj celoj, kreskperspektivoj kaj bezonata funkcieco - kaj tiam Synology fidele servos al vi, kaj viaj haroj fariĝos molaj kaj silkecaj.

Unu el la gravaj faktoroj dum elektado de vendisto estas la nuna medio. Kiom da stoksistemoj vi jam havas kaj kun kiuj stoksistemoj viaj inĝenieroj povas labori. Ĉu vi bezonas alian vendiston, alian kontaktpunkton, ĉu vi iom post iom migros la tutan ŝarĝon de vendisto A al vendisto B?

Oni ne devus produkti estaĵojn preter kio estas necesa.

iSCSI/FC/Dosiero

Ne ekzistas konsento inter inĝenieroj pri la temo de alirprotokoloj, kaj la debato similas pli teologiajn diskutojn ol inĝenierajn. Sed ĝenerale, la sekvaj punktoj povas esti notitaj:

FCoE pli morta ol viva.

FC kontraŭ iSCSI. Unu el la ĉefaj avantaĝoj de FC en 2019 super IP-stokado, dediĉita fabriko por datuma aliro, estas kompensita de dediĉita IP-reto. FC ne havas tutmondajn avantaĝojn super IP-retoj, kaj IP povas esti uzata por konstrui stokadsistemojn de iu ajn ŝarĝnivelo, ĝis sistemoj por peza DBMS por la kerna banksistemo de granda banko. Aliflanke, la morto de FC estas profetita jam de kelkaj jaroj, sed io konstante malhelpas ĝin. Hodiaŭ, ekzemple, iuj ludantoj en la stokada merkato aktive disvolvas la normon NVMEoF. Ĉu li dividos la sorton de FCoE - tempo diros.

Dosiera aliro ankaŭ ne estas io malinda je atento. NFS/CIFS funkcias bone en produktivecaj medioj kaj, se dezajnitaj ĝuste, ne havas pli da plendoj ol blokprotokoloj.

Hibrido/Ĉiuj Flash Array

Klasikaj stokaj sistemoj venas en 2 specoj:

  1. AFA (All Flash Array) - sistemoj optimumigitaj por SSD-uzo.
  2. Hibrido - permesante al vi uzi kaj HDD kaj SSD aŭ kombinaĵon de ili.

Ilia ĉefa diferenco estas la subtenataj konservaj efikecteknologioj kaj la maksimuma nivelo de rendimento (alta IOPS kaj malalta latencia). Ambaŭ sistemoj (en la plej multaj el siaj modeloj, ne kalkulante la malaltrangan segmenton) povas funkcii kiel kaj blokaj kaj dosieraparatoj. La subtenata funkcieco dependas de la nivelo de la sistemo, kaj por pli junaj modeloj ĝi estas plej ofte reduktita al minimuma nivelo. Ĉi tio indas atenti kiam vi studas la karakterizaĵojn de aparta modelo, kaj ne nur la kapablojn de la tuta linio entute. Ankaŭ, kompreneble, ĝiaj teknikaj trajtoj, kiel procesoro, kvanto de memoro, kaŝmemoro, nombro kaj specoj de havenoj ktp., ankaŭ dependas de la nivelo de la sistemo. El administra vidpunkto, AFA-oj diferencas de hibridaj (diskaj) sistemoj nur en la efektivigo de mekanismoj por labori kun SSD-diskoj, kaj eĉ se vi uzas SSD en hibrida sistemo, ĉi tio tute ne signifas, ke vi povos. atingi la nivelon de rendimento je la nivelo de AFA-sistemo. Ankaŭ, en la plej multaj kazoj, enliniaj efikaj stokadmekanismoj estas malfunkciigitaj sur hibridaj sistemoj, kaj ilia inkludo kondukas al perdo en efikeco.

Specialaj stokaj sistemoj

Krom ĝeneraluzeblaj stokadsistemoj, temigis ĉefe funkcian datumtraktadon, ekzistas specialaj stokadsistemoj kun ŝlosilaj principoj kiuj estas fundamente diferencaj de la kutimaj (malalta latencia, alta IOPS):

Amaskomunikiloj.

Ĉi tiuj sistemoj estas dizajnitaj por stoki kaj prilabori grandajn amaskomunikilajn dosierojn. Resp. la prokrasto fariĝas preskaŭ negrava, kaj la kapablo sendi kaj ricevi datumojn en larĝa bando en multaj paralelaj fluoj venas al la unua loko.

Senduplikigi stokadsistemojn por sekurkopioj.

Ĉar sekurkopioj distingiĝas per sia simileco unu al la alia, kio estas malofta en normalaj kondiĉoj (la meza rezerva kopio diferencas de la hieraŭa kopio je 1-2%), ĉi tiu klaso de sistemoj ege efike pakas la datumojn registritajn sur ili en sufiĉe malgranda. nombro da fizikaj amaskomunikiloj. Ekzemple, en iuj kazoj, datumaj kunpremaj proporcioj povas atingi 200 ĝis 1.

Objektaj stokaj sistemoj.

Ĉi tiuj stoksistemoj ne havas la kutimajn blok-alirajn volumojn kaj dosierpartojn, kaj ĉefe ili similas grandegan datumbazon. Aliro al objekto stokita en tia sistemo estas farita per unika identigilo aŭ per metadatenoj (ekzemple, ĉiuj JPEG-formataj objektoj kun kredato inter XX-XX-XXXX kaj YY-YY-YYYY).

Konforma sistemo.

Ili ne estas tiel oftaj en Rusio hodiaŭ, sed ili estas menciindaj. La celo de tiaj stoksistemoj estas garantiita datumstokado por plenumi sekurecpolitikojn aŭ reguligajn postulojn. Iuj sistemoj (ekzemple EMC Centera) efektivigis funkcion por malpermesi forigon de datumoj - tuj kiam la ŝlosilo estas turnita kaj la sistemo eniras ĉi tiun reĝimon, nek la administranto nek iu ajn alia povas fizike forigi datumojn jam registritajn.

Propraj teknologioj

Ekbrila kaŝmemoro

Flash Cache estas komunnomo por ĉiuj proprietaj teknologioj por uzi fulmmemoron kiel dunivelan kaŝmemoron. Dum uzado de fulmdeponejo, la stokadsistemo estas kutime kalkulita por disponigi stabilan ŝarĝon de magnetaj diskoj, dum la pinto estas servita per la kaŝmemoro.

En ĉi tiu kazo, necesas kompreni la ŝarĝan profilon kaj la gradon de lokalizo de aliro al blokoj de stokaj volumoj. Fulma kaŝmemoro estas teknologio por laborkvantoj kun tre lokalizitaj demandoj, kaj estas preskaŭ neaplikebla por unuforme ŝarĝitaj volumoj (kiel ekzemple por analizaj sistemoj).

Ekzistas du fulmaj kaŝmemorefektivigoj haveblaj sur la merkato:

  • Nurlegebla. En ĉi tiu kazo, nur legitaj datumoj estas kaŝitaj, kaj skribo iras rekte al la diskoj. Iuj fabrikantoj, kiel NetApp, kredas, ke skribi al siaj stoksistemoj jam estas optimuma, kaj la kaŝmemoro tute ne helpos.
  • Legu/Skribu. Ne nur legado, sed ankaŭ skribo estas kaŝmemorigita, kio ebligas al vi bufrigi la fluon kaj redukti la efikon de RAID Penalty, kaj kiel rezulto pliigi ĝeneralan rendimenton por stokadsistemoj kun malpli optimuma skribmekanismo.

Tiering

Plurnivela stokado (laciga) estas teknologio por kombini nivelojn kun malsamaj rendimentniveloj, kiel ekzemple SSD kaj HDD, en ununuran diskon. En kazo de prononcita malebeneco de aliro al datumblokoj, la sistemo povos aŭtomate ekvilibrigi datumblokojn, movante ŝarĝitajn al alt-efikeca nivelo, kaj malvarmajn, male, al pli malrapida.

Hibridaj sistemoj de la malsuperaj kaj mezaj klasoj uzas plurnivelan stokadon kun datumoj moviĝantaj inter niveloj laŭ horaro. Samtempe, la grandeco de la plurnivela stokado por la plej bonaj modeloj estas 256 MB. Ĉi tiuj funkcioj ne permesas al ni konsideri gradan stokadoteknologion teknologio por pliigi produktivecon, kiel multaj homoj erare kredas. Plurnivela stokado en malaltaj kaj mezklasaj sistemoj estas teknologio por optimumigi stokadkostojn por sistemoj kun prononcita ŝarĝa malebeneco.

Ekrano

Kiom ajn ni parolas pri la fidindeco de stokaj sistemoj, ekzistas multaj ŝancoj perdi datumojn, kiuj ne dependas de aparataj problemoj. Ĉi tio povus esti virusoj, piratoj aŭ ajna alia neintencita forigo/korupto de datumoj. Tial, sekurkopii produktadajn datumojn estas integra parto de la laboro de inĝeniero.

Momentfoto estas momentfoto de volumeno en iu momento. Kiam vi laboras kun plej multaj sistemoj, kiel virtualigo, datumbazoj, ktp. ni devas preni tian momentfoton de kiu ni kopios la datumojn al rezerva kopio, dum nia IS povos sekure daŭrigi labori kun ĉi tiu volumo. Sed indas memori, ke ne ĉiuj momentfotoj estas same utilaj. Malsamaj vendistoj havas malsamajn alirojn al kreado de momentfotoj rilataj al sia arkitekturo.

Bovino (Kopio-Sur-Skribo). Kiam vi provas skribi datumblokon, ĝia originala enhavo estas kopiita al speciala areo, post kiu la skribo daŭrigas normale. Ĉi tio malhelpas datuman korupton ene de la momentfoto. Kompreneble, ĉiuj ĉi tiuj "parazitaj" datummanipuladoj kaŭzas plian ŝarĝon sur la stokado-sistemo kaj tial vendistoj kun similaj efektivigoj ne rekomendas uzi pli ol dekduon da momentfotoj, kaj tute ne uzi ilin sur tre ŝarĝitaj volumoj.

Vico (Alidirekti-sur-Skribo). En ĉi tiu kazo, la originala volumo nature frostiĝas, kaj kiam oni provas skribi datumblokon, la stokadsistemo skribas datumojn al speciala areo en libera spaco, ŝanĝante la lokon de ĉi tiu bloko en la metadatuma tabelo. Ĉi tio permesas redukti la nombron da reverkaj operacioj, kio finfine forigas la malpliiĝon de rendimento kaj forigas limigojn pri momentfotoj kaj ilia nombro.

Momentfotoj ankaŭ estas de du specoj rilate al aplikoj:

Aplika konsistenco. En la momento de kreado de momentfoto, la stokado-sistemo tiras agenton en la operaciumo de la konsumanto, kiu perforte forigas disko-kaŝmemorojn de memoro al disko kaj devigas la aplikaĵon fari tion. En ĉi tiu kazo, dum restarigo de momentfoto, la datumoj estos konsekvencaj.

Kraŝo konsekvenca. En ĉi tiu kazo, nenio tia okazas kaj la momentfoto estas kreita kiel estas. En la kazo de reakiro de tia momentfoto, la bildo estas identa al kio okazus se la potenco estus subite malŝaltita kaj iu perdo de datumoj eblas, blokita en kaŝmemoroj kaj neniam atingante la diskon. Tiaj momentfotoj estas pli facile efektivigeblaj kaj ne kaŭzas rendimentan degeneron en aplikoj, sed estas malpli fidindaj.

Kial estas bezonataj momentfotoj en stokaj sistemoj?

  • Senagenta sekurkopio rekte de la stokada sistemo
  • Kreu testajn mediojn bazitajn sur realaj datumoj
  • Koncerne dosierajn stokadsistemojn, ĝi povas esti uzata por krei VDI-mediojn per la uzo de stokadsistemaj momentfotoj anstataŭe de hiperviziero.
  • Certigu malaltajn RPO-ojn kreante planitajn momentfotojn ĉe frekvenco signife pli alta ol la rezerva frekvenco

Klonado

Volumo-klonado - funkcias laŭ simila principo kiel momentfotoj, sed estas uzata ne nur por legi datumojn, sed por plene labori kun ĝi. Ni povas akiri precizan kopion de nia volumo, kun ĉiuj datumoj sur ĝi, sen fari fizikan kopion, kio ŝparos spacon. Kutime, voluma klonado estas uzata aŭ en Test&Dev aŭ se vi volas kontroli la funkciojn de iuj ĝisdatigoj en via IS. Klonado permesos al vi fari tion kiel eble plej rapide kaj ekonomie laŭ diskresursoj, ĉar Nur ŝanĝitaj datumblokoj estos skribitaj.

Reproduktado/Ĵurnalo

Reproduktado estas mekanismo por krei kopion de datumoj sur alia fizika stokada sistemo. Tipe, ĉiu vendisto havas proprietan teknologion, kiu funkcias nur ene de sia propra linio. Sed ekzistas ankaŭ triaj solvoj, inkluzive de tiuj, kiuj funkcias ĉe la hiperviziero-nivelo, kiel ekzemple VMware vSphere Replication.

La funkcieco de proprietaj teknologioj kaj la facileco de ili estas kutime multe pli alta ol universalaj, sed ili rezultas neaplikeblaj kiam, ekzemple, necesas fari kopion de NetApp al HP MSA.

Reproduktado estas dividita en du subtipojn:

Sinkrona. En la kazo de sinkrona reproduktado, la skriba operacio estas sendita al la dua stokadosistemo tuj kaj la ekzekuto ne estas konfirmita ĝis la fora stokadosistemo konfirmas. Pro tio, la alirprokrasto pliiĝas, sed ni havas precizan spegulan kopion de la datumoj. Tiuj. RPO = 0 en kazo de perdo de la ĉefa stoksistemo.

nesinkrona. Skribaj operacioj estas ekzekutitaj nur sur la ĉefa stokadosistemo kaj estas konfirmitaj tuj, dum samtempe amasiĝas en bufro por bata transdono al la fora stokadosistemo. Tiu speco de reproduktado estas signifa por malpli valoraj datenoj, aŭ por kanaloj kun malalta bendolarĝo aŭ alta latenteco (tipa por distancoj pli ol 100 km). Sekve, RPO = pakaĵeta sendofrekvenco.

Ofte, kune kun reproduktado, ekzistas mekanismo arbohakado diskoperacioj. En ĉi tiu kazo, speciala areo estas asignita por registri kaj registri operaciojn de certa profundo en tempo, aŭ limigitaj de la volumeno de la ŝtipo, estas stokitaj. Por certaj proprietaj teknologioj, kiel EMC RecoverPoint, ekzistas integriĝo kun sistemprogramaro, kiu permesas vin ligi certajn legosignojn al specifa protokolo-eniro. Danke al ĉi tio, eblas retrorigi la staton de volumo (aŭ krei klonon) ne nur ĝis la 23-a de aprilo, 11 horoj 59 sekundoj 13 milisekundoj, sed ĝis la momento antaŭ "FALIĈI ĈIUJN TABLOJ; DEGANI.”

Metroa areto

Metro-grupo estas teknologio, kiu ebligas al vi krei dudirektan sinkronan reproduktadon inter du stokadsistemoj tiel, ke de ekstere ĉi tiu paro aspektas kiel unu stokadsistemo. Ĝi estas uzata por krei aretojn kun geografie apartigitaj brakoj ĉe metrodistancoj (malpli ol 100 km).

Surbaze de la ekzemplo de uzo en virtualiga medio, la metrocluster permesas krei datumvendejon kun virtualaj maŝinoj, alirebla por registri de du datumcentroj samtempe. En ĉi tiu kazo, areto estas kreita ĉe la hipervizora nivelo, konsistanta el gastigantoj en malsamaj fizikaj datumcentroj, konektitaj al ĉi tiu datuma vendejo. Kiu ebligas al vi fari la sekvantajn:

  • Plena aŭtomatigo de la reakiro post la morto de unu el la datumcentroj. Sen aldonaj financoj, ĉiuj VM-oj kurantaj en la forpasinta datumcentro estos aŭtomate rekomencitaj en la restanta. RTO = alta havebleca aretotempo (15 sekundoj por VMware) + tempo por ŝargi la operaciumon kaj komenci servojn.
  • Evitado de katastrofoj aŭ, en la rusa, evitado de katastrofoj. Se elektroprovizo laboro estas planita en datumcentro 1, tiam ni havas la ŝancon migri la tutan gravan ŝarĝon al datumcentro 2 senhalte antaŭe, antaŭ ol la laboro komenciĝas.

Virtualigo

Stokadovirtualigo estas teknike la uzo de volumoj de alia stokadsistemo kiel diskoj. Stokado-virtualigilo povas simple transdoni la volumon de iu alia al la konsumanto kiel sian propran, samtempe spegulante ĝin al alia stokadsistemo, aŭ eĉ krei RAID de eksteraj volumoj.
Klasikaj reprezentantoj en la stokada virtualiga klaso estas EMC VPLEX kaj IBM SVC. Kaj kompreneble stokadosistemoj kun virtualiga funkcio - NetApp, Hitachi, IBM / Lenovo Storwize.

Kial ĝi povus esti bezonata?

  • Redundo ĉe la stokada sistemo. Spegulo estas kreita inter la volumoj, kaj unu duono povas esti sur HP 3Par, kaj la alia sur NetApp. Kaj la virtualigilo estas de EMC.
  • Movu datumojn kun minimuma malfunkcio inter stokaj sistemoj de malsamaj fabrikantoj. Ni supozu, ke datumoj devas esti migritaj de la malnova 3Par, kiu estos forigita, al la nova Dell. En ĉi tiu kazo, konsumantoj estas malkonektitaj de 3Par, la volumoj estas translokigitaj sub VPLEX kaj denove estas prezentitaj al konsumantoj. Ĉar ne iomete ŝanĝiĝis sur la volumo, laboro daŭras. La procezo de spegulo de la volumo al la nova Dell komenciĝas en la fono, kaj post kompletigo, la spegulo estas rompita kaj 3Par estas malŝaltita.
  • Organizo de metrogrupoj.

Kunpremado/maldupliko

Kunpremado kaj maldupliko estas teknologioj, kiuj permesas vin ŝpari diskospacon en via stokada sistemo. Indas tuj mencii, ke ne ĉiuj datumoj principe estas submetitaj al kunpremado kaj/aŭ maldupliko, dum iuj specoj de datumoj estas pli bone kunpremitaj kaj malduplikataj, kaj iuj - inverse.

Estas 2 specoj de kunpremado kaj deduplikado:

En linio — kunpremado kaj maldupliko de datumblokoj okazas antaŭ skribi ĉi tiujn datumojn al disko. Tiel, la sistemo nur kalkulas la hash de la bloko kaj komparas ĝin en la tabelo kun la ekzistantaj. Unue, ĝi estas pli rapida ol nur skribi al disko, kaj due, ni ne malŝparas kroman diskospacon.

Afiŝo - kiam ĉi tiuj operacioj estas faritaj sur jam registritaj datumoj situantaj sur diskoj. Sekve, la datumoj unue estas skribitaj al disko, kaj nur tiam la hash estas kalkulita kaj nenecesaj blokoj estas forigitaj kaj diskresursoj estas liberigitaj.

Indas diri, ke plej multaj vendistoj uzas ambaŭ tipojn, kio permesas al ili optimumigi ĉi tiujn procezojn kaj tiel pliigi sian efikecon. Plej multaj stokaj vendistoj havas utilecojn, kiuj ebligas al vi analizi viajn datumajn arojn. Ĉi tiuj utilecoj funkcias laŭ la sama logiko, kiu estas efektivigita en la stokada sistemo, do la taksita nivelo de efikeco estos la sama. Ankaŭ, memoru, ke multaj vendistoj havas agadon garantiajn programojn, kiuj promesas almenaŭ same bonan rendimenton por certaj (aŭ ĉiuj) datumtipoj. Kaj vi ne devas neglekti ĉi tiun programon, ĉar kalkulante la sistemon por viaj taskoj, konsiderante la efikan koeficienton de aparta sistemo, vi povas ŝpari volumon. Ankaŭ indas konsideri, ke ĉi tiuj programoj estas desegnitaj por AFA-sistemoj, sed danke al la aĉeto de pli malgranda volumo de SSD-oj ol HDD-oj en klasikaj sistemoj, ĉi tio reduktos ilian koston, kaj se ne egalas al la kosto de diskosistemo, tiam proksimiĝu al ĝi.

La modelo

Kaj jen ni venas al la ĝusta demando.

"Ili ofertas al mi du stokajn opciojn - ABC SuperStorage S600 kaj XYZ HyperOcean 666v4, kion vi rekomendas?"

Fariĝas "Ĉi tie ili ofertas al mi du stokajn opciojn - ABC SuperStorage S600 kaj XYZ HyperOcean 666v4, kion vi rekomendas?

La cela ŝarĝo estas miksitaj VMware virtualaj maŝinoj kun produktado/testo/evoluo-bukloj. Test = produktiva. 150 TB ĉiu kun maksimuma rendimento de 80 IOPS 000kb blokas 8% hazardan aliron 50/80 legado-skribi. 20 TB por disvolviĝo, 300 IOPS sufiĉas, 50 hazardaj, 000 skribas.

Produktiveco supozeble en la metrocluster RPO = 15 minutoj RTO = 1 horo, evoluo en nesinkrona reproduktado RPO = 3 horoj, testo sur unu ejo.

Estos 50TB DBMS, protokolado estus bone por ili.

Ni havas Dell-servilojn ĉie, malnovajn stoksistemojn de Hitachi, ili apenaŭ povas elteni, ni planas pliigi la ŝarĝon je 50% laŭ volumeno kaj rendimento."

Kiel oni diras, ĝuste formulita demando enhavas 80% de la respondo.

aldona informo

Kion vi devus legi aldone laŭ la aŭtoroj

Libroj

  • Olifer kaj Olifer "Komputilaj retoj". La libro helpos sistemigi kaj eble pli bone kompreni kiel funkcias la datumtransdona medio por IP/Eterretaj stokadsistemoj
  • "EMC-Informstokado kaj Administrado." Bonega libro pri la bazoj de stokadsistemoj, la kial, kiel kaj kial.

Forumoj kaj babilejoj

Ĝeneralaj rekomendoj

Prezo listo

Nun, koncerne prezojn - ĝenerale, se estas prezoj por stokaj sistemoj, ili kutime estas Listoprezoj, de kiuj ĉiu kliento ricevas individuan rabaton. La grandeco de la rabato konsistas el granda nombro da parametroj, do simple neeble antaŭdiri, kian finan prezon via kompanio ricevos sen peti la distribuiston. Sed samtempe en regulaj komputilaj vendejoj komencis aperi lastatempe malaltaj modeloj, kiel ekzemple nix.ruxcom-shop.ru. Ĉi tie vi povas tuj aĉeti la sistemon, pri kiu vi interesiĝas je fiksa prezo, kiel ajnaj komputilaj komponantoj.

Sed mi ŝatus noti tuj, ke rekta komparo per TB/$ ne estas ĝusta. Se ni alproksimiĝas al ĝi de ĉi tiu vidpunkto, tiam la plej malmultekosta solvo estos simpla JBOD + servilo, kiu ne provizos nek la flekseblecon nek fidindecon, kiujn provizas plenrajta, duobla regila stokado. Ĉi tio tute ne signifas, ke JBOD estas abomena kaj aĉa malpura lertaĵo, vi nur bezonas denove tre klare kompreni kiel kaj por kiuj celoj vi uzos ĉi tiun solvon. Vi ofte povas aŭdi, ke estas nenio por rompi en JBOD, estas nur unu malantaŭa ebeno. Tamen, dorsplanoj ankaŭ foje malsukcesas. Ĉio rompiĝas frue aŭ malfrue.

Tuta

Necesas kompari sistemojn unu kun la alia ne nur laŭ prezo, aŭ ne nur laŭ rendimento, sed laŭ la totalo de ĉiuj indikiloj.

Aĉetu HDD nur se vi certas, ke vi bezonas HDD. Por malaltaj ŝarĝoj kaj nekunpremeblaj datumtipoj, alie, indas turni sin al programoj de garantio de efikeco de konservado de SSD, kiujn la plej multaj vendistoj nun havas (kaj ili vere funkcias, eĉ en Rusio), sed ĉio dependas de la aplikoj kaj datumoj kiuj troviĝos. sur ĉi tiu stoka sistemo.

Ne iru por malmultekosta. Kelkfoje ĉi tiuj kaŝas multajn malagrablajn momentojn, unu el kiuj Evgenij Elizarov priskribis en siaj artikoloj pri Infortrend. Kaj ke, finfine, ĉi tiu malkareco povas miskarburi vin. Ne forgesu - "la avarulo pagas dufoje."

Fonto: www.habr.com

Aldoni komenton