Afritun, hluti 1: Tilgangur, endurskoðun aðferða og tækni

Afritun, hluti 1: Tilgangur, endurskoðun aðferða og tækni
Af hverju þarftu að taka öryggisafrit? Þegar öllu er á botninn hvolft er búnaðurinn mjög, mjög áreiðanlegur og að auki eru til „ský“ sem eru betri að áreiðanleika en líkamlegir netþjónar: með réttri uppsetningu getur „ský“ þjónn auðveldlega lifað af bilun á líkamlegum netþjóni innviða, og frá sjónarhorni þjónustunotenda verður lítið, varla áberandi stökk í tímaþjónustu. Auk þess þarf oft að greiða fyrir „auka“ örgjörvatíma, diskálag og netumferð.

Tilvalið forrit keyrir hratt, lekur ekki minni, hefur engin göt og er ekki til.

-Óþekktur

Þar sem forrit eru enn skrifuð af próteinhönnuðum, og oft er ekkert prófunarferli, auk þess sem forrit eru sjaldan afhent með „bestu starfsvenjum“ (sem sjálf eru líka forrit og því ófullkomin), þurfa kerfisstjórar oftast að leysa vandamál sem hljóma stuttlega en í stuttu máli: „farðu aftur í hvernig það var“, „komdu grunninn í venjulegan gang“, „virkar hægt - rúllaðu til baka“ og líka uppáhalds „ég veit ekki hvað, en lagaðu það“.

Til viðbótar við rökvillur sem koma upp vegna kærulausrar vinnu þróunaraðila, eða blöndu af aðstæðum, sem og ófullkominni þekkingu eða misskilningi á litlum eiginleikum byggingarforrita - þar á meðal tengingar og kerfis, þar á meðal stýrikerfi, rekla og fastbúnað - það eru líka aðrar villur. Til dæmis treysta flestir forritarar á keyrslutíma og gleyma algjörlega eðlisfræðilegum lögmálum, sem enn er ómögulegt að sniðganga með því að nota forrit. Þetta felur í sér óendanlegan áreiðanleika diskaundirkerfisins og almennt hvers kyns gagnageymslu undirkerfis (þar á meðal vinnsluminni og skyndiminni örgjörva!), og enginn vinnslutími á örgjörvanum og skortur á villum við sendingu yfir netið og við vinnslu á örgjörva og netleynd, sem er jöfn 0. Þú ættir ekki að vanrækja hinn alræmda frest, því ef þú uppfyllir hann ekki í tæka tíð verða vandamál verri en blæbrigði net- og diskareksturs.

Afritun, hluti 1: Tilgangur, endurskoðun aðferða og tækni

Hvað á að gera við vandamál sem rísa af fullum krafti og hanga yfir verðmætum gögnum? Það er ekkert sem kemur í stað lifandi þróunaraðila og það er ekki staðreynd að það verði mögulegt í náinni framtíð. Hins vegar hefur aðeins örfáum verkefnum tekist að sanna að fullu að áætlunin virki eins og til er ætlast og það verður ekki endilega hægt að taka og heimfæra sönnunargögnin í önnur sambærileg verkefni. Slík sönnunargögn taka líka mikinn tíma og krefjast sérstakrar færni og þekkingar og það lágmarkar nánast möguleikann á notkun þeirra að teknu tilliti til tímamarka. Að auki vitum við ekki enn hvernig á að nota ofurhraða, ódýra og óendanlega áreiðanlega tækni til að geyma, vinna og senda upplýsingar. Slík tækni, ef hún er til, er í formi hugtaka, eða - oftast - aðeins í vísindaskáldsögubókum og kvikmyndum.

Góðir listamenn afrita, frábærir listamenn stela.

— Pablo Picasso.

Farsælustu lausnirnar og furðueinfaldir hlutir gerast venjulega þar sem hugtök, tækni, þekking og svið vísinda sem eru algjörlega ósamrýmanleg við fyrstu sýn mætast.

Til dæmis eru fuglar og flugvélar með vængi, en þrátt fyrir hagnýt líkindi - meginreglan um notkun í sumum stillingum er sú sama og tæknileg vandamál eru leyst á svipaðan hátt: hol bein, notkun sterkra og léttra efna osfrv. - niðurstöðurnar eru allt aðrar, þó mjög svipaðar. Bestu dæmin sem við sjáum í tækni okkar eru líka að miklu leyti fengin að láni frá náttúrunni: þrýstihólf skipa og kafbáta eru bein hliðstæða við annelids; byggja árásarfylki og athuga heilleika gagna - afrita DNA keðjuna; sem og pöruð líffæri, sjálfstæði í starfi mismunandi líffæra frá miðtaugakerfinu (sjálfvirkni hjartans) og viðbrögð - sjálfstætt kerfi á netinu. Auðvitað er vandamál að taka og beita tilbúnum lausnum „á hausinn“, en hver veit, kannski eru engar aðrar lausnir til.

Ef ég hefði bara vitað hvar þú myndir falla, þá hefði ég lagt út strá!

— Hvít-rússneskt þjóðarorðtak

Þetta þýðir að öryggisafrit eru mikilvæg fyrir þá sem vilja:

  • Vertu fær um að endurheimta rekstur kerfa þinna með lágmarks niður í miðbæ, eða jafnvel án þess
  • Sýndu djarflega, því ef um villu er að ræða er alltaf möguleiki á afturköllun
  • Lágmarka afleiðingar vísvitandi gagnaspillingar

Hér er smá kenning

Sérhver flokkun er handahófskennd. Náttúran flokkar ekki. Við flokkum vegna þess að það er þægilegra fyrir okkur. Og við flokkum eftir gögnum sem við tökum líka eftir geðþótta.

—Jean Bruler

Óháð líkamlegri geymsluaðferð er hægt að skipta rökréttri gagnageymslu í tvær leiðir til að fá aðgang að þessum gögnum: blokk og skrá. Þessi skipting hefur nýlega verið mjög óskýr, vegna þess að eingöngu blokk, sem og eingöngu skrá, rökrétt geymsla er ekki til. Hins vegar, til einföldunar, munum við gera ráð fyrir að þeir séu til.

Blokkgagnageymsla felur í sér að það er líkamlegt tæki þar sem gögn eru skrifuð í ákveðnum föstum hlutum, blokkum. Hægt er að nálgast blokkir á ákveðnu heimilisfangi; hver blokk hefur sitt eigið heimilisfang innan tækisins.

Afrit er venjulega gert með því að afrita gagnablokkir. Til að tryggja gagnaheilleika er upptaka nýrra blokka, sem og breytingar á þeim sem fyrir eru, stöðvuð við afritun. Ef við tökum líkingu úr venjulegum heimi, þá er næst skápur með eins númeruðum frumum.

Afritun, hluti 1: Tilgangur, endurskoðun aðferða og tækni

Geymsla skráagagna sem byggir á rökréttu tækjareglunni er nálægt blokkageymslu og er oft skipulögð ofan á. Mikilvægur munur er tilvist geymslustigveldis og mannalæsileg nöfn. Útdrætti er úthlutað í formi skráar - nafngreint gagnasvæði, sem og möppu - sérstakrar skráar þar sem lýsingar og aðgangur að öðrum skrám eru geymdar. Hægt er að útvega skrám viðbótar lýsigögn: sköpunartíma, aðgangsfánar osfrv. Afrit er venjulega gert á þennan hátt: þeir leita að breyttum skrám, afrita þær síðan í aðra skráageymslu með sömu uppbyggingu. Gagnaheilleiki er venjulega útfærður með því að ekki er verið að skrifa á skrár. Lýsigögn skráar eru afrituð á sama hátt. Nærtækasta samlíkingin er bókasafn, sem hefur kafla með mismunandi bókum, og hefur einnig bækling með mönnum læsilegum nöfnum bókanna.

Afritun, hluti 1: Tilgangur, endurskoðun aðferða og tækni

Nýlega er stundum lýst öðrum valkosti, sem í grundvallaratriðum byrjaði að geyma skráargögn, og sem hefur sömu fornaldareiginleika: gagnageymslu hluta.

Það er frábrugðið skráargeymslu að því leyti að það hefur ekki meira en eitt hreiður (flat kerfi) og skráarnöfnin, þó þau séu læsileg, henta samt betur til vinnslu í vélum. Þegar öryggisafrit eru framkvæmd er hlutgeymsla oftast meðhöndluð á svipaðan hátt og skráageymslur, en stundum eru aðrir valkostir.

— Það eru tvenns konar kerfisstjórar, þeir sem taka ekki afrit og þeir sem gera það nú þegar.
- Reyndar eru til þrjár gerðir: það eru líka þeir sem athuga hvort hægt sé að endurheimta afrit.

-Óþekktur

Það er líka þess virði að skilja að gagnaafritunarferlið sjálft er framkvæmt af forritum, svo það hefur alla sömu ókosti og öll önnur forrit. Til að fjarlægja (ekki útrýma!) ósjálfstæði á mannlega þættinum, sem og eiginleikum - sem hver fyrir sig hafa ekki mikil áhrif, en saman geta gefið áberandi áhrif - s.k. regla 3-2-1. Það eru margir möguleikar á því hvernig á að ráða það, en mér líkar betur við eftirfarandi túlkun: 3 sett af sömu gögnum verða að vera geymd, 2 sett verða að vera geymd á mismunandi sniðum og 1 sett verður að geyma í landfræðilega fjarlægri geymslu.

Geymslusniðið ætti að skilja sem hér segir:

  • Ef það er háð líkamlegri geymsluaðferð breytum við líkamlegri aðferð.
  • Ef það er háð rökréttu geymsluaðferðinni breytum við rökréttu aðferðinni.

Til að ná hámarksáhrifum 3-2-1 reglunnar er mælt með því að breyta geymslusniði á báða vegu.

Frá sjónarhóli þess að öryggisafrit sé tilbúið í þeim tilgangi sem til er ætlast - að endurheimta virkni - er gerður greinarmunur á „heitu“ og „kaldu“ afriti. Heitir eru frábrugðnir köldum í aðeins einu atriði: þeir eru strax tilbúnir til notkunar, á meðan þeir kaldir þurfa nokkur viðbótarskref til endurheimtar: afkóðun, útdráttur úr skjalasafni osfrv.

Ekki rugla saman heitum og köldum eintökum við afrit á netinu og utan nets, sem fela í sér líkamlega einangrun gagna og eru í raun annað merki um flokkun öryggisafritunaraðferða. Þannig að afrit án nettengingar - sem er ekki beint tengt kerfinu þar sem það þarf að endurheimta - getur verið annað hvort heitt eða kalt (hvað varðar viðbúnað til bata). Eintak á netinu getur verið fáanlegt beint þar sem það þarf að endurheimta það og oftast er það heitt en það eru líka kaldar.

Að auki, ekki gleyma því að ferlið við að búa til öryggisafrit sjálft endar venjulega ekki með því að búa til eitt öryggisafrit og það getur verið nokkuð mikill fjöldi afrita. Þess vegna er nauðsynlegt að greina á milli fullkominna öryggisafrita, þ.e. þau sem hægt er að endurheimta óháð öðrum öryggisafritum, svo og mismunandi (stigvaxandi, mismunadrifandi, lækkandi, o.s.frv.) afrit - þau sem ekki er hægt að endurheimta sjálfstætt og krefjast bráðabirgðaendurheimtar eins eða fleiri afrita.

Mismunandi stigvaxandi öryggisafrit eru tilraun til að spara varageymslupláss. Þannig eru aðeins breytt gögn frá fyrri öryggisafritinu skrifuð á afritið.

Mismunandi niðurfellingar eru búnar til í sama tilgangi, en á aðeins annan hátt: fullt öryggisafrit er gert, en aðeins munurinn á ferska eintakinu og því fyrra er í raun geymdur.

Sérstaklega er þess virði að íhuga ferlið við öryggisafrit yfir geymslu, sem styður fjarveru á geymslu afrita. Þannig, ef þú skrifar fullt afrit ofan á það, verður aðeins munurinn á afritunum í raun skrifaður, en ferlið við að endurheimta afritin verður svipað og endurheimt úr fullu afriti og algjörlega gegnsætt.

Quis custodiet ipsos custodes?

(Hver mun gæta varðmannanna sjálfra? - lat.)

Það er mjög óþægilegt þegar engin afrit eru til, en það er miklu verra ef öryggisafrit virðist hafa verið gert, en við endurheimt kemur í ljós að það er ekki hægt að endurheimta það vegna þess að:

  • Heiðarleiki upprunagagnanna hefur verið í hættu.
  • Afritunargeymslan er skemmd.
  • Endurheimt virkar mjög hægt; þú getur ekki notað gögn sem hafa verið endurheimt að hluta.

Rétt smíðað öryggisafritunarferli verður að taka mið af slíkum athugasemdum, sérstaklega fyrstu tveimur.

Hægt er að tryggja heilleika upprunagagnanna á nokkra vegu. Algengast er að nota eftirfarandi: a) búa til skyndimyndir af skráarkerfinu á blokkastigi, b) „frysta“ ástand skráarkerfisins, c) sérstakt blokkartæki með útgáfugeymslu, d) raðupptöku skráa eða blokkir. Athugunarsummur eru einnig notaðar til að tryggja að gögn séu staðfest við endurheimt.

Einnig er hægt að greina spillingu á geymslum með því að nota eftirlitstölur. Önnur aðferð er notkun sérhæfðra tækja eða skráarkerfa þar sem ekki er hægt að breyta þegar skráðum gögnum, en hægt er að bæta við nýjum.

Til að flýta fyrir bata er gagnabati notað með mörgum ferlum til bata - að því gefnu að það sé enginn flöskuháls í formi hægs netkerfis eða hægs diskakerfis. Til að komast í kringum aðstæður með endurheimt gögn að hluta geturðu skipt öryggisafritunarferlinu í tiltölulega lítil undirverkefni, sem hvert um sig er framkvæmt fyrir sig. Þannig verður það mögulegt að endurheimta árangur stöðugt á meðan þú spáir fyrir um batatímann. Þetta vandamál liggur oftast í skipulagi flugvélarinnar (SLA), svo við munum ekki dvelja við þetta í smáatriðum.

Sérfræðingur í kryddi er ekki sá sem bætir þeim í hvern rétt, heldur sá sem bætir aldrei neinu við hann.

-IN. Sinyavsky

Starfshættir varðandi hugbúnaðinn sem kerfisstjórar nota geta verið mismunandi, en almennu meginreglurnar eru samt, með einum eða öðrum hætti, þær sömu, einkum:

  • Það er eindregið mælt með því að nota tilbúnar lausnir.
  • Forrit ættu að virka fyrirsjáanlega, þ.e. Það ættu ekki að vera neinir óskráðir eiginleikar eða flöskuhálsar.
  • Uppsetning hvers forrits ætti að vera svo einföld að þú þarft ekki að lesa handbókina eða svindlablaðið í hvert skipti.
  • Ef mögulegt er ætti lausnin að vera algild, því netþjónar geta verið mjög mismunandi í eiginleikum vélbúnaðar.

Það eru eftirfarandi algeng forrit til að taka afrit af blokkartækjum:

  • dd, sem vopnahlésdagurinn í kerfisstjórnun þekkir, þetta felur einnig í sér svipuð forrit (sama dd_rescue, til dæmis).
  • Tól sem eru innbyggð í sum skráarkerfi sem búa til sorp af skráarkerfinu.
  • Alætur veitur; til dæmis partclone.
  • Eigin, oft eignarréttar ákvarðanir; til dæmis NortonGhost og síðar.

Fyrir skráarkerfi er öryggisafritunarvandamálið leyst að hluta með því að nota aðferðir sem eiga við um blokkartæki, en vandamálið er hægt að leysa á skilvirkari hátt með því að nota til dæmis:

  • Rsync, almennt forrit og samskiptareglur til að samstilla stöðu skráakerfa.
  • Innbyggt skjalavörslutæki (ZFS).
  • Þriðja aðila geymsluverkfæri; vinsælasti fulltrúinn er tar. Það eru aðrir, til dæmis dar - í staðinn fyrir tjöru sem miðar að nútímakerfum.

Það er þess virði að minnast sérstaklega á hugbúnaðarverkfæri til að tryggja samræmi í gögnum við gerð öryggisafrita. Algengustu valkostirnir eru:

  • Að setja skráarkerfið upp í skrifvarinn ham (ReadOnly), eða frysta skráarkerfið (frysta) - aðferðin er takmörkuð nothæf.
  • Búa til skyndimyndir af ástandi skráakerfa eða blokkunartækja (LVM, ZFS).
  • Notkun verkfæra frá þriðja aðila til að skipuleggja birtingar, jafnvel í þeim tilvikum þar sem ekki er hægt að gefa fyrri punkta af einhverjum ástæðum (forrit eins og heitafrit).
  • Afrita-við-breytingartæknin (CopyOnWrite) er hins vegar oftast bundin við skráarkerfið sem notað er (BTRFS, ZFS).

Svo, fyrir lítinn netþjón þarftu að útvega öryggisafritunarkerfi sem uppfyllir eftirfarandi kröfur:

  • Auðvelt í notkun - engin sérstök viðbótarskref eru nauðsynleg meðan á notkun stendur, lágmarksskref til að búa til og endurheimta afrit.
  • Universal - virkar á bæði stórum og litlum netþjónum; þetta er mikilvægt þegar fjöldi netþjóna fjölgar eða stækkar.
  • Uppsett af pakkastjóra, eða í einni eða tveimur skipunum eins og „hala niður og taka upp“.
  • Stöðugt - venjulegt eða gamalgróið geymslusnið er notað.
  • Fljótur í vinnu.

Umsækjendur frá þeim sem uppfylla meira eða minna skilyrði:

  • rdiff-afrit
  • rsnapshot
  • urp
  • afrit
  • tvíverknað
  • látum dupa
  • dar
  • zbackup
  • fastur
  • borgbackup

Afritun, hluti 1: Tilgangur, endurskoðun aðferða og tækni

Sýndarvél (byggt á XenServer) með eftirfarandi eiginleikum verður notuð sem prófunarbekkur:

  • 4 kjarna 2.5 GHz,
  • 16 GB vinnsluminni,
  • 50 GB hybrid geymsla (geymslukerfi með skyndiminni á SSD 20% af stærð sýndardisksins) í formi sérs sýndardisks án skiptingar,
  • 200 Mbps netrás.

Næstum sama vél verður notuð sem varamiðlari fyrir móttakara, aðeins með 500 GB harða diski.

Stýrikerfi - Centos 7 x64: venjuleg skipting, auka skipting verður notuð sem gagnagjafi.

Sem upphafsgögn skulum við taka WordPress síðu með 40 GB af miðlunarskrám og mysql gagnagrunni. Þar sem sýndarþjónar eru mjög mismunandi í eiginleikum, og einnig fyrir betri endurgerðanleika, er hér

prófunarniðurstöður netþjóns með því að nota sysbench.sysbench --threads=4 --time=30 --cpu-max-prime=20000 CPU keyrsla
sysbench 1.1.0-18a9f86 (notar búnt LuaJIT 2.1.0-beta3)
Að keyra prófið með eftirfarandi valkostum:
Fjöldi þræði: 4
Frumstillir slembitölugenerator frá núverandi tíma

Takmörk frumtölu: 20000

Byrjar starfsmannaþræði...

Þræðir byrjaðir!

CPU hraði:
atburðir á sekúndu: 836.69

Afköst:
viðburðir/s (eps): 836.6908
tími liðinn: 30.0039s
Heildarfjöldi viðburða: 25104

Seinkun (ms):
mín: 2.38
meðaltal: 4.78
hámark: 22.39
95. hundraðshluti: 10.46
summa: 119923.64

Þráður sanngirni:
atburðir (meðal/stddev): 6276.0000/13.91
framkvæmdartími (meðal./stddev): 29.9809/0.01

sysbench --threads=4 --time=30 --memory-block-size=1K --memory-scope=global --memory-total-size=100G --memory-oper=les memory keyrt
sysbench 1.1.0-18a9f86 (notar búnt LuaJIT 2.1.0-beta3)
Að keyra prófið með eftirfarandi valkostum:
Fjöldi þræði: 4
Frumstillir slembitölugenerator frá núverandi tíma

Keyrir minnishraðapróf með eftirfarandi valkostum:
blokk stærð: 1KiB
heildarstærð: 102400MiB
aðgerð: lesa
umfang: alþjóðlegt

Byrjar starfsmannaþræði...

Þræðir byrjaðir!

Heildaraðgerðir: 50900446 (1696677.10 á sekúndu)

49707.47 MiB flutt (1656.91 MiB/sek)

Afköst:
viðburðir/s (eps): 1696677.1017
tími liðinn: 30.0001s
Heildarfjöldi viðburða: 50900446

Seinkun (ms):
mín: 0.00
meðaltal: 0.00
hámark: 24.01
95. hundraðshluti: 0.00
summa: 39106.74

Þráður sanngirni:
atburðir (meðal/stddev): 12725111.5000/137775.15
framkvæmdartími (meðal./stddev): 9.7767/0.10

sysbench --threads=4 --time=30 --memory-block-size=1K --memory-scope=global --memory-total-size=100G --memory-oper=skrifa minniskeyrslu
sysbench 1.1.0-18a9f86 (notar búnt LuaJIT 2.1.0-beta3)
Að keyra prófið með eftirfarandi valkostum:
Fjöldi þræði: 4
Frumstillir slembitölugenerator frá núverandi tíma

Keyrir minnishraðapróf með eftirfarandi valkostum:
blokk stærð: 1KiB
heildarstærð: 102400MiB
aðgerð: skrifa
umfang: alþjóðlegt

Byrjar starfsmannaþræði...

Þræðir byrjaðir!

Heildaraðgerðir: 35910413 (1197008.62 á sekúndu)

35068.76 MiB flutt (1168.95 MiB/sek)

Afköst:
viðburðir/s (eps): 1197008.6179
tími liðinn: 30.0001s
Heildarfjöldi viðburða: 35910413

Seinkun (ms):
mín: 0.00
meðaltal: 0.00
hámark: 16.90
95. hundraðshluti: 0.00
summa: 43604.83

Þráður sanngirni:
atburðir (meðal/stddev): 8977603.2500/233905.84
framkvæmdartími (meðal./stddev): 10.9012/0.41

sysbench --threads=4 --file-test-mode=rndrw --time=60 --file-block-size=4K --file-total-size=1G fileio keyra
sysbench 1.1.0-18a9f86 (notar búnt LuaJIT 2.1.0-beta3)
Að keyra prófið með eftirfarandi valkostum:
Fjöldi þræði: 4
Frumstillir slembitölugenerator frá núverandi tíma

Auka skrá opin fánar: (engin)
128 skrár, 8MB hver
1GiB heildarskráarstærð
Blokkstærð 4KiB
Fjöldi IO beiðna: 0
Les-/skrifhlutfall fyrir samsett slembipróf: 1.50
Reglubundið FSYNC virkt, kallar fsync() hverjar 100 beiðnir.
Hringir í fsync() í lok prófs, Virkt.
Notar samstilltan I/O ham
Gerir handahófskennt r/w próf
Byrjar starfsmannaþræði...

Þræðir byrjaðir!

Afköst:
lesa: IOPS=3868.21 15.11 MiB/s (15.84 MB/s)
skrifa: IOPS=2578.83 10.07 MiB/s (10.56 MB/s)
fsync: IOPS=8226.98

Seinkun (ms):
mín: 0.00
meðaltal: 0.27
hámark: 18.01
95. hundraðshluti: 1.08
summa: 238469.45

Þessi athugasemd byrjar stórt

greinaröð um öryggisafrit

  1. Öryggisafritun, hluti 1: Hvers vegna þarf öryggisafritun, yfirlit yfir aðferðir, tækni
  2. Afritunarhluti 2: Skoðaðu og prófa rsync-undirstaða öryggisafritunarverkfæri
  3. Afritunarhluti 3: Skoða og prófa tvívirkni, tvívirkni, deja dup
  4. Backup Part 4: Skoða og prófa zbackup, restic, borgbackup
  5. Backup Part 5: Prófa bacula og veeam öryggisafrit fyrir Linux
  6. Afritunarhluti 6: Samanburður á öryggisafritunarverkfærum
  7. Afritunarhluti 7: Ályktanir

Heimild: www.habr.com

Bæta við athugasemd