Afritunarhluti 3: Endurskoðun og prófun á tvívirkni, duplicati

Afritunarhluti 3: Endurskoðun og prófun á tvívirkni, duplicati

Þessi athugasemd fjallar um afritunarverkfæri sem framkvæma afrit með því að búa til skjalasafn á afritunarþjóni.

Meðal þeirra sem uppfylla kröfurnar eru tvívirkni (sem er með fínu viðmóti í formi deja dup) og duplicati.

Annað mjög merkilegt öryggisafritunartæki er dar, en þar sem það hefur mjög víðtækan lista yfir valkosti - prófunaraðferðin nær yfir varla 10% af því sem hún er fær um - erum við ekki að prófa það sem hluta af núverandi lotu.

Væntanlegur árangur

Þar sem báðir umsækjendur búa til skjalasafn á einn eða annan hátt er hægt að nota venjulega tjöru sem leiðbeiningar.

Að auki munum við meta hversu vel gagnageymsla á geymsluþjóninum er fínstillt með því að búa til öryggisafrit sem innihalda aðeins muninn á fullu afriti og núverandi ástandi skránna, eða á milli fyrri og núverandi skjalasafna (stigvaxandi, lækkandi osfrv.) .

Hegðun þegar öryggisafrit eru búin til:

  1. Tiltölulega lítill fjöldi skráa á afritunargeymsluþjóninum (sambærilegt við fjölda öryggisafrita eða stærð gagna í GB), en stærð þeirra er nokkuð stór (tugir til hundruð megabæta).
  2. Stærð geymslunnar mun aðeins innihalda breytingar - engar afrit verða geymdar, þannig að geymslustærðin verður minni en með hugbúnaði sem byggir á rsync.
  3. Búast má við miklu örgjörvaálagi þegar þjöppun og/eða dulkóðun er notuð, og líklega nokkuð mikilli net- og diskaálagi ef geymslu- og/eða dulkóðunarferlið er í gangi á öryggisafritsgeymsluþjóni.

Við skulum keyra eftirfarandi skipun sem viðmiðunargildi:

cd /src/dir; tar -cf - * | ssh backup_server "cat > /backup/dir/archive.tar"

Framkvæmdarniðurstöður urðu sem hér segir:

Afritunarhluti 3: Endurskoðun og prófun á tvívirkni, duplicati

Framkvæmdartími 3m12s. Það má sjá að hraðinn er takmarkaður af diskundirkerfi öryggisafritunarþjónsins, eins og í dæminu með rsync. Aðeins örlítið hraðar, því... upptaka fer í eina skrá.

Einnig, til að meta þjöppun, skulum við keyra sama valkost, en virkja þjöppun á hlið öryggisafritunarþjónsins:

cd /src/dir; tar -cf - * | ssh backup_server "gzip > /backup/dir/archive.tgz"

Úrslitin eru:

Afritunarhluti 3: Endurskoðun og prófun á tvívirkni, duplicati

Framkvæmdartími 10m11s. Líklega er flöskuhálsinn einflæðisþjöppan á móttökuendanum.

Sama skipun, en með þjöppun flutt á netþjóninn með upprunalegu gögnunum til að prófa þá tilgátu að flöskuhálsinn sé einþráður þjöppu.

cd /src/dir; tar -czf - * | ssh backup_server "cat > /backup/dir/archive.tgz"

Þetta varð svona:

Afritunarhluti 3: Endurskoðun og prófun á tvívirkni, duplicati

Framkvæmdartíminn var 9m37s. Álagið á einum kjarna við þjöppuna sést vel, því Flutningshraði netsins og álagið á undirkerfi frumdisksins er svipað.

Til að meta dulkóðun geturðu notað openssl eða gpg með því að tengja viðbótarskipun openssl eða gpg í pípu. Til viðmiðunar verður skipun eins og þessi:

cd /src/dir; tar -cf - * | ssh backup_server "gzip | openssl enc -e -aes256 -pass pass:somepassword -out /backup/dir/archive.tgz.enc"

Úrslitin komu svona út:

Afritunarhluti 3: Endurskoðun og prófun á tvívirkni, duplicati

Framkvæmdartíminn reyndist vera 10m30s, þar sem 2 ferli voru í gangi á móttökuhliðinni - flöskuhálsinn er aftur einþráða þjöppu, auk lítillar dulkóðunar kostnaður.

UPP: Að beiðni bliznezz er ég að bæta við prófum með pigz. Ef þú notar aðeins þjöppuna myndi það taka 6m30s, ef þú bætir líka við dulkóðun, þá væri það um 7m. Dýfan í neðsta línuritinu er óhreinsað diskskyndiminni:

Afritunarhluti 3: Endurskoðun og prófun á tvívirkni, duplicati

Tvítekið próf

Duplicity er python hugbúnaður til að taka öryggisafrit með því að búa til dulkóðuð skjalasafn á tar-sniði.

Fyrir stigvaxandi skjalasafn er librsync notað, svo þú getur búist við hegðuninni sem lýst er í fyrri færsla í seríunni.

Hægt er að dulkóða öryggisafrit og undirrita með því að nota gnupg, sem er mikilvægt þegar mismunandi veitendur eru notaðir til að geyma afrit (s3, backblaze, gdrive, osfrv.)

Við skulum sjá hverjar niðurstöðurnar eru:

Þetta eru niðurstöðurnar sem við fengum þegar við keyrðum án dulkóðunar

Vindskeið

Afritunarhluti 3: Endurskoðun og prófun á tvívirkni, duplicati

Keyrslutími hvers prufuhlaups:

Ræsa 1
Ræsa 2
Ræsa 3

16m33s
17m20s
16m30s

8m29s
9m3s
8m45s

5m21s
6m04s
5m53s

Og hér eru niðurstöðurnar þegar gnupg dulkóðun er virkjuð, með lykilstærð 2048 bita:

Afritunarhluti 3: Endurskoðun og prófun á tvívirkni, duplicati

Rekstrartími á sömu gögnum, með dulkóðun:

Ræsa 1
Ræsa 2
Ræsa 3

17m22s
17m32s
17m28s

8m52s
9m13s
9m3s

5m48s
5m40s
5m30s

Stærð blokkarinnar var tilgreind - 512 megabæti, sem sést vel á línuritunum; Örgjörvaálagið hélst í raun 50%, sem þýðir að forritið notar ekki meira en einn örgjörvakjarna.

Meginreglan um rekstur forritsins er líka nokkuð greinilega sýnileg: þeir tóku gagnastykki, þjappuðu því saman og sendu það á öryggisafritsgeymsluþjón, sem getur verið frekar hægt.
Annar eiginleiki er fyrirsjáanlegur keyrslutími forritsins, sem fer aðeins eftir stærð breyttra gagna.

Það að virkja dulkóðun jók ekki verulega keyrslutíma forritsins, en það jók álag á örgjörva um um 10%, sem getur verið nokkuð góður bónus.

Því miður gat þetta forrit ekki greint ástandið á réttan hátt við endurnefna möppu, og stærð geymslunnar sem varð til þess reyndist vera jöfn stærð breytinganna (þ. nær yfir þessa hegðun.

Tvítekið próf

Þessi hugbúnaður er skrifaður í C# og keyrir með því að nota safn af bókasöfnum frá Mono. Það er GUI sem og CLI útgáfa.

Áætlaður listi yfir helstu eiginleika er svipaður og tvískiptur, þar á meðal ýmsar öryggisafritsgeymsluveitur, en ólíkt tvívirkni eru flestir eiginleikar fáanlegir án verkfæra frá þriðja aðila. Hvort þetta er plús eða mínus fer eftir tilvikinu, en fyrir byrjendur er líklegast auðveldara að hafa lista yfir alla eiginleikana fyrir framan þá í einu, frekar en að þurfa að setja upp viðbótarpakka fyrir python, eins og er. málið með tvöfeldni.

Annar lítill blæbrigði - forritið skrifar virkan staðbundinn sqlite gagnagrunn fyrir hönd notandans sem byrjar öryggisafritið, svo þú þarft að auki að tryggja að nauðsynlegur gagnagrunnur sé rétt tilgreindur í hvert skipti sem ferlið er hafið með því að nota cli. Þegar unnið er í gegnum GUI eða WEBGUI verða upplýsingar falin fyrir notandanum.

Við skulum sjá hvaða vísbendingar þessi lausn getur framleitt:

Ef þú slekkur á dulkóðun (og WEBGUI mælir ekki með að gera þetta) eru niðurstöðurnar sem hér segir:

Afritunarhluti 3: Endurskoðun og prófun á tvívirkni, duplicati

Hours:

Ræsa 1
Ræsa 2
Ræsa 3

20m43s
20m13s
20m28s

5m21s
5m40s
5m35s

7m36s
7m54s
7m49s

Með dulkóðun virka, með því að nota aes, lítur það svona út:

Afritunarhluti 3: Endurskoðun og prófun á tvívirkni, duplicati

Hours:

Ræsa 1
Ræsa 2
Ræsa 3

29m9s
30m1s
29m54s

5m29s
6m2s
5m54s

8m44s
9m12s
9m1s

Og ef þú notar ytra forritið gnupg koma eftirfarandi niðurstöður út:

Afritunarhluti 3: Endurskoðun og prófun á tvívirkni, duplicati

Ræsa 1
Ræsa 2
Ræsa 3

26m6s
26m35s
26m17s

5m20s
5m48s
5m40s

8m12s
8m42s
8m15s

Eins og þú sérð getur forritið virkað í nokkrum þráðum, en þetta gerir það ekki að afkastameiri lausn, og ef þú berð saman dulkóðunarvinnuna er það að ræsa utanaðkomandi forrit
reyndist vera hraðari en að nota bókasafnið úr Mono settinu. Þetta gæti stafað af því að utanaðkomandi forritið er hagstæðara.

Annað sniðugt var sú staðreynd að stærð geymslunnar tekur nákvæmlega jafn mikið og raunveruleg breytt gögn, þ.e. duplicati fann endurnefna möppu og höndlaði þetta ástand rétt. Þetta má sjá þegar seinni prófið er keyrt.

Á heildina litið, nokkuð jákvæð áhrif á forritið, þar á meðal að vera frekar vingjarnlegur við nýliða.

Niðurstöður

Báðir umsækjendur unnu frekar hægt, en almennt, miðað við venjulega tjöru, eru framfarir, að minnsta kosti með duplicati. Verðið á slíkum framförum er líka ljóst - áberandi byrði
örgjörva. Almennt séð eru engin sérstök frávik við að spá fyrir um niðurstöður.

Niðurstöður

Ef þú þarft ekki að flýta þér neitt, og er líka með auka örgjörva, þá mun einhver af þeim lausnum sem litið er til skila, í öllu falli hefur verið unnið talsvert mikið sem ætti ekki að endurtaka með því að skrifa umbúðir ofan á tjöru . Tilvist dulkóðunar er mjög nauðsynlegur eiginleiki ef ekki er hægt að treysta þjóninum til að geyma öryggisafrit að fullu.

Samanborið við lausnir byggðar rsync - árangur getur verið margfalt verri, þrátt fyrir að í sinni hreinu mynd virkaði tar 20-30% hraðar en rsync.
Það er sparnaður á stærð geymslunnar, en aðeins með tvítekningu.

Tilkynning

Öryggisafritun, hluti 1: Hvers vegna þarf öryggisafritun, yfirlit yfir aðferðir, tækni
Afritunarhluti 2: Skoðaðu og prófa rsync-undirstaða öryggisafritunarverkfæri
Afritunarhluti 3: Skoðaðu og prófaðu tvívirkni, duplicati, deja dup
Backup Part 4: Skoða og prófa zbackup, restic, borgbackup
Backup Part 5: Prófa bacula og veeam öryggisafrit fyrir Linux
Afritunarhluti 6: Samanburður á öryggisafritunarverkfærum
Afritunarhluti 7: Ályktanir

Sent af: Pavel Demkovich

Heimild: www.habr.com

Bæta við athugasemd