Jak zkrátit úložiště záloh v objektovém úložišti až o 90 %

Naši turečtí klienti nás požádali, abychom správně nakonfigurovali zálohování pro jejich datové centrum. Děláme podobné projekty v Rusku, ale tady byl příběh spíše o zkoumání, jak to nejlépe udělat.

Vzhledem k tomu: existuje místní úložiště S3, existuje Veritas NetBackup, který získal novou rozšířenou funkcionalitu pro přesun dat do objektového úložiště, nyní s podporou deduplikace, a v tomto místním úložišti je problém s volným místem.

Úkol: udělat vše tak, aby proces ukládání záložních kopií byl rychlý a levný.

Ve skutečnosti před tím byly v S3 všechno jen soubory a to byly kompletní odlitky kritických strojů datového centra. To znamená, že to není příliš optimalizované, ale na začátku vše fungovalo. Nyní je čas na to přijít a udělat to správně.

Obrázek ukazuje, k čemu jsme dospěli:

Jak zkrátit úložiště záloh v objektovém úložišti až o 90 %

Jak vidíte, první záloha byla provedena pomalu (70 Mb/s) a následné zálohy stejných systémů byly mnohem rychlejší.

Ve skutečnosti dále existuje trochu více podrobností o tom, jaké funkce existují.

Záložní protokoly pro ty, kteří jsou připraveni přečíst půl stránky výpisuPlné s přeskenováním
18. prosince 2018 12:09:43 — Info bpbkar (pid=4452) akcelerátor odeslal na server 14883996160 bajtů z 14883994624 bajtů, optimalizace 0.0 %
18. 2018. 12 10:07:23002 - Info NBCC (pid=3) StorageServer=PureDisk_rhceph_rawd:s14570817.cloud.ngn.com.tr; Report=PDDO Stats (použitý vícevláknový stream) pro (NBCC): naskenováno: 1760761 KB, CR odesláno: 0 KB, CR odesláno přes FC: 87.9 KB, odstraněno: XNUMX %, mezipaměť vypnuta

Plný
18. prosince 2018 12:13:18 — Info bpbkar (pid=2864) akcelerátor odeslal na server 181675008 bajtů z 14884060160 bajtů, optimalizace 98.8 %
18. 2018. 12 13:40:23527 - Info NBCC (pid=3) StorageServer=PureDisk_rhceph_rawd:s14569706.cloud.ngn.com.tr; Report=PDDO Stats for (NBCC): naskenováno: 45145 KB, CR odesláno: 0 KB, CR odesláno přes FC: 99.7 KB, odstraněno: XNUMX %, mezipaměť vypnuta

Přírůstkové
18. prosince 2018 12:15:32 — Info bpbkar (pid=792) akcelerátor odeslal na server 9970688 bajtů z 14726108160 bajtů, optimalizace 99.9 %
18. 2018. 12 15:53:23656 - Info NBCC (pid=3) StorageServer=PureDisk_rhceph_rawd:s14383788.cloud.ngn.com.tr; Report=PDDO Stats for (NBCC): naskenováno: 15700 KB, CR odesláno: 0 KB, CR odesláno přes FC: 99.9 KB, odstraněno: XNUMX %, mezipaměť vypnuta

Plný
18. prosince 2018 12:18:02 — Info bpbkar (pid=3496) akcelerátor odeslal na server 171746816 bajtů z 14884093952 bajtů, optimalizace 98.8 %
18. 2018. 12 18:24:23878 - Info NBCC (pid=3) StorageServer=PureDisk_rhceph_rawd:s14569739.cloud.ngn.com.tr; Report=PDDO Stats for (NBCC): naskenováno: 34120 KB, CR odesláno: 0 KB, CR odesláno přes FC: 99.8 KB, odstraněno: XNUMX %, mezipaměť vypnuta

Co je za problém

Zákazníci chtějí dělat zálohy co nejčastěji a ukládat je co nejlevněji. Nejlepší je uložit je levně v objektových úložištích, jako je S3, protože jsou nejlevnější za cenu služby za megabajt, odkud můžete zálohu vrátit zpět v rozumném čase. Když je zálohování hodně, není to příliš levné, protože většinu úložiště zabírají kopie stejných dat. V případě HaaS tureckých kolegů lze úložiště zahustit přibližně o 80–90 %. Je jasné, že se to týká konkrétně jejich specifik, ale určitě bych počítal s minimálně 50% dědou.

Aby se problém vyřešil, hlavní dodavatelé již dlouho vytvořili brány pro Amazon S3. Všechny jejich metody jsou kompatibilní s místním S3, pokud podporují Amazon API. V tureckém datovém centru se zálohuje do našeho S3, stejně jako do T-III „Compressor“ v Rusku, protože toto pracovní schéma se nám osvědčilo.

A naše S3 je plně kompatibilní s metodami zálohování Amazon S3. To znamená, že všechny zálohovací nástroje, které podporují tyto metody, vám umožňují zkopírovat vše do takového úložiště „po vybalení“.

Veritas NetBackup přidal funkci CloudCatalyst:

Jak zkrátit úložiště záloh v objektovém úložišti až o 90 %

To znamená, že mezi stroji, které je třeba zálohovat, a bránou je mezilehlý linuxový server, přes který prochází záložní provoz z agentů SRK a je deduplikován za běhu, než se přenese do S3. Jestliže dříve existovalo 30 záloh po 20 GB s kompresí, nyní (kvůli podobnosti strojů) se jejich objem zmenšil o 90 %. Deduplikační jádro se používá stejně jako při ukládání na běžné disky pomocí Netbackup.

Zde je to, co se stane před zprostředkujícím serverem:

Jak zkrátit úložiště záloh v objektovém úložišti až o 90 %

Testovali jsme a došli jsme k závěru, že při implementaci do našich datových center to šetří místo v úložišti S3 pro nás i pro zákazníky. Jako majitelé komerčních datových center samozřejmě účtujeme podle obsazeného objemu, ale i pro nás je to stále velmi výhodné – začínáme totiž vydělávat na škálovatelnějších místech v softwaru a ne na pronájmu hardwaru. No a to je snížení interních nákladů.

Protokoly228 úloh (0 ve frontě 0 aktivní 0 čekání na opakování 0 pozastaveno 0 nedokončeno 228 hotovo — 13 vybraných)
(Filtr byl použit [13])

ID úlohy Typ Stav Podrobnosti Stav Zásady úlohy Plán úlohy Klient Media Server Čas zahájení Uplynulý čas Konec Čas úložiště Pokus o operaci Kilobajty Soubory Cesta % dokončena (odhad) Vlastník PID úlohy Kopie nadřazené ID úlohy KB/s Aktivní Spustit Aktivní Uplynulá relace profilu trezoru robota ID média k vysunutí přesunu dat Typ mimo hostitele Hlavní priorita Deduplikace Rychlost Akcelerátor přenosu Optimalizace instance nebo sdílení databáze Host
— 1358 Snímek Hotovo 0 VMware — NGNCloudADC NBCC 18. prosince 2018 12:16:19 00:02:18 18. prosince 2018 12:18:37 STU_DP_S3_****záloha 1 100 1358% záloha 18 2018% :12:16 PM 27:00:02 Disk pro okamžitou obnovu Standardní WIN-************ 10
1360 Backup Hotovo 0 VMware Full NGNCloudADC NBCC 18. prosince 2018 12:16:48 00:01:39 18. prosince 2018 12:18:27 STU_DP_S3_****záloha 1 14,535,248 149654 100 23858 1358. prosince , 335,098 18:2018:12 16:48:00 Disk pro okamžitou obnovu Standard WIN-*********** 01 39 % 0 %
1352 Snímek Hotovo 0 VMware - NGNCloudADC NBCC 18. prosince 2018 12:14:04 00:02:01 18. prosince 2018 12:16:05 STU_DP_S3_****záloha 1 100 1352%, záloha 18 2018 12 % 14:14 PM 00:01:51 Disk pro okamžitou obnovu Standardní WIN-************ 0
1354 Záloha Hotovo 0 VMware Incremental NGNCloudADC NBCC 18. prosince 2018 12:14:34 PM 00:01:21 18. prosince 2018 12:15:55 STU_DP_S3_****záloha 1 14,380,965 147 100 23617 1352. prosince , 500,817 18:2018:12 14:34:00 Disk pro okamžitou obnovu Standard WIN-*********** 01 21 % 0 %
1347 Snímek Hotovo 0 VMware - NGNCloudADC NBCC 18. prosince 2018 12:11:45 00:02:08 18. prosince 2018 12:13:53 STU_DP_S3_****záloha 1 100 1347%, záloha 18 2018 12 % 11:45 PM 00:02:08 Disk pro okamžitou obnovu Standardní WIN-************ 0
1349 Backup Hotovo 0 VMware Full NGNCloudADC NBCC 18. prosince 2018 12:12:02 00:01:41 18. prosince 2018 12:13:43 STU_DP_S3_****záloha 1 14,535,215 149653 100 23508 1347. prosince , 316,319 18:2018:12 12:02:00 Disk pro okamžitou obnovu Standard WIN-*********** 01 41 % 0 %
1341 Snímek Hotovo 0 VMware - NGNCloudADC NBCC 18. prosince 2018 12:05:28 00:04:53 18. prosince 2018 12:10:21 STU_DP_S3_****záloha 1 100 1341%, záloha 18 2018 12 % 05:28 PM 00:04:53 Disk pro okamžitou obnovu Standardní WIN-************ 0
1342 Záloha Hotovo 0 VMware Full_Rescan NGNCloudADC NBCC 18. prosince 2018 12:05:47 00:04:24 18. prosince 2018 12:10:11 STU_DP_S3_****záloha 1%14,535,151 149653 100% 22999 kořen 1341 70,380 18 2018 pros 12 , 05 47:00:04 24:0:87.9 Disk Instant Recovery Standard WIN-*********** 0 XNUMX % XNUMX %

hotovo 1339:150 AM 18:2018:11 Disk pro okamžitou obnovu Standardní WIN-************ 05
1327 Snímek Hotovo 0 VMware - ********.********.cloud NBCC 17. prosince 2018 12:54:42 05:51:38 17. prosince 2018 6:46:20 STU_DP_S3_****záloha 1 100% root 1327 17. prosince 2018 12:54:42 05:51:38 Disk pro okamžitou obnovu Standardní WIN-*********** 0
1328 Záloha Hotovo 0 VMware Full ********.********.cloud NBCC 17. prosince 2018 12:55:10 05:29:21 17. prosince 2018 6:24:31 STU_DP_S3_****záloha 1 222,602,719 258932 100 12856 1327 % 11,326 root 17 2018 12 55. prosince 10 05:29:21 0:87.9:0 Disk pro okamžitou obnovu**** Standardní XNUMX% WIN-*** XNUMX %
1136 Snímek Hotovo 0 VMware - ********.********.cloud NBCC 14. prosince 2018 4:48:22 04:05:16 14. prosince 2018 8:53:38 STU_DP_S3_****záloha 1 100% root 1136 14. prosince 2018 4:48:22 04:05:16 Disk pro okamžitou obnovu Standardní WIN-*********** 0
1140 Záloha Hotovo 0 VMware Full_Scan *******.********.cloud NBCC 14. prosince 2018 4:49:14 03:49:58 14. prosince 2018 8:39:12 STU_DP_S3_****záloha 1 217,631,332 255465 100 26438 1136 % 15,963 root 14 2018 4 49. prosince 14 03:49:58 0:45.2:0 Disk pro okamžitou obnovu**** Standardní XNUMX% WIN-***.**** XNUMX %

Akcelerátor umožňuje snížit provoz od agentů, protože Přenášejí se pouze změny dat, to znamená, že ani úplné zálohy se neodesílají celé, protože server médií shromažďuje následné plné zálohy z přírůstkových záloh.

Zprostředkující server má vlastní úložiště, kam zapisuje „mezipaměť“ dat a udržuje databázi pro deduplikaci.

Kompletní architektura vypadá takto:

  1. Hlavní server spravuje konfiguraci, aktualizace atd. a je umístěn v cloudu.
  2. Mediální server (střední stroj *nix) by měl být umístěn nejblíže redundantním systémům z hlediska dostupnosti sítě. Zde se provádí deduplikace záloh ze všech rezervovaných strojů.
  3. Na zálohovaných počítačích jsou agenti, kteří obecně posílají na server médií pouze to, co není v jeho úložišti.

Vše začíná úplným skenováním – jedná se o plnohodnotnou plnou zálohu. V tomto okamžiku mediální server vše vezme, deduplikuje a přenese do S3. Rychlost na mediální server je nízká, ale od něj je vyšší. Hlavním omezením je výpočetní výkon serveru.

Následující zálohy jsou provedeny kompletní z pohledu všech systémů, ale ve skutečnosti jde o něco jako syntetické plné zálohy. To znamená, že ke skutečnému přenosu a záznamu na server médií dochází pouze u těch datových bloků, které dosud nebyly v zálohách virtuálních počítačů zaznamenány. A do S3 se přenesou a zaznamenají pouze ty datové bloky, jejichž hash není v deduplikační databázi mediálního serveru. Jednodušeji řečeno, je to něco, co nikdy předtím nebylo viděno v žádné záloze jediného virtuálního počítače.

Během obnovy si mediální server vyžádá potřebné deduplikované objekty od S3, rehydratuje je a předá agentům IRB, tzn. při obnově je nutné počítat s objemem provozu, který se bude rovnat skutečnému objemu obnovovaných dat.

Vypadá to takto:

Jak zkrátit úložiště záloh v objektovém úložišti až o 90 %

A tady je další kus polena169 úloh (0 ve frontě 0 aktivní 0 čekání na opakování 0 pozastaveno 0 nedokončeno 169 hotovo — 1 vybraných)

ID úlohy Typ Stav Podrobnosti Stav Zásady úlohy Plán úlohy Klient Media Server Čas zahájení Uplynulý čas Konec Čas úložiště Pokus o operaci Kilobajty Soubory Cesta % dokončena (odhad) Vlastník PID úlohy Kopie nadřazené ID úlohy KB/s Aktivní Spustit Aktivní Uplynulá relace profilu trezoru robota ID média k vysunutí přesunu dat Typ mimo hostitele Hlavní priorita Deduplikace Rychlost Akcelerátor přenosu Optimalizace instance nebo sdílení databáze Host
– 1372 Obnovení Hotovo 0 NBPR01 NBCC 19. prosince 2018 1:05:58 PM 00:04:32 19. prosince 2018 1:10:30 1 14,380,577 1 100 % 8548 ROOT 1372, 70,567 ROOT 19 2018:1 :06 PM 00:00:04 WIN-************ 30 90000

Integrita dat je zajištěna samotnou ochranou S3 – je zde dobrá redundance, která chrání před selháním hardwaru, jako je vybité vřeteno pevného disku.

Server médií potřebuje 4 TB mezipaměti – toto je doporučení společnosti Veritas pro minimální velikost. Více je lepší, ale to jsme udělali.

Celkový

Když nám partner vhodil 3 GB do S20, uložili jsme 60 GB, protože poskytujeme trojí georezervaci dat. Nyní je mnohem menší provoz, což je dobré jak pro kanál, tak pro tarify úložiště.

V tomto případě jsou trasy uzavřeny za „velkým internetem“, ale můžete provozovat provoz přes VPN L2 přes internet, ale je lepší nainstalovat mediální server před vstupem poskytovatele.

Pokud máte zájem dozvědět se o těchto funkcích v našich ruských datových centrech nebo máte dotazy ohledně implementace doma, zeptejte se v komentářích nebo e-mailem [chráněno e-mailem].

Zdroj: www.habr.com

Přidat komentář