Ako zhutniť ukladanie záloh v objektovom úložisku až o 90 %

Naši tureckí klienti nás požiadali, aby sme správne nakonfigurovali zálohovanie pre ich dátové centrum. V Rusku robíme podobné projekty, ale tu bol príbeh skôr o skúmaní, ako to najlepšie urobiť.

Vzhľadom na to: existuje lokálne úložisko S3, existuje Veritas NetBackup, ktorý získal novú rozšírenú funkcionalitu na presun údajov do objektového úložiska, teraz s podporou deduplikácie, a v tomto lokálnom úložisku je problém s voľným priestorom.

Úloha: urobiť všetko tak, aby bol proces ukladania záložných kópií rýchly a lacný.

V skutočnosti, predtým, všetko v S3 boli jednoducho súbory, a to boli kompletné odliatky kritických strojov dátového centra. To znamená, že to nie je príliš optimalizované, ale na začiatku všetko fungovalo. Teraz je čas na to prísť a urobiť to správne.

Obrázok ukazuje, k čomu sme dospeli:

Ako zhutniť ukladanie záloh v objektovom úložisku až o 90 %

Ako vidíte, prvá záloha bola urobená pomaly (70 Mb/s) a následné zálohy tých istých systémov boli oveľa rýchlejšie.

V skutočnosti, ďalej je tu trochu viac podrobností o tom, aké funkcie existujú.

Záložné protokoly pre tých, ktorí sú pripravení prečítať si polovicu strany výpisuPlné s opätovným skenovaním
18. december 2018 12:09:43 — Info bpbkar (pid=4452) akcelerátor odoslal na server 14883996160 bajtov z 14883994624 bajtov, optimalizácia 0.0 %
18. 2018. 12 10:07:23002 - Info NBCC (pid=3) StorageServer=PureDisk_rhceph_rawd:s14570817.cloud.ngn.com.tr; Report=PDDO Stats (použitý viacvláknový stream) pre (NBCC): naskenované: 1760761 KB, CR odoslaná: 0 KB, CR odoslaná cez FC: 87.9 KB, odstránenie: XNUMX %, vyrovnávacia pamäť vypnutá

plne
18. december 2018 12:13:18 — Info bpbkar (pid=2864) akcelerátor odoslal na server 181675008 bajtov z 14884060160 bajtov, optimalizácia 98.8 %
18. 2018. 12 13:40:23527 - Info NBCC (pid=3) StorageServer=PureDisk_rhceph_rawd:s14569706.cloud.ngn.com.tr; Report=PDDO Stats for (NBCC): naskenované: 45145 KB, CR odoslaná: 0 KB, CR odoslaná cez FC: 99.7 KB, deup: XNUMX %, cache deaktivovaná

inkrementálny
18. december 2018 12:15:32 — Info bpbkar (pid=792) akcelerátor odoslal na server 9970688 bajtov z 14726108160 bajtov, optimalizácia 99.9 %
18. 2018. 12 15:53:23656 - Info NBCC (pid=3) StorageServer=PureDisk_rhceph_rawd:s14383788.cloud.ngn.com.tr; Report=PDDO Stats for (NBCC): naskenované: 15700 KB, CR odoslaná: 0 KB, CR odoslaná cez FC: 99.9 KB, deup: XNUMX %, cache deaktivovaná

plne
18. december 2018 12:18:02 — Info bpbkar (pid=3496) akcelerátor odoslal na server 171746816 bajtov z 14884093952 bajtov, optimalizácia 98.8 %
18. 2018. 12 18:24:23878 - Info NBCC (pid=3) StorageServer=PureDisk_rhceph_rawd:s14569739.cloud.ngn.com.tr; Report=PDDO Stats for (NBCC): naskenované: 34120 KB, CR odoslaná: 0 KB, CR odoslaná cez FC: 99.8 KB, deup: XNUMX %, cache deaktivovaná

Aký je problém

Zákazníci chcú robiť zálohy čo najčastejšie a ukladať ich čo najlacnejšie. Najlepšie je uložiť ich lacno v objektových úložiskách, ako je S3, pretože sú najlacnejšie za cenu služby za megabajt, odkiaľ môžete zálohu v primeranom čase vrátiť späť. Keď je zálohovanie veľa, nie je to veľmi lacné, pretože väčšinu úložiska zaberajú kópie rovnakých údajov. V prípade HaaS tureckých kolegov môže byť sklad zahustený približne o 80 – 90 %. Je jasné, že sa to týka konkrétne ich špecifík, ale určite by som rátal aspoň s 50% dedkom.

Na vyriešenie problému hlavní dodávatelia už dlho vytvorili brány pre Amazon S3. Všetky ich metódy sú kompatibilné s lokálnym S3, pokiaľ podporujú Amazon API. V tureckom dátovom centre sa zálohuje do nášho S3, ako aj do T-III „Compressor“ v Rusku, keďže táto schéma práce sa nám osvedčila.

A náš S3 je plne kompatibilný s metódami zálohovania Amazon S3. To znamená, že všetky zálohovacie nástroje, ktoré podporujú tieto metódy, vám umožňujú skopírovať všetko do takéhoto úložiska „po vybalení“.

Veritas NetBackup pridal funkciu CloudCatalyst:

Ako zhutniť ukladanie záloh v objektovom úložisku až o 90 %

To znamená, že medzi strojmi, ktoré je potrebné zálohovať, a bránou je medziľahlý linuxový server, cez ktorý prechádza záložná prevádzka z agentov SRK a deduplikuje sa za behu pred jej prenosom do S3. Ak predtým existovalo 30 záloh po 20 GB s kompresiou, teraz (kvôli podobnosti strojov) sa ich objem zmenšil o 90 %. Deduplikačný engine sa používa rovnako ako pri ukladaní na bežné disky pomocou Netbackup.

Tu je to, čo sa stane pred prechodným serverom:

Ako zhutniť ukladanie záloh v objektovom úložisku až o 90 %

Testovali sme a dospeli sme k záveru, že pri implementácii v našich dátových centrách to šetrí miesto v úložisku S3 pre nás aj pre zákazníkov. Ako vlastník komerčných dátových centier, samozrejme, účtujeme podľa obsadeného objemu, no aj tak je to pre nás veľmi výhodné – pretože začíname zarábať na škálovateľnejších miestach v softvéri a nie na prenájme hardvéru. Nuž a tým je zníženie interných nákladov.

Denníky228 úloh (0 vo fronte 0 aktívnych 0 čaká na opakovanie 0 pozastavené 0 nedokončené 228 Dokončené — 13 vybratých)
(Použitý filter [13])

Typ ID úlohy Stav Podrobnosti Stav Zásady úlohy Plán úlohy Klient Media Server Čas začiatku Uplynutý čas Koniec Čas úložiska Pokus o operáciu Kilobajty Súbory Cesta % dokončená (odhadovaná) Vlastník PID úlohy Kopírovať rodičovskú ID úlohy KB/s Aktívne Spustiť Aktívne Uplynulá relácia profilu trezoru robota ID média na vysunutie pohybu údajov Typ mimo hostiteľa Hlavná priorita Deduplikácia Rýchlosť prenosu Urýchľovač optimalizácie Inštancia alebo zdieľanie databázy Hostiteľ
— 1358 Snímka hotová 0 VMware — NGNCloudADC NBCC 18. december 2018 12:16:19 00:02:18 18. december 2018 12:18:37 STU_DP_S3_****cup, december 1 100%, root 1358 18 :2018:12 PM 16:27:00 Disk na okamžitú obnovu štandardný WIN-************ 02
1360 Záloha Hotovo 0 VMware Úplná NGNCloudADC NBCC 18. decembra 2018 12:16:48 00:01:39 18. decembra 2018 12:18:27 STU_DP_S3_****záloha 1 14,535,248 149654 100 23858 1358 335,098. decembra , 18 2018:12:16 48:00:01 Disk Instant Recovery Standard WIN-*********** 39 0 % 99.8 %
1352 Snímka hotová 0 VMware - NGNCloudADC NBCC 18. decembra 2018 12:14:04 00:02:01 18. decembra 2018 12:16:05 STU_DP_S3_****záloha 1 100 1352%, záloha 18 2018% 12:14 14:00:01 Disk na okamžitú obnovu Standard WIN-************ 51
1354 Záloha dokončená 0 ​​VMware Incremental NGNCloudADC NBCC 18. december 2018 12:14:34 PM 00:01:21 18. december 2018 12:15:55 STU_DP_S3_****záloha 1 14,380,965 147 100 23617 1352 500,817. decembra , 18 2018:12:14 34:00:01 Disk Instant Recovery Standard WIN-*********** 21 0 % 99.9 %
1347 Snímka hotová 0 VMware - NGNCloudADC NBCC 18. decembra 2018 12:11:45 00:02:08 18. decembra 2018 12:13:53 STU_DP_S3_****záloha 1 100 1347%, záloha 18 2018% 12:11 45:00:02 Disk na okamžitú obnovu Standard WIN-************ 08
1349 Záloha Hotovo 0 VMware Úplná NGNCloudADC NBCC 18. decembra 2018 12:12:02 00:01:41 18. decembra 2018 12:13:43 STU_DP_S3_****záloha 1 14,535,215 149653 100 23508 1347 316,319. decembra , 18 2018:12:12 02:00:01 Disk Instant Recovery Standard WIN-*********** 41 0 % 99.7 %
1341 Snímka hotová 0 VMware - NGNCloudADC NBCC 18. decembra 2018 12:05:28 00:04:53 18. decembra 2018 12:10:21 STU_DP_S3_****záloha 1 100 1341%, záloha 18 2018% 12:05 28:00:04 Disk na okamžitú obnovu Standard WIN-************ 53
1342 Záloha dokončená 0 ​​VMware Full_Rescan NGNCloudADC NBCC 18. decembra 2018 12:05:47 00:04:24 18. decembra 2018 12:10:11 STU_DP_S3_****záloha 1% 14,535,151% 149653 koreň 100 22999 1341 70,380 dec 18 , 2018 12:05:47 PM 00:04:24 Disk Instant Recovery Standard WIN-*********** 0 87.9 % 0 %

1339 Snímka hotová 150 VMware - NGNCloudADC NBCC 18. december 2018 11:05:46 00:00:53 18. december 2018 11:06:39 STU_DP_S3_****záloha 1 100%, záloha 1339 18 % 2018:11 05:46:00 Disk na okamžitú obnovu štandardný WIN-************ 00
1327 Snímka hotová 0 VMware - ********.********.cloud NBCC 17. decembra 2018 12:54:42 05:51:38 17. decembra 2018 6:46:20 STU_DP_S3_****záloha 1 100% root 1327 17. december 2018 12:54:42 05:51:38 Disk Instant Recovery Standard WIN-*********** 0
1328 Záloha dokončená 0 ​​VMware Full ********.********.cloud NBCC 17. decembra 2018 12:55:10 05:29:21 17. decembra 2018 6:24:31 STU_DP_S3_****záloha 1 222,602,719 258932 100 12856 1327 % 11,326 root 17 2018 12 55. december 10 05:29:21 0:87.9:0 Disk na okamžitú obnovu**** Štandardné XNUMX% WIN-*** XNUMX%
1136 Snímka hotová 0 VMware - ********.********.cloud NBCC 14. decembra 2018 4:48:22 04:05:16 14. decembra 2018 8:53:38 STU_DP_S3_****záloha 1 100% root 1136 14. december 2018 4:48:22 04:05:16 Disk Instant Recovery Standard WIN-*********** 0
1140 Záloha dokončená 0 ​​VMware Full_Scan *******.********.cloud NBCC 14. decembra 2018 4:49:14 03:49:58 14. decembra 2018 8:39:12 STU_DP_S3_****záloha 1 217,631,332 255465 100 26438 1136 % 15,963 root 14 2018 4 49. december 14 03:49:58 0:45.2:0 Disk na okamžitú obnovu**** Štandardný XNUMX% WIN-***.**** XNUMX%

Akcelerátor vám umožňuje znížiť návštevnosť agentov, pretože Prenášajú sa iba zmeny údajov, to znamená, že ani úplné zálohy sa neodovzdávajú úplne, pretože mediálny server zhromažďuje následné úplné zálohy z prírastkových záloh.

Sprostredkovateľský server má svoje vlastné úložisko, kde zapisuje „cache“ údajov a udržiava databázu na deduplikáciu.

Kompletná architektúra vyzerá takto:

  1. Hlavný server spravuje konfiguráciu, aktualizácie atď. a nachádza sa v cloude.
  2. Mediálny server (stredný stroj *nix) by mal byť umiestnený najbližšie k redundantným systémom z hľadiska dostupnosti siete. Tu sa vykonáva deduplikácia záloh zo všetkých rezervovaných počítačov.
  3. Na zálohovaných počítačoch sú agenti, ktorí vo všeobecnosti posielajú na server médií len to, čo nie je v jeho úložisku.

Všetko to začína úplným skenovaním - toto je plnohodnotná plná záloha. V tomto bode mediálny server vezme všetko, deduplikuje to a prenesie do S3. Rýchlosť na mediálny server je nízka, ale od neho je vyššia. Hlavným obmedzením je výpočtový výkon servera.

Nasledujúce zálohy sú robené kompletné z pohľadu všetkých systémov, no v skutočnosti sú to niečo ako syntetické plné zálohy. To znamená, že k skutočnému prenosu a nahrávaniu na mediálny server dochádza len z tých dátových blokov, s ktorými sa ešte v zálohách VM predtým nestretli. A iba tie dátové bloky, ktorých hash nie je v deduplikačnej databáze mediálneho servera, sa prenesú a zaznamenajú do S3. Jednoduchšie povedané, toto je niečo, čo ešte nikdy nebolo vidieť v žiadnej zálohe jedného VM.

Počas obnovy si mediálny server vyžiada potrebné deduplikované objekty od S3, rehydratuje ich a odovzdá agentom IRB, t.j. pri obnove je potrebné brať do úvahy objem prevádzky, ktorý sa bude rovnať skutočnému objemu obnovovaných dát.

Ako to vyzerá:

Ako zhutniť ukladanie záloh v objektovom úložisku až o 90 %

A tu je ďalší kus guľatiny169 úloh (0 vo fronte 0 aktívnych 0 čaká na opakovanie 0 pozastavené 0 nedokončené 169 Dokončené — 1 vybratých)

Typ ID úlohy Stav Podrobnosti Stav Zásady úlohy Plán úlohy Klient Media Server Čas začiatku Uplynutý čas Koniec Čas úložiska Pokus o operáciu Kilobajty Súbory Cesta % dokončená (odhadovaná) Vlastník PID úlohy Kopírovať rodičovskú ID úlohy KB/s Aktívne Spustiť Aktívne Uplynulá relácia profilu trezoru robota ID média na vysunutie pohybu údajov Typ mimo hostiteľa Hlavná priorita Deduplikácia Rýchlosť prenosu Urýchľovač optimalizácie Inštancia alebo zdieľanie databázy Hostiteľ
– 1372 Obnovenie dokončené 0 NBPR01 NBCC 19. december 2018 1:05:58 PM 00:04:32 19. december 2018 1:10:30 1 14,380,577 1 100 % 8548 1372 ROOT 70,567, 19 ROOT 2018 1:06 :00 PM 00:04:30 WIN-************ 90000 XNUMX

Integrita dát je zabezpečená samotnou ochranou S3 - je tu dobrá redundancia na ochranu pred zlyhaniami hardvéru, ako je napríklad mŕtve vreteno pevného disku.

Mediálny server potrebuje 4 TB vyrovnávacej pamäte – toto je minimálna veľkosť odporúčaná spoločnosťou Veritas. Viac je lepšie, ale to sme urobili.

Celkový

Keď nám partner vhodil do S3 20 GB, uložili sme 60 GB, pretože poskytujeme trojnásobnú geografickú rezerváciu dát. Teraz je oveľa menšia prevádzka, čo je dobré pre kanál aj tarify za úložisko.

V tomto prípade sú trasy uzavreté za „veľkým internetom“, ale môžete riadiť prevádzku cez VPN L2 cez internet, ale je lepšie nainštalovať mediálny server pred vstupom poskytovateľa.

Ak máte záujem dozvedieť sa o týchto funkciách v našich ruských dátových centrách alebo máte otázky týkajúce sa implementácie doma, opýtajte sa v komentároch alebo e-mailom [chránené e-mailom].

Zdroj: hab.com

Pridať komentár