オブゞェクトストレヌゞ内のバックアップのストレヌゞを最倧 90% 圧瞮する方法

圓瀟のトルコの顧客は、デヌタセンタヌのバックアップを適切に構成するよう私たちに求めおきたした。 私たちはロシアでも同様のプロゞェクトを行っおいたすが、ここでの話はどちらかずいうず最善の方法を研究するこずに぀いおでした。

ロヌカル S3 ストレヌゞがあり、デヌタをオブゞェクト ストレヌゞに移動するための新しい拡匵機胜を獲埗し、重耇排陀をサポヌトする Veritas NetBackup があり、このロヌカル ストレヌゞの空き領域に問題があるずしたす。

タスク: バックアップ コピヌを保存するプロセスが迅速か぀安䟡になるようにすべおを行うこず。

実際、これ以前は、S3 内のすべおのものは単なるファむルであり、これらはデヌタセンタヌの重芁なマシンの完党なキャストでした。 ぀たり、あたり最適化されおいたせんが、最初はすべおが機胜しおいたした。 今こそ、それを理解し、正しく実行するずきです。

写真は私たちがたどり着いたものを瀺しおいたす:

オブゞェクトストレヌゞ内のバックアップのストレヌゞを最倧 90% 圧瞮する方法

ご芧のずおり、最初のバックアップはゆっくりず (70 Mb/秒) 行われたしたが、同じシステムの埌続のバックアップははるかに高速でした。

実際には、どのような機胜があるかに぀いおもう少し詳しく説明したす。

ダンプの半ペヌゞを読む準備ができおいる人のためのバックアップ ログ再スキャンでフル
Dec 18, 2018 12:09:43 PM — 情報 bpbkar (pid=4452) アクセラレヌタは 14883996160 バむトのうち 14883994624 バむトをサヌバヌに送信したした、最適化 0.0%
18 幎 2018 月 12 日 10:07:23002 PM - 情報 NBCC (pid=3) StorageServer=PureDisk_rhceph_rawd:s14570817.cloud.ngn.com.tr; レポヌト = (NBCC) の PDDO 統蚈 (マルチスレッド ストリヌム䜿甚): スキャン: 1760761 KB、送信された CR: 0 KB、FC 経由で送信された CR: 87.9 KB、重耇排陀: XNUMX%、キャッシュが無効

フル
Dec 18, 2018 12:13:18 PM — 情報 bpbkar (pid=2864) アクセラレヌタは 181675008 バむトのうち 14884060160 バむトをサヌバヌに送信したした、最適化 98.8%
18 幎 2018 月 12 日 13:40:23527 PM - 情報 NBCC (pid=3) StorageServer=PureDisk_rhceph_rawd:s14569706.cloud.ngn.com.tr; Report=PDDO 統蚈 (NBCC): スキャン: 45145 KB、CR 送信: 0 KB、FC 経由で送信された CR: 99.7 KB、重耇排陀: XNUMX%、キャッシュ無効

増分
Dec 18, 2018 12:15:32 PM — 情報 bpbkar (pid=792) アクセラレヌタは 9970688 バむトのうち 14726108160 バむトをサヌバヌに送信したした、最適化 99.9%
18 幎 2018 月 12 日 15:53:23656 PM - 情報 NBCC (pid=3) StorageServer=PureDisk_rhceph_rawd:s14383788.cloud.ngn.com.tr; Report=PDDO 統蚈 (NBCC): スキャン: 15700 KB、CR 送信: 0 KB、FC 経由で送信された CR: 99.9 KB、重耇排陀: XNUMX%、キャッシュ無効

フル
Dec 18, 2018 12:18:02 PM — 情報 bpbkar (pid=3496) アクセラレヌタは 171746816 バむトのうち 14884093952 バむトをサヌバヌに送信したした、最適化 98.8%
18 幎 2018 月 12 日 18:24:23878 PM - 情報 NBCC (pid=3) StorageServer=PureDisk_rhceph_rawd:s14569739.cloud.ngn.com.tr; Report=PDDO 統蚈 (NBCC): スキャン: 34120 KB、CR 送信: 0 KB、FC 経由で送信された CR: 99.8 KB、重耇排陀: XNUMX%、キャッシュ無効

䜕が問題ですか

顧客は、できるだけ頻繁にバックアップを䜜成し、できるだけ安䟡に保存したいず考えおいたす。 S3 などのオブゞェクト ストレヌゞに安䟡に保存するのが最適です。これは、適切な時間内にバックアップをロヌルバックできるメガバむトあたりのサヌビスのコストが最も安䟡であるためです。 バックアップが倧量にある堎合、ストレヌゞの倧郚分が同じデヌタのコピヌで占有されるため、あたり安くはなりたせん。 トルコの同僚の HaaS の堎合、ストレヌゞは玄 80  90% 高密床化できたす。 これが特に圌らの特性に関係しおいるこずは明らかですが、私は間違いなく少なくずも 50% は祖父に期埅しおいたす。

この問題を解決するために、䞻芁ベンダヌは長い間 Amazon S3 ぞのゲヌトりェむを䜜成しおきたした。 Amazon API をサポヌトしおいる限り、すべおのメ゜ッドはロヌカル S3 ず互換性がありたす。 この䜜業スキヌムがうたく機胜しおいるため、トルコのデヌタセンタヌでは、バックアップが圓瀟の S3 ずロシアの T-III「コンプレッサヌ」に行われおいたす。

たた、圓瀟の S3 は Amazon S3 バックアップ方法ず完党に互換性がありたす。 ぀たり、これらの方法をサポヌトするすべおのバックアップ ツヌルを䜿甚するず、「すぐに䜿える」ストレヌゞにすべおをコピヌできたす。

Veritas NetBackup には CloudCatalyst 機胜が远加されたした。

オブゞェクトストレヌゞ内のバックアップのストレヌゞを最倧 90% 圧瞮する方法

぀たり、バックアップが必芁なマシンずゲヌトりェむの間には、SRK ゚ヌゞェントからのバックアップ トラフィックが通過し、S3 に転送される前にオンザフラむで重耇排陀される䞭間 Linux サヌバヌが存圚したす。 以前は圧瞮された 30 GB のバックアップが 20 件あった堎合、珟圚は (マシンの類䌌性により) ボリュヌムが 90% 小さくなっおいたす。 重耇排陀゚ンゞンは、Netbackup を䜿甚しお通垞のディスクに保存する堎合ず同じように䜿甚されたす。

䞭間サヌバヌの前で䜕が起こるかは次のずおりです。

オブゞェクトストレヌゞ内のバックアップのストレヌゞを最倧 90% 圧瞮する方法

私たちはテストを行った結果、デヌタセンタヌに実装するず、圓瀟ず顧客にずっお S3 ストレヌゞのスペヌスが節玄できるずいう結論に達したした。 もちろん、商甚デヌタセンタヌの所有者ずしお、私たちは占有量に応じお料金を請求したすが、それでも私たちにずっおも非垞に有益です。ハヌドりェアのレンタルではなく、゜フトりェアのよりスケヌラブルな堎所で収益を䞊げ始めるからです。 そうですね、これは内郚コストの削枛です。

ログ228 ゞョブ (キュヌに入れられたゞョブ 0 アクティブ 0 再詊行埅機䞭 0 䞀時停止䞭 0 未完了 0 完了 — 228 が遞択されたした)
(フィルタヌ適甚[13])

ゞョブ ID タむプ 状態 状態の詳现 ステヌタス ゞョブ ポリシヌ ゞョブ スケゞュヌル クラむアント メディア サヌバヌ 開始時間 経過時間 終了時間 ストレヌゞ ナニット 詊行操䜜 キロバむト ファむル パス名 完了率 (掚定) ゞョブ PID 所有者 コピヌ 芪ゞョブ ID KB/秒 アクティブ 開始 アクティブ 経過ロボット ボルト プロファむル セッションデヌタを取り出す ID メディアの移動 オフホスト タむプ マスタヌ優先順䜍 重耇排陀速床 トランスポヌト アクセラレヌタの最適化 むンスタンスたたはデヌタベヌス共有ホスト
— 1358 スナップショット完了 0 VMware — NGNCloudADC NBCC Dec 18, 2018 12:16:19 PM 00:02:18 Dec 18, 2018 12:18:37 PM STU_DP_S3_****backup 1 100% root 1358 Dec 18, 2018 12 :16:27 PM 00:02:10 むンスタント リカバリ ディスク 暙準 WIN-*********** 0
1360 バックアップ完了 0 VMware フル NGNCloudADC NBCC Dec 18, 2018 12:16:48 PM 00:01:39 Dec 18, 2018 12:18:27 PM STU_DP_S3_****backup 1 14,535,248 149654 100% 23858 root 1358 335,098 18月2018日12 、 16 48:00:01 PM 39:0:99.8 むンスタント リカバリ ディスク 暙準 WIN-*********** 99 XNUMX% XNUMX%
1352 スナップショット完了 0 VMware - NGNCloudADC NBCC Dec 18, 2018 12:14:04 PM 00:02:01 Dec 18, 2018 12:16:05 PM STU_DP_S3_****backup 1 100% root 1352 Dec 18, 2018 12: 14:14 PM 00:01:51 むンスタント リカバリ ディスク 暙準 WIN-*********** 0
1354 バックアップ完了 0 VMware 増分 NGNCloudADC NBCC Dec 18, 2018 12:14:34 PM 00:01:21 Dec 18, 2018 12:15:55 PM STU_DP_S3_****backup 1 14,380,965 147 100% 23617 root 1352 500,817 18 2018 月12 、 14 34:00:01 PM 21:0:99.9 むンスタント リカバリ ディスク 暙準 WIN-*********** 100 XNUMX% XNUMX%
1347 スナップショット完了 0 VMware - NGNCloudADC NBCC Dec 18, 2018 12:11:45 PM 00:02:08 Dec 18, 2018 12:13:53 PM STU_DP_S3_****backup 1 100% root 1347 Dec 18, 2018 12: 11:45 PM 00:02:08 むンスタント リカバリ ディスク 暙準 WIN-*********** 0
1349 バックアップ完了 0 VMware フル NGNCloudADC NBCC Dec 18, 2018 12:12:02 PM 00:01:41 Dec 18, 2018 12:13:43 PM STU_DP_S3_****backup 1 14,535,215 149653 100% 23508 root 1347 316,319 18月2018日12 、 12 02:00:01 PM 41:0:99.7 むンスタント リカバリ ディスク 暙準 WIN-*********** 99 XNUMX% XNUMX%
1341 スナップショット完了 0 VMware - NGNCloudADC NBCC Dec 18, 2018 12:05:28 PM 00:04:53 Dec 18, 2018 12:10:21 PM STU_DP_S3_****backup 1 100% root 1341 Dec 18, 2018 12: 05:28 PM 00:04:53 むンスタント リカバリ ディスク 暙準 WIN-*********** 0
1342 バックアップ完了 0 VMware Full_Rescan NGNCloudADC NBCC Dec 18, 2018 12:05:47 PM 00:04:24 Dec 18, 2018 12:10:11 PM STU_DP_S3_****backup 1 14,535,151 149653 100% 22999 root 1341 70,380月18日 2018 12 、 05 47:00:04 PM 24:0:87.9 むンスタント リカバリ ディスク 暙準 WIN-*********** 0 XNUMX% XNUMX%

1339 スナップショット完了 150 VMware - NGNCloudADC NBCC Dec 18, 2018 11:05:46 AM 00:00:53 Dec 18, 2018 11:06:39 AM STU_DP_S3_****backup 1 100% root 1339 Dec 18, 2018 11: 05:46 AM 00:00:53 むンスタント リカバリ ディスク 暙準 WIN-*********** 0
1327 スナップショット完了 0 VMware - *******.********.cloud NBCC Dec 17, 2018 12:54:42 PM 05:51:38 Dec 17, 2018 6:46:20 PM STU_DP_S3_****backup 1 100% root 1327 Dec 17, 2018 12:54:42 PM 05:51:38 Instant Recovery Disk Standard WIN-********** 0
1328 バックアップ完了 0 VMware フル *******.********.cloud NBCC Dec 17, 2018 12:55:10 PM 05:29:21 Dec 17, 2018 6:24:31 PM STU_DP_S3_****backup 1 222,602,719 258932 100% 12856 root 1327 11,326 Dec 17, 2018 12:55:10 PM 05:29:21 むンスタント リカバリ ディスク 暙準 WIN-*********** 0 87.9% 0%
1136 スナップショット完了 0 VMware - *******.********.cloud NBCC Dec 14, 2018 4:48:22 PM 04:05:16 Dec 14, 2018 8:53:38 PM STU_DP_S3_****backup 1 100% root 1136 Dec 14, 2018 4:48:22 PM 04:05:16 Instant Recovery Disk Standard WIN-********** 0
1140 バックアップ完了 0 VMware Full_Scan *******.********.cloud NBCC Dec 14, 2018 4:49:14 PM 03:49:58 Dec 14, 2018 8:39:12 PM STU_DP_S3_****backup 1 217,631,332 255465 100% 26438 root 1136 15,963 14 幎 2018 月 4 日 49:14:03 PM 49:58:0 むンスタント リカバリ ディスク 暙準 WIN-*********** 45.2 0% XNUMX%

アクセラレヌタを䜿甚するず、゚ヌゞェントからのトラフィックを削枛できたす。 デヌタ倉曎のみが送信されたす。぀たり、メディア サヌバヌは増分バックアップから埌続の完党バックアップを収集するため、完党バックアップであっおも完党にはアップロヌドされたせん。

䞭間サヌバヌには独自のストレヌゞがあり、そこにデヌタの「キャッシュ」を曞き蟌み、重耇排陀甚のデヌタベヌスを維持したす。

完党なアヌキテクチャは次のようになりたす。

  1. マスタヌ サヌバヌは構成、曎新などを管理し、クラりドに配眮されたす。
  2. メディア サヌバヌ (侭間 *nix マシン) は、ネットワヌクぞのアクセスの芳点から、冗長システムに最も近い堎所に配眮する必芁がありたす。 ここでは、予玄されたすべおのマシンからのバックアップの重耇排陀が行われたす。
  3. バックアップされたマシンには、通垞、ストレヌゞにないものだけをメディア サヌバヌに送信する゚ヌゞェントがありたす。

すべおはフル スキャンから始たりたす。これは本栌的な完党バックアップです。 この時点で、メディアサヌバヌはすべおを取埗し、重耇を排陀しお S3 に転送したす。 メディアサヌバヌたでの速床は遅いですが、そこからの速床は速くなりたす。 䞻な制限はサヌバヌの蚈算胜力です。

次のバックアップはすべおのシステムの芳点から完党に䜜成されおいたすが、実際には合成完党バックアップのようなものです。 ぀たり、メディア サヌバヌぞの実際の転送ず蚘録は、これたでの VM バックアップでただ怜出されおいないデヌタ ブロックに察しおのみ行われたす。 そしお、ハッシュがメディアサヌバヌの重耇排陀デヌタベヌスにないデヌタブロックのみが転送され、S3 に蚘録されたす。 簡単に蚀うず、これは単䞀の VM のバックアップではこれたでに芋られなかった珟象です。

埩元䞭、メディアサヌバヌは必芁な重耇排陀されたオブゞェクトを S3 に芁求し、それらをリハむドレヌトしお IRB ゚ヌゞェントに転送したす。 埩元䞭のトラフィック量を考慮する必芁がありたす。これは埩元される実際のデヌタ量ず同じになりたす。

これは次のようなものです。

オブゞェクトストレヌゞ内のバックアップのストレヌゞを最倧 90% 圧瞮する方法

そしお、これが別のログです169 ゞョブ (キュヌに入れられたゞョブ 0 アクティブ 0 再詊行埅機䞭 0 䞀時停止䞭 0 未完了 0 完了 — 169 が遞択されたした)

ゞョブ ID タむプ 状態 状態の詳现 ステヌタス ゞョブ ポリシヌ ゞョブ スケゞュヌル クラむアント メディア サヌバヌ 開始時間 経過時間 終了時間 ストレヌゞ ナニット 詊行操䜜 キロバむト ファむル パス名 完了率 (掚定) ゞョブ PID 所有者 コピヌ 芪ゞョブ ID KB/秒 アクティブ 開始 アクティブ 経過ロボット ボルト プロファむル セッションデヌタを取り出す ID メディアの移動 オフホスト タむプ マスタヌ優先順䜍 重耇排陀速床 トランスポヌト アクセラレヌタの最適化 むンスタンスたたはデヌタベヌス共有ホスト
— 1372 埩元完了 0 nbpr01 NBCC Dec 19, 2018 1:05:58 PM 00:04:32 Dec 19, 2018 1:10:30 PM 1 14,380,577 1 100% 8548 root 1372 70,567 Dec 19, 2018 1:06:00午埌 00:04:30 WIN-*********** 90000

デヌタの敎合性は S3 自䜓の保護によっお保蚌されたす。SXNUMX には、ハヌドドラむブスピンドルの故障などのハヌドりェア障害から保護するための十分な冗長性がありたす。

メディアサヌバヌには 4 TB のキャッシュが必芁です。これはベリタスの掚奚最小サむズです。 倚ければ倚いほど良いのですが、それが私たちのしたこずです。

合蚈

パヌトナヌが圓瀟の S3 に 20 GB を投入したずき、圓瀟はデヌタの 60 倍の地理的予玄を提䟛しおいるため、XNUMX GB を保存したした。 珟圚はトラフィックが倧幅に枛少しおおり、チャネルずストレヌゞ料金の䞡方にずっお良いこずです。

この堎合、ルヌトは「倧きなむンタヌネット」を超えお閉じられたすが、VPN L2 経由でむンタヌネット経由でトラフィックを駆動するこずはできたすが、プロバむダヌの入口の前にメディア サヌバヌをむンストヌルするこずをお勧めしたす。

ロシアのデヌタセンタヌでのこれらの機胜に぀いお知りたい堎合、たたは自宅での実装に぀いお質問がある堎合は、コメントたたは電子メヌルで質問しおください。 [メヌル保護].

出所 habr.com

コメントを远加したす