В 我們向您介紹了 4 月發布的 Veeam Backup & Replication 9.5 (VBR) Update XNUMX 中的新功能,其中我們故意沒有提及磁帶備份。關於這個區域的故事值得寫一篇單獨的文章,因為確實有很多新功能。
– QA 夥計們,你們會寫一篇文章嗎?
- 為什麼不呢!

21 世紀的磁帶驅動器
將資料儲存在磁帶(盒式磁帶,“泰帕「我們在研發部門這樣稱呼它們)並不局限於過去的 ZX-Spectrum 計算機,一個遊戲可以加載到 48 kb 的 RAM 中, 持續幾分鐘。在過去的二十五年裡,磁帶的速度和容量增加了6至7個數量級。這不是一個完全正確的比較,並且 標準 跟不上。然而,現代技術可以在一公里長的磁帶上記錄 12 TB 的資料(壓縮模式下最多 30 TB),因此,即使考慮到記錄/讀取設備的投資,160 美元的硬碟在長期儲存大量資料的成本方面也遠遠落後於競爭對手。此類磁帶上的資料可可靠地保存 15 至 30 年。
我將從另一邊過來。上次 達到了一個新的水平。他們可以在大型公司的基礎設施中等待數週甚至數月的時間,一旦出現另一個零日漏洞,他們就可以摧毀(這需要人工幫助,因為涉及到大筆資金)所有數據,以及所有可以訪問的備份副本。這裡 ,當時公司不得不向敲詐勒索者支付贖金。所謂的 氣隙即實體上與基礎設施隔離的備份實際上已成為解決此類問題的唯一可靠方法。磁帶是這裡永恆的解決方案之一。

但是領先製造商(IBM、HPE、Oracle、Dell)在鐵和鋇鐵氧體的規格和技術創新不足以可靠地保護資料;需要好的軟體。在 Veeam,我們有一整個團隊致力於磁帶備份,每天大約有 10 個人進行分析、規劃、研究、開發和測試。您可以在之前的文章中看到這項工作的成果(, )。過去一年做了哪些工作?
詞彙表
選擇在於,是使用母語的自由,還是使用使可讀性變得複雜的官腔官腔。我更喜歡第一個,因此如果下面列表中的俚語讓任何人感到不快,我提前道歉。這裡我將簡單提醒一下每個術語的含義。
VBR 名人可以跳過此部分喬巴 – job – 備份任務。事實上,整個 VBR 都是建立在作業之上的。除了備份和複製之外,這還可以複製到磁帶(備份到磁帶作業)。我要聲明的是,從備份副本還原(還原)也是一項工作,但在本文中,這個詞意味著備份。
貯存 – 儲存 – 一個歷史悠久的名稱。這些是 儲存庫 (儲存庫 - 儲存),包含備份副本 - 滿的 и 增量。一個儲存可以包含一個或多個虛擬機器。
鏈 – 鏈 – 相互連結的儲存序列。要從第 n 個增量儲存中復原數據,需要從 (n-1) 到第 1 個的所有先前的資料以及第一個增量引用的完整儲存。
來源, 目標 – 源、目標。來源是作業處理的原始實體。對於備份/副本,這通常是虛擬機器管理程式中的虛擬機器。對於磁帶作業,來源是備份作業本身(對於檔案到磁帶作業,來源是檔案)。備份作業的目標是儲存備份的儲存庫。對於磁帶作業來說,它是一個媒體池。
媒體池 - – 資訊載體池,在我們的例子中是磁帶。使用者建立的包含一個或多個庫的磁帶的邏輯容器。因此,磁帶作業總是以媒體池為目標,也就是說,資料不是寫入特定磁帶或庫中的任何磁帶,而是寫入一組特定的磁帶。媒體池具有資料保留時間設置,此後可以重寫磁帶。用戶可以創建標準和 。現在,每種類型都可以是 WORM 和非 WORM,下文將詳細介紹。
媒體集 - – 媒體池中的一組磁帶,用於連續寫入備份/檔案。對於 GFS 池,媒體集也與一個間隔(例如,每年)相關聯,並且磁帶僅在其間隔內輪換。
– 磁帶庫的元素。驅動器讀取並倒帶磁帶,更換器是一個在儲存槽、彈出槽和驅動器之間移動磁帶的機器人。還有 獨立驅動器 (獨立 - 單獨站立),這裡的更換者的角色是由一個人扮演的。此驅動器需要在連接庫的 Windows 機器上正確安裝製造商的驅動程式;我們可以透過本機 SCSI 使用無需驅動程式的轉換器。
租客錄音。受保護的提供者 - 受保護的客戶端
立刻把你的王牌攤在桌面上。我們更新的最重要功能是專為 ,在其基礎設施中使用 VBR。開發始於兩年前。我們很快意識到,在下一個版本中我們無法處理如此嚴峻的任務,因此我們稍事休息並最終在 9.5 Update 4 中發布了該功能。
簡而言之,提供者現在可以使用 GFS 池中的磁帶作業將其客戶的備份複製到磁帶上。這為供應商(我們和商業部門都非常珍惜這些大公司)提供了兩個選擇:
- 保護您的客戶(租戶,租戶 - 租戶)因意外刪除或基礎設施問題(「伺服器機房洪水」)而導致資料遺失;
- 為租用戶提供一項附加服務,用於從根據資料保留策略早已從雲端儲存庫中刪除但仍保留在磁帶上的舊備份中還原資料。
從行銷角度來看,該功能非常“美味”,但從我們的角度來看,實現起來同樣困難。
設計
出現的主要問題是資料加密。大多數雲端備份都是加密的,統計顯示約佔總數的三分之二。這個數字令我們感到驚訝,我們以為幾乎所有東西都是加密的,但事實並非如此——許多客戶似乎對他們的提供者絕對有信心。
範例很簡單:提供者不應該能夠解密其租戶的資料。同時,新功能需要在提供者端開設帶有備份的儲存。這是為了移動資料塊所必需的,例如創建 。最主要的是,當在執行作業期間沒有將必要的金鑰傳輸到提供者方面時,這需要獨立於租用戶來完成。
這個問題的解決方案也涉及發布附加元件的另一個重要功能,即 – 包含新增額外的加密金鑰。檔案金鑰以加密形式儲存在提供者的資料庫中。根據提供者方面的一個巧妙方案,它可以用於打開存儲,在存儲之間移動和重新加密數據塊(畢竟每個存儲都有自己的密鑰),但它不能解密數據本身。

一個巧妙的方案(工作版)
我要補充一點,研發部門的所有工程師都非常喜歡我們產品中的加密功能,儘管沒有人知道它到底是如何運作的。 (這裡也有一個關於「它為什麼會起作用」的笑話,但編輯們沒有讓它通過。)
測試
該功能已報告數百個錯誤。最困難的領域是加密、使用者介面和復原問題。
從測試的角度來看,困難在於巨大的可變性,租戶作業和儲存庫的類型和種類的「組合」——我的意思是在將備份還原到基礎設施時的來源和目標。這一切都是在框架內用邏輯串連起來的 (包括一個新的 - 並行性和每日媒體集,更多內容見下文),並且一般來說,關於磁帶不常見的雲細節。不要忘記添加大量的加密。繼續這個比喻,我們吃飽了這道菜——但我們也從各個角度品嚐了它。

測試計劃片段
其結果是,
詳細描述可以參見 (目前為英文): , 。我將詳細論述要點。
備份
提供者將租戶添加到以 GFS 池為目標的磁帶作業中。如果您擁有雲端許可證,則該選項在精靈的第二步驟中可用 房客。您可以一次或單獨新增所有租戶,也可以僅選擇特定租戶的特定配額(但不是子配額)。您不能在一個作業中混合租用戶備份和常規本機備份。

其餘設定幾乎與 GFS 池中的常規作業完全相同。
提供者端和租用戶端都可以進行資料復原。
提供者端的恢復
它是透過一個新的嚮導來執行的。在這裡,您可以轉到單獨的工作,恢復某一天儲存庫中的整個鏈。

有三家餐廳可供選擇:
- 回到原處。在這種情況下,如果有原始備份,則會被刪除;租用戶作業會自動重新配置到復原的鏈中。假設這樣的餐廳對客戶來說是完全不可見的,並且只會在短時間內與雲端儲存庫斷開連線。
- 到新的配額/存儲庫。例如,提供者可以為此目的建立一個單獨的臨時帳戶,隨後將其刪除。與提供者的資料庫同步後,備份將出現在租戶基礎架構中。
- 只需將其複製到提供者基礎設施中註冊的 Linux 或 Windows 伺服器的磁碟即可。然後可以將該鏈寫入閃存驅動器並發送給租戶。

租戶端恢復
此選項意味著客戶擁有自己的磁帶基礎設施和大量餐廳資料。提供者可以透過送貨服務將帶有錄製備份的磁帶實體發送給客戶,客戶在其設備上對其進行分類,解密磁帶和備份,並處理備份副本,就像他自己將它們錄製在磁帶上一樣。這裡有一個避免透過 WAN 下載大量資料的實用技巧。
GFS 池的主要改進
-媒體池兩年前出現在 VBR 9.5 版本。在發布的更新中,無論是與租戶到磁帶功能的出現有關,還是應用戶的要求,我們都大大改進了此功能。
每日媒體集
出現了一個新的 日常的 (每日)媒體集。現在,GFS 池可以儲存每天的備份,不僅可以儲存完整的備份,還可以儲存增量的備份。後者佔用的空間明顯較少,這樣做是為了節省磁帶。假設這些磁帶在庫中不斷旋轉並且不會被帶到遠端儲存。在這種情況下,對於從增量角度來看的餐館,您將需要其中一套高級媒體(每週、每月、每季或每年)的磁帶。如果不啟用每週媒體集,就無法啟用每日媒體集,因為在大多數情況下,需要每週磁帶才能從增量副本進行還原。它們要么一直放在圖書館裡,要么存放在不遠處的倉庫裡。

GFS 媒體池中磁帶作業操作的邏輯 ,技術作家不會讓你說謊。簡而言之,省略細節,僅將完整備份(包括虛擬完整備份)複製到每周和高級媒體集,每個日期一個,並且將存儲庫中當天的所有備份複製到每日集,因為備份作業可以每天啟動多次。
GFS 池中的並發、啟動時間和等待
現在,在 GFS 媒體池中也可以並行記錄多個庫驅動器上的多個鍊或作業(以前只能在常規媒體池中)。在步驟 選項 媒體池。

重要說明:同一個檔案總是寫入一個線程,因此在有多個大型虛擬機器的情況下建議啟用 因此備份由多條鏈組成。
此外,還可以選擇 GFS 作業本身的開始時間。許多用戶對於半夜啟動感到不滿,因為之後他們必須等待幾乎一整天的時間才能完成來源作業。現在可以將這個時間設定為,例如,傍晚,此時已經有內容需要複製到磁帶上。此外,應使用者的要求,我們在進階設定中新增了一個選項,以前只能使用註冊表項來啟動該選項。選擇就足夠了 處理最近的還原點,而不是等待 – 磁帶作業開始時儲存庫中的內容被複製到磁帶上(例如,昨天的時間點),無需等待。

改進了多個庫的處理
我們將討論將多個庫新增至一個媒體池的情況。我們以前曾支持過這種做法,但客戶不時會抱怨這種行為不完全可預測。
這是

例如,磁帶作業啟動後,佔用了第一個庫中的兩個驅動器,但並行設定允許它同時使用 4 個驅動器。這項工作是否應該切換到媒體池中的第二個庫並使用它,或者這是否會浪費資源?
另一個案例。選擇了根據「無可用磁帶」條件進行切換的選項;第一個庫只有一個磁帶,但它可能保存了所有資料。但是,這些設定允許您並行寫入兩個磁帶。在這種情況下我應該使用第二個函式庫嗎?
我們決定透過明確配置行為來清理這個區域。
已經成為

角色出現—— 積極的 и 被動的。媒體池本身有兩種模式:故障安全模式,或 故障轉移 (故障轉移)和 平行記錄 (平行)。現在,根據您的要求,您可以以不同的方式配置媒體池。
- 如果您有多個相等的庫並且需要在其中並行進行錄製,請啟用並行錄製模式;為了實現這一點,必須為所有圖書館指派主動角色。在這種情況下,只要有需要,就會使用新的磁帶和驅動器,無論它們位於哪個庫中。仍然有一個優先順序 - 我們將首先嘗試在清單中位置較高的庫中尋找資源。
- 如果您有一個主庫和一個備用的舊驅動器或獨立驅動器,請將主庫放在清單頂部並為備份設備選擇被動角色,以啟用故障轉移模式。只有在工作確實需要時才會切換到這樣的設備。這種情況將被視為異常,並會透過電子郵件發送通知。
有一個更複雜的情況我們尚不支持——在存在被動庫的情況下存在多個主動庫。回饋將顯示是否需要這樣的配置以及該功能是否需要在將來「完成」。標準做法。
WORM支持
蟲 – 一次寫入,多次讀取 – 磁帶無法擦除或重寫 ,您只能新增資料。它們的強制使用受到某些組織的規則的管制,例如從事醫學領域的組織。這種磁帶的主要問題是 VBR 或 寫下一個以後無法刪除的標題,並且當嘗試這樣做時磁帶作業會因錯誤而崩潰。
在 9.5 Update 4 中,已經實現了對此類磁帶的全面支援。新增了 WORM 媒體池、常規和 GFS,其中只能放置此類型的磁帶。

新磁帶上有一個藍色的“凍結”圖示。從使用者的角度來看,使用 WORM 盒式磁帶與使用普通盒式磁帶沒有什麼不同。
磁帶的「蠕蟲」最初由後綴決定 ,但如果其上的條碼正常或不可讀,則該資訊是在磁帶首次插入時由驅動器提供的。您將無法將 WORM 磁帶放入常規媒體池並寫入其中。有趣的是,已經有一些用戶將 WORM 條碼貼到普通盒式磁帶上,並對更新後基礎設施的變化感到驚訝。
卡式晶片
隨著不可重寫磁帶的推出,他們開始使用 。我們以前沒有在晶片中使用標準屬性,現在我們寫入和讀取其中一些,但我們不會將它們視為主要資料來源。主要參考點仍然是磁帶的標題。事實證明,這個決定是正確的:發布一個月後,我們看到用戶硬體「動物園」在與晶片協作方面呈現出怎樣的驚喜。
將 NDMP 磁碟區備份到磁帶
總結一下,根據評論數量,這是本次更新最受歡迎的功能。現在可以將 NDMP 磁碟區備份到磁帶。 VBR 基礎設施需求 ,之後就可以在文件磁帶作業中從該主機選擇磁碟區。它們以文件的形式放置在盒式磁帶上,並具有特殊屬性,以便在編目時與普通文件區分開來。

第一個實作有一定的限制:不支援擴展,而且備份和還原只能針對整個磁碟區,而不能針對單一檔案。備份工作透過 (對 NetApp 來說 – ),這裡有一些特殊之處:增量點的最大數量為 9,之後強制進行完整備份。
作為結論
這些只是 VBR 9.5 Update 4 中磁帶備份領域最重要的創新。我將列出其他更改:
- 能夠設定磁帶作業中來源作業和文件的順序;
- 新增了磁帶操作員角色(使用者可以執行除從磁帶復原之外的所有操作 - 有一個復原操作員可以執行此操作);
- 在文件磁帶作業中新增了成熟的包含/排除遮罩(NDMP 除外);
- 改進了文件磁帶作業中的恢復功能(資料夾將使用備份時存在的文件進行恢復,而不是使用其整個備份歷史記錄中任何時間點的所有文件進行恢復 - 順便說一下,這是一個非常受歡迎的功能);
- 從磁帶恢復大量文件的速度已經提高;
- 選擇下一個要錄製的磁帶的演算法已經得到改進,特別是在其他所有條件相同的情況下,我們會考慮其整個生命週期內錄製/讀取的資料量,並選取最新的一個;
- 提高了產品穩定性。
有用的鏈接
為了多樣化,我將提供幾個俄語資源連結:
- 嗯,概述視頻“工作原理”已經回到了之前的位置(雖然目前是英文的)——你可以觀看它們 。幻燈片 95–102 討論了磁帶。
來源: www.habr.com
