做好備份:打破神話以慶祝節日

做好備份:打破神話以慶祝節日

備份並不是每台熨斗都熱衷的流行技術之一。 它只需要在任何嚴肅的公司,僅此而已。 我們備份銀行中的數千台服務器 - 這是一項複雜而有趣的工作,其中的一些微妙之處以及關於備份的典型誤解只是想被告知。

我已經研究這個主題近 20 年了,其中最近 2 年是在 Promsvyazbank 工作的。 在實踐之初,我幾乎是手動進行備份,使用僅複製文件的腳本。 然後 Windows 中出現了方便的工具:用於準備文件的 Robocopy 實用程序和用於復制的 NT Backup。 直到那時才出現了專門軟件的時代,主要是 Veritas Backup Exec,現在稱為 Symantec Backup Exec。 所以我很早就熟悉備份了。

簡單來說,備份就是按照一定的規律保留數據(虛擬機、應用程序、數據庫和文件)的副本,以防萬一。 每種情況通常都表現為硬件或邏輯故障並導致數據丟失。 備份系統的目的是減少信息丟失。 硬件故障例如是數據庫所在的服務器或存儲器的故障。 邏輯 - 這是部分數據的丟失或更改,包括由於人為因素造成的:他們意外刪除了表、文件,啟動了錯誤的腳本來執行。 監管機構還要求長期存儲某種類型的信息,例如長達幾年。

做好備份:打破神話以慶祝節日

備份最典型的用途是恢復保存的數據庫副本,用於部署各種測試系統,為開發人員克隆。

關於備份存在一些典型的誤區,這些誤區很早就應該被消除。 以下是其中最著名的。

誤區一:備份長期以來只是安全或存儲系統中的一個小功能

備份系統仍然是一類單獨的解決方案,並且非常獨立。 他們有太多的工作要做。 事實上,它們是數據完整性的最後一道防線。 因此,備份按照自己的節奏、時間表進行。 為服務器生成每日報告,其中存在充當監控系統觸發器的事件。

做好備份:打破神話以慶祝節日

另外,訪問備份系統的角色模型允許您將部分權限委託給目標系統的管理員來管理備份。

誤區2:有了RAID,就不再需要備份了。

做好備份:打破神話以慶祝節日

毫無疑問,RAID陣列和數據複製是保護信息系統免受硬件故障影響的好方法,如果您有備用服務器,則可以在主機發生故障時快速組織切換到它。

由於系統用戶所犯的邏輯錯誤,冗餘和復制無法保存。 這是一個回寫備用服務器 - 是的,如果在同步之前檢測到錯誤,它可以提供幫助。 如果錯過了這個時刻呢? 只有及時備份才會有幫助。 如果您知道昨天數據發生了變化,則可以將系統恢復到前天並從中提取必要的數據。 鑑於邏輯錯誤是最常見的事實,好的舊備份仍然是經過驗證的必要工具。

誤區 3:備份是每月一次的事情。

備份頻率是一個可配置的設置,主要取決於您的備份系統要求。 很可能會發現幾乎從未改變且不是特別重要的數據,它們的丟失對公司來說並不重要。
事實上,它們可以每月備份一次,甚至更少。 但更關鍵的數據會更頻繁地保存,具體取決於 RPO(恢復點目標)指標,該指標設置允許的數據丟失。 這可以是每週一次、每天一次、甚至每小時幾次。 我們有來自 DBMS 的這些事務日誌。

做好備份:打破神話以慶祝節日

當系統投入商業運行時,必須批准備份文件,其中反映了要點、更新程序、恢復系統的程序、存儲備份的程序等。

誤區 4:副本量不斷增長並完全佔用所有分配的空間。

備份的保留期限有限。 例如,存儲一年中所有 365 個每日備份是沒有意義的。 一般來說,每日副本保留 2 周是可以接受的,之後會更換新的副本,並且當月第一個製作的版本會保留長期存儲。 反過來,它也會存儲一段時間——每個副本都有一個生命週期。

做好備份:打破神話以慶祝節日

有數據丟失保護。 規則適用:在刪除備份之前,必須形成下一個備份。 因此,如果備份尚未完成,例如由於服務器不可用,數據將不會被刪除。 不僅遵守時間範圍,而且還控制套裝中的副本數量。 如果系統設計有兩個全備份,那麼總會有兩個,只有當新的第三個成功寫入時,舊的才會被刪除。 因此,備份存檔佔用的捲的增長僅與受保護數據量的增長相關,與時間無關。

誤區 5. 備份已開始 - 一切都掛起

最好這樣說:如果一切都懸而未決,那麼管理員的手就不會從那里長出來。 一般來說,備份的性能取決於許多因素。 比如備份系統本身的速度:磁盤存儲、磁帶庫的速度有多快。 從備份系統的服務器的速度來看:是否有時間處理數據、執行壓縮和重複數據刪除。 還有客戶端和服務器之間的通信線路的速度。

備份可以轉到一個或多個流,具體取決於正在備份的系統是否支持多線程。 例如,Oracle DBMS 允許您根據可用處理器的數量提供多個線程,直到傳輸速率達到網絡帶寬限制。

如果您嘗試備份大量線程,那麼就有可能使正在運行的系統超載,它真的會開始變慢。 因此,選擇最佳的線程數以確保足夠的性能。 如果即使是最輕微的性能下降也是至關重要的,那麼當備份不是從作戰服務器而是從其克隆(數據庫術語中的備用)執行時,就有一個很好的選擇。 此過程不會啟動主工作系統。 由於服務器不用於維護,因此可以通過更多流檢索數據。

在大型組織中,為備份系統創建單獨的網絡,以便備份不會影響生產。 另外,流量可能不是通過網絡傳輸,而是通過SAN傳輸。
做好備份:打破神話以慶祝節日
我們也嘗試隨著時間的推移分散負載。 備份主要在非工作時間完成:晚上、週末。 而且,它們並不是同時運行。 虛擬機的備份是一個特例。 該過程實際上對機器本身的性能沒有影響,因此備份可以分散在白天,而不是推遲晚上的一切。 有很多微妙之處,如果你考慮到一切,備份不會影響系統的性能。

誤區 6. 啟動備份系統——這對你來說是容錯的

不要忘記,備份系統是最後一道防線,這意味著在它前面還應該有五個系統來確保IT基礎設施和企業信息系統的連續性、高可用性和容災能力。

希望備份能夠恢復所有數據并快速恢復下降的服務是不值得的。 從備份那一刻到發生故障那一刻的數據丟失是可以保證的,並且數據可以在幾個小時(或幾天,如果你幸運的話)上傳到新服務器。 因此,創建成熟的容錯系統而不將所有內容轉移到備份是有意義的。

誤區 7:我設置了一次備份,並檢查其是否有效。 只剩下看日誌了

這是最有害的神話之一,只有在事件發生時你才會意識到它的虛假性。 成功的備份日誌並不能保證一切都按預期進行。 提前檢查保存的副本的可部署性非常重要。 也就是說,在測試環境中啟動恢復過程並查看結果。

以及一些關於系統管理員的工作

手動模式下,已經很久沒有人復制數據了。 現代 SRK 可以備份幾乎所有內容,您只需正確設置即可。 如果添加了新服務器,請設置策略:選擇要備份的內容、指定存儲選項並應用計劃。

做好備份:打破神話以慶祝節日

與此同時,由於服務器數量龐大,包括 Windows 和 Linux/Unix 上的數據庫、郵件系統、虛擬機集群和文件共享,仍有大量工作要做。 保持備份系統運行的員工不會閒著。

為了慶祝這個節日,我祝愿所有管理員擁有堅強的神經、清晰的動作和無限的備份存儲空間!

來源: www.habr.com

添加評論