准备就绪的备份:打破神话以纪念假期

准备就绪的备份:打破神话以纪念假期

备份并不是每个熨斗都大喊大叫的时髦技术之一。 它必须在任何严肃的公司中,仅此而已。 我们在银行中备份数千台服务器 - 这是一项复杂而有趣的工作,其中的一些微妙之处,以及对备份的典型误解,只是想被告知。

我研究这个主题已经将近 20 年,其中最近 2 年是在 Promsvyazbank。 在实践的一开始,我几乎是手动备份,使用简单复制文件的脚本。 然后 Windows 中出现了方便的工具:用于准备文件的 Robocopy 实用程序和用于复制的 NT Backup。 直到那时才出现专门软件的时代,主要是 Veritas Backup Exec,现在称为 Symantec Backup Exec。 所以我很早就熟悉备份了。

简单来说,备份就是保留一份数据(虚拟机、应用程序、数据库和文件)的副本,以备不时之需。 每种情况通常都表现为硬件或逻辑故障并导致数据丢失。 备份系统的目的是减少信息丢失。 硬件故障,例如,数据库所在的服务器或存储出现故障。 逻辑——这是部分数据的丢失或改变,包括由于人为因素:他们不小心删除了一个表、文件,启动了一个歪曲的脚本来执行。 监管机构还要求长期存储某种类型的信息,例如长达数年。

准备就绪的备份:打破神话以纪念假期

备份的最典型用途是恢复已保存的数据库副本,用于部署各种测试系统,为开发人员克隆。

关于备份有一些典型的误区,早就该破除了。 这是其中最著名的。

误区 1. 备份一直只是安全或存储系统中的一个小功能

备份系统仍然是一类独立的解决方案,而且非常独立。 他们有太多的工作要做。 事实上,它们是数据完整性的最后一道防线。 因此,备份会按照自己的节奏和时间表进行。 为服务器生成每日报告,有些事件充当监控系统的触发器。

准备就绪的备份:打破神话以纪念假期

此外,访问备份系统的角色模型允许您将部分权限委托给目标系统的管理员来管理备份。

误区二:有了RAID,就不需要备份了。

准备就绪的备份:打破神话以纪念假期

毫无疑问,RAID阵列和数据复制是保护信息系统免受硬件故障影响的好方法,如果你有一台备用服务器,你可以在主机出现故障时快速组织切换到它。

从系统用户所犯的逻辑错误来看,冗余和复制并不能挽救。 这是一个回写备用服务器 - 是的,如果在同步之前检测到错误,它可以提供帮助。 如果错过了那一刻? 只有及时备份才会有所帮助。 如果您知道昨天数据发生了变化,您可以将系统恢复到前天并从中提取必要的数据。 鉴于逻辑错误是最常见的事实,良好的旧备份仍然是一个经过验证的必要工具。

误区 3. 备份是每月进行一次的操作。

备份频率是一个可配置的设置,主要取决于您的备份系统要求。 很有可能找到几乎从不更改且不是特别重要的数据,它们的丢失对公司来说并不重要。
事实上,它们可以每月备份一次,甚至更少。 但更关键的数据会更频繁地保存,这取决于 RPO(恢复点目标)指标,它设置了允许的数据丢失。 这可以是每周一次、每天一次,甚至每小时几次。 我们有来自 DBMS 的这些事务日志。

准备就绪的备份:打破神话以纪念假期

系统投入商用时,备份文件必须经过审批,备份文件应反映要点、更新流程、系统恢复流程、备份存储流程等。

误区 4. 副本的数量不断增长并完全占用所有分配的空间。

备份的保留期有限。 例如,存储一年中所有 365 天的备份是没有意义的。 通常,将每日副本保留 2 周是可以接受的,之后它们会被新副本替换,并且当月第一个制作的版本将长期保存。 反过来,它也会存储一段时间——每个副本都有一个生命周期。

准备就绪的备份:打破神话以纪念假期

有数据丢失保护。 规则适用:在删除备份之前,必须形成下一个备份。 因此,如果备份尚未完成,例如由于服务器不可用,数据将不会被删除。 不仅时间框架受到尊重,而且集合中的副本数量也受到控制。 如果系统设计成有两个完整备份,那么总会有两个,只有当新的第三个写入成功后,旧的才会被删除。 所以备份存档占用体积的增长只与受保护数据量的增长有关,与时间无关。

误区 5. 备份开始 - 一切都挂了

最好这样说:如果一切都挂了,那么管理员的手就不会从那里长出来。 通常,备份的性能取决于许多因素。 例如,关于备份系统本身的速度:磁盘存储、磁带库有多快。 从备份系统服务器的速度来看:是否有时间处理数据,进行压缩和去重。 以及客户端和服务器之间的通信线路的速度。

备份可以转到一个或多个流,具体取决于被备份的系统是否支持多线程。 例如,Oracle DBMS 允许您根据可用处理器的数量分配多个线程,直到传输速率达到网络带宽限制。

如果您尝试备份大量线程,则有可能使正在运行的系统过载,它真的会开始变慢。 因此,选择最佳线程数以确保足够的性能。 如果即使是最轻微的性能下降也很重要,那么当备份不是从战斗服务器而是从其克隆(数据库术语中的备用)执行时,这是一个很好的选择。 此过程不会引导主工作系统。 由于服务器不用于维护,因此可以通过更多流检索数据。

在大型组织中,为备份系统创建一个单独的网络,以便备份不影响生产。 另外,流量可能不是通过网络传输,而是通过SAN传输。
准备就绪的备份:打破神话以纪念假期
我们也尝试随着时间的推移分散负载。 备份主要在非工作时间完成:晚上、周末。 此外,它们不会同时运行。 虚拟机的备份是一种特殊情况。 这个过程对机器本身的性能几乎没有影响,所以备份可以分散在白天,而不是推迟到晚上。 有很多微妙之处,如果你考虑到一切,备份不会影响系统的性能。

误区 6. 启动备份系统——这对你来说是容错

永远不要忘记,备份系统是最后一道防线,这意味着在它前面还要多出XNUMX个系统来保证IT基础设施和企业信息系统的连续性、高可用和容灾能力。

希望备份能够恢复所有数据并快速提升倒下的服务是不值得的。 从备份时刻到故障时刻的数据丢失是有保证的,并且数据可以上传到新服务器数小时(或几天,如果你幸运的话)。 因此,在不将所有内容都转移到备份的情况下创建成熟的容错系统是有意义的。

误区 7. 我设置了一次备份,检查它是否有效。 它仍然只是查看日志

这是最有害的神话之一,您只有在事件中才能意识到它的虚假性。 成功的备份日志并不能保证一切都按预期进行。 提前检查保存的副本的可部署性很重要。 也就是说,在测试环境中启动恢复过程并查看结果。

还有一点关于系统管理员的工作

在手动模式下,已经很久没有人复制数据了。 现代 SRK 几乎可以备份所有内容,您只需正确设置即可。 如果添加了新服务器,请设置策略:选择要备份的内容、指定存储选项并应用计划。

准备就绪的备份:打破神话以纪念假期

同时,由于庞大的服务器群,包括数据库、邮件系统、虚拟机集群、Windows 和 Linux / Unix 上的文件共享,还有很多工作要做。 保持备份系统运行的员工不会闲着。

为了庆祝这个假期,我祝愿所有管理员神经强壮,动作清晰,存储备份的空间无穷无尽!

来源: habr.com

添加评论