冻结还是现代化——假期期间我们会做什么?

冻结还是现代化——假期期间我们会做什么?

元旦假期即将来临,在节假日前夕,又到了回答这个问题的时候了:这段时间IT基础设施会发生什么变化? 没有我们,她将如何生活? 或者也许可以花这段时间对 IT 基础设施进行现代化改造,以便在一年内“一切都将自行运行”?

当IT部门打算与所有人(除了值班的管理员,如果有的话)一起休息时,这种选择需要执行复杂的工作,这可以用通用术语“冻结”来表示。

计划性工作是相反的选择,当抓住机会时,你可以尝试冷静地采取任何必要的行动,例如升级网络和/或服务器设备。

“冻结”

该策略的基本原则是“如果有效,就不要碰它”。

从某个时间点开始,宣布暂停所有工作,
与发展和改进有关。

所有有关改进和开发的问题都被推迟到以后。

工作服务经过彻底测试。

对所有发现的问题进行分析并分为两类:容易解决
并且很难去除。

首先分析容易解决的问题以确定会发生什么
如果? 只有在不存在的情况下才会开展消除它们的工作
潜在的困难。

棘手的问题被记录并记录下来,但它们的实施
推迟到暂停期结束。

在检查之前,制定一个计划,其中输入控制对象,
控制参数和验证方法。

例如,Windows 文件服务器 - 读取事件日志、检查状态
RAID阵列等

网络基础设施有自己的报告工具。

对于有云平台支持的设备 合勤星云 原则上没有特殊问题,系统正常工作,信息已收集。

对于防火墙来说,这种数据收集器的角色可以由服务接管
安全报告器.

对事件正常发展的最大危险发生在被迫暂停的时刻。 当所有的验证工作都已经完成,而周末还没有到来的时候。 有了空闲时间,员工不知道该做什么。 人们注意到,所有噩梦般的问题都会导致一堆愚蠢的、不必要的工作来消除它们,这些问题都是从这句话开始的:“我会尝试......”。

为了填补这段时期的工作停顿,密集的文档工作是完美的。 这样做的好处是双重的:不仅可以让人们的俏皮双手和闪闪发光的眼睛保持忙碌,而且还可以减少发生事件时解决问题所需的时间。

在周末和节假日,员工经常无法工作,因此,如果最新信息仅存储在某人聪明的头脑中,那么就应该将其转移到纸质或文件中。

顺便说一下纸质媒体。 尽管有倒退的指责,但文档的硬拷贝(例如,带有 IP 和 MAC 地址的服务器列表、网络图和各种法规的打印输出)可能非常有用。 特别是启用和禁用的规定,因为情况是:为了正确启动IT基础设施,您需要阅读文档,然后才打开设备,而为了阅读文档,您需要打开设备- 虽然不常见,但确实会发生。 当停电之前,大多数服务器都安全关闭,并且所需的文档存储在其中一台服务器上时,也会发生类似的情况。 当然,这种情况是在最不合时宜的时候出现的。

因此,所有重要的技术细节都被记录下来。 还有什么需要注意的吗?

  • 检查视频监控系统,如有必要,释放系统空间
    视频数据的存储。

  • 检查防盗和火灾警报系统。

  • 检查是否有互联网、域名、网站托管和
    其他云服务。

  • 检查备件(主要是硬盘和 SSD)的可用性,以供更换
    RAID 阵列。

  • 更换组件 (SPTA) 必须存放在靠近其预定设备的地方。 磁盘在城外的远程站点发生故障,而组件存储在中央办公室的情况在除夕夜并不令人愉快。

  • 更新有用员工的联系人列表,包括秘书(办公室经理)、保安主管、供应经理、仓库管理员以及其他与 IT 部门不直接相关但在紧急情况下可能需要的员工。

重要! IT 部门的所有员工都应该拥有所有必要的联系方式。 当人们每次在办公室见面时,当包含电话号码和地址的珍贵文件始终在共享资源上可用时,这是一回事;当员工在办公室无人时尝试远程解决问题时,这是另一回事。

警告! 如果设备位于数据中心,您应该提前保管好允许在周末和节假日访问设备的员工的通行证。

当服务器机房位于租用建筑物内时,情况也是如此。 你很容易遇到这样的情况:按照“最高当局”的意愿,周末和节假日限制出入,保安甚至不允许系统管理员进入大楼。

远程访问功能也值得关注。 如果服务器方面的一切或多或少都清楚 - 在极端情况下,如果 RDP 或 SSH 没有响应 - 有 IPMI(例如,用于 HP 服务器的 iLO 或用于 IBM 的 IMM2),那么对于远程设备,情况就没那么简单了。

在这种情况下,合勤星云用户处于更有利的境地。

例如,如果远程工作时互联网网关配置错误,那么很容易出现这样的情况:“急诊室的钥匙存放在急诊室。” 剩下要做的只有一件事:来到服务器机房、办公室、数据中心、远程站点等。

对我们来说幸运的是,Nebula 总是警告与错误配置相关的可能问题。

最重要的是,云管理使用出站连接,其中一台网络设备本身建立与管理环境的连接。 也就是说,无需在防火墙中“挖洞”,并且重置设置再次关闭这些“洞”的风险也较小。

建议。 在星云中,您可以输入有关设备放置和最重要信息
重要联系人作为注释。

预定工作

新年假期只是普通工人的无条件休息时间。 IT 部门通常被迫利用这些空闲时间作为使基础设施井然有序的唯一机会。

在很多情况下,您不必骑鹿,而是现代化并重建您的 IT 基础设施,并解决平时无法解决的老问题。 比如重新交叉、更换网络基础设施、重建VLAN结构、调整设备配置以提高安全性等等。

我们立即简单回顾一下计划工作准备和实施过程中需要完成的要点。

我们回答这个问题:“为什么?”

说实话,技术工作恰好是为了作秀而进行的,因为这就是管理层想要的。 在这种情况下,最好回到“冻结”项目,“重新绘制”这个过程,以实现可见的现代化。 最后,无论如何,文档都必须更新。

我们彻底记录系统

似乎有一台服务器,但没有人知道上面运行着什么。 有一台旧的 NoName 交换机配置了 VLAN,但如何更改或配置它们是未知和不清楚的。

首先,我们澄清并找出 IT 基础设施的所有技术细微差别,然后才进行计划。

谁是该流程的所有者(资源、服务、服务器、设备、场所等)?

所有者不是被理解为物质所有者,而是过程所有者。 例如,CCTV 部门使用此交换机,在重新配置 VLAN 后,摄像机与用于存储视频数据的服务器失去了联系 - 这在某种程度上是完全糟糕的,如果确实有必要,则必须提供“解决方法”。 “哦,我们不知道这是你的硬件”选项 - 原则上,这种情况不应该发生。

与“冻结”的情况一样,我们“针对所有情况”更新联系人列表,同时我们不会忘记添加流程所有者。

制定行动计划

如果计划只存在于我们的头脑中,那么它是没有用的。 如果是纸质的就更好了。 如果与所有“竞争参与者”(包括安全负责人)仔细制定出方案,必要时安全负责人必须提供上锁办公室的钥匙,那么这已经是一件事情了。

一份有各种老板签名的计划,至少遵循这样的原则:“通知。 同意” - 这将使您避免以下形式的各种问题:“但是没有人
我警告过你! 因此,最后要做好准备,准备好相关文件供签字。

我们为一切、一切、一切创建备份!

同时,备份副本不仅是所有业务数据的副本,还包括配置文件、系统盘的镜像(镜像)等。 我们不会详细讨论复制业务数据和信息以便快速恢复。 如果我们谈论备份的理论和实践,那么本文致力于 一个完整的单独手册

要备份网络设备配置,您可以使用保存配置文件的内置功能和外部服务,例如 Zyxel Nebula 或 合勤科技SecuManager

我们正在研究替代方案

总有一种情况会出现问题,或者由于某种原因你需要偏离主要计划。 例如,同一 CCTV 部门改变了更改交换机上 VLAN 的想法。 你总是需要回答这个问题:“如果呢?”

最后,当一切都解决了,劳动力成本已经评估,工时已经计算,我们已经考虑了为此要求多少休假和奖金——值得回到“为什么?”这一点再次。 并再次批判性地重新考虑计划内容。

我们协调停机时间和工作的其他方面

仅仅警告是不够的。 有必要向管理层和其他员工传达一个清晰的认识:某些事情(甚至整个事情)可能会在一段时间内不起作用。

您需要做好准备,因为某些部分的停机时间可以大大减少
该计划是否必须放弃?

“你想要什么? 你们这些IT专家,只会浪费金钱,还会干扰工作! 很高兴至少在这一点上达成了一致!” ——在回答有关技术工作和现代化的任何问题时,您有时会听到这些争论。

让我们再看一下“为什么?”

我们对这个主题思考了很长时间:“为什么需要这一切?” 以及“这款游戏值得吗?”

只有在经历了所有这些阶段之后,计划是毫无疑问的,才值得
开始实施已构想、计划、准备和
与所有当局一致同意。

-

当然,如此简短的回顾并不能描述所有的生活情况。 但我们真诚地尝试描述一些最常见的时刻。 当然,总会有一些公司和部门考虑到所有这些,编写并批准了特殊文件。

但这并不重要。 还有一些事情很重要。

最主要的是一切都安静地进行,没有中断。 祝您新年成功!

节日快乐,同事们!

有用的链接

  1. 我们的 购物车 对于网络人士来说。 我们帮助、沟通、了解来自合勤的各种好东西。
  2. 合勤官网上的星云云网络.
  3. 官网云CNM SecuReporter分析服务说明
    合勤
    .
  4. 官方的 Cloud CNM SecuManager 管理和分析软件说明
    在线
    合勤
    .
  5. 合勤科技支持园区 EMEA 上的有用资源 -
    星云
    .

来源: habr.com

添加评论