系统管理员作为濒危物种的史诗

世界各地的系统管理员,祝贺您的专业假期!

我们已经没有系统管理员了(好吧,差不多)。 然而,关于他们的传说却历历在目。 为了庆祝这个节日,我们准备了这部史诗。 亲爱的读者,放心吧。

系统管理员作为濒危物种的史诗

曾几何时,Dodo IS 的世界着火了。 那段至暗时刻,我们系统管理员的主要任务就是多活一天,不哭。

很久以前,程序员写代码又少又慢,每周只在 prod 上发布一次。 所以问题每 XNUMX 天只出现一次。 但后来他们开始编写更多代码并更频繁地发布代码,问题开始增加,有时一切都开始崩溃,回滚变得更糟。 系统管理员深受其害,但容忍了这场闹剧。

晚上他们坐在家里,心中充满忧虑。 每次它发生时“它从未发生过,监控再次发出求救信号:伙计,世界着火了!”。 然后我们的系统管理员穿上红色雨衣,在绑腿上穿短裤,在额头上卷曲,飞去拯救渡渡鸟世界。

注意,稍微解释一下。 在 Dodo IS 中从来没有维护硬件的传统系统管理员。 我们立即在 Azure 云上取得进展。

他们做了什么:

  • 如果有东西坏了,他们会把它修好;
  • 专家级别的服务器;
  • 负责 Azure 中的虚拟网络;
  • 负责低级的事情,例如,组件的交互(*窃窃私语*,有时他们不会四处翻找);
  • 服务器重新连接;
  • 和许多其他野生动物。

基础架构工程师团队(我们称其为系统管理员)的生活就是灭火和不断破坏测试台。 他们生活并感到悲伤,然后他们决定思考:为什么情况如此糟糕,或者我们可以做得更好? 比如,我们不会把人分为程序员和系统管理员吗?

任务

给定: 有一个系统管理员,他在他的职责范围内有服务器,一个将他连接到其他服务器的网络,基础设施级程序(托管应用程序的网络服务器,数据库管理系统等)。 并且有一个程序员,其职责范围是工作代码。

还有一些东西在交界处。 这是谁的责任?

通常,我们的系统管理员和程序员就在这个交界处相遇,然后开始:

“伙计们,什么都行不通,可能是因为基础设施。
- 伙计,不,它在代码中。

一天这时,他们之间开始长出一道篱笆,他们高兴地通过篱笆扔便便。 这个任务,就像一坨便便,被从栅栏的一侧扔到另一侧。 与此同时,没有人接近解决这一局面。 悲伤的笑脸。

几年前在谷歌,当他们想到不交换任务,而是做一件共同的事情时,一缕阳光划破了阴沉的天空。

但是,如果我们将一切都描述为代码呢?

2016 年,谷歌发布了一本名为《站点可靠性工程》的书,讲述了系统管理员角色的转变:从魔法大师到软件和自动化使用方面的形式化工程方法。 他们自己经历了所有的荆棘和障碍,掌握了窍门并决定与世界分享。 这本书在公共领域 这里.

这本书包含简单的事实:

  • 做任何事情都像代码一样好;
  • 使用工程方法 - 很好;
  • 做好监控是好的;
  • 如果服务没有明确的日志记录和监控,则阻止它被发布也很好。

我们的 Gleb 阅读了这些做法(),然后我们走了。 实施! 现在我们正处于过渡阶段。 SRE 团队成立(有 6 名现成的专家,还有 6 名正在入职)并准备好改变完全由代码组成的世界。

我们创建基础设施的方式使开发人员能够管理他们的环境并完全独立地与 SRE 协作。

王而不是结论

系统管理员是一个有价值的职业。 但是系统部分的知识还需要出色的软件工程技能。

系统变得越来越简单,对管理铁服务器的超级独特知识的需求每年都在减少。 云技术正在取代对这些知识的需求。

在不久的将来,一名优秀的系统管理员将必须具备良好的软件工程技能。 更好的是,他应该在这方面有很好的技能。

没有人知道如何在未来发生之前预测未来,但我们相信,随着时间的推移,想要增加不断膨胀的系统管理员人员的公司会越来越少。 当然,虽然粉丝会留下来。 今天骑马的人很少,大多是用汽车,虽然也有情人……

祝大家系统管理员日快乐,给大家写代码!

来源: habr.com

添加评论