不要再认为 SLA 会拯救你。 需要它来安抚并创造一种虚假的安全感。

不要再认为 SLA 会拯救你。 需要它来安抚并创造一种虚假的安全感。

SLA,也称为“服务级别协议”,是客户与服务提供商之间关于客户将获得的服务的保证协议。 还规定了因供应商过错造成停机的赔偿等。 从本质上讲,SLA 是一种凭证,数据中心或托管提供商可以借助该凭证让潜在客户相信他会以一切可能的方式得到善待。 问题是您可以在 SLA 中编写任何您想要的内容,并且本文档中编写的事件不会经常发生。 SLA 远非选择数据中心的指南,您当然不应该依赖它。

我们都习惯于签署某种施加某些义务的协议。 SLA 也不例外——通常是可以想象到的最不切实际的文档。 唯一可能更无用的是在“商业秘密”概念并不真正存在的司法管辖区中的保密协议。 但问题在于,SLA 并不能帮助客户选择合适的供应商,而只是蒙蔽了双眼。

托管商最常在向公众展示的 SLA 公共版本中写入哪些内容? 嗯,第一行是托管商的“可靠性”一词 - 通常是 98 到 99,999% 的数字。 事实上,这些数字只是营销人员的美丽发明。 曾几何时,当托管还很年轻且昂贵,云只是专家的梦想(以及每个人的宽带接入)时,托管正常运行时间指标非常非常重要。 现在,当所有供应商都使用相同的设备、位于相同的骨干网络并提供相同的服务包时,正常运行时间指标绝对不引人注目。

是否存在“正确”的 SLA?

当然,也有理想版本的SLA,但它们都是非标准文档,由客户和供应商手动注册和缔结。 此外,这种类型的 SLA 通常涉及某种合同工作而不是服务。

好的 SLA 应该包括哪些内容? 简而言之,好的 SLA 是规范两个实体之间关系的文档,它使其中一方(客户)能够最大程度地控制流程。 也就是说,它在现实世界中是如何运作的:有一个文件描述全球交互过程并规范各方之间的关系。 它设定了界限、规则,并且本身就成为双方都可以充分利用的影响力杠杆。 因此,由于正确的 SLA,客户可以简单地强迫承包商按照约定工作,并且它可以帮助承包商消除过度活跃的客户的“需求”,而这些需求在合同中是不合理的。 它看起来像这样:“我们的 SLA 是这样说的,离开这里,我们按照约定做一切。”

也就是说,“正确的 SLA”=“提供服务的适当合同”并提供对情况的控制。 但这只有在“平等”工作时才有可能。

网站上写的和现实中等待的是两件事

总的来说,我们将进一步讨论的一切都是典型的营销技巧和对注意力的考验。

如果我们采用流行的国内托管商,那么一个报价比另一个更好:25/8 支持,服务器正常运行时间 99,9999999% 的时间,至少在俄罗斯有一堆自己的数据中心。 请记住有关数据中心的一点, 我们稍后再讨论这个问题。 与此同时,我们来谈谈理想的容错统计数据,以及当一个人的服务器仍然陷入“0,0000001% 的故障”时所面临的情况。

对于 98% 及以上的指标,任何下降都属于统计错误边缘的事件。 工作设备和连接要么存在,要么不存在。 您可以使用“可靠性”评级为 50%(根据其自己的 SLA)的主机多年而不会出现任何问题,或者您可以使用声称 99,99% 的主机每月“失败”一次,持续几天。

当跌倒的时刻确实到来时(我们提醒您,每个人都有跌倒的一天),那么客户就会面临一个名为“支持”的内部公司机器,并且服务协议和 SLA 就会被曝光。 这是什么意思:

  • 最有可能的是,在停机的前四个小时内,您将无法提供任何东西,尽管一些托管服务商从崩溃那一刻起就开始重新计算资费(赔偿金)。
  • 如果服务器长时间不可用,您可以提交重新计算费率的请求。
  • 前提是该问题是由于供应商的过错造成的。
  • 如果您的问题是由第三方(在高速公路上)引起的,那么似乎“没有人应该受到责备”,问题何时解决就看您的运气了。

然而,重要的是要明白,您永远无法接触到工程团队,大多数情况下您会被第一线支持人员拦住,他们在真正的工程师试图解决问题时与您通信。 听起来很熟悉?

在这里,许多人依赖 SLA,这似乎可以保护您免受此类情况的影响。 但事实上,公司很少超越自己文档的界限,或者能够以最小化自身成本的方式扭转局面。 SLA 的首要任务是消除警惕,并让人们相信,即使出现不可预见的情况,“一切都会好起来的”。 SLA 的第二个目的是传达主要关键点并为服务提供商提供回旋余地,即能够将故障归因于供应商“不负责”的某些事情。

与此同时,大客户实际上根本不关心SLA 范围内的补偿。 “SLA补偿”是在资费范围内按设备停机时间比例退还资金,这永远无法弥补潜在金钱和声誉损失的1%。 在这种情况下,对客户来说,尽快解决问题比某种“资费重新计算”更为重要。

“世界各地有许多数据中心”令人担忧

我们将服务提供商拥有大量数据中心的情况单独分类,因为除了上述明显的通信问题之外,还会出现不明显的问题。 例如,您的服务提供商无权访问“他们的”数据中心。

在我们的上一篇文章中 我们写了关于联属计划的类型并提到了“白标”模型其本质就是打着自己的幌子倒卖他人的能力。 绝大多数声称在许多地区拥有“自己的数据中心”的现代托管服务商都是使用白标模式的经销商。 也就是说,它们在物理上与瑞士、德国或荷兰的条件数据中心无关。

这里发生了极其有趣的碰撞。 您与服务提供商签订的 SLA 仍然有效且有效,但供应商无法以某种方式从根本上影响发生事故时的情况。 他本人依赖于自己的供应商——数据中心,电源架是从数据中心购买并转售的。

因此,如果您不仅看重合同和 SLA 中关于可靠性和服务的优美措辞,而且看重服务提供商快速解决问题的能力,那么您应该直接与设施所有者合作。 事实上,这涉及到与数据中心的直接交互。

当许多 DC 实际上可以属于一家公司时,我们为什么不考虑其他选择呢? 嗯,这样的公司非常非常少。 可以是一、二、三个小型数据中心或一个大型数据中心。 但十几个DC,其中一半在俄罗斯联邦,第二个在欧洲,几乎是不可能的。 这意味着经销商公司的数量比您想象的要多得多。 这是一个简单的例子:

不要再认为 SLA 会拯救你。 需要它来安抚并创造一种虚假的安全感。
估算 Google Cloud 服务数据中心的数量。 欧洲只有六个。 在伦敦、阿姆斯特丹、布鲁塞尔、赫尔辛基、法兰克福和苏黎世。 也就是说,在所有主要高速公路点。 因为数据中心昂贵、复杂,而且是一个非常庞大的项目。 现在请记住莫斯科某个地方的托管公司,“在俄罗斯和欧洲拥有十几个数据中心”。

当然,没有好的供应商在白标计划中拥有合作伙伴,但数量已经足够了,而且他们提供最高水平的服务。 它们使得可以通过同一浏览器窗口同时租用欧盟和俄罗斯联邦的容量,接受卢布付款,而不是外币付款,等等。 但当 SLA 中描述的情况发生时,他们就成为与您完全相同的情况的人质。

这再次提醒我们,如果不了解供应商的组织结构和能力,SLA是没有用的。

其结果是

服务器崩溃总是令人不愉快的事件,它可能发生在任何地方的任何人身上。 问题是你想要对局势有多大的控制力。 现在市场上没有太多的直接容量供应商,如果我们谈论大型参与者,那么相对而言,他们在整个欧洲可以访问的十几个 DC 中只拥有莫斯科某个地方的一个。

在这里,每个客户都必须自己决定:我是立即选择舒适还是花时间和精力在俄罗斯或欧洲可接受的位置寻找数据中心,在那里我可以放置我的设备或购买容量。 对于第一种情况,目前市场上的标准解决方案是合适的。 第二,你将不得不出汗。

首先,需要确定服务卖方是否是设施/数据中心的直接所有者。 许多使用白标模式的经销商会尽力掩饰自己的身份,在这种情况下,您需要寻找一些间接标志。 例如,如果“他们的欧洲 DC”有一些与供应商公司名称不同的特定名称和徽标。 或者如果“合作伙伴”这个词出现在某个地方。 95% 的情况下,合作伙伴 = 白标。

接下来,你需要熟悉公司本身的结构,或者更好的是亲自看看设备。 在数据中心中,游览或至少在自己的网站或博客上发表游览文章的做法并不新鲜(我们写过这样的文章) 时间 и ),他们用照片和详细描述谈论他们的数据中心。

对于许多数据中心,您可以安排亲自参观办公室以及对数据中心进行一次简短的游览。 在那里您可以评估有序程度,也许您将能够与其中一位工程师进行交流。 很明显,如果您需要一台 300 卢布/月的服务器,那么没有人会带您参观生产,但如果您需要大量的容量,那么销售部门很可能会满足您。 例如,我们进行此类游览。

无论如何,应该使用常识和业务需求。 例如,如果您需要分布式基础设施(一些服务器位于俄罗斯联邦,其他服务器位于欧盟),那么使用与使用白标的欧洲 DC 建立合作伙伴关系的托管商的服务会更容易且更有利可图模型。 如果您的整个基础设施将集中在一个点,即一个数据中心,那么值得花一些时间寻找供应商。

因为典型的 SLA 很可能不会帮助您。 但与设施所有者(而不是经销商)合作将大大加快可能问题的解决速度。

来源: habr.com

添加评论