Facebook 面临历史上最严重的宕机,导致该公司的所有服务(包括 facebook.com、instagram.com 和 WhatsApp)在 6 小时内无法使用 - 从周一 18:39(MSK)到 0:28 (MSK)周二。 故障的根源是管理数据中心之间流量的骨干路由器上的 BGP 设置发生变化,导致 Facebook 数据中心与全球网络其他部分的连接出现级联中断。 从外部来看,所发生的事情就像有人同时断开了所有 Facebook 数据中心的电缆。

有趣的是,该故障导致内部信息系统和通信系统中断,导致大多数远程工作的员工无法连接到基础设施并联系同事,这使得恢复工作变得非常复杂,因为关键网络工程师也在远程工作。 此外,获得物理访问也出现了问题,因为员工身份证和场所的访问控制系统与集中服务绑定并且也停止工作。
此次故障也影响了DNS注册商(Facebook域名由其自身的注册商RegistrarSEC和RegistrarSafe提供服务)与一些大型注册商之间的信息交换系统。 域名包括 GoDaddy 在内的多家域名注册商已将 facebook.com 域名列为待售域名,这引发了新的潜在问题,即域名注册商可能遭到攻击并被查封。
此外,目前尚不清楚对 BGP 设置所做的更改是意外错误还是攻击和恶意活动的结果。 Facebook 在一份已发表的声明中仅声称,目前还没有证据表明用户数据已被泄露。 值得注意的是,巧合的是,在哥伦比亚广播公司频道播出弗朗西斯·豪根关于 Facebook 滥用行为的采访几个小时后,工作就被中断了。
Cloudflare 的一项分析显示,在服务中断期间,指向 Facebook DNS 服务器所在子网的 BGP 路由停止通告,导致无法解析 facebook.com 和 instagram.com 等域名的 IP 地址。这些域名的 TTL(缓存时间)参数被设置为 5 分钟,这使得第三方 DNS 服务器迅速停止提供地址信息。 IP地址 公司继续运营,但如果没有 DNS 和域名映射数据,一切都毫无意义。
来源: opennet.ru
