近日,欧洲云计算巨头 OVH 位于法国斯特拉斯堡的机房发生严重火灾,该区域总共有 4 个数据中心,发生起火的 SBG2 数据中心被完全烧毁,另有一个数据中心 SBG1 的建筑物部分受损,SBG3 因受到消防保护暂未受影响,以及 SBG4 确认没有受到波及。幸运的是,到目前(发文时间)为止,还没有关于大火造成人员伤亡的报道。
(事件发生几小时后,OVH数据中心页面不再显示SBG2和SBG3)
当地报纸称 115 位消防员投入 6 个小时才将其扑灭。经过长达 6 个小时的持续燃烧,SBG2 内的数据恐怕已经彻底丢失。
(火灾现场)
令人担忧的是,火灾已经导致OVH 部分客户数据完全丢失且无法恢复,大量 OVH 客户的 Web 服务无法访问。受影响的客户包括网络威胁情报公司 Bad Packets、免费国际象棋服务器 http://Lichess.org 的提供者、游戏制造商 Rust等等。
Rust 旗下的游戏工作室 Facepunch Studios 也证实,他们的数据已在这场大火中全部丢失,即使数据中心重新上线后,也无法恢复任何数据。
火灾发生后,CEO 创始人兼董事长 Oktave Klaba发推建议客户启动容灾恢复计划。他表示将在接下来的 1-2 周对服务器进行紧急修复,完全恢复时间待定。
截至发文,并无声明发现火灾确切起因。12日Octave Klaba发布视频道歉并解释可能是因为(不间断电源)UPS电源故障导致的OVH数据中心起火。
OVH是欧洲最大的托管服务提供商之一,除 AWS、微软 Azure 以及 Google Cloud 之外,OVH 堪称全球体量最大的 Web 托管服务商之一,在全球拥有 27 个数据中心,其中 15 个位于欧洲。而这一切发生在 OVH 启动了首次公开募股 (IPO) 计划两天后。
通篇看下来,损失最惨重的莫过于 OVH 和那些损失了所有数据且没做任何灾备的企业,因为数据丢失且无备份的情况下,即代表着业务中断,严重的甚至关门大吉。
当下数字化时代,数据对于企业及个人的重要程度不言而喻。然而上述事件告诉我们,除了做好日常安全预警和处理机制以外,同样也得做好灾备,应对意外来临,哪怕是已经上云。
同创DR专家解读:
云计算自诞生之日起,即具备了先天的优势,诸如降低IT成本、快速交付、弹性扩展等等,人们不再需要担心硬件性能和兼容性的问题,同时基于云计算的服务也顺应潮流被业界广泛认可并迅速推广。
但是这场OVH数据中心发生的火灾也警醒了我们,云服务与所有技术一样,有利也有弊,如果企业和云服务提供商没有充分从灾难恢复和业务连续性的角度去思考安全问题,一旦发生类似灾难性事件时,那么放在云上的数据和业务系统都会受到牵连,甚至全部丢失。
要做到未雨绸缪,防微杜渐,完善灾备与业务连续性体系建设,同时配备合理监控手段,及时响应,做好应急处置。无论是否已经上云,都应重视这个问题。
云服务商虽然可以利用规模效应及成熟的技术为企业提供业务运行的基础环境保障,但是对于存在行业监管,有合规压力的企业,云服务商这方面的能力上就略显不足,通过与专业的BCM和DR公司进行合作会是个不错的选择。能够高效的帮助企业完成业务梳理、灾备策略规划、合规建设、应急演练和培训等工作。
提升环境监控的颗粒度和范围对于及时准确的判断类似火灾这种严重事件非常关键。监控工具搜集来自物理探针和软件探针的各类信息,通过手工或者人工智能技术对各类信息中的内容进行筛选分析,最终以显形的方式展现出来。
总之,企业时刻需要具备防患意识,通过与专业的灾备公司合作满足行业合规要求,同时辅以专业的灾备平台软件帮助企业简化业务连续性和灾备管理流程、降低整体成本、提升用户处置应急事件的综合能力,帮助企业在业务永续的道路上一路向前。
参考资料:
网友评论