据 MSPoweruser 报道,微软 Azure 虚拟机服务今天面临长达 6 小时的中断。在 2021 年 10 月 13 日 05:12 UTC 和 11:45 UTC 之间,使用 Windows 虚拟机的 Azure 客户子集在执行服务管理操作时面临问题 —— 如启动、创建、更新、删除。新虚拟机的部署和更新也失败了。基于 Linux 的虚拟机和现有运行的 Windows 虚拟机没有受到这个问题的影响。此外,在创建资源时,对 Windows 虚拟机有依赖性的服务也可能遇到类似的故障。
IT之家获悉,微软公布了这次故障的原因:
“我们发现在服务管理操作过程中的调用是失败的,因为无法查询到所需的工件版本数据。我们的调查集中在后端计算资源提供者(CRP),以确定调用失败的原因,并确定无法从存储库中查询到所需的 VMGuestAgent。VM Guest Agent Extension 发布架构正在被迁移(作为传统服务管理后台系统迁移的一部分)到一个新的平台,该平台利用了最新的 Azure Resource Manager(ARM)功能。
缓解措施。我们通过将适当的扩展标记为正确的预期级别(在这种情况下是公开的)来减轻影响。工程师们主动验证了更新完成后,操作恢复到完全成功率。
接下来的步骤。我们将继续调查,以确定完整的根本原因,并防止未来发生。完整的根本原因分析(RCA)将在 72 小时内公布。”