一个简单的命令输入错误是如何摧毁Amazon S3和互联网的一大块
发布时间:2022-08-12 07:55:12 385
相关标签: # 服务器# 数据# 服务器

亚马逊周四承认,在该公司计费系统的例行调试过程中,一个输入错误的命令导致亚马逊网络服务(AWS)的一些服务器在周二中断了5个小时。
这个问题导致数万个网站和服务完全无法使用,而其他网站则显示了破损的图片和链接,这让全世界的在线用户感到困惑。
受干扰影响的网站和服务包括Quora、Slack、Medium、Giphy、Trello、Splitwise、Soundcloud和IFTTT等。
下面是发生的事情
周二上午,亚马逊简单存储服务(Amazon Simple Storage Service,S3)团队的成员正在调试S3云存储计费系统。作为该过程的一部分,该团队需要让一些计费服务器离线,但不幸的是,它最终关闭了一大组服务器。
“不幸的是,该命令的一个输入输入错误,并且删除了比预期更大的一组服务器,”亚马逊说。“意外删除的服务器支持另外两个S3子系统。”哎呀。至于为什么重启某些服务的时间比预期的要长,亚马逊表示,它的一些服务器已经“很多年”没有重启了。
由于S3系统在过去几年中经历了巨大的增长,“重新启动这些服务并运行必要的安全检查以验证元数据的完整性的过程花费了比预期更长的时间”。
该公司对客户所面临的不便表示歉意,并承诺将实施新的保障措施。
亚马逊表示,由于这起事件,该公司正在做出“几项改变”,包括采取措施防止错误输入在未来引发此类问题。
导致本周互联网中断的打字错误还破坏了AWS服务健康仪表板,因此该公司不得不使用其Twitter帐户向客户通报事件的最新情况。
因此,亚马逊也在改变AWS服务健康仪表板的管理控制台,以便它可以在多个地区运行。
特别声明:以上内容(图片及文字)均为互联网收集或者用户上传发布,本站仅提供信息存储服务!如有侵权或有涉及法律问题请联系我们。
举报