一些AWS云服务器遭遇的问题导致互联网的“半壁江山”出现了网页打开缓慢或故障。亚马逊庞大的数据中心网络为众多在线服务和网站提供支持,因此正如我们在之前的AWS故障事件中看到的那样,AWS的任何问题都会产生巨大的连锁效应。许多人在美国东部时间上午10点45分左右开始注意到问题。
虽然一些依赖AWS的受影响服务已经恢复,但互联网的运行仍然比平常要慢一点,而且较不稳定。受故障影响的最重要的软件应用可能是亚马逊员工在使用的那些应用。CNBC指出,亚马逊Flex员工、仓库员工和送货员工在Reddit上纷纷吐槽,声称用来跟踪包裹、告诉他们去哪里以及通常确保物品准时送达的软件应用也随之瘫痪。
有报道称,迪士尼 和Netflix流媒体以及《PUBG》、《英雄联盟》和《Valorant》等游戏出现了故障。我们还注意到访问Amazon.com及亚马逊的其他产品(比如Alexa AI助理、Kindle电子书、亚马逊音乐或Ring安全摄像头)出现了一些问题。
DownDetector网站列出了故障报告急剧增多的服务,涵盖几乎任何知名品牌:Tinder、Roku、Coinbase、Cash App和Venmo,这份名单越来越长。
众多网络管理员报告,连接到亚马逊的实例和控制他们对服务器访问的AWS管理控制台遇到了错误。亚马逊的官方状态页面已更新,附有确认了这次故障的消息。
[太平洋标准时间上午11点26分]我们已看到US-EAST-1区域中多个AWS API受到了影响。该问题还影响了我们的一些监控和事件响应工具,从而延迟了我们提供更新的进度。受影响的服务包括:EC2、Connect、DynamoDB、Glue、Athena、Timestream和Chime以及US-EAST-1的其他AWS服务。
该问题的根本原因是US-EAST-1区域的多个网络设备受到损坏。我们正同时寻求多条缓解路径,已经看到了恢复的一些迹象,但我们目前还无法估计到底何时完全恢复正常。所有AWS区域中控制台的root登录都受到了该问题的影响,但是客户可以使用IAM角色完成身份验证,登录到US-EAST-1以外的控制台。
问题似乎集中在位于弗吉尼亚州的US-EAST-1 AWS区域(该区域为美国东部区的用户提供连接服务),因此其他地方的用户可能不会看到那么多问题;即使你受到了影响,也可能表现为网页打开速度稍慢,原因是网络需要 将你的请求重新路由到其他地方。被要求发表评论时,亚马逊指出关注其状态页面上的更新,更新表明该公司正在“积极努力恢复”。
自2011年以来亚马逊已遭遇了一长串的其他故障事件,包括2020年11月影响了US-EAST-1区域的一起大规模事件:在亚马逊用于实时处理流数据的Kinesis服务遇到问题之后,一大批知名网站和在线服务纷纷瘫痪。
2019年9月,位于北弗吉尼亚州的AWS US-EAST-1数据中心遭遇断电事件,导致没有实际备份来恢复文件的亚马逊客户丢失了数据。
2017年2月,亚马逊的S3(简单存储服务)大规模中断导致数百万个小型或知名网站和应用程序后端宕机,其中包括Adobe的应用程序及服务、Docker、Giphy、Hacker News、IFTTT、Mailchimp、Medium、Quora、Signal、Slack、Trello、Twilio和Twitch。