背景说明
由于北京二区机房某一个电力模块故障,导致某汽车行业客户一个线上核心Redis数据库异常无法使用,收到大量汽车用户的投诉,需要尽快恢复业务。
客户反馈问题后,大客户售后经理紧急联系数据库技术服务专家,高优先恢复客户的数据库,但是由于客户主备数据库实例都是部署在同一个可用区,并且同时受到了断电的影响,如果要恢复只能通过最近时间点的备份进行恢复,但是会有数据的丢失。还好在通过备份数据恢复数据库后,客户的业务可以正常使用,并没有收到用户的报障。但是,由于整个断电时间比较长,对客户业务的影响比较严重。
云顾问解决方案
复盘客户的问题发现,其实云顾问的Redis评估项中包含了跨可用区部署的评估,而且每周还会发送数据库的隐患报告给客户,但是客户认为已经是主备架构的数据库,就没有去考虑跨区的部署。经过和客户沟通,我们会协助客户对核心数据库进行重点解读,并推动客户尽快去整改,避免类似问题发生。