背景说明
某医疗企业线上APP采用MYSQL数据库,该库只设置了一个RO实例,并没有设置RO组多实例,客户的信息调度全部依赖此库。在某次RO实例发生事务性故障的时没有其他实例可用,导致客户业务APP无法正常使用。当时只能通过腾讯云后台把VIP切换到备库紧急恢复业务,在RO单点实例恢复服务后,再切回到RO的IP, 切换过程会造成闪断。整个故障处理过程持续了23分钟,对客户影响比较大。
云顾问解决方案
为了不让其他客户再遇到类似的情况,避免对客户的业务造成损失,云顾问增加了对RO单点的巡检项,旨在帮助客户提前发现问题,规避问题发生,更好的帮助客户在腾讯云上运行各项业务。
从产品使用上,创建了RO组后,不仅适用于读写分离和一主多从应用场景,也可显著提高用户数据库的读负载能力。RO组可以设置负载均衡和延迟剔除,这样配置同一个RO组内的多个只读实例就可起到容灾的作用。
该客户通过云顾问巡检到有此类风险场景的所有实例,在后来的工作中配置了RO组多实例,到目前为止,没有再出现同样问题。