No.173 为什么代理架构常作为缓存实现方案

2022-12-03 09:25:42 浏览数 (1)

引言

本文主要走查了Redis的集群模式的故障发现、故障转移流程。

由于Redis集群模式中存在过高的通信成本。

集群代理模式也常常作为自建缓存集群的方案。

第三部分对常见的缓存代理架构做了简述,文章主要内容有:

一、Redis集群模式的故障发现

二、Redis集群模式的故障转移

三、常见缓存代理架构方案简述

一、Redis集群模式的故障发现

Redis集群模式故障发现过程有主观下线与客观下线。

主观下线简单来说就是我这个节点认为你故障了。

客观下线则是集群中大多数节点认为你故障了。

这些判定与状态的同步均通过Gossip协议PING/PONG来通信。

主观下线流程

  • @1 定时向集群中其他节点发送PING消息
  • @2 超过时间(cluster-node-timeout)未收到接受节点PONG响应消息
  • @3 认为该接受节点存在故障,标记为主观下线状态pfail

客观下线流程

  • @1 Gossip协议PING/PONG通信
    • 携带集群1/10的其他节点状态
    • 当然也包含主观下线节点的信息
  • @2 接受节点维护故障节点下线报告
    • 只处理发送为主节点的请求,从节点不处理
    • 不存在故障节点下线报告,新增下线报告
    • 已存在故障节点下线报告,更新报告时间
  • @3 尝试故障节点的客观下线逻辑
    • 每次收到其他节点的故障状态pfail时,均会尝试客观下线
    • 监测故障下线报告是否过期,过期的报告将被删除
    • 报告时间超过cluster-node-timeout*2未被更新将被移除
    • 下线报告数量小于持有槽主节点的数量的二分之一,退出客观下线
    • 下线报告数量大于持有槽主节点的数量的二分之一,标记客观下线
    • 向集群广播一条fail消息(标记客观下线立即生效、故障从节点发起故障转移流程)

二、Redis集群模式的故障转移

Redis集群模式从节点的作用用于灾备,主节点故障时能够替换顶上去。

Redis的从节点当然也不例外。

  • 多个从节点谁去替换主节点?
  • 选举逻辑以及选举失效是怎么样的?

故障转移流程

从节点中复制的偏移量越大,替换主节点的优先级越高。

从节点获得持有槽的主节点一半以上的选票,可替换为主节点。

从节点向集群广播PONG消息,通知该变更。

三、常见缓存代理架构方案简述

Redis的集群模式客户端直连集群,不需要额外的组件,运维难度较低。

由于集群中每个实例都需要保存路由信息,彼此不断传播通信更新,也造成通信成本进而影响集群规模。

Redis的集群模式也会造成客户端需要重定向,带来复杂性。

因此,缓存代理模式可以解决这种复杂性,当然组件也会增多。

客服端:兼容RESP协议的轻量级客户端。

集群代理:负责域客户端建立连接,以及转发请求到对应的槽位和实例节点。

元数据中心:主要负责存储槽位与实例对应路由信息以及健康检查心跳探测。

集群模式一:集群部署主从架构,需要元数中心负责心跳的健康监测,主从节点的HA,当主节点故障切换从节点接管。

集群模式二:集群部署Raft组,不需要额外的HA心跳监测,集群自闭环,三个节点一组成本较高。

模式一

模式二

兼容RESP协议的轻量级客户端与代理建立长链接。

发送读写请求到代理层,代理根据路由规则将key路由到对应集群的槽位。

管理平台可对元数据信息、槽位分配、代理以及集群部署运维等进行管理。

可视化白屏化对整个集群的监控、告警、大key等水位监控告警。

0 人点赞