Redis中的HotKey如何解决

对于三高系统，Redis是必须/必需的，当并发高到一定的程度就可能会出现HotKey的问题，今天我们来看下Redis中的HotKey如何解决。

什么是HotKey

在较短的时间内，海量请求访问一个Key，这样的Key就被称为HotKey。

HotKey的危害

海量请求在较短的时间内，访问一个Key，势必会导致被访问的Redis服务器压力剧增，可能会将Redis服务器击垮，从而影响线上业务；
HotKey过期的一瞬间，海量请求在较短的时间内，访问这个Key，因为Key过期了，这些请求会走到数据库，可能会将数据库击垮，从而影响线上业务。（这是缓存击穿问题）

HotKey如何解决

HotKey如何解决是一个比较宽泛的问题，涉及到多个方面，我们一个个来看。

Redis部署

通常来说，Redis有两种集群形式：数据分片集群、主从哨兵集群，其实这两种集群形式或多或少的都一定程度上缓解了HotKey的问题。

主从哨兵集群

如果我们采用单主：

所有的读请求都会打在仅有的一个Redis服务器，都不用管Key是什么，只要并发一高，就会导致Redis服务器压力剧增；
一旦仅有的一个Redis服务器挂了，就没有第二个Redis服务器顶上去了，无法继续提供服务。

如果我们采用主从哨兵集群：

读请求会被分散到Master节点或者多台Slave节点，将请求进行了初步的分散；
Master节点挂了，Slave节点会升级为新的Master节点，继续提供服务。

数据分片集群

Key被分散在了不同的Redis节点，将请求进行了进一步的分散。

如果采用数据分片集群，同时也会部署主从哨兵，这样又有了主从哨兵集群的特性：

读请求会被分散到Master节点或者多台Slave节点，将请求进行了初步的分散；
Master节点挂了，Slave节点会升级为新的Master节点，继续提供服务。

画外音：我以前一直以为大部分公司都已经采用了数据分片集群，其实不然，某个我认为不差钱的公司，在2021年采用的还是主从哨兵集群，出了问题，才转变成数据分片集群，我到我们公司一瞧，才发现我们公司也是主从哨兵集群。

隔离

不同的业务分配不同的Redis集群，不要将所有的业务都“混杂”在一个Redis集群。

只要可以做到集群隔离，在一定程度上就已经避免了HotKey，但是对于超高并发的系统来说，可能还有点不够，所以才会有下面的更进一步的措施。

如何应对HotKey

这个问题，可以拆分成三个子问题：如何发现HotKey、如何通知HotKey的产生、如何对HotKey进行处理。

如何发现HotKey

如何发现HotKey的前提是知道每个Key的使用情况，并进行统计，所以这又拆成了两个更小的子问题：如何知道每个Key的使用情况，如何进行统计。

如何知道每个Key的使用情况

谁最清楚知道每个Key的使用情况，当然是客户端、代理层，所以我们可以在客户端或者代理层进行埋点。

客户端埋点

在客户端请求Redis的代码中进行埋点。

优点：

实现较为简单
轻量级
几乎没有性能损耗

缺点：

进行统一管理较为麻烦：如果想开启或者关闭埋点、上报，会比较麻烦
升级、迭代较为麻烦：如果埋点、上报方式需要优化，就需要升级Jar包，再找一个黄道吉日进行发布
客户端会有一定的压力：不管是实时上报使用情况，还是准实时上报使用情况，都会对客户端造成一定的压力

代理层埋点

客户端不直接连接Redis集群，而是连接Redis代理，在代理层进行埋点。

优点：

客户端没有压力
对客户端完全透明
升级、迭代比较简单
进行统一管理比较简单

缺点：

实现复杂
会有一定的性能损耗：代理层需要转发请求到真正的Redis集群
单点故障问题：需要做到高可用，更复杂
单点热点问题：代理层本身就是一个热点，需要分散热点，更复杂

如何上报每个Key的使用情况

我们在客户端或者代理层进行了埋点，自然是由它们上报每个Key的使用情况，如何上报又是一个小话题。

实时/准实时

实时上报：每次请求，都进行上报
准实时上报：积累一定量或者一定时间的请求，再进行上报

是否预统计

如果采用准实时上报，在客户端或者代理层是否对使用情况进行预统计：

进行预统计：减少上报的数据量，减轻统计的压力，自身会有压力
不进行预统计：上报的数据量比较多，自身几乎没有压力

如何统计

不管如何进行上报，使用情况最终都会通过Kafka，发送到统计端，这个时候统计端就来活了。一般来说，这个时候会借助于大数据，较为简单的方式：Flink开一个时间窗口，消费Kafka的数据，对时间窗口内的数据进行统计，如果在一个时间窗口内，某个Key的使用达了一定的阈值，就代表这是一个HotKey。

如何通知HotKey的产生

经过上面的步骤，我们已经知道了某个HotKey产生了，这个时候就需要通知到客户端或者代理层，那如何通知HotKey的产生呢？

MQ：用MQ通知客户端或者代理层HotKey是什么
RPC/Http：通过RPC/Http通知客户端或者代理层HotKey是什么
配置中心/注册中心指令：既然遇到了HotKey的问题，并且想解决，那基本上是技术实力非常强大的公司，应该有非常完善的服务治理体系，此时，可以通过配置中心/注册中心下发指令到客户端或者代理层，告知HotKey是什么

如何处理HotKey

客户端或者代理层已经知晓了HotKey产生了，就自动开启一定的策略，来避免HotKey带来的热点问题：

使用本地缓存，不至于让所有请求都打到Redis集群
将HotKey的数据复制多份，分散到不同的Redis节点上

在实际开发中，可能在很大程度上，都不会有埋点、上报、统计，通知、策略自动开启，这一套比较完善的Redis HotKey解决方案，我们能做到的就是预估某个Key可能会成为热点，就采用本地缓存复制多份HotKey数据的方式来避免HotKey带来的热点问题。我们还经常会因为偷懒，所以设计了一个大而全的Key，所有的业务都从这个Key中读取数据，但是有些业务只需要其中的一小部分数据，有些业务只需要另外一小部分数据，如果不同的业务读取不同的Key，又可以将请求进行分散，这是非常简单，而且有效的方式。

云数据库Redis 数据库 sql

0 人点赞