Redis键过期策略、内存淘汰策略详解

2022-11-30 14:53:21 浏览数 (1)

1 设置带过期时间的 key

代码语言:javascript复制
# 时间复杂度:O(1),最常用方式
expire key seconds

# 字符串独有方式
setex(String key, int seconds, String value)

除了string独有设置过期时间的方法,其他类型都需要依靠expire方法设置时间,若:

  • 未设置时间,则缓存永不过期
  • 设置过期时间,但之后又想让缓存永不过期,使用persist方法。

设置key的过期时间。超时后,将会自动删除该key。在Redis的术语中一个key的相关超时是volatile的。

超时后只有对key执行DEL、SET、GETSET时才会清除。所以,从概念上讲,所有改变key而不用新值替换的所有操作都将保持超时不变。 例如,使用 INCR 递增key的值,执行 LPUSH 将新值推到 list 中或用 HSET 改变hash的field,这些操作都使超时保持不变。

  • 使用 PERSIST 命令可以清除超时,使其变成一个永久key
  • keyRENAME 命令修改,相关的超时时间会转移到新key
  • keyRENAME 命令修改,比如原来就存在 Key_A,然后调用 RENAME Key_B Key_A 命令,这时不管原来 Key_A 是永久的还是设为超时的,都会由Key_B的有效期状态覆盖

注意,使用非正超时调用 EXPIRE/PEXPIRE 或具有过去时间的 EXPIREAT/PEXPIREAT 将导致key被删除而不是过期(因此,发出的key事件将是 del,而不是过期)。

1.1 刷新过期时间

对已经有过期时间的key执行EXPIRE操作,将会更新它的过期时间。有很多应用有这种业务场景,例如记录会话的session。

1.2 Redis 之前的 2.1.3 的差异

在 Redis 版本之前 2.1.3 中,使用更改其值的命令更改具有过期集的密钥具有完全删除key的效果。由于现在修复的复制层中存在限制,因此需要此语义。

EXPIRE 将返回 0,并且不会更改具有超时集的键的超时。

1.3 返回值

  • 1 如果成功设置过期时间。
  • 0 如果key不存在或者不能设置过期时间。

1.4 示例

假设有一 Web 服务,对用户最近访问的最新 N 页感兴趣,这样每个相邻页面视图在上一个页面之后不超过 60 秒。从概念上讲,可以将这组页面视图视为用户的导航会话,该会话可能包含有关ta当前正在寻找的产品的有趣信息,以便你可以推荐相关产品。

可使用以下策略轻松在 Redis 中对此模式建模:每次用户执行页面视图时,您都会调用以下命令:

代码语言:javascript复制
MULTI
RPUSH pagewviews.user:<userid> http://.....
EXPIRE pagewviews.user:<userid> 60
EXEC

如果用户空闲超过 60 秒,则将删除该key,并且仅记录差异小于 60 秒的后续页面视图。 此模式很容易修改,使用 INCR 而不是使用 RPUSH 的列表。

1.5 带过期时间的 key

通常,创建 Redis 键时没有关联的存活时间。key将永存,除非用户以显式方式(例如 DEL 命令)将其删除。 EXPIRE 族的命令能够将过期项与给定key关联,但代价是该key使用的额外内存。当key具有过期集时,Redis 将确保在经过指定时间时删除该key。 可使用 EXPIRE 和 PERSIST 命令(或其他严格命令)更新或完全删除生存的关键时间。

1.6 过期精度

在 Redis 2.4 中,过期可能不准确,并且可能介于 0 到 1 秒之间。 由于 Redis 2.6,过期误差从 0 到 1 毫秒。

1.7 过期和持久化

过期信息的键存储为绝对 Unix 时间戳(Redis 版本 2.6 或更高版本为毫秒)。这意味着即使 Redis 实例不处于活动状态,时间也在流动。 要使过期工作良好,必须稳定计算机时间。若将 RDB 文件从两台计算机上移动,其时钟中具有大 desync,则可能会发生有趣的事情(如加载时加载到过期的所有key)。 即使运行时的实例,也始终会检查计算机时钟,例如,如果将一个key设置为 1000 秒,然后在将来设置计算机时间 2000 秒,则该key将立即过期,而不是持续 1000 秒。

2 Redis的key过期策略

  • 被动方式 - 惰性删除
  • 主动方式 - 定期删除

为保证 Redis 的高性能,所以不会单独安排一个线程专门去删除。

2.1 惰性删除

key过期时不删除,每次获取key时,再去检查是否过期。若过期,则删除,返回null。

2.1.1 优点

删除操作只发生在取key时,且只删除当前key,所以对CPU时间占用较少。此时删除已非做不可,毕竟若还不删除,就会获取到已过期key。

当查询该key时,Redis再很懒惰地检查是否删除。这和 Spring 的延迟初始化有着异曲同工之妙。

2.1.2 缺点

但这是不够的,因为有过期key,永远不会再访问。若大量key在超出TTL后,很久一段时间内,都没有被获取过,则可能发生内存泄露(无用垃圾占用了大量内存)。

无论如何,这些key都应过期,因此还需要定期 Redis 在具有过期集的key之间随机测试几个key。已过期的所有key将从key空间中删除。

定时删除

在设置key的过期时间的同时,为该key创建一个定时器,让定时器在key的过期时间来临时,对key进行删除。

优点

保证内存被尽快释放

缺点

  • 若过期key很多,删除这些key会占用很多的CPU时间,在CPU时间紧张的情况下,CPU不能把所有的时间用来做要紧的事儿,还需要去花时间删除这些key
  • 定时器的创建耗时,若为每一个设置过期时间的key创建一个定时器(将会有大量的定时器产生),性能影响严重

所以没人用

2.2 定期删除

每隔一段时间执行一次删除过期key操作。

优点:

  • 通过限制删除操作的时长和频率,来减少删除操作对CPU时间的占用–处理"定时删除"的缺点
  • 定期删除过期key–处理"惰性删除"的缺点

缺点

  • 在内存友好方面,不如"定时删除"
  • 在CPU时间友好方面,不如"惰性删除"

难点

  • 合理设置删除操作的执行时长(每次删除执行多长时间)和执行频率(每隔多长时间做一次删除)(这个要根据服务器运行情况来定了)

具体来说,如下 Redis 每秒 10 次:

  1. 测试 20 个带有过期的随机键
  2. 删除找到的所有已过期key
  3. 如果超过 25% 的key已过期,从步骤 1 重新开始

这是一个微不足道的概率算法,假设我们的样本代表整个key空间,继续过期,直到可能过期的key百分比低于 25%。 这意味着在任何给定时刻,使用内存的已过期的最大键量等于最大写入操作量/秒除以 4。

Redis采用的过期策略

惰性删除 定期删除。

惰性删除流程

在进行get或setnx等操作时,先检查key是否过期:

  • 若过期,删除key,然后执行相应操作
  • 若没过期,直接执行相应操作

定期删除流程

简单而言,对指定个数个库的每一个库随机删除小于等于指定个数个过期key。

  • 遍历每个数据库(就是redis.conf中配置的"database"数量,默认为16)
  • 检查当前库中的指定个数个key(默认是每个库检查20个key,注意相当于该循环执行20次,循环体时下边的描述)
  • 如果当前库中没有一个key设置了过期时间,直接执行下一个库的遍历
  • 随机获取一个设置了过期时间的key,检查该key是否过期,如果过期,删除key
  • 判断定期删除操作是否已经达到指定时长,若已经达到,直接退出定期删除。

注意

  • 对于定期删除,在程序中有一个全局变量current_db来记录下一个将要遍历的库,假设有16个库,我们这一次定期删除遍历了10个,那此时的current_db就是11,下一次定期删除就从第11个库开始遍历,假设current_db等于15了,那么之后遍历就再从0号库开始(此时current_db==0)

由于在实际中并没有操作过定期删除的时长和频率,所以这两个值的设置方式作为疑问。

RDB对过期key处理

过期key对RDB没有任何影响。

  • 从内存数据库持久化数据到RDB文件
    • 持久化key之前,会检查是否过期,过期的key不进入RDB文件
  • 从RDB文件恢复数据到内存数据库
    • 数据载入数据库之前,会对key先进行过期检查,如果过期,不导入数据库(主库情况)

AOF处理过期key

过期key对AOF没有任何影响。

从内存数据库持久化到AOF文件

  • 当key过期后,还没有被删除,此时进行执行持久化操作(该key是不会进入aof文件的,因为没有发生修改命令)
  • 当key过期后,在发生删除操作时,程序会向aof文件追加一条del命令(在将来的以aof文件恢复数据的时候该过期的键就会被删掉)

AOF重写

重写时,会先判断key是否过期,已过期的key不会重写到aof文件

2.3 在复制链路和 AOF 文件中处理过期的方式

为了在不牺牲一致性的情况下获得正确行为,当key过期时,DEL 操作将同时在 AOF 文件中合成并获取所有附加的从节点。这样,过期的这个处理过程集中到主节点中,还没有一致性错误的可能性。

但是,虽然连接到主节点的从节点不会独立过期key(但会等待来自master的 DEL),但它们仍将使用数据集中现有过期的完整状态,因此,当选择slave作为master时,它将能够独立过期key,完全充当master。

默认每台Redis服务器有16个数据库,默认使用0号数据库,所有的操作都是对0号数据库的操作

代码语言:javascript复制
# 设置数据库数量。默认为16个库,默认使用DB 0,可使用"select 1"来选择一号数据库
# 注意:由于默认使用0号数据库,那么我们所做的所有的缓存操作都存在0号数据库上,
# 当你在1号数据库上去查找的时候,就查不到之前set过的缓存
# 若想将0号数据库上的缓存移动到1号数据库,可以使用"move key 1"
databases 16
  • memcached只是用了惰性删除,而redis同时使用了惰性删除与定期删除,这也是二者的一个不同点(可以看做是redis优于memcached的一点)
  • 对于惰性删除而言,并不是只有获取key的时候才会检查key是否过期,在某些设置key的方法上也会检查(eg.setnx key2 value2:该方法类似于memcached的add方法,如果设置的key2已经存在,那么该方法返回false,什么都不做;如果设置的key2不存在,那么该方法设置缓存key2-value2。假设调用此方法的时候,发现redis中已经存在了key2,但是该key2已经过期了,如果此时不执行删除操作的话,setnx方法将会直接返回false,也就是说此时并没有重新设置key2-value2成功,所以对于一定要在setnx执行之前,对key2进行过期检查)

可是,很多过期key,你没及时去查,定期删除也漏掉了,大量过期key堆积内存,Redis内存殆耗尽! 因此内存满时,还需有内存淘汰机制!这就是 Redis 自己 主动删除 数据了!

3 内存淘汰

3.1 内存淘汰策略

  • 配置项

noeviction(Redis默认策略)

不删除任何东西,只需在写操作中返回错误。即不会继续服务写请求 (但DEL 请求可继续服务),读请求可继续进行。 这保证不会丢数据,但会让线上业务无法持续进行。

  • config.c
代码语言:javascript复制
createEnumConfig("maxmemory-policy", NULL, 
	MODIFIABLE_CONFIG, maxmemory_policy_enum, 
		server.maxmemory_policy, 
			MAXMEMORY_NO_EVICTION, NULL, NULL),

allkeys-random

当内存不足以容纳新写入的数据时,在键空间中,随机移除某key。

但是凭啥随机呢,至少也是把最近最少使用的key删除。

allkeys-lru

当内存不足以容纳新写入数据时,在键空间中,移除最近最少使用的key,没有设置过期时间的 key 也会被淘汰。

allkeys-lfu(Least Frequently Used)

LRU的关键是看页面最后一次被使用到发生调度的时间长短,而LFU关键是看一定时间段内页面被使用的频率

volatile-lru(最常用)

尝试淘汰设置了过期时间的 key,最少使用的 key 优先被淘汰。 没有设置过期时间的 key 不会被淘汰,这样可以保证需要持久化的数据不会突然丢失。 区别于 allkey-lru,这个策略要淘汰的只是过期的 key 集。

volatile-lfu

volatile-random

淘汰的 key 是过期 key 集合中随机的 key。

volatile-ttl

淘汰的策略不是 LRU,而是 key 的剩余寿命 ttl 的值,ttl 越小越优先被淘汰。

volatile-xxx 策略只会针对带TTL的 key 进行淘汰,allkeys-xxx 策略会对所有的 key 进行淘汰。

  • 若只拿 Redis 做缓存,推荐 allkeys-xxx,客户端写缓存时不必携带TTL
  • 若你还想同时使用 Redis 持久化,推荐 volatile-xxx,这样可以保留没有TTL的 key,它们是永久 key 不会被 LRU 淘汰。

数据淘汰策略

  1. volatile-lru:从已设置过期时间的数据集(server.db[i].expires)中挑选最近最少使用的数据淘汰
  2. volatile-ttl:从已设置过期时间的数据集(server.db[i].expires)中挑选将要过期的数据淘汰
  3. volatile-random:从已设置过期时间的数据集(server.db[i].expires)中任意选择数据淘汰
  4. allkeys-lru:从数据集(server.db[i].dict)中挑选最近最少使用的数据淘汰;
  5. allkeys-random:从数据集(server.db[i].dict)中任意选择数据淘汰;
  6. no-enviction(驱逐):禁止驱逐数据。

应用场景

可以充分的利用Redis的特性,大大提高效率。

  • 在主页中显示最新的项目列表 Redis使用的是常驻内存的缓存,速度非常快
    • LPUSH用来插入一个内容ID,作为关键字存储在列表头部
    • LTRIM用来限制列表中的项目数最多为5000 如果用户需要的检索的数据量超越这个缓存容量,这时才需要把请求发送到数据库
  • 删除和过滤 如果一篇文章被删除,可以使用LREM从缓存中彻底清除掉
  • 排行榜及相关问题 排行榜(leader board)按照得分进行排序
    • ZADD命令可以直接实现这个功能
    • ZREVRANGE命令可以用来按照得分来获取前100名的用户
    • ZRANK可以用来获取用户排名,非常直接而且操作容易
  • 按照用户投票和时间排序 排行榜,得分会随着时间变化。 LPUSH和LTRIM命令结合运用,把文章添加到一个列表中 一项后台任务用来获取列表,并重新计算列表的排序,ZADD命令用来按照新的顺序填充生成列表。列表可以实现非常快速的检索,即使是负载很重的站点。
  • 过期处理 使用Unix时间作为关键字,用来保持列表能够按时间排序。对current_time和time_to_live进行检索,完成查找过期项目的艰巨任务。另一项后台任务使用ZRANGE…WITHSCORES进行查询,删除过期的条目。
  • 计数 进行各种数据统计的用途是非常广泛的,比如想知道什么时候封锁一个IP地址 INCRBY命令让这些变得很容易,通过原子递增保持计数 GETSET用来重置计数器 过期属性用来确认一个关键字什么时候应该删除
  • 特定时间内的特定项目 这是特定访问者的问题,可以通过给每次页面浏览使用SADD命令来解决 SADD不会将已经存在的成员添加到一个集合。
  • Pub/Sub 在更新中保持用户对数据的映射是系统中的一个普遍任务。Redis的pub/sub功能使用了SUBSCRIBE、UNSUBSCRIBE和PUBLISH命令,让这个变得更加容易。
  • 队列 在当前的编程中队列随处可见。除了push和pop类型的命令之外,Redis还有阻塞队列的命令,能够让一个程序在执行时被另一个程序添加到队列。

参考

  • https://redis.io/commands#generic

0 人点赞