写点什么

聊聊 Redis 内存淘汰策略

发布于: 2 小时前
聊聊 Redis 内存淘汰策略

文章首发于公众号 “蘑菇睡不着”❞

前情回顾

《源码级别了解Redis持久化》

《聊聊Redis过期键删除策略》

《Redis数据结构详解》

《超详细Redis五种数据结构底层实现》


这一期咱们一起来看看 Redis 的内存淘汰策略~

为什么要有内存淘汰机制

  大家都知道 Redis 中的键会设置过期时间,当到达过期时间时会通过一定策略清除对应 key,但是 redis 内存是由上限的,当达到内存上限时,就要通过一定策略淘汰掉相应 kv 键值对。

Redis 内存上限

maxmemory 配置选项使用来配置 Redis 的存储数据所能使用的最大内存限制。可以通过在内置文件 redis.conf 中配置,也可在 Redis 运行时通过命令 CONFIG SET 来配置。例如,我们要配置内存上限是 100M 的 Redis 缓存,那么我们可以在 redis.conf 配置如下:

maxmemory 100mb
复制代码

设置 maxmemory 为 0 表示没有内存限制。在 64-bit 系统中,默认是 0 无限制,但是在 32-bit 系统中默认是 3GB。

当存储数据达到限制时,Redis 会根据情形选择不同策略,或者返回 errors(这样会导致浪费更多的内存),或者清除一些旧数据回收内存来添加新数据。

Redis 内存淘汰策略

  • noenviction:不清除数据,只是返回错误,这样会导致浪费掉更多的内存,对大多数写命令(DEL 命令和其他的少数命令例外)

  • allkeys-lru:从所有的数据集中挑选最近最少使用的数据淘汰,以供新数据使用

  • volatile-lru:从已设置过期时间的数据集中挑选最近最少使用的数据淘汰,以供新数据使用

  • allkeys-random:从所有数据集中任意选择数据淘汰,以供新数据使用

  • volatile-random:从已设置过期时间的数据集中任意选择数据淘汰,以供新数据使用

  • volatile-ttl:从已设置过期时间的数据集中挑选将要过期的数据淘汰,以供新数据使用

  • volatile-lfu:从所有配置了过期时间的键中淘汰使用频率最少的键

  • allkeys-lfu:从所有键中淘汰使用频率最少的键

回收的过程

理解回收过程是运作流程非常的重要,回收过程如下:

  • 一个客户端运行一个新命令,添加了新数据。

  • Redis 检查内存使用情况,如果大于 maxmemory 限制,根据策略来回收键。

  • 一个新的命令被执行,如此等等。

我们添加数据时通过检查,然后回收键以返回到限制以下,来连续不断的穿越内存限制的边界。

如果一个命令导致大量的内存被占用(比如一个很大的集合保存到一个新的键),那么内存限制很快就会被这个明显的内存量所超越。

近似 LRU 算法

Redis 的 LRU 算法不是一个严格的 LRU 实现。这意味着 Redis 不能选择最佳候选键来回收,也就是最久未被访问的那些键。相反,Redis 会尝试执行一个近似的 LRU 算法,通过采样一小部分键,然后在采样键中回收最适合(拥有最久访问时间)的那个。

然而,从 Redis3.0 开始,算法被改进为维护一个回收候选键池。这改善了算法的性能,使得更接近于真实的 LRU 算法的行为。Redis 的 LRU 算法有一点很重要,你可以调整算法的精度,通过改变每次回收时检查的采样数量。

这个参数可以通过如下配置指令:

maxmemory-samples 5
复制代码

Redis 没有使用真实的 LRU 实现的原因,是因为这会消耗更多的内存。然而,近似值对使用 Redis 的应用来说基本上也是等价的。

LFU

LFU (Least frequently used) 「最不经常使用」算法。而 LRU 是「最近最少使用」算法。

从 Redis 4.0 开始,可以使用 LFU 过期策略。这种模式在某些情况下可能会更好(提供更好的命中率/未命中率),因为使用 LFU Redis 会尝试跟踪项目的访问频率,因此很少使用的项目会被淘汰,而经常使用的项目有更高的机会留在内存中。

那为什么会出现 LFU 算法那?大家请看下面的场景:

A - A - A - - - A - A -A - - -B - - - - B - - B - - - - - - B
复制代码

如果是 「LRU」 算法 那么会淘汰 A,因为 B 是最近使用的,但是很明显 A 的使用频率是最高的,理应留下 A,所以 「LFU」 算法应运而生。(淘汰最少使用的 key)

LFU 把原来的 key 对象的内部时钟的 24 位分成两部分,前 16 位还代表时钟,后 8 位代表一个计数器, 称为「Morris 计数器」。后 8 位表示当前 key 对象的访问频率,8 位只能代表 255,但是 redis 并没有采用线性上升的方式,而是通过一个复杂的公式,通过配置两个参数来调整数据的递增速度。

下图从左到右表示 key 的命中次数,从上到下表示影响因子,在影响因子为 100 的条件下,经过 10M 次命中才能把后 8 位值加满到 255.

这个参数是可配置的的,通过这个:

lfu-log-factor 10
复制代码

「上说的是计数器的增长,那么什么情况削减那?」

默认是 如果一个 key 每一分钟没使用,「Morris 计数器」 就削减 1. 这个也可以通过下面进行配置:

lfu-decay-time 1
复制代码

「有个问题就是,新的 key 怎么办,岂不是上来就被淘汰?」

为了避免这种问题 Redis 默认情况下新分配的 key 的后 8 位计数器的值为 5,防止因为访问频率过低而直接被删除。

总结

Redis 为了避免内存超出容量,使用特定的内存淘汰策略来释放内存,主要思想是 LRU 和 Redis 4.0 推出的 LFU 算法。LRU 是最近最少使用算法,LFU 是最少使用算法。


更多精彩内容,微信搜索 “蘑菇睡不着”


「如果觉得对您有帮助,麻烦帮忙点个赞,你的支持是我创作最大的动力」


你越主动就越主动,我们下期见~

发布于: 2 小时前阅读数: 3
用户头像

还未添加个人签名 2020.11.12 加入

还未添加个人简介

评论

发布
暂无评论
聊聊 Redis 内存淘汰策略