写点什么

分布式系统架构 7:本地缓存

  • 2025-01-18
    福建
  • 本文字数:1504 字

    阅读完需:约 5 分钟

1.引入缓存的影响


我们在开发时,用到缓存的情况,无非就是为了减少客户端对相同资源的重复请求,降低服务器的负载压力。引入缓存后,既有好处也有坏处


引入缓存负面影响:


  • 开发角度,增加了系统复杂度,需考虑缓存失效、更新、一致性问题

  • 运维角度,缓存会掩盖一些缺陷问题

  • 安全角度,缓存可能泄密某些保密数据


引入缓存的理由:


  • 为了缓解 CPU 压力,将实时计算运行结果存储起来,节省 CPU 压力

  • 为了缓解 I/O 压力,将原本对网络、磁盘的访问改为对内存的访问


2.缓存的属性


选择缓存时,主要考虑吞吐量、命中率、扩展功能、分布式支持。 前 3 个这篇文章会讲,下一篇再讲分布式缓存


2.1 吞吐量


并发场景下,每秒操作数 OPS,反映了缓存的工作效率


如 Java8 并发包的 ConcurrentHashMap,线程安全实现原理是 CAS+synchronized 锁单个元素。但是该类仅有缓存功能,没有命中率、淘汰策略、缓存统计等功能


并发场景下,不可避免的会有读写数据带来的状态竞争问题,当前有 2 种处理套路:


  • 以 Guava Cache 为代表的同步处理机制:在访问缓存数据时,一并完成缓存淘汰、统计、失效等状态变更操作,通过分段加锁等优化手段来尽量减少数据竞争。

  • 以 Caffeine 为代表的异步日志提交机制:参考经典的数据库设计理论,把对数据的读、写过程看作是日志(即对数据的操作指令)的提交过程。


Caffeine 使用了环形缓冲区来记录状态变动日志,为进一步减少数据竞争,Caffeine 给每个线程都设置了专用的环形缓冲区,如下是 Wikipedia 上的环形缓冲示意:



环形缓冲区结构中,读取和写入是一起进行的,只要读取指针不落后于写指针一圈,这个操作可以永久进行下去,容纳无限多的新字符。

如果不满足,则必须阻塞写指针,等待读取清空缓冲区


2.2 命中率与淘汰策略


缓存的容量是有限的,也因此需要自动地实现淘汰低价值目标,也就是缓存淘汰策略


主要实现方案有三种:


第一种:FIFO(First In First Out)


优先淘汰最早进入被缓存的数据。FIFO 的实现十分简单,但一般来说,越是频繁被用到的数据,往往越会早早地被存入缓存之中。


所以这种淘汰策略,很可能会大幅降低缓存的命中率


第二种:LRU(Least Recent Used)


优先淘汰最久未被使用访问过的数据。LRU 通常会采用 HashMap 加 LinkedList 的双重结构(如 LinkedHashMap)来实现。每次缓存命中时,将命中对象调整到 LinkedList 的头部,每次淘汰从链表尾部清理


存在问题:如果热点数据一段时间没被访问,就会被淘汰;


第三种:LFU(Least Frequently Used)


优先淘汰最不经常使用的数据。LFU 会给每个数据添加一个访问计数器,每访问一次就加 1,当需要淘汰数据的时候,就清理计数器数值最小的那批数据。


缺点:每个数据都需要维护计数器,不便于处理随时间变化的热点数据


以上只是列了三种基础的淘汰策略,实际 Caffeine 官方还制定了两种高级淘汰策略:ARC(Adaptive Replacement Cache)和 LIRS(Low Inter-Reference Recency Set),更复杂的淘汰策略都是为了提高命中率的。


3.扩展功能


缓存不是只实现一个 Map 接口就可以的,还需要一些额外的功能,下面列出缓存的扩展功能:


  • 加载器:从被动放入,变为主动通过加载器去加载指定 Key 值的数据

  • 淘汰策略:支持用户根据需要自行选择淘汰策略

  • 失效策略:缓存数据在超过一定时间内自动失效,Redis 的策略是定时删除、定期删除、惰性删除

  • 事件通知:提供事件监听器,在数据状态变动时进行一些额外操作

  • 并发级别:如 Guava Cache 通过分段加锁来实现缓存的并发设置

  • 容量控制:设置初始容量和最大容量

  • 统计信息:命中率、平均加载时间、自动回收计数等信息

  • 持久化:将缓存数据存储到数据库或者磁盘


4.本地缓存对比



文章转载自:卷福同学

原文链接:https://www.cnblogs.com/dnboy/p/18676548

体验地址:http://www.jnpfsoft.com/?from=001YH

用户头像

还未添加个人签名 2023-06-19 加入

还未添加个人简介

评论

发布
暂无评论
分布式系统架构7:本地缓存_缓存_快乐非自愿限量之名_InfoQ写作社区