Redis 为什么这么快?
首先 Redis 是一个使用 ANSI C 编写的、开源的、支持网络的、基于内存的、可选持久化的键值对存储系统。
1 Redis 的发家史
2009 年由 Salvatore Sanfilippo(Redis 之父)发布初始版本
2013 年 5 月之前,由 VMare 赞助
2013 年 5 月-2015 年 6 月,由 Pivotal 赞助
2015 年 6 月起,由 Redis Labs 赞助
根据 db-engines.com 上的排名,到目前为止 Redis 依然是最流行的键值对存储系统。
2 Redis 主要版本
2009 年 5 月发布 Redis 初始版本
2012 年发布 Redis 2.6.0
2013 年 11 月发布 Redis 2.8.0
2015 年 4 月发布 Redis 3.0.0,在该版本 Redis 引入集群
2017 年 7 月发布 Redis 4.0.0,在该版本 Redis 引入了模块系统
2018 年 10 月发布 Redis 5.0.0,在该版本引入了 Streams 结构
2020 年 5 月 2 日发布 6.0.1(稳定版),在该版本中引入多线程、RESP3 协议、无盘复制副本
2022 年 1 月 31 日发布 7.0 RC1,在该版本中主要是对性能和内存进行优化,新的 AOF 模式
3 Redis 有多快?
Redis 中带有一个可以进行性能测试的工具 redis-benchmark,通过这个命令,我们就可以模拟多个客户端同时发起请求的场景,并且可以检测 Redis 处理这些请求所需要的时间。
根据官方的文档,Redis 已经在超过 60000 个连接上进行了基准测试,并且在这些条件下仍然能够维持 50000 q/s。同样的请求量如果打到 MySQL 上,那肯定扛不住,直接就崩掉了。
With high-end configurations, the number of client connections is also an important factor. Being based on epoll/kqueue, the Redis event loop is quite scalable. Redis has already been benchmarked at more than 60000 connections, and was still able to sustain 50000 q/s in these conditions. As a rule of thumb, an instance with 30000 connections can only process half the throughput achievable with 100 connections. Here is an example showing the throughput of a Redis instance per number of connections;
4 Redis 为什么可以这么快?
那是什么原因造就了 Redis 可以具有如此高的性能?主要分为以下几个方面
4.1 基于内存实现
Mysql 的数据存储持久化是存储到磁盘上的,读取数据是内存中如果没有的话,就会产生磁盘 I/O,先把数据读取到内存中,再读取数据。而 Redis 则是直接把数据存储到内存中,减少了磁盘 I/O 造成的消耗。
4.2 高效的数据结构
合理的数据结构,就是可以让你的应用/程序更快。Mysql 索引为了提高效率,选择了 B+树的数据结构。先看下 Redis 的数据结构 &内部编码图:
4.2.1 SDS 简单动态字符串
Redis 没有采用原生 C 语言的字符串类型而是自己实现了字符串结构-简单动态字符串(simple dynamic string)
SDS 与 C 语言字符串的区别:
获取字符串长度:C 字符串的复杂度为 O(N),而 SDS 的复杂度为 O(1)。
杜绝缓冲区溢出(C 语言每次需要手动扩容),如果 C 字符串想要扩容,在没有申请足够多的内存空间下,会出现内存溢出的情况,而 SDS 记录了字符串的长度,如果长度不够的情况下会进行扩容。
减少修改字符串时带来的内存重分配次数
空间预分配,
规则 1:修改后长度< 1MB,预分配同样大小未使用空间,free=len;
规则 2:修改后长度 >= 1MB,预分配 1MB 未使用空间。
惰性空间释放,SDS 缩短时,不是回收多余的内存空间,而是 free 记录下多余的空间,后续有变更,直接使用 free 中记录的空间,减少分配。
4.2.2 embstr & raw
Redis 的字符串有两种存储方式,在长度特别短时,使用 emb 形式存储 (embeded),当长度超过 44 时,使用 raw 形式存储。
为什么分界线是 44 呢?
在 CPU 和主内存之间还有一个高速数据缓冲区,有 L1,L2,L3 三级缓存,L1 级缓存时距离 CPU 最近的,CPU 会有限从 L1 缓存中获取数据,其次是 L2,L3。
L1 最快但是他的存储空间也是有限的,大概 64 字节,抛去对象固定属性占用的空间,以及‘\0’,剩余的空间最多也就是 44 个字节,超过 44 字节 L1 缓存就存不下了。
4.2.3 字典(DICT)
Redis 作为 K-V 型内存数据库,所有的键值就是用字典来存储。字典就是哈希表,比如 HashMap,通过 key 就可以直接获取到对应的 value。而哈希表的特性,在 O(1)时间复杂度就可以获得对应的值。
两个 hashtable 通常情况下只有一个 hashtable 是有值的,另外一个是在进行 rehash 的时候才会用到,在扩容时逐渐的从一个 hashtable 中迁移至另外一个 hashtable 中,搬迁结束后旧的 hashtable 会被清空。
4.2.4 压缩列表(ziplist)
redis 为了节省内存空间,zset 和 hash 对象在数据比较少的时候采用的是 ziplist 的结构,是一块连续的内存空间,并且支持双向遍历
4.2.5 跳跃表
跳跃表是 Redis 特有的数据结构,就是在链表的基础上,增加多级索引提升查找效率。
跳跃表支持平均 O(logN),最坏 O(N)复杂度的节点查找,还可以通过顺序性操作批量处理节点。
4.3 合理的数据编码
Redis 支持多种数据类型,每种基本类型,可能对多种数据结构。什么时候,使用什么样数据结构,使用什么样编码,是 redis 设计者总结优化的结果。
String:如果存储数字的话,是用 int 类型的编码;如果存储非数字,小于等于 39 字节的字符串,是 embstr;大于 39 个字节,则是 raw 编码。
List:如果列表的元素个数小于 512 个,列表每个元素的值都小于 64 字节(默认),使用 ziplist 编码,否则使用 linkedlist 编码
Hash:哈希类型元素个数小于 512 个,所有值小于 64 字节的话,使用 ziplist 编码,否则使用 hashtable 编码。
Set:如果集合中的元素都是整数且元素个数小于 512 个,使用 intset 编码,否则使用 hashtable 编码。
Zset:当有序集合的元素个数小于 128 个,每个元素的值小于 64 字节时,使用 ziplist 编码,否则使用 skiplist(跳跃表)编码
4.4 合理的线程模型
首先是单线程模型-避免了上下文切换造成的时间浪费,单线程指的是网络请求模块使用了一个线程,即一个线程处理所有网络请求,其他模块该使用多线程,仍会使用了多个线程,使用多线程,如果没有一个良好的设计,很有可能造成在多线程数增加的时候前期吞吐率增加,后期吞吐率反而增长没有那么明显了。
多线程的情况下通常会出现共享一部分资源,当多个线程同时修改这一部分共享资源时就需要有额外的机制来进行保障,就会造成额外的开销
另外一点则是 I/O 多路复用模型,在不了解原理的情况下,我们类比一个实例:在课堂上让全班 30 个人同时做作业,做完后老师检查,30 个学生的作业都检查完成才能下课。如何在有限的资源下,以最快的速度下课呢?
第一种:安排一个老师,按顺序逐个检查。先检查 A,然后是 B,之后是 C、D。。。这中间如果有一个学生卡住,全班都会被耽误。这种模式就好比,你用循环挨个处理 socket,根本不具有并发能力。这种方式只需要一个老师,但是耗时时间会比较长。
第二种:安排 30 个老师,每个老师检查一个学生的作业。 这种类似于为每一个 socket 创建一个进程或者线程处理连接。这种方式需要 30 个老师(最消耗资源),但是速度最快。
第三种:安排一个老师,站在讲台上,谁解答完谁举手。这时 C、D 举手,表示他们作业做完了,老师下去依次检查 C、D 的答案,然后继续回到讲台上等。此时 E、A 又举手,然后去处理 E 和 A。这种方式可以在最小的资源消耗的情况下,最快的处理完任务。
多路 I/O 复用技术可以让单个线程高效的处理多个连接请求,而 Redis 使用用 epoll 作为 I/O 多路复用技术的实现。并且,Redis 自身的事件处理模型将 epoll 中的连接、读写、关闭都转换为事件,不在网络 I/O 上浪费过多的时间。
5 使用场景
6 参考文档
DB-Engines Ranking https://db-engines.com/en/ranking
Redis benchmarks https://redis.io/topics/benchmarks/
Redis 中的 IO 多路复用机制 https://www.cnblogs.com/reecelin/p/13538382.html
版权声明: 本文为 InfoQ 作者【京东科技开发者】的原创文章。
原文链接:【http://xie.infoq.cn/article/a39c5e0bdb25d22e2c5788b92】。文章转载请联系作者。
评论