一文彻底搞透 Redis 的数据类型及具体的应用场景

作者：EquatorCoco

2024-10-24
福建
本文字数：2602 字
阅读完需：约 9 分钟

Redis 提供了丰富的数据类型，每种数据类型都有其独特的存储结构和操作方法，可以满足不同的业务场景需求。下面详细介绍 Redis 支持的主要数据类型及其底层实现，并结合具体的应用场景说明其使用。

1. 字符串（String）

介绍：

Redis 中最基本的键值对类型，键和值都可以是字符串，值的最大限制为 512MB。
String 类型是 Redis 最常用的数据类型，它支持简单的 GET、SET 操作，以及自增、自减、字符串拼接等操作。

典型应用场景：

缓存数据：存储用户登录状态、Token、配置信息等。
计数器：通过 INCR、DECR 实现简单的计数器，比如网站访问量、点赞数等。
分布式锁：结合 SETNX 命令，可以用字符串来实现简单的分布式锁。

底层原理：

Redis 底层对字符串使用的是简单动态字符串（SDS），它不仅是 C 字符串的封装，还加入了长度属性和空间预留等优化策略。SDS 支持二进制安全，可以存储文本和二进制数据。

2. 哈希（Hash）

介绍：

哈希是一个键值对集合，适合存储对象。每个键可以有多个字段，每个字段都有一个值。
操作包括 HSET、HGET、HDEL 等。

典型应用场景：

存储用户信息：如用户 ID 作为键，用户的属性（姓名、年龄、性别等）作为字段，避免将整个用户对象序列化成字符串。
配置项管理：存储配置项，方便根据字段名快速访问和更新某个配置。

底层原理：

哈希使用了两种底层数据结构：小数据量时使用压缩列表（ziplist），大数据量时使用哈希表（hashtable）。压缩列表可以节省内存，但随着哈希表的增长会自动转换为哈希表，保证查询效率。

3. 列表（List）

介绍：

列表是一个双向链表，可以从头部或尾部插入、删除元素，常用命令包括 LPUSH、RPUSH、LPOP、RPOP 等。
Redis 支持阻塞操作，如 BLPOP、BRPOP，在没有元素时可以阻塞等待。

典型应用场景：

消息队列：列表可以作为简单的消息队列，用 LPUSH 将消息放入队列，用 RPOP 或 BRPOP 弹出消息。
任务调度：异步任务分发系统中，可以将任务放入队列中，由多个消费者去消费。

底层原理：

列表采用双向链表（quicklist）实现。对于较短的列表，Redis 会使用压缩列表（ziplist）来节省内存；对于较长的列表，则会采用真正的双向链表来平衡操作的时间复杂度。

4. 集合（Set）

介绍：

集合是无序的、唯一的元素集合，提供类似于数学集合的操作，支持交集、并集、差集等。
常用操作包括 SADD、SREM、SISMEMBER、SMEMBERS、SINTER 等。

典型应用场景：

标签系统：如将用户标签存储为集合，每个集合代表一个用户群体，方便进行集合运算，如找出同时拥有某两个标签的用户。
去重功能：在某些场景下（如热门搜索词、访问日志的去重），可以通过集合的唯一性特性来避免重复数据。

底层原理：

小集合时使用整数集合（intset），大集合时使用哈希表（hashtable）实现。通过哈希表的快速查找特性，可以实现 O(1) 的时间复杂度来判断元素是否存在。

5. 有序集合（Sorted Set）

介绍：

有序集合类似于集合，但每个元素关联一个分数，集合中的元素会按分数排序。支持的操作包括 ZADD、ZRANGE、ZREM、ZREVRANGE、ZCOUNT 等。

典型应用场景：

排行榜：比如游戏中的积分榜，按用户分数进行排名。可以通过 ZADD 添加玩家及其分数，通过 ZRANGE 获取排名。
延迟任务：通过分数设置任务执行的时间，按时间从集合中取出需要执行的任务。

底层原理：

有序集合底层使用的是跳表（Skiplist）和哈希表相结合的数据结构，跳表使得有序集合支持快速的范围查询和插入操作（时间复杂度 O(logN)），而哈希表保证元素的快速定位。

6. 位图（Bitmaps）

介绍：

位图实际上是字符串类型的扩展，可以把字符串看作一系列连续的二进制位，可以对这些二进制位进行位操作。支持的命令有 SETBIT、GETBIT、BITCOUNT、BITOP 等。

典型应用场景：

用户签到系统：用位图存储用户的签到记录，每天对应一个 bit，0 表示未签到，1 表示已签到。
活跃用户统计：通过位图存储某一时间段内用户是否活跃，快速统计某天有多少活跃用户。

底层原理：

位图的底层存储是 Redis 的字符串结构，但位操作是直接针对每个二进制位，因此能够在非常紧凑的存储空间内实现高效的操作，适合海量数据场景。

7. HyperLogLog

介绍：

HyperLogLog 是一种用于基数统计的算法，可以用于估算一个集合中不重复元素的个数，且占用的内存空间非常小。
常用命令有 PFADD、PFCOUNT。

典型应用场景：

独立访客统计：在网站分析中统计独立访客（UV），只需为每个访客 ID 添加到 HyperLogLog 中，快速得到不重复用户数。
大规模数据去重计数：用于估算大规模数据中的去重个数，如点击、请求、访问量等。

底层原理：

HyperLogLog 是一种基数估计算法，通过哈希分布将数据映射到位向量中，通过统计不同前缀的最大长度来估算基数，其优点是占用内存极小，缺点是只能进行估算，存在一定误差。

8. 地理空间（Geospatial）

介绍：

Redis 支持存储地理位置数据，并基于这些数据进行范围查询和距离计算。常用命令包括 GEOADD、GEODIST、GEORADIUS、GEOHASH 等。

典型应用场景：

LBS 应用：比如打车应用中，存储司机和乘客的地理位置，根据位置计算距离，匹配最近的车辆。
附近商家搜索：用户输入位置后，查询附近的商家，并根据距离排序返回。

底层原理：

Redis 的地理空间数据是基于有序集合实现的，使用 GEOHASH 算法将地理坐标编码为 64 位的整数，存入有序集合中。通过对这些编码的范围查询，可以实现快速的空间检索。

9. 流（Streams）

介绍：

Stream 是 Redis 5.0 引入的一种新的数据类型，支持消息队列的功能，类似于 Kafka 或者 RabbitMQ，支持消费组、消息持久化和自动应答等特性。常用命令包括 XADD、XREAD、XGROUP、XACK 等。

典型应用场景：

消息系统：通过流数据类型，多个消费者可以从同一个队列中消费数据，实现消息分发和处理。
日志系统：可以将日志信息存储在 Redis 的流中，实现持久化和实时消费。

底层原理：

Stream 是基于压缩列表和链表的结合体，数据结构复杂度较高，可以高效存储大量的流式数据。通过内部维护的 ID 进行排序和管理，使得它适合处理有序的、持续生成的数据流。

总结

Redis 提供的多种数据类型，不仅丰富了其在不同业务场景下的适用性，还能通过内存友好的数据结构和高效的算法来保证性能。在选择 Redis 数据类型时，通常需要根据业务需求来匹配合适的数据结构，从而最大限度地提升系统性能和资源利用率。

文章转载自：lgx211
原文链接：https://www.cnblogs.com/lgx211/p/18498695
体验地址：http://www.jnpfsoft.com/?from=infoq

发布于: 刚刚阅读数: 4

EquatorCoco

关注

还未添加个人签名 2023-06-19 加入

还未添加个人简介

发布

暂无评论

创作场景

一文彻底搞透 Redis 的数据类型及具体的应用场景

1. 字符串（String）

介绍：

典型应用场景：

底层原理：

2. 哈希（Hash）

介绍：

典型应用场景：

底层原理：

3. 列表（List）

介绍：

典型应用场景：

底层原理：

4. 集合（Set）

介绍：

典型应用场景：

底层原理：

5. 有序集合（Sorted Set）

介绍：

典型应用场景：

底层原理：

6. 位图（Bitmaps）

介绍：

典型应用场景：

底层原理：

7. HyperLogLog

介绍：

典型应用场景：

底层原理：

8. 地理空间（Geospatial）

介绍：

典型应用场景：

底层原理：

9. 流（Streams）

介绍：

典型应用场景：

底层原理：

总结

EquatorCoco

评论