写点什么

Redis-Cluster 集群

用户头像
Sakura
关注
发布于: 2021 年 04 月 24 日

一、redis-cluster 设计 Redis-Cluster 采用无中心结构,每个节点保存数据和整个集群状态,每个节点都和其他所有节点连接。


redis.png


其结构特点:


1、所有的 redis 节点彼此互联(PING-PONG 机制),内部使用二进制协议优化传输速度和带宽。


2、节点的 fail 是通过集群中超过半数的节点检测失效时才生效。


3、客户端与 redis 节点直连,不需要中间 proxy 层.客户端不需要连接集群所有节点,连接集群中任何一个可用节点即可。


4、redis-cluster 把所有的物理节点映射到[0-16383]slot 上(不一定是平均分配),cluster 负责维护 node<->slot<->value。


5、Redis 集群预分好 16384 个桶,当需要在 Redis 集群中放置一个 key-value 时,根据 CRC16(key) mod 16384 的值,决定将一个 key 放到哪个桶中。


a.redis cluster 节点分配 现在我们是三个主节点分别是:A, B, C 三个节点,它们可以是一台机器上的三个端口,也可以是三台不同的服务器。那么,采用哈希槽 (hash slot)的方式来分配 16384 个 slot 的话,它们三个节点分别承担的 slot 区间是:

  • 节点 A 覆盖 0-5460;

  • 节点 B 覆盖 5461-10922;

  • 节点 C 覆盖 10923-16383.

    获取数据: 如果存入一个值,按照 redis cluster 哈希槽的算法: CRC16('key')384 = 6782。 那么就会把这个 key 的存储分配到 B 上了。同样,当我连接(A,B,C)任何一个节点想获取'key'这个 key 时,也会这样的算法,然后内部跳转到 B 节点上获取数据

    新增一个主节点: 新增一个节点 D,redis cluster 的这种做法是从各个节点的前面各拿取一部分 slot 到 D 上,我会在接下来的实践中实验。大致就会变成这样:

  • 节点 A 覆盖 1365-5460

  • 节点 B 覆盖 6827-10922

  • 节点 C 覆盖 12288-16383

  • 节点 D 覆盖 0-1364,5461-6826,10923-12287

同样删除一个节点也是类似,移动完成后就可以删除这个节点了。

b.Redis Cluster 主从模式 redis cluster 为了保证数据的高可用性,加入了主从模式,一个主节点对应一个或多个从节点,主节点提供数据存取,从节点则是从主节点拉取数据备份,当这个主节点挂掉后,就会有这个从节点选取一个来充当主节点,从而保证集群不会挂掉

上面那个例子里, 集群有 ABC 三个主节点, 如果这 3 个节点都没有加入从节点,如果 B 挂掉了,我们就无法访问整个集群了。A 和 C 的 slot 也无法访问。

所以我们在集群建立的时候,一定要为每个主节点都添加了从节点, 比如像这样, 集群包含主节点 A、B、C, 以及从节点 A1、B1、C1, 那么即使 B 挂掉系统也可以继续正确工作。

B1 节点替代了 B 节点,所以 Redis 集群将会选择 B1 节点作为新的主节点,集群将会继续正确地提供服务。 当 B 重新开启后,它就会变成 B1 的从节点。

不过需要注意,如果节点 B 和 B1 同时挂了,Redis 集群就无法继续正确地提供服务了。

二、redis 集群的搭建 集群中至少应该有奇数个节点,所以至少有三个节点,每个节点至少有一个备份节点,所以下面使用 6 节点(主节点、备份节点由 redis-cluster 集群确定) 下载redis 1、安装 redis 节点指定端口 解压 redis 压缩包,编译安装

[root@localhost redis-3.2.0]# tar xzf redis-3.2.0.tar.gz[root@localhost redis-3.2.0]# cd redis-3.2.0[root@localhost redis-3.2.0]# make[root@localhost redis01]# make install PREFIX=/usr/andy/redis-cluster
复制代码

在 redis-cluster 下 修改 bin 文件夹为 redis01,复制 redis.conf 配置文件 创建目录 redis-cluster 并在此目录下再创建 7000 7001 7002 7003 7004 7005 共 6 个目录,在 7000 中创建配置文件 redis.conf,内容如下:

        daemonize yes #后台启动        port 7001 #修改端口号,从7001到7006        cluster-enabled yes #开启cluster,去掉注释        cluster-config-file nodes.conf #自动生成        cluster-node-timeout 15000 #节点通信时间        appendonly yes #持久化方式
复制代码

同时把 redis.conf 复制到其它目录中

2、安装 redis-trib 所需的 ruby 脚本 注意:centos7 默认的 ruby 版本太低(2.0),要卸载重装(最低 2.2)

yum remove rubyyum install rubyyum install rubygems
复制代码

复制 redis 解压文件 src 下的 redis-trib.rb 文件到 redis-cluster 目录并安装 gem

gem install redis-3.x.x.gem
复制代码

若不想安装 src 目录下的 gem,也可以直接gem install redis

注意,gem install 可能会报错 Unable to require openssl,install OpenSSL and rebuild ruby (preferred) or use .... 解决步骤:

  1. yum install openssl-devel -y

  2. 在 ruby 安装包/root/ruby-x.x.x/ext/openssl,执行 ruby ./extconf.rb

  3. 执行 make,若出现 make: *** No rule to make target /include/ruby.h', needed byossl.o'. Stop.;在 Makefile 顶部中的增加top_srcdir = ../..

  4. 执行 make install

3、启动所有的 redis 节点 可以写一个命令脚本 start-all.sh

cd 7000redis-server redis.confcd ..cd 7001redis-server redis.confcd ..cd 7002redis-server redis.confcd ..cd 7003redis-server redis.confcd ..cd 7004redis-server redis.confcd ..cd 7005redis-server redis.confcd ..
复制代码

设置权限启动

[root@localhost redis-cluster]# chmod 777 start-all.sh [root@localhost redis-cluster]# ./start-all.sh 
复制代码

查看 redis 进程启动状态

[root@localhost redis-4.0.2]# ps -ef|grep clusterroot      54956      1  0 19:17 ?        00:00:00 redis-server *:7000 [cluster]root      54961      1  0 19:17 ?        00:00:00 redis-server *:7001 [cluster]root      54966      1  0 19:17 ?        00:00:00 redis-server *:7002 [cluster]root      54971      1  0 19:17 ?        00:00:00 redis-server *:7003 [cluster]root      54976      1  0 19:17 ?        00:00:00 redis-server *:7004 [cluster]root      54981      1  0 19:17 ?        00:00:00 redis-server *:7005 [cluster]root      55071  24089  0 19:24 pts/0    00:00:00 grep --color=auto cluster
复制代码

可以看到 redis 的 6 个节点已经启动成功 注意:这里并没有创建集群

4、使用 redis-trib.rb 创建集群 注意:redis-trib.rb 在 redis/src 目录下。

./redis-trib.rb create --replicas 1 127.0.0.1:7001 127.0.0.1:7002 127.0.0.1:7003 127.0.0.1:7004 127.0.0.1:7005 127.0.0.1:7000
复制代码

使用 create 命令 --replicas 1 参数表示为每个主节点创建一个从节点,其他参数是实例的地址集合。

[root@localhost redis]# ./src/redis-trib.rb create --replicas 1 127.0.0.1:7001 127.0.0.1:7002 127.0.0.1:7003 127.0.0.1:7004 127.0.0.1:7005 127.0.0.1:7000>>> Creating cluster>>> Performing hash slots allocation on 6 nodes...Using 3 masters:127.0.0.1:7001127.0.0.1:7002127.0.0.1:7003Adding replica 127.0.0.1:7004 to 127.0.0.1:7001Adding replica 127.0.0.1:7005 to 127.0.0.1:7002Adding replica 127.0.0.1:7000 to 127.0.0.1:7003M: f4ee0a501f9aaf11351787a46ffb4659d45b7bd7 127.0.0.1:7001   slots:0-5460 (5461 slots) masterM: 671a0524a616da8b2f50f3d11a74aaf563578e41 127.0.0.1:7002   slots:5461-10922 (5462 slots) masterM: 18948dab5b07e3726afd1b6a42d5bf6e2f411ba1 127.0.0.1:7003   slots:10923-16383 (5461 slots) masterS: 34e322ca50a2842e9f3664442cb11c897defba06 127.0.0.1:7004   replicates f4ee0a501f9aaf11351787a46ffb4659d45b7bd7S: 62a00566233fbff4467c4031345b1db13cf12b46 127.0.0.1:7005   replicates 671a0524a616da8b2f50f3d11a74aaf563578e41S: 2cb649ad3584370c960e2036fb01db834a546114 127.0.0.1:7000   replicates 18948dab5b07e3726afd1b6a42d5bf6e2f411ba1Can I set the above configuration? (type 'yes' to accept): yes>>> Nodes configuration updated>>> Assign a different config epoch to each node>>> Sending CLUSTER MEET messages to join the clusterWaiting for the cluster to join...>>> Performing Cluster Check (using node 127.0.0.1:7001)M: f4ee0a501f9aaf11351787a46ffb4659d45b7bd7 127.0.0.1:7001   slots:0-5460 (5461 slots) master   1 additional replica(s)M: 671a0524a616da8b2f50f3d11a74aaf563578e41 127.0.0.1:7002   slots:5461-10922 (5462 slots) master   1 additional replica(s)S: 2cb649ad3584370c960e2036fb01db834a546114 127.0.0.1:7000   slots: (0 slots) slave   replicates 18948dab5b07e3726afd1b6a42d5bf6e2f411ba1S: 34e322ca50a2842e9f3664442cb11c897defba06 127.0.0.1:7004   slots: (0 slots) slave   replicates f4ee0a501f9aaf11351787a46ffb4659d45b7bd7M: 18948dab5b07e3726afd1b6a42d5bf6e2f411ba1 127.0.0.1:7003   slots:10923-16383 (5461 slots) master   1 additional replica(s)S: 62a00566233fbff4467c4031345b1db13cf12b46 127.0.0.1:7005   slots: (0 slots) slave   replicates 671a0524a616da8b2f50f3d11a74aaf563578e41[OK] All nodes agree about slots configuration.>>> Check for open slots...>>> Check slots coverage...[OK] All 16384 slots covered.
复制代码

上面显示创建成功,有 3 个主节点,3 个从节点,每个节点都是成功连接状态。

三、redis 集群的测试 测试存取值,客户端连接集群 redis-cli 需要带上 -c ,redis-cli -c -p 端口号

[root@localhost redis]# ./redis-cli -c -p 7001127.0.0.1:7001> set name andy-> Redirected to slot [5798] located at 127.0.0.1:7002OK127.0.0.1:7002> get name"andy"127.0.0.1:7002> 
复制代码

根据 redis-cluster 的 key 值分配,name 应该分配到节点 7002[5461-10922]上,上面显示 redis cluster 自动从 7001 跳转到了 7002 节点。

测试一下 7000 从节点获取 name 值

[root@localhost redis]# ./redis-cli -c -p 7000127.0.0.1:7000> get name-> Redirected to slot [5798] located at 127.0.0.1:7002"andy"127.0.0.1:7002> 
复制代码

四、集群节点选举 现在模拟将 7002 节点挂掉,按照 redis-cluster 原理会选举会将 7002 的从节点 7005 选举为主节点。

[root@localhost redis-cluster]# ps -ef | grep redisroot       7966      1  0 12:50 ?        00:00:29 ./redis-server 127.0.0.1:7000 [cluster]root       7950      1  0 12:50 ?        00:00:28 ./redis-server 127.0.0.1:7001 [cluster]root       7952      1  0 12:50 ?        00:00:29 ./redis-server 127.0.0.1:7002 [cluster]root       7956      1  0 12:50 ?        00:00:29 ./redis-server 127.0.0.1:7003 [cluster]root       7960      1  0 12:50 ?        00:00:29 ./redis-server 127.0.0.1:7004 [cluster]root       7964      1  0 12:50 ?        00:00:29 ./redis-server 127.0.0.1:7005 [cluster]root      11346  10581  0 14:57 pts/2    00:00:00 grep --color=auto redis[root@localhost redis-cluster]# kill 7952
复制代码

在查看集群中的 7002 节点

[root@localhost src]# ./redis-trib.rb check 127.0.0.1:7002>>> Performing Cluster Check (using node 127.0.0.1:7002)S: 671a0524a616da8b2f50f3d11a74aaf563578e41 127.0.0.1:7002   slots: (0 slots) slave   replicates 62a00566233fbff4467c4031345b1db13cf12b46M: 18948dab5b07e3726afd1b6a42d5bf6e2f411ba1 127.0.0.1:7003   slots:10923-16383 (5461 slots) master   1 additional replica(s)M: 62a00566233fbff4467c4031345b1db13cf12b46 127.0.0.1:7005   slots:5461-10922 (5462 slots) master   1 additional replica(s)M: f4ee0a501f9aaf11351787a46ffb4659d45b7bd7 127.0.0.1:7001   slots:0-5460 (5461 slots) master   1 additional replica(s)S: 34e322ca50a2842e9f3664442cb11c897defba06 127.0.0.1:7004   slots: (0 slots) slave   replicates f4ee0a501f9aaf11351787a46ffb4659d45b7bd7S: 2cb649ad3584370c960e2036fb01db834a546114 127.0.0.1:7000   slots: (0 slots) slave   replicates 18948dab5b07e3726afd1b6a42d5bf6e2f411ba1[OK] All nodes agree about slots configuration.>>> Check for open slots...>>> Check slots coverage...[OK] All 16384 slots covered.
复制代码

可以看到集群连接不了 7002 节点,而 7005 有原来的 S 转换为 M 节点,代替了原来的 7002 节点。我们可以获取 name 值:

[root@localhost redis]# ./redis-cli -c -p 7001127.0.0.1:7001> get name-> Redirected to slot [5798] located at 127.0.0.1:7005"andy"127.0.0.1:7005> 127.0.0.1:7005> 
复制代码

从 7001 节点连入,自动跳转到 7005 节点,并且获取 name 值。

现在我们将 7002 节点恢复,看是否会自动加入集群中以及充当的 M 还是 S 节点。

[root@localhost redis-cluster]# cd 7002[root@localhost 7002]# ./redis-server redis.conf [root@localhost 7002]# 
复制代码

再 check 一下 7002 节点,可以看到 7002 节点变成了 7005 的从节点。


用户头像

Sakura

关注

还未添加个人签名 2020.09.22 加入

还未添加个人简介

评论

发布
暂无评论
Redis-Cluster集群