写点什么

Redis Cluster 集群收缩主从节点详细教程

作者:jiangxl
  • 2022 年 5 月 18 日
  • 本文字数:3263 字

    阅读完需:约 11 分钟

Redis Cluster 集群收缩主从节点

@[TOC]

1.Cluster 集群收缩概念

当项目压力承载力过高时,需要增加节点来提高负载,当项目压力不是很大时,也希望能够将集群收缩下来,给其他项目使用,这就要用到集群收缩了


集群收缩操作和集群扩容是一样的,只需要把方向反过来即可。


扩容的时候执行一次命令就可以实现槽位迁移成功,而收缩的时候有几个主节点就需要执行多少次,比如除去要下线的节点,还有 3 个主节点,那么就需要执行三次,填写迁移出槽位的数量也需要除以 3,每个节点也需要平均分配。


收缩的时候首先要填写分出多少个槽位,然后填写要分给谁,最后填写从哪分出槽位,一般分多少个槽位,就需要看要下线的主机上有多少个槽位,然后除以集群主节点数,使每一个主机点分到的槽位都是相同的,填写要分配给谁的时候,第一次填写第一个主节点的 ID,第二次填写第二个主节点的 ID,最后填写提供槽位的节点 ID,就是下线节点的 ID 号。


集群收缩扩容槽位的时候不会影响数据的使用。


集群收缩的源端就是要下线的主节点,目标端就是在线的主节点(分配给谁的节点)。咱们要清楚一点,只有主节点是有槽位的,因此呢需要将主节点的槽位分配给其他主节点,当槽位清空后,这个主机节点就可以下线了。



收缩集群前后对比图



集群收缩操作步骤:


​ 1.执行 reshard 命令将需要下线的主节点进行槽位分散。


​ 2.有几个主节点就需要执行几次 reshard 命令,首先填写要分出的槽位数,然后填写分给谁,最后填写从哪里分。


​ 3.当槽位分散完成后,要下线的主节点没有任何数据时,将节点从集群中删除。


集群信息


目前集群时四主四从共 8 个节点,我们需要将集群改为三主三从,收缩出两个节点给其他程序使用。


2.将 6390 主节点从集群中收缩

2.1.计算需要分给每一个节点的槽位数

可以看到 6390 节点上有 4096 个槽位,删除要下线的 6390 节点后,我们还有 3 个主节点,4096 除 3 得到 1365,分配槽位的时候给每个节点分配 1365 个槽位即可均匀。


2.2.分配 1365 个槽位给 192.168.81.210 的 6380 节点

我们需要将 192.168.81.240 的 6390 节点分出 1365 个槽位给 192.168.81.210 的 6380 节点。


只需要把 What is the receiving node ID 填写成 192.168.81.210 的 6380 节点 ID 即可,指的是分配出来的槽位要给谁。


然后 source node 填写 192.168.81.240 的 6390 节点的 ID,这里指的是从哪个节点上分出 1365 个槽位,填写 ID 后,回车后会提示还要从哪个节点上分配槽位,因为只有 6390 需要分出槽位,所以在这里填写 done,表示只有这个一个节点分出 1365 个槽位给其他节点。


[root@redis-1 /data/redis_cluster/redis-3.2.9/src]# ./redis-trib.rb reshard 192.168.81.210:6380How many slots do you want to move (from 1 to 16384)? 1365        #分配出多少个槽位
What is the receiving node ID? 80e256579658eb256c5b710a3f82c439665794ba #将槽位分给那个节点
Please enter all the source node IDs. Type 'all' to use all the nodes as source nodes for the hash slots. Type 'done' once you entered all the source nodes IDs.Source node #1:6bee155f136f40e28e1f60c8ddec3b158cd8f8e8 #从哪个节点分出槽位Source node #2:done
Do you want to proceed with the proposed reshard plan (yes/no)? yes #输入yes继续
复制代码


下面是收缩节点的过程截图。



数据迁移过程。



槽位分出迁移成功。


2.3.分配 1365 个槽位给 192.168.81.220 的 6380 节点

[root@redis-1 /data/redis_cluster/redis-3.2.9/src]# ./redis-trib.rb reshard 192.168.81.210:6380How many slots do you want to move (from 1 to 16384)? 1365        #分配出多少个槽位
What is the receiving node ID? 10dc7f3f9a753140a8494adbbe5a13d0026451a1 #将槽位分给那个节点
Please enter all the source node IDs. Type 'all' to use all the nodes as source nodes for the hash slots. Type 'done' once you entered all the source nodes IDs.Source node #1:6bee155f136f40e28e1f60c8ddec3b158cd8f8e8 #从哪个节点分出槽位Source node #2:done
Do you want to proceed with the proposed reshard plan (yes/no)? yes #输入yes继续
复制代码


收缩过程截图展示。




2.4.分配 1365 个槽位给 192.168.81.230 的 6380 节点

[root@redis-1 /data/redis_cluster/redis-3.2.9/src]# ./redis-trib.rb reshard 192.168.81.210:6380How many slots do you want to move (from 1 to 16384)? 1366        #分配出多少个槽位
What is the receiving node ID? a4381138fdc142f18881b7b6ca8ae5b0d02a3228 #将槽位分给那个节点
Please enter all the source node IDs. Type 'all' to use all the nodes as source nodes for the hash slots. Type 'done' once you entered all the source nodes IDs.Source node #1:6bee155f136f40e28e1f60c8ddec3b158cd8f8e8 #从哪个节点分出槽位Source node #2:done
Do you want to proceed with the proposed reshard plan (yes/no)? yes #输入yes继续
复制代码


收缩过程截图展示。




当最后一个节点迁移完数据后,6390 主节点槽位数变为 0。


2.5.查看当前集群槽位分配

槽位及数据已经从 6390 即将下线的主机迁移完毕,可以看下当前集群三个主节点的槽位数。


可以非常清楚的看到,现在每个主节点的槽位数为 5461。



如果觉得槽位重新分配后顺序不太满意,那么在执行一下 reshard,把其它节点的槽位都分给 192.168.81.210 的 6380 上,这样一来,210 的 6380 拥有的槽位就是 0-16383,然后在将 210 的槽位一个节点分给 5461 个,分完之后,各节点的顺序就一致了。


3.验证数据迁移过程是否导致数据异常

多开几个窗口,一个执行数据槽位迁移,一个不断创建 key,一个查看 key 的创建进度,一个查看 key 的数据。持续测试,发现没有任何数据异常,全部显示 ok。


4.将下线的主节点从集群中删除

4.1.删除节点

使用 redis-trib 删除一个节点,如果这个节点存在复制关系,有节点在复制当前节点或者当前节点复制别的节点的数据,redis-trib 会自动处理复制关系,然后将节点删除,节点删除后会把对应的进程也停止运行。


删除节点之前必须确保该节点没有任何槽位和数据,否则会删除失败。


命令:./redis-trib.rb del-node 节点IP:端口 ID


[root@redis-1 /data/redis_cluster/redis-3.2.9/src]# ./redis-trib.rb del-node 192.168.81.240:6390 6bee155f136f40e28e1f60c8ddec3b158cd8f8e8>>> Removing node 6bee155f136f40e28e1f60c8ddec3b158cd8f8e8 from cluster 192.168.81.240:6390>>> Sending CLUSTER FORGET messages to the cluster...>>> SHUTDOWN the node.
[root@redis-1 /data/redis_cluster/redis-3.2.9/src]# ./redis-trib.rb del-node 192.168.81.240:6391 f6b9320dfbc929ad5a31cdb149360b0fd8de2e60>>> Removing node f6b9320dfbc929ad5a31cdb149360b0fd8de2e60 from cluster 192.168.81.240:6391>>> Sending CLUSTER FORGET messages to the cluster...>>> SHUTDOWN the node.
复制代码


4.2.调整主从交叉复制

删掉 192.168.81.240 服务器上的两个 redis 节点后,192.168.81.210 服务器上的 6380 就没有了复制关系,我们需要把 192.168.81.230 的 6381 节点复制 192.168.81.210 的 6380 节点。


[root@redis-1 ~]# redis-cli -h 192.168.81.230 -p 6381192.168.81.230:6381> CLUSTER REPLICATE 80e256579658eb256c5b710a3f82c439665794baOK
复制代码


4.3.当节点存在数据无法删除

[root@redis-1 /data/redis_cluster/redis-3.2.9/src]# ./redis-trib.rb del-node 192.168.81.220:6380 10dc7f3f9a753140a8494adbbe5a13d0026451a1>>> Removing node 10dc7f3f9a753140a8494adbbe5a13d0026451a1 from cluster 192.168.81.220:6380[ERR] Node 192.168.81.220:6380 is not empty! Reshard data away and try again.
复制代码


5.将下线主机清空集群信息

redis-trib 虽然能够将节点在集群中删除,但是无法将其的集群信息清空,如果集群信息还有保留,那么该接地那就无法加入其它集群。



在下线的 redis 节点上使用 cluster reset 删除集群信息即可。


192.168.81.240:6390> CLUSTER resetOK
复制代码



用户头像

jiangxl

关注

还未添加个人签名 2022.04.27 加入

还未添加个人简介

评论

发布
暂无评论
Redis Cluster集群收缩主从节点详细教程_jiangxl_InfoQ写作社区