Redis 稳定性实践
本文会讲述作者在线上环境使用redis遇到过的一些坑,主要是一些参数配置和选型,目的只有一个:如何让redis不挂,提高可用性;不涉及到集群方案的选型等内容。
aof因为是不断的追加,所以越来越多,所以有aof rewrite的功能;
我们到底选rdb还是aof作为持久化的方式?
我的建议,如果数据量超过100M,就用aof;
1、避免触发全量主、从同步
Redis主从机制分全量同步、增量同步2种,在大促的时候如果触发主、从同步全量同步是非常危险的,在主上可能会阻塞请求,从因为也要将数据加载到内存中,所以也可能导致客户端报错,所以我们要尽量避免在大促场景触发全量主从同步而导致Redis不可用。
我们先看下Redis主、从同步的过程:
2)主将1产生的文件发送给从;
3)从将RDB文件加载到内存中;
4)主在完成1的时候同时将每次的命令写入到一个缓冲区中;
这里有几个关键参数:
1)、repl-backlog-size
即复制缓冲区的大小,这个参数默认只有1M,非常的小,生产场景可以自己根据以下公式计算:
即如果1秒的写入量在100kb, 我们允许抖动的时间为5分钟,则这个设置为
100k*5*50=25M
注意这个在主和从上都要设置,因为主挂了,一个从切主后也可保持一致。
2)、repl-timeout
主从之间的复制超时时间,默认为60s,可以根据情况自己调整。
3、client-output-buffer-limit slave
限制从分配的缓冲区的大小,因为一个从也是主的一个客户端。
这个配置有3个参数
hard limit: 缓冲区大小的硬性限制。
soft limit: 缓冲去大小的软性限制。
soft seconds:缓冲区大小达到了(超过)soft limit值的持续时间。
1) client buffer的大小达到了soft limit并持续了soft seconds时间,将立即断开和客户端的连接。
2) client buffer的大小达到了hard limit,server也会立即断开和客户端的连接。
在大促的时候,为了防止主从连接断开,这个也可以适当调整大小,具体参数自己的业务场景可以容忍的断开时间,这个涉及到数据一致性问题,一般不建议设为3个0,即永不超时并且缓冲区不限制大小。
2、aof rewrite
如果持久化方式配置为aof的话,大促的时候需要注意不要触发aof rewrite,因为这个也会阻塞用户的请求。
推荐配置如下
no-appendfsync-on-rewrite yes
no-appendfsync-on-rewrite 0
3、aof持久化的配置
aof刷磁盘有每次写操作写一次、1s刷新1次、不主动刷新3种,根据业务可以接受宕机数据丢失多久来配置,一般来说1s刷新基本上满足大部分的场景。
版权声明: 本文为 InfoQ 作者【心平气和】的原创文章。
原文链接:【http://xie.infoq.cn/article/35d5ea98aa3d46fe177bdfbf5】。文章转载请联系作者。
评论