写点什么

Redis 稳定性实践

用户头像
心平气和
关注
发布于: 2020 年 05 月 17 日

本文会讲述作者在线上环境使用redis遇到过的一些坑,主要是一些参数配置和选型,目的只有一个:如何让redis不挂,提高可用性;不涉及到集群方案的选型等内容。



aof因为是不断的追加,所以越来越多,所以有aof rewrite的功能;



我们到底选rdb还是aof作为持久化的方式?

我的建议,如果数据量超过100M,就用aof;



1、避免触发全量主、从同步

Redis主从机制分全量同步、增量同步2种,在大促的时候如果触发主、从同步全量同步是非常危险的,在主上可能会阻塞请求,从因为也要将数据加载到内存中,所以也可能导致客户端报错,所以我们要尽量避免在大促场景触发全量主从同步而导致Redis不可用。



我们先看下Redis主、从同步的过程:



2)主将1产生的文件发送给从;

3)从将RDB文件加载到内存中;

4)主在完成1的时候同时将每次的命令写入到一个缓冲区中;



这里有几个关键参数:

1)、repl-backlog-size

即复制缓冲区的大小,这个参数默认只有1M,非常的小,生产场景可以自己根据以下公式计算:



即如果1秒的写入量在100kb, 我们允许抖动的时间为5分钟,则这个设置为

100k*5*50=25M



注意这个在主和从上都要设置,因为主挂了,一个从切主后也可保持一致。



2)、repl-timeout 

主从之间的复制超时时间,默认为60s,可以根据情况自己调整。



3、client-output-buffer-limit slave 

限制从分配的缓冲区的大小,因为一个从也是主的一个客户端。

这个配置有3个参数

hard limit: 缓冲区大小的硬性限制。

soft limit: 缓冲去大小的软性限制。

soft seconds:缓冲区大小达到了(超过)soft limit值的持续时间。



1) client buffer的大小达到了soft limit并持续了soft seconds时间,将立即断开和客户端的连接。

2) client buffer的大小达到了hard limit,server也会立即断开和客户端的连接。



在大促的时候,为了防止主从连接断开,这个也可以适当调整大小,具体参数自己的业务场景可以容忍的断开时间,这个涉及到数据一致性问题,一般不建议设为3个0,即永不超时并且缓冲区不限制大小。



2、aof rewrite

如果持久化方式配置为aof的话,大促的时候需要注意不要触发aof  rewrite,因为这个也会阻塞用户的请求。



推荐配置如下

no-appendfsync-on-rewrite yes

no-appendfsync-on-rewrite    0



3、aof持久化的配置

aof刷磁盘有每次写操作写一次、1s刷新1次、不主动刷新3种,根据业务可以接受宕机数据丢失多久来配置,一般来说1s刷新基本上满足大部分的场景。



直播评论系统分析设计

如何做好稳定性

从一次线上故障来看redis删除机制

直播评论系统分析设计





发布于: 2020 年 05 月 17 日阅读数: 68
用户头像

心平气和

关注

欢迎关注公众号:程序员升级之路 2018.03.06 加入

还未添加个人简介

评论

发布
暂无评论
Redis稳定性实践