写点什么

十一周作业

用户头像
关注
发布于: 2021 年 01 月 10 日

导致系统不可用的原因,主要有以下一些方面

1.硬件故障

2.软件 bug

3.系统发布

4.并发压力

5.网络攻击

6.外部灾害


-- 应对系统稳定的高可用方案

高可用问题的解决思路,主要包括避免问题发生、故障转移、降低故障影响、快速恢复系统几个方面保证。

1.首先需要做计算和存储的冗余备份,包括主备、主从、集群和负载均衡等技术。

2.保证系统高可用的另一个策略是失败隔离,将失败限制在一个较小的范围之内,使故障影响范围不扩大。具体实现失败隔离的主要架构技术是消息队列。

3.限流和降级也是保护系统高可用的一种手段。在高并发场景下,如果系统的访问量超过了系统的承受能力,可以通过限流对系统进行保护。限流是指对进入系统的用户请求进行流量限制,如果访问量超过了系统的最大处理能力,就会丢弃一部分的用户请求,保证整个系统可用,保证大部分用户是可以访问系统的。

4.降级:系统抛弃部分不重要的功能,比如不发送短信通知,以此确保核心功能不受影响。

5.熔断:我们不去调用出问题的服务,让系统绕开故障点,就像电路的保险丝一样,自己熔断,切断通路,避免系统资源大量被占用。比如,用户下单时,如果积分服务出现问题,我们就先不送积分,后续再补偿。

6.功能禁用:针对具体的功能,我们设置好功能开关,让代码根据开关设置,灵活决定是否执行这部分逻辑。

7.采用幂等、错误重试、补偿等机制处理服务中的错误和异常。

8.异地多活架构,保证地区级别的服务不可用问题。

9.同时,要有完善的监控和运维机制处理各类情况。


用户头像

关注

还未添加个人签名 2018.11.12 加入

还未添加个人简介

评论

发布
暂无评论
十一周作业