写点什么

week-11-part1 分析系统不可用的原因

用户头像
陈龙
关注
发布于: 2021 年 01 月 10 日
week-11-part1分析系统不可用的原因
  1. 导致系统不可用的原因:

硬件故障;软件 Bug;系统发布;并发压力;网络攻击;外部灾害。

保障系统稳定高可用的方案:

分 3 个层次:

1.架构设计:

解耦;隔离;异步;备份;Failover(失效转移);幂等;事务补偿;重试;熔断;限流;自适应限流;降级;异地多活;

2.系统运维:

自动化测试;自动化部署;预发布验证;灰度发布;运行监控(用户行为日志,业务运运行数据和系统性能数据)

3.系统故障分析:

根据故障描述分析

【系统配置(系统负荷能力)

应用服务本身:

技术(系统)数据分析(CPU,数据库,JVM,缓存,并发量,线程数,请求响应时间,架构设计)

业务数据分析(业务流程,业务数据高峰时段)】


用户头像

陈龙

关注

还未添加个人签名 2018.02.26 加入

还未添加个人简介

评论

发布
暂无评论
week-11-part1分析系统不可用的原因