week-11-part1 分析系统不可用的原因
导致系统不可用的原因:
硬件故障;软件 Bug;系统发布;并发压力;网络攻击;外部灾害。
保障系统稳定高可用的方案:
分 3 个层次:
1.架构设计:
解耦;隔离;异步;备份;Failover(失效转移);幂等;事务补偿;重试;熔断;限流;自适应限流;降级;异地多活;
2.系统运维:
自动化测试;自动化部署;预发布验证;灰度发布;运行监控(用户行为日志,业务运运行数据和系统性能数据)
3.系统故障分析:
根据故障描述分析
【系统配置(系统负荷能力)
应用服务本身:
技术(系统)数据分析(CPU,数据库,JVM,缓存,并发量,线程数,请求响应时间,架构设计)
业务数据分析(业务流程,业务数据高峰时段)】
评论