我所接触的大型互联网系统
实现目标
高可用、稳定性、高性能
可维护、伸缩性
开发门槛低、迭代快
运维和自动化程度高
如何实现
系统性能
微内核、组件抽象
分层设计
减少耦合、单一职责
异步化
分布式事务
高性能内存队列
批量调用和处理
限流、熔断
容灾
开发质量和速度
规范开发文档
开发背景
需求分析与设计
国内、国际化
相关影响评估
监控打点
上线和回滚方案
优化开发
常用开发抽象配置化
规则引擎
UDF
测试自动化
单元测试
集成测试
流量录制回放、diff测试
配置文件对比测试
运维简单
监控
监控报警直接反应业务指标
链接报警处理建议和联系人
日志
关键步骤
上下文
异常栈(不要过多)
自动运维
故障实例自动迁移
内存使用率过高
cpu使用率过高
报错日志过多
关键异常过多
自动扩缩容
整体cpu使用率过高
整体内存使用率过高
容灾能力
限流
熔断
双机房部署
流量调度
失败消息重试
评论