我所接触的大型互联网系统

用户头像
张瑞浩
关注
发布于: 2020 年 07 月 01 日

实现目标

  • 高可用、稳定性、高性能

  • 可维护、伸缩性

  • 开发门槛低、迭代快

  • 运维和自动化程度高

如何实现

系统性能

  • 微内核、组件抽象

  • 分层设计

  • 减少耦合、单一职责

  • 异步化

  • 分布式事务

  • 高性能内存队列

  • 批量调用和处理

  • 限流、熔断

  • 容灾

开发质量和速度

  • 规范开发文档

  • 开发背景

  • 需求分析与设计

  • 国内、国际化

  • 相关影响评估

  • 监控打点

  • 上线和回滚方案

  • 优化开发

  • 常用开发抽象配置化

  • 规则引擎

  • UDF

  • 测试自动化

  • 单元测试

  • 集成测试

  • 流量录制回放、diff测试

  • 配置文件对比测试

运维简单

  • 监控

  • 监控报警直接反应业务指标

  • 链接报警处理建议和联系人

  • 日志

  • 关键步骤

  • 上下文

  • 异常栈(不要过多)

  • 自动运维

  • 故障实例自动迁移

  • 内存使用率过高

  • cpu使用率过高

  • 报错日志过多

  • 关键异常过多

  • 自动扩缩容

  • 整体cpu使用率过高

  • 整体内存使用率过高

容灾能力

  • 限流

  • 熔断

  • 双机房部署

  • 流量调度

  • 失败消息重试



用户头像

张瑞浩

关注

还未添加个人签名 2018.09.18 加入

还未添加个人简介

评论

发布
暂无评论
我所接触的大型互联网系统