写点什么

内行,阿里大牛离职带出内部“高并发系统设计”学习手册

作者:程序知音
  • 2022 年 7 月 12 日
  • 本文字数:2590 字

    阅读完需:约 8 分钟

前言

我们知道,高并发代表着大流量,高并发系统设计的魅力就在于我们能够凭借自己的聪明才智设计巧妙的方案,从而抵抗巨大流量的冲击,带给用户更好的使用体验。这些方案好似能操纵流量,让流量更加平稳得被系统中的服务和组件处理。

来做个简单的比喻吧。

从古至今,长江和黄河流域水患不断,远古时期,大禹曾拓宽河道,清除淤沙让流水更加顺畅;都江堰作为史上最成功的的治水案例之一,用引流将岷江之水分流到多个支流中,以分担水流压力;三门峡和葛洲坝通过建造水库将水引入水库先存储起来,然后再想办法把水库中的水缓缓地排出去,以此提高下游的抗洪能力。

"秒杀活动"、"抢红包"、"微博热搜"、"12306 抢票"、"共享单车拉新"等都是高并发的典型业务场景,那么如何解决这些业务场景背后的难点问题呢?

  • 秒杀系统中,QPS 达到 10 万/s 时,如何定位并解决业务瓶颈?

  • 明星婚恋话题不断引爆微博热搜,如何确保系统不宕机?

  • 共享单车充值活动,如何保证不超卖?

  • ......

同一时间、海量用户的高频访问对任何平台都是难题,但可喜的是,虽然业务场景不同,设计和优化的思想却是万变不离其宗。如果你掌握了高并发系统设计的核心技术点(缓存、池化、异步化、负载均衡、队列、降级熔断等),深化成自 己的知识体系,解决这些业务问题将不在话下,应对自如。


那么,我们怎么去学习、提高我们的高并发系统设计的能力呢?

Step ①:基础

首先,我们需要了解一下知识点:

  1. 高并发系统:它的通用设计方法是什么

  2. 架构分层:我们为什么一定要这么做?

  3. 系统设计目标(一):如何提升系统性能?

  4. 系统设计目标(二):系统怎样做到高可用?

  5. 系统设计目标(三):如何让系统易于扩展?

Step ②:数据库

在第一步中,我已经从宏观的角度带你了解了高并发系统设计的基础知识,你已经知晓了,我们系统设计的目的是为了获得更好的性能、更高的可用性,以及更强的系统扩展能力。

那么在这一步,我们正式进入演进篇,我会再从局部出发,带你逐一了解完成这些目标会使用到的一些方法,这些方***针对性地解决高并发系统设计中出现的问题。

  1. 池化技术:如何减少频繁创建数据库连接的性能损耗?

  2. 数据库优化方案(一):查询请求增加时,如何做主从分离?

  3. 数据库优化方案(二):写入数据量增加时,如何实现分库分表?

  4. 发号器:如何保证分库分表后 ID 的全局唯一性?

  5. NoSQL:在高并发场景下,数据库和 NoSQL 如何做到互补?

Step ③:缓存

通过前面数据库篇的学习,你已经了解了在高并发大流量下,数据库层的演进过程以及库表设计上的考虑点。

那么我将从缓存定义、缓存分类和缓存优势劣势三个方面全方位带你掌握缓存的设计思想和理念,带你针对性地掌握使用缓存的正确姿势,以便让你在实际工作中能够更好地使用缓存提升整体系统的性能。

  1. 缓存:数据库成为瓶颈后,动态数据的查询要如何加速?

  2. 缓存的使用姿势(一):如何选择缓存的读写策略?

  3. 缓存的使用姿势(二):缓存如何做到高可用?

  4. 缓存的使用姿势(三):缓存穿透了怎么办?

  5. CDN:静态资源如何加速?

Stpe ④:消息队列

1 秒钟之内,有 1 万个数据库连接同时达到,系统的数据库濒临崩溃,寻找能够应对如此高并发的写请求方案迫在眉睫。这时你想到了消息队列。

这里我会从以下几个问题去带大家学习如何使用消息队列解决秒杀场景下的问题:

  1. 消息队列:秒杀时如何处理每秒上万次的下单请求?

  2. 消息投递:如何保证消息仅仅被消费一次?

  3. 消息队列:如何降低消息队列系统中消息的延迟?

Step ⑤:分布式服务

通过前面几个篇章的内容,你已经从数据库、缓存和消息队列的角度对自己的垂直电商系统在性能、可用性和扩展性上做了优化。

但是有一个问题一直萦绕在你的心里:究竟是什么促使我们将一体化架构,拆分成微服务化架构?是不是说系统的整体 QPS 到了 1 万,或者到了 2 万,就一定要做微服务化拆分呢?

我将从以下几个点去讲解,为什么我们要用分布式服务?它好在哪里、如何实现?

  1. 系统架构:每秒 1 万次请求的系统要做服务化拆分吗?

  2. 微服务架构:微服务化后,系统架构要如何改造?

  3. RPC 框架:10 万 QPS 下如何实现毫秒级的服务调用?

  4. 注册中心:分布式系统如何寻址?

  5. 分布式 Trace:横跨几十个分布式组件的慢请求要如何排查?

  6. 负载均衡:怎样提升系统的横向扩展能力?

  7. API 网关:系统的门面要如何做呢?

  8. 多机房部署:跨地域的分布式系统如何做?

  9. Service Mesh:如何屏蔽服务化系统的服务治理细节?

Step ⑥:维护

要想快速地发现和定位业务系统中出现的问题,必须搭建一套完善的服务端监控体系。正所谓“道路千万条,监控第一条,监控不到位,领导两行泪”。不过,在搭建的过程中,你的团队又陷入了困境:

  • 首先,监控的指标要如何选择呢?

  • 采集这些指标可以有哪些方法和途径呢?

  • 指标采集到之后又要如何处理和展示呢?

这些问题,一环扣一环,关乎着系统的稳定性和可用性,通过完成一下这些,我就带你解决这些问题,搭建一套服务端监控体系。

  1. 给系统加上眼睛:服务端监控要怎么做?

  2. 应用性能管理:用户的使用体验应该如何监控?

  3. 压力测试:怎样设计全链路压力测试平台?

  4. 配置管理:成千上万的配置项要如何管理?

  5. 降级熔断:如何屏蔽非核心系统故障的影响?

  6. 流量控制:高并发系统中我们如何操纵流量?

在前面,我分别从数据库、缓存、消息队列和分布式服务化的角度,带你了解了面对高并发的时候要如何保证系统的高性能、高可用和高可扩展。其中虽然有大量的例子辅助你理解理论知识,但是没有一个完整的实例帮你把知识串起来。

所以,为了将我们提及的知识落地,在实战篇中,我会以微博为背景,用两个完整的案例带你从实践的角度应对高并发大流量的冲击,期望给你一个更加具体的感性认识,为你在实现类似系统的时候提供一些思路。

  1. 计数系统设计(一):面对海量数据的计数器要如何做?

  2. 计数系统设计(二):50 万 QPS 下如何设计未读数系统?

  3. 信息流设计(一):通用信息流系统的推模式要如何做?

  4. 信息流设计(二):通用信息流系统的拉模式要如何做?

总结

通过以上七个步骤,我想你应该能够从中获益良多,掌握高并发系统设计的精髓!

从基础出发,由浅入深,从七个方面(基础+数据库+缓存+消息队列+分布式服务+维护+实战)去带领大家去学习高并发系统设计!

先带你建立对高并发系统设计的直观理解,再以最简单架构逐步演进到支撑百万、千万并发的分布式架构为案例,带你解决这个过程中遇到的痛点问题,提升业务处理能力,真正完成一次系统演进,最后结合实战优化整体设计思路。

文章到这里就结束了,原文档 PDF 打开方式👉我的学习笔记

用户头像

程序知音

关注

还未添加个人签名 2022.06.25 加入

还未添加个人简介

评论

发布
暂无评论
内行,阿里大牛离职带出内部“高并发系统设计”学习手册_Java_程序知音_InfoQ写作社区