写点什么

week7 性能优化(一) 作业和学习总结

用户头像
杨斌
关注
发布于: 2020 年 12 月 13 日

作业一(至少完成一项):

  1. 性能压测的时候,随着并发压力的增加,系统响应时间和吞吐量如何变化,为什么?


性能测试是优化的前提和基础,也是性能优化结果的检查和度量标准。不通视角下的网站性能有不通的标准,也有不同的优化手段。网站性能测试的主要指标有响应时间,并发数,吞吐量,性能计数器等。

  • 响应时间:指应用系统从发出请求开始到收到最后响应数据所需的时间。

  • 并发数:系统能够同时处理请求的数目,

  • 吞吐量:指单位时间内系统处理的请求的数量,体现了系统的处理能力。

压力测试是在超过安全负载的情况下,对系统继续施加压力,直到系统奔溃或不能在处理任何请求,以此获得系统的最大压力承受能力。

随着并发压力的增加,系统的吞吐量随之增加,达到系统资源的瓶颈后,系统的吞吐量会急剧下降,响应时间也变长,直到系统崩溃。总体上呈现一个抛物线的形式,如下图:




  1. 用你熟悉的编程语言写一个 Web 性能压测工具,输入参数:URL,请求总次数,并发数。输出参数:平均响应时间,95% 响应时间。用这个测试工具以 10 并发、100 次请求压测 www.baidu.com

作业二:根据当周学习情况,完成一篇学习总结

week7 性能优化

7.1 性能测试:系统性能的主要技术指标

性能测试

性能测试是优化的前提和基础,也是性能优化结果的检查和度量标准。不通视角下的网站性能有不通的标准,也有不同的优化手段。

  • 逐渐视角:用户感受到的性能

  • 客观视角:性能指标衡量的性能

 

性能测试指标

不通视角下有不同的性能指标,不同的标准有不同的性能测试指标,网站性能测试的主要指标有响应时间,并发数,吞吐量,性能计数器等。

 

响应时间:指应用系统从发出请求开始到收到最后响应数据所需的时间。响应时间是系统最重要的性能指标,直观的反映了系统的“快慢”。

 

并发数

并发数:系统能够同时处理请求的数目,这个数字也反映了系统的负载特征。对于网站而言,并发数即系统并发用户数,指同时提交请求的用户数目,于此相对应,还有在线用户数(当前登陆系统的用户数)和系统用户数(可能访问系统的总用户数)。

 

吞吐量

吞吐量:指单位时间内系统处理的请求的数量,体现了系统的处理能力。对于网站可以用“请求数/秒”或者“页面数/秒“来衡量,也可以用”访问人数/天”或者“处理的业务数小时”等来衡量。

TPS(每秒事物数)也是吞吐量的一个指标,此处还有 HPS(没秒 HTTP 请求数),QPS(每秒查询数)等。

 

吞吐量=(1000/响应时间ms)* 并发数
复制代码

性能计数器

性能计数器:是描述服务器或者操作系统性能的一些数据指标。包括 system load,对象与线程数,内存使用,cpu 使用,磁盘与网络 I/O 等指标。这些指标也是系统监控的重要参数,对这些指标设置报警阈值,当监控系统发现性能计数器超过阈值的时候,就向运维和开发人员报警,及时发现处理系统异常。

 

性能测试方法

性能测试是一个总称,具体可以细分未性能测试、负载测试、压力测试、稳定性测试。

 

性能测试:

性能测试是以系统设计初期规划的性能指标未预期目标,对系统不断施加压力,验证系统在资源可接受范围内,是否能达到性能预期。

 

负载测试:

负载测试是对系统不断的增加并发请求以增加系统压力,直到系统的某项或多项性能指标达到安全临界点,如某种资源已经呈饱和状态,这时候对系统施加压力,系统的处理能力不但不能提升,反而会下降。

 

压力测试

压力测试是在超过安全负载的情况下,对系统继续施加压力,直到系统奔溃或不能在处理任何请求,以此获得系统的最大压力承受能力。

 

稳定性测试

稳定性测试被测试系统在特定硬件、软件、网络环境条件下,给系统加载一定业务压力,使系统运行一段较长时间,以此检测系统是否稳定。在生产环境,请求压力是不均匀的,呈波浪特征,硬刺为了更好的模拟生产环境,稳定性测试也应不均匀的对系统施加压力。





基于 Flower 的应用重构性能测试



性能测试压测可用性



7.2 全链路测试的挑战

全链路压测其实指的就是在特定的业务场景下,将相关的链路完整的串联起来同时施压,尽可能模拟出真实的用户行为,当系统整站流量都被打上来的时候,必定会暴露出性能瓶颈,才能够探测出系统整体的真实处理能力,以及有指导的在大促前进行容量规划和性能优化,这便是线上实施全链路压测的真正目的。

 

全链路压测的挑战

  • 压测相关的业务系统众多,并且牵涉到整条链路上所有的基础设施和中间件,如何确保压测流量能够畅通无阻,没有死角?压测的数据怎么构造(亿万级别的商品和用户),数据模型如何与真实贴近?

  • 全链路压测直接在向上的真实环境模拟,怎么样来保障对线上无影响?

  • 大型促销活动所带来的巨大流量要怎么样制作出来?

 

数据构造



数据隔离

  • 逻辑隔离:直接吧测试数据和正常数据写在一起,通过特殊的标识能够区分

  • 可能污染线上数据,破坏线上数据安全性

  • 虚拟隔离:在所有写数据的地方做 mock,并不真正的写进去

  • 这个方案不会对线上产生污染,到那时 mock 对压测结果的准确性会产生干扰

  • 物理隔离:所有写数据的地方对压测流量进行识别,判断一旦是压测流量的写,就写到隔离的位置,包括存储、缓存、搜素引擎等。

 

案例:流量构造

天猫双十一全链路压测的流量平台是一个典型的 master+slave 结构,master 作为压测管理控制台管理者上千个 slave 节点;slave 节点作为压测引擎,负责具体的请求发送。

Master 作为整个压测平台的大脑,负责的整个平台的运转控制、命令发送、数据搜集、决策等。Slave 节点部署全球各地的 cdn 节点上,从而摸您从全球各地过来的用户请求。整套全链路压测的流量平台在压测过程中平衡输出 1000 + w/s 的用户请求、同时保持过亿的无线用户长链接。



全链路压测平台化



7.3 性能优化:系统性能优化的分层思想

软件系能耐优化的两个基本原则

  • 你不能优化一个没有测试的软件

  • 你不能优化一个你不了解的软件

 

性能测试的主要指标

  • 响应时间:完成一次任务花费的时间

  • 并发数:同时处理的任务数

  • 吞吐量:单位时间完成的任务数

  • 性能计数器:System Load,线程数,进程数,CPU,内存、磁盘、网络使用率

 

Spark 应用性能优化



性能优化的一般方法

  • 性能测试,获取性能指标

  • 指标分析,发现性能与资源瓶颈点

  • 架构与代码分析,寻找性能与资源瓶颈关键所在

  • 架构与代码及其他性能,优化关键技术点,平衡资源利用

  • 性能测试,进入性能优化闭环

 

系统性能优化的分层思想

  • 机房与骨干网络的优化

  • 服务器与硬件性能优化

  • 操作系统优化

  • 虚拟机性能优化

  • 基础组建性能优化

  • 软件架构性能优化

  • 软件代码性能优化

 

案例-网卡

Spark 作业过程需要创书大量数据,进行资源瓶颈分析,发现大量时间消耗在网络传输上。



优化方案:升级网卡



案例:操作系统性能优化

资源利用分析,发现大量 cpu 操作未 sys 类型,消耗大量的计算资源。

调查发现,起因是部分 linux 版本缺省情况下打开 tranparent huge page 导致

优化方案:关闭 transparent huge page



案例:基础组建性能优化



软件架构性能优化三板斧

  • 缓存

  • 异步

  • 集群

 

缓存



异步:即时响应,更好的用户体验;控制消费速度,合适的负载压力;异步主要优化写操作




集群:

古老谚语:如果一匹马拉不动车,无需换一匹更强的马 ,而是用两匹马拉车。

互联网技术的发展路径就是:更多的用户访问需要消耗更多的计算资源,单一服务器计算资源的增加是有极限的,所以需要增加更多的服务器。关键是如何利用起来这些服务器。

集群的技术目标只有一个:如何使很多台服务器对使用者而言看起来像一台服务器。



软件代码性能优化

遵循面向对象的设计原则与设计模式编程,很多的时候程序性能不好不是因为性能上有什么技术挑战,仅仅就是因为代码太烂了。

  • 并发编程,多线程和锁

  • 资源复用,线程池与对象池

  • 异步编程,生产者和消费者

  • 数据结构,数组、链表,hash 表,数

 

7.4 操作系统:计算机如何处理成百上千的并发请求

程序运行时架构

  • 程序是静态的

  • 程序运行起来后,被称为进程



操作系统多任务运行环境

计算机的 cpu 核心数是有限的。但是,服务器可以同时处理数以百计甚至以千计的并发用户请求。

那么,计算机如何做到呢?

  • 进程分时执行

 

进程的运行期状态

  • 运行:当一个进程在 cpu 上运行时,则称该进程处于运行状态。处于运行状态的进程数目小于等于 cpu 的数目。

  • 就绪:当一个进程获得了除 cpu 以外的一切所需资源,只要得到 cpu 即可运行,则称此进程处于就绪状态,就绪状态有时候也被称为等待运行状态。

  • 阻塞:也称为等待或睡眠状态,当一个进程正在等待某一事件发生(例如等待 i/o 完成,等待锁。。。)而暂时停止运行,这时即时把 cpu 分配给进程也无法运行,故称为该进程处于阻塞状态。

 

进程 VS 线程

不同进程轮流在 cpu 上执行,每次都要进程进程间 cpu 切换,代价非常大。因此,服务器应用通常是但进程多线程。

进程从操作系统获取基本的内存空间,所有的线程共享着进程的内存地址空间。而每个线程也会拥有自己私有的内存地址范围,其他线程不能访问。



线程栈

vodi f(){  int x=g(1)  x++;  //g函数返回}int g(int x){  return x+1}
复制代码



Java Web 应用多线程运行时试图



线程安全

当某些代码修改内存堆(进程共享内存)里的数据的时候,如果多个线程在同时执行,就可能会出现同时修改数据的情况,比如,两个线程同时对一个堆中的数据执行+1 操作,最终这个数据只会被加一次,这就是人们常说的线程安全问题,实际上线程的结果应该是一次加一,即最终的结果应该是+2.



临界区

多个线程访问共享资源的这段代码被称为临界区,解决线程安全问题的主要方法是使用锁,将临界区的代码加锁,只有获得锁的线程才能执行临界区代码。

lock.lock(); //线程获得锁i++ ; //临界区代码,i位与堆中lock。unlock(); //线程释放锁
复制代码

 

阻塞导致高并发系统崩溃

锁(I/O)会引起线程阻塞。阻塞导致线程即使不能继续执行,也不能释放资源。进而导致资源耗尽。最终导致系统奔溃。



避免阻塞引起的崩溃

  • 限流:控制进入计算机的请求数,进而减少创建的线程数。

  • 降级:关闭部分功能程序的执行,尽可能释放线程。

  • 反应式:异步;无临界区(Actor 模型)

 

7.5 锁:锁原语 CAS 与各类锁

锁原语 CAS

CAS(V,E,N)

  • V 表示要更新的变量

  • E 表示预期值

  • N 表示新值

 

如果 V 值等于 E 值,则将 V 值的值设置为 N,若 V 值和 E 值不通,什么都不做

CAS 是一种系统原语,原语的执行必须是连续的,在执行过程中不允许被中断。

 

Java 通过 CAS 原语在对象头中修改 Mark Word 实现加锁



偏向锁 轻量级锁 重量级锁

  • 偏向锁:指一段同步代码一直被一个线程所访问,那么该线程会自动获取所,降低获取锁的代价

  • 轻量级锁:指当锁是偏向锁时,被另一个线程所访问,偏向锁就会升级为轻量级锁,其他线程会通过自旋的形式尝试获取锁,不会阻塞,提高性能。

  • 重量级锁:指当锁是轻量级锁时,另一个线程虽然自旋,但自旋不会一直持续下去,当自旋到一定次数时,还没获取到锁,就会进入阻塞,该锁膨胀为重量级锁,重量级锁会让其他申请的线程进入苏泽,性能降低。

 

总线锁和缓存锁

  • 总线锁:使用处理器的 LOCK# 信号,当一个处理器在内存总线上输出此信号的时候, 其他处理器的请求将被阻塞,该处理器独占内存。

  • 缓存锁:是指内存区域如果被缓存在处理器的缓存行中,并且在 Lock 操作期间被锁定, 那么当它执行锁操作回写到内存时,处理器不在总线上声言 LOCK# 信号,而是修改内 部的内存地址,并允许它的缓存一致性机制来保证操作的原子性,因为缓存一致性机制 会阻止同时修改由两个以上处理器缓存的内存区域数据,当其他处理器回写已被锁定的 缓存行数据时,会使缓存行无效。

 

公平锁 非公平锁

  • 公平锁就是多个线程按照申请锁的顺序来获取锁的。

  • 非公平锁就是多个线程获取锁的顺序并不是按照申请锁的顺序,有可能后申请的线程比 先申请的线程优先获取锁,可能会造成饥饿现象。

 

可重入锁

  • 可重入就是说某个线程已经获得某个锁,可以再次获取锁而不会出现死锁。

 

 独享锁/互斥锁 共享锁 读写锁

  • 独享锁/互斥锁:该锁一次只能被一个线程所持有

  • 共享锁:该锁可以被多个线程所持有 

  • 读写锁:多个读线程之间并不互斥,而写线程则要求与任何线程互斥

 

乐观锁 悲观锁

  • 悲观锁认为对于同一个数据的并发操作,一定是会发生修改的,哪怕没有修改,也会认 为修改。因此对于同一个数据的并发操作,悲观锁采取加锁的形式。悲观的认为,不加 锁的并发操作一定会出问题。

  • 乐观锁则认为对于同一个数据的并发操作,是不会发生修改的。在更新数据的时候,检 查是否已经被修改过,如果修改过,就放弃。

 

分段锁

  • 分段锁的设计目的是细化锁的粒度,当操作不需要更新整个数组的时候,就仅仅针对数 组的一段进行加锁操作。

  • JDK ConcurrentHashMap 是通过分段锁的形式来实现高效并发操作的。

 

自旋锁

  • 自旋锁是指尝试获取锁的线程不会立即阻塞,而是采用循环的方式去尝试获取锁,这样 的好处是减少线程上下文切换的消耗,缺点是循环会消耗 CPU。

 

7.6 案例:异步并发分布式锁编程框架 akka

详见 pdf 文件《案例:异步并发分布式编程框架 akka.pdf》


用户头像

杨斌

关注

还未添加个人签名 2020.03.17 加入

还未添加个人简介

评论

发布
暂无评论
week7 性能优化(一) 作业和学习总结