架构师培训 -07 总结 性能测试与性能优化
1.性能测试
性能测试是性能优化的前提和基础,也是性能优化结果的检查和度量标准。不同视角下的网站性能有不同的标准,也有不同的优化手段。
主观视角:用户感受到到的性能。
客观视角:性能指标衡量的性能。
1.1性能测试指标
网站性能测试的主要指标有响应时间,并发数,吞吐量、性能计数器等。
响应时间
指应用系统从发出请求开始到收到最后响应数据所需要的时间。
并发数
系统能够同时处理请求的数目,这个数字也反映了系统的负载特性。对于网站而言,并发数即系统并发用户数,指同时提交请求的用户数,于此相对应,还有在线用户数(当前登录系统的用户数)和系统用户数(可能访问系统的总用户数)。
吞吐量
指单位时间内系统处理的请求数量,体现系统的处理能力。对于网站,可以用“请求数/秒”或是“页面数/秒”来衡量,也可以用“访问人数/天”或是“处理的业务数/小时”等衡量。
TPS(每秒事务数)也是吞吐量的一个指标,还有HPS(每秒 http请求数)。
QPS(每秒查询数)。
吞吐量=(1000/响应时间ms)X并发数。
TPS,QPS都是泛指,并不是专指我们平时开发中的事务,查询等,可以理解为请求数量。
性能计数器
是描述服务器和操作系统性能的一些数据指标。包括System Load、对象与线程数、内存使用、CPU使用、磁盘与网络I/O等指标。这些指标也是系统监控的重要参数,对这些指标设置报警阀值,当监控系统发现性能计数超过阀值的时候,就像运维和开发人员报警,及时发现处理系统异常。
1.2性能测试方法
性能测试是一个总裁称,具体可细分为性能测试,负载测试,压力测试,稳定性测试。
性能测试
以系统设计初期规划的性能指标为预期指标,对系统不断施加压力,验证系统在资源可接受的范围内,是否能到性能预期。
负载测试
对系统不断增加并发请求以增加系统压力,直到系统的某项或多项性能指标达到安全临界值,如某种资源已经呈饱和状态,这时候继续对系统施加压力,系统的处理能力不但不能提高,反而会下降。
压力测试
超过安全负载的情况下,对系统继续施加压力,直到系统崩溃或不能再处理任何请求,以此获得系统最大压力承受能力。
稳定性测试
被测试系统在特定硬件,软件、网络环境条件下,给系统加载一定业务压力,使系统运行一段较长时间,以此检测系统是否稳定。在生产环境,请求压力是不均匀的,呈波浪特性,因此为了更好的模式生产环境,稳定性测试也应该不均匀的对系统施加压力。
2.性能优化
2.1.性能优化两个基本原则
你不能优化一个没有测试的软件。
你不能优化一个你不了解的软件。
2.2性能优化的一般方法
性能测试,获得性能指标。
指标分析,发现性能与资源瓶颈点。
架构与代码分析,寻找性能与资源瓶颈关键所在。
架构与代码优化,优化关键技术点,平衡资源利用。
性能测试,进入性能优化闭环。
2.3系统性能优化的分层思想
机房与主干网的性能优化
异地多活的多机房架构
专线网络与自主CDN建设
服务器与硬件性能优化
使用更优的CPU,磁盘,内存,网卡,对软件的性能优化可能上数量级的,有时候远远超过代码和架构的性能优化。
快速提升系统性能的一种方式。
操作系统性能优化
--
虚拟机性能优化
开发中用的JVM,分析当前具体的业务情况,可以在内存大小,垃圾回收器等方面的设置实现优化的目的。
基础组件系能优化
以下是阿里通过组件优化达到了大幅提升的案例。这种优化也需要花大量时间进行不断的实验。
软件架构性能优化
最管用的三点:缓存、异步和集群。
软件代码性能优化
遵循面向对象的设计原则与设计模式编程,很多时候程序性能不好不是因为性能上有什么技术挑战,仅仅是因为代码写的太烂了。
并发编程,多线程与锁。
资源复用,线程池和对象池。
异步编程,生产者与消费者。
数据结构,数组、链表、hash表、树等。
3.操作系统
程序是静态的,程序运行起来以后被称为进程。
3.1进程的运行期状态
计算机的CPU核数是是有限的。但是,服务器可以同时处理数以百计甚至数以千计的并发用户请求。
计算机是怎么做到的?进程分时执行
运行
当一个进程在CPU上运行时,则称该进程处于运行状态。处于运行状态的进程的数目小于等于CPU数目。
就绪
当一个进程获得了除了CPU之外的一切所需资源,只要得到CPU即可运行,则陈此进程处于就绪状态,就绪状态有时候也被称为等待运行状态。
阻塞
也称为等待或睡眠状态,当一个进程正在等待某一事件发生(例如等待I/O完成,等待锁...)而暂时停止运行,这时候即使把CPU分配给进程也无法运行,故陈改进程处于阻塞状态。
3.2进程VS线程
不同进程轮流在CPU上执行,每次都要进行进程间CPU切换,代价非常大,因此服务器应用通常是单进程多线程。
进程从操作系统获得基本的内存空间,所有的线程共享着进程的内存地址空间。而每个线程也会拥有自己私有的内存地址范围,其他线程不能访问。
3.3系统崩溃的原因
阻塞导致高并发系统崩溃。锁,I\O等会引起线程阻塞。阻塞导致线程既不能运行,也不能释放资源。进而导致资源耗尽,最终导致系统崩溃。
如何避免阻塞引起的系统崩溃?
限流:控制进入计算机的请求数,进而减少创建的线程数。
降级:关闭部分功能程序的执行,尽早释放线程。
避免阻塞:异步I/0;无临界区(Actor模型)。
4锁
锁是用来解决多线程在获取资源的时候,如何保证资源获取的有序性和占用性。
4.1锁原语CAS
CAS是一种系统原语,原语被执行必须是连续的,在执行过程中不允许被中断。
CAS(V,E,N)
V表示要更新的变量
E表示预期值
N表示更新值
如果V值等于E值,则将V的值设为N,若V值和E值不同,什么都不做。
Java通过CAS原语在对象头中修改Mark Word实现加锁。
4.2锁的种类
4.2.1偏向锁、轻量级锁、重量级锁
偏向锁
指一段同步代码一直被一个线程访问,那么该线程会自动获取锁,降低获取说的代价。
轻量级锁
指当锁是偏向锁时,被另外一个线程访问,偏向锁就会升级为轻量级锁,其他线程就会通过自旋的形式尝试获取锁,不会阻塞,提供性能。
重量级锁
指当锁是轻量级锁时,另一个线程虽然自旋,但自旋不会一直持续下去,当自旋到一定次数时,还没有获得锁,就会进入阻塞,该锁膨胀为重量级锁,重量级锁会让其他申请的线程进入阻塞,性能降低。
4.2.2总线锁、缓存锁
总线锁
使用处理器的Lock#信号,当一个处理器在内存总线上输出此信号的时候,其他处理器的请求被阻塞,该处理器独占内存。
缓存锁
是指内存区域如果被缓存在处理器的缓存行中,并且在LOCK操作期间被锁定,那么当它执行操作回写到内存时,处理器不在总线上声言Lock#信号,而是修改内部的内存地址,并允许它的缓存一致性机制来保证操作的原子性,因为缓存一致性机制会阻止同时修改由两个以上处理器缓存的内存区域数据,当其他处理器会写已被锁定的缓存行数据时,会使缓存行无效。
4.2.3公平锁、非公平锁
公平锁
多个线程按照申请锁的先后顺序来获取锁。
非公平锁
多个线程获取锁的顺序不是按照申请锁的顺序,有可能后申请的线程比先申请的线程优先获取锁,可能会造成饥饿现象。
4.2.4可重入锁
是只某个线程获得了某个锁,可以再次获取锁而不会出现死锁。
4.2.5独享锁/互斥锁、共享锁、读写锁
独享锁/互斥锁
该锁一次只能被一个线程所持有。
共享锁
改锁可以被多个线程所持有。
读写锁
多个读线程之间并不互斥,而写线程则要求与任何线程互斥。
4.2.6乐观锁、悲观锁
乐观锁
认为对同一个数据的并发操作,一定是会发生修改的,哪怕没有修改,也会认为修改。因此对于同一个数据的并发操作,悲观锁采取加锁的形式。悲观的认为,不加锁的并发操作一定会出问题。
悲观锁
认为对同一个数据的并发操作,是不会发生修改的。在更新数据的时候,检查是否已被修改过,如果修改过,就放弃。
4.2.7分段锁
分段锁设计的目的是细化锁的粒度,当操作不需要更新整个数组的时候,就仅仅针对数组的一段加锁操作。(ConcurrentHashMap就是使用分段锁)
4.2.8自旋锁
是指尝试获取锁的线程不会立即阻塞,而是采用循环的方式去尝试获取锁,这样的好处减少线程上下文切换的消耗,缺点是循环会消耗CPU。 (轻量级锁就是自旋锁的一种)
评论