架构师训练营 week7 学习总结
1、性能测试
性能测试,是通过自动化的测试工具模拟多种正常、峰值以及异常负载条件来对系统的各项性能指标进行测试。其是性能优化的前提和基础,也是性能优化的度量标准。在一个系统软件中,不同视角由不同的性能指标。
主观视角:用户感受到的系统速度
客观视角:性能指标衡量的性能
1)、性能测试指标:网站性能测试的主要指标有响应时间、并发数、性能计数器等
响应时间:应用系统从发出请求开始到收到最后响应数据所需要的时间,直接反应系统的“快慢”。
并发数:系统能够同时处理的请求数,反应系统的负载特性。即系统并发用户数,与此相对应的有在线用户数和系统用户数。
吞吐量:指单位时间内系统处理的请求的数量,反应系统的处理能力。在网站中,与此相对应的有”请求数/秒“或者是”页面数/秒“来衡量,也可以用”访问人数/天“或是”处理的业务数/小时“等衡量。常见的的指标:TPS和QPS。吞吐量 = (1000/响应时间ms)× 并发数
性能计数器:描述服务器或者操作系统性能的一些指标。如:system load 、对象与线程数、内存使用、CPU使用、磁盘与网络I/O等。
2)、性能测试方法:性能测试、负载测试、压力测试、稳定性测试
性能测试:以系统设计初期规划的性能指标为预期目标,对系统不断施加压力,验证系统在资源可接受范围内是否能达到性能预期。
负载测试:对系统不断地增加并发请求以增加系统压力,直到达到系统地某项或多项性能指标地安全临界值。继续施加压力,系统地处理能力不但不会提高,反而会降低,我们要找到这个转折点。
压力测试:超过安全负载地情况下,对系统继续施加压力,直到系统崩溃或不能再处理任何请求,以此获得系统最大压力承受能力。
稳定性测试:被测试系统在特定硬件、软件、网络环境下,给系统加载一定业务压力,使系统运行一段较长时间,以此检测系统是否稳定。请求要不均匀地发送。
从上图我们可得知,随着并发数地增加,系统地响应时间 在增加,TPS不增反减,错误率攀升,系统负载加大等等。
3)、全链路压测
全链路压测是指在特定地业务场景下,将相关地链路完整的串联起来同时施压,尽可能模拟出真是的用户行为,当系统整站流量都被打上来的时候,必定会暴露出性能瓶颈,才能够探测出系统的真实处理能力,以及有指导的在大促前进行容量规划和性能优化。这就是其目的。分为以下三个步骤:
数据构造
数据隔离
流量构造
全链路压测遇到的挑战
压测相关的业务系统众多,并且牵涉到整条链路上所有的基础设施和中间件,如何确保压测流量能够畅通无阻,没有死角?
压测的数据怎么构造?数据模型如何与真实贴近?
全链路压测直接与线上环境进行模拟,怎么保障对线上无影响?
大型促销活动所带来的巨大流量要怎么制作出来?
全链路压测平台化案例:
2、分布式系统性能优化
软件性能优化的两个基本原则:你不能优化一个没有测试过的软件,你不能优化一个你不了解的软件。
1)、Spark性能测试案例
事务处理时间
CPU状态
内存状态
网络状态
硬盘状态
2)、性能优化的一般方法
性能测试,获取性能指标(开始)
指标分析,发现性能与资源瓶颈点
架构与代码分析,寻找性能与资源瓶颈关键所在
架构与代码优化,优化关键技术点,平衡资源利用
性能测试,进入性能优化闭环
3)、系统性能优化的分层思想
机房与骨干网络性能优化
服务器与硬件性能优化
操作系统性能优化
虚拟机性能优化
基础组件性能优化
软件架构性能优化
三板斧:缓存、异步、集群
缓存:从内存获取数据、减少数据库访问,降低存储设备负载压力,缓存结果对象。
异步:即时响应,更好的用户体验控制消费速度,合适的负载压力
集群:增加服务器资源。如何使很多台服务器对使用者而要看起来像一台服务器。
软件代码性能优化:遵循面向对象的设计原则和设计模式变成,很多时候程序性能不好不是因为性能有什么技术挑战,仅仅是因为代码太烂了。并发编程,多线程与锁,资源复用,线城市与对象池,异步编程,生产者消费者,数据结构,数组,链表,hash表,树
3、操作系统
1、程序运行时架构:程序是静态的,程序运行起来以后,被加载到内存中执行,被称作进程。
2)、操作系统多任务运行环境
计算机的CPU核心数是有限的,为了应对操作系统复杂的处理请求,诞生了进程分时执行机制。
进程的三大状态:
运行:当一个进程在CPU上运行时,则称该进程处于运行状态,处于运行状态的进程小于等于CPU的数目。
就绪:当一个进程获得了除CPU以外的一切所需资源,只要得到CPU即可运行,则成进程处于就绪状态。
阻塞:等待或睡眠状态,当一个进程等待某一事件发生而暂停运行。
3)、进程VS线程:进程从操作系统获得基本的内存空间,所有的线程共享着进程的内存地址空间,而每个线程也会拥有自己私有的内存地址范围,其他线程不能访问。
由于线程的特殊性,引入了线程安全机制
当某些代码修改内存堆里的数据时,如果多个线程同时执行,则会出现数据不一致的情况。
临界区:多个线程访问共享资源的这段代码被称为临界区,解决线程安全问题ide主要方法是使用锁,将临界区的代码加锁,只有获得锁的线程才能执行临界区代码。
4)、导致系统崩溃的原因分析
阻塞导致高并发系统崩溃:锁会引起线程阻塞,导致线程不能继续执行,也不能释放资源,导致资源耗尽,最终导致系统崩溃。
解决方案:
限流:控制进入计算机的请求树,进而减少创建的线程数
降级:关闭部分功能程序的执行,尽早释放线程
避免阻塞:异步I/O,无临界区
5)、锁
锁原语CAS(V,E,N):V表示要更新的变量,E表示预期值,N表示新值。
如果V值等于E值,将V设置为N,若不同,则什么都不做。CAS是一种系统原语,原语的执行是连续的,在执行过程中不允许被中断。
偏向锁:指一段代同步代码一直被一个线程访问,那么该线程会自动取消获取锁,降低锁的代价
轻量级锁:指当锁是偏向锁时,被另一个线程所访问,偏向锁就会升级为轻量级锁,其他线程会通过自旋的形式尝试获取锁,不会阻塞,提高性能。
重量级锁:指当锁是轻量级锁时,另一个线程虽然资源,但自旋不会一直持续下去,当自旋到一定次数时,还没获取到锁,就会进入阻塞,该锁膨胀为重量级锁,重量级锁会让其他申请的线程进入阻塞,性能降低。
多CPU情况下的锁:
总线锁:使用处理器的LOCK#信号,当一个处理器在内存总线上输出此信号的时候,其他处理器的请求将被阻带,该处理器独占内存。
缓存锁:内存区域如果被缓存在处理器中的缓存行中,并且在LOCK期间被锁定,那么当他执行锁操作回写到内存时,处理器不再总线上声言LOCK#信号,而是修改内部的内存地址,并允许它的缓存一致性机制来保证操作的原子性,因为缓存一致性机制会阻止同时修改由两个以上处理去缓存的内存区域数据,当其他处理器回写已被锁定的缓存行数据时,会使缓存行无效。
公平锁:就是多个线程按照申请锁的顺序来获取锁。
非公平锁:多个线程获取锁的顺序不是按照申请锁的顺序,有可能后申请的线程比先申请的线程优先获取锁,可能会造成饥俄现象。
可重入锁:某个线程已经获得某个锁,可以再次获取锁而不会出现死锁。
独享锁:该锁一次只能被一个线程持有。
共享锁:该锁可悲多个线程持有。
读写锁:多个线程之间并不沪指,而写线程则要求与任何线程互斥。
悲观锁:认为对于同一个数据的并发操作,一定是会发生修改的,哪怕没有修改,也会认为修改,因此对于同一个数据的并发操作,悲观锁采取加锁的形式。悲观地认为,不加锁的并发操作一定会出问题。
乐观锁:认为对于同一个数据的并发操作,是不会发生修改的,在更新数据的时候,检查是否已经被修改过,如果修改过,就放弃。
分段锁:分段所的设计目的是细化锁的粒度,当操作不需要更新整个数组的时候,就仅仅针对数组的一段进行加锁操作。
自旋锁:尝试获取锁的线程不会立即阻塞,而是采用循环的方式去获取锁,这样的好处就是减少线程上下文切换的小号,缺点是消耗CPU。
4、文件与硬盘I/O
1、)机械硬盘:
2)、固态硬盘
数据库的B+树就是针对机械硬盘设计的。
总结完。
评论