一文带你了解如何排查内存泄漏导致的页面卡顿现象
不知道在座的各位有没有被问到过这样一个问题:如果页面卡顿,你觉得可能是什么原因造成的?有什么办法锁定原因并解决吗?
这是一个非常宽泛而又有深度的问题,他涉及到很多的页面性能优化问题,我依稀还记得当初面试被问到这个问题时我是这么回答的:
先会检查是否是网络请求太多,导致数据返回较慢,可以适当做一些缓存
也有可能是某块资源的 bundle 太大,可以考虑拆分一下
然后排查一下 js 代码,是不是某处有过多循环导致占用主线程时间过长
浏览器某帧渲染的东西太多,导致的卡顿
在页面渲染过程中,可能有很多重复的重排重绘
emmmmmm....不知道了
后来了解到了,感官上的长时间运行页面卡顿也有可能是因为内存泄漏引起的
🌟 内存泄漏的定义
那什么是内存泄漏呢?借助别的大佬给出的定义,内存泄漏就是指由于疏忽或者程序的某些错误造成未能释放已经不再使用的内存的情况。简单来讲就是假设某个变量占用 100M 的内存,而你又用不到这个变量,但是这个变量没有被手动的回收或自动回收,即仍然占用 100M 的内存空间,这就是一种内存的浪费,即内存泄漏
🌼 JS 的数据存储
JavaScript
的内存空间分为栈内存和堆内存,前者用来存放一些简单变量,后者用来存放复杂对象
简单变量指的是 JS 的基本数据类型,例如:
String
、Number
、Boolean
、null
、undefined
、Symbol
、BigInt
复杂对象指的是 JS 的引用数据类型,例如:
Object
、Array
、Function
...
🌴 JS 垃圾回收机制
根据内存泄漏的定义,有些变量或数据不再被使用或不需要了,那么它就是垃圾变量或垃圾数据,如果其一直保存在内存中,最终可能会导致内存占用过多的情况。那么此时就需要对这些垃圾数据进行回收,这里引入了垃圾回收机制的概念
垃圾回收的机制分为手动和自动两种
例如C/C++
采用的就是手动回收的机制,即先用代码为某个变量分配一定的内存,然后在不需要了后,再用代码手动释放掉内存
而JavaScript
采用的则是自动回收的机制,即我们不需要关心何时为变量分配多大的内存,也不需要关心何时去释放内存,因为这一切都是自动的。但这不表示我们不需要关心内存的管理!!!!否则也不会有本文讨论的内存泄露了
接下来就讲一下JavaScript
的垃圾回收机制
通常全局状态(window)下的变量是不会被自动回收的,所以我们来讨论一下局部作用域下的内存回收情况
以上代码的调用栈如下图所示:
图中左侧为栈空间,用于存放一些执行上下文和基本类型数据;右侧为堆空间,用于存放一些复杂对象数据
当代码执行到fn2()
时,栈空间内的执行上下文从上往下依次是 fn2函数执行上下文 => fn1函数执行上下文 => 全局执行上下文
待fn2
函数内部执行完毕以后,就该退出fn2函数执行上下文
了,即箭头向下移动,此时fn2函数执行上下文
会被清除并释放栈内存空间,如图所示:
待fn1
函数内部执行完毕以后,就该退出fn1函数执行上下文
了,即箭头再向下移动,此时fn1函数执行上下文
会被清除并释放相应的栈内存空间,如图所示:
此时处于全局的执行上下文中。JavaScript
的垃圾回收器会每隔一段时间遍历调用栈,假设此时触发了垃圾回收机制,当遍历调用栈时发现变量b
和变量c
没有被任何变量所引用,所以认定它们是垃圾数据并给它们打上标记。因为fn1
函数执行完后将变量a
返回了出去,并存储在全局变量res
中,所以认定其为活动数据并打上相应标记。待空闲时刻就会将标记上垃圾数据的变量给全部清除掉,释放相应的内存,如图所示:
从这我们得出几点结论:
JavaScript
的垃圾回收机制是自动执行的,并且会通过标记来识别并清除垃圾数据在离开局部作用域后,若该作用域内的变量没有被外部作用域所引用,则在后续会被清除
补充: JavaScript
的垃圾回收机制有着很多的步骤,上述只讲到了标记-清除
,其实还有其它的过程,这里简单介绍一下就不展开讨论了。例如:标记-整理
,在清空部分垃圾数据后释放了一定的内存空间后会可能会留下大面积的不连续内存片段,导致后续可能无法为某些对象分配连续内存,此时需要整理一下内存空间;交替执行
,因为JavaScript
是运行在主线程上的,所以执行垃圾回收机制时会暂停js
的运行,若垃圾回收执行时间过长,则会给用户带来明显的卡顿现象,所以垃圾回收机制会被分成一个个的小任务,穿插在js
任务之中,即交替执行,尽可能得保证不会带来明显的卡顿感
👋 Chrome devTools 查看内存情况
在了解一些常见的内存泄漏的场景之前,先简单介绍一下如何使用Chrome
的开发者工具来查看js
内存情况
首先打开Chrome
的无痕模式,这样做的目的是为了屏蔽掉Chrome
插件对我们之后测试内存占用情况的影响
然后打开开发者工具
,找到Performance
这一栏,可以看到其内部带着一些功能按钮,例如:开始录制按钮;刷新页面按钮;清空记录按钮;记录并可视化 js 内存、节点、事件监听器按钮;触发垃圾回收机制按钮等等
简单录制一下百度页面,看看我们能获得什么,如下动图所示:
从上图中我们可以看到,在页面从零到加载完成这个过程中JS Heap(js堆内存)
、documents(文档)
、Nodes(DOM节点)
、Listeners(监听器)
、GPU memory(GPU内存)
的最低值、最高值以及随时间的走势曲线,这也是我们主要关注的点
再来看看开发者工具中的Memory
一栏,其主要是用于记录页面堆内存的具体情况以及js
堆内存随加载时间线动态的分配情况
堆快照就像照相机一样,能记录你当前页面的堆内存情况,每快照一次就会产生一条快照记录,如图所示:
如上图所示,刚开始执行了一次快照,记录了当时堆内存空间占用为13.9MB
,然后我们点击了页面中某些按钮,又执行一次快照,记录了当时堆内存空间占用为13.4MB
。并且点击对应的快照记录,能看到当时所有内存中的变量情况(结构、占总占用内存的百分比...)
然后我们还可以看一下页面动态的内存变化情况,如图所示:
在开始记录后,我们可以看到图中右上角有起伏的蓝色与灰色的柱形图,其中蓝色表示当前时间线下占用着的内存;灰色表示之前占用的内存空间已被清除释放。
从上图过程来看,我们可以看到刚开始处于的tab
所对应显示的页面中占用了一定的堆内存空间,成蓝色柱形,在点击别的tab
后,原tab
对应的内容消失,并且原来蓝色的柱形变成灰色(表示原占用的内存空间得到了释放),同时新tab
所对应显示的页面也占用了一定的堆内存空间。因此后续我们就可以针对这个图来查看内存的占用与清除情况
🔥 内存泄漏的场景
那么到底有哪些情况会出现内存泄漏的情况呢?这里列举了常见的几种:
闭包使用不当引起内存泄漏
全局变量
分离的 DOM 节点
控制台的打印
遗忘的定时器
接下来介绍一下各种情况,并尝试用刚才讲到的两种方法来捕捉问题所在
1.闭包使用不当
文章开头的例子中,在退出fn1函数执行上下文
后,该上下文中的变量a
本应被当作垃圾数据给回收掉,但因fn1
函数最终将变量a
返回并赋值给全局变量res
,其产生了对变量a
的引用,所以变量a
被标记为活动变量并一直占用着相应的内存,假设变量res
后续用不到,这就算是一种闭包使用不当的例子
接下来尝试使用Performance
和Memory
来查看一下闭包导致的内存泄漏问题,为了使内存泄漏的结果更加明显,我们稍微改动一下文章开头的例子,代码如下:
设置了一个按钮,每次执行就会将fn1
函数的返回值添加到全局数组变量res
中,是为了能在performacne
的曲线图中看出效果,如图所示:
在每次录制开始时手动触发一次垃圾回收机制,这是为了确认一个初始的堆内存基准线,便于后面的对比,然后我们点击了几次按钮,即往全局数组变量res
中添加了几个比较大的数组对象,最后再触发一次垃圾回收,发现录制结果的JS Heap
曲线刚开始成阶梯式上升的,最后的曲线的高度比基准线要高,说明可能是存在内存泄漏的问题
在得知有内存泄漏的情况存在时,我们可以改用Memory
来更明确得确认问题和定位问题
首先可以用Allocation instrumentation on timeline
来确认问题,如下图所示:
在我们每次点击按钮后,动态内存分配情况图上都会出现一个蓝色的柱形,并且在我们触发垃圾回收后,蓝色柱形都没变成灰色柱形,即之前分配的内存并未被清除
所以此时我们就可以更明确得确认内存泄漏的问题是存在的了,接下来就精准定位问题,可以利用Heap snapshot
来定位问题,如图所示:
第一次先点击快照记录初始的内存情况,然后我们多次点击按钮后再次点击快照,记录此时的内存情况,发现从原来的1.1M
内存空间变成了1.4M
内存空间,然后我们选中第二条快照记录,可以看到右上角有个All objects
的字段,其表示展示的是当前选中的快照记录所有对象的分配情况,而我们想要知道的是第二条快照与第一条快照的区别在哪,所以选择Object allocated between Snapshot1 and Snapshot2
,即展示第一条快照和第二条快照存在差异的内存对象分配情况,此时可以看到Array
的百分比很高,初步可以判断是该变量存在问题,点击查看详情后就能查看到该变量对应的具体数据了
以上就是一个判断闭包带来内存泄漏问题并简单定位的方法了
2.全局变量
全局的变量一般是不会被垃圾回收掉的,在文章开头也提到过了。当然这并不是说变量都不能存在全局,只是有时候会因为疏忽而导致某些变量流失到全局,例如未声明变量,却直接对某变量进行赋值,就会导致该变量在全局创建,如下所示:
此时这种情况就会在全局自动创建一个变量name
,并将一个很大的数组赋值给name
,又因为是全局变量,所以该内存空间就一直不会被释放
解决办法的话,自己平时要多加注意,不要在变量未声明前赋值,或者也可以开启严格模式,这样就会在不知情犯错时,收到报错警告,例如:
3.分离的 DOM 节点
什么叫 DOM 节点?假设你手动移除了某个dom
节点,本应释放该dom
节点所占用的内存,但却因为疏忽导致某处代码仍对该被移除节点有引用,最终导致该节点所占内存无法被释放,例如这种情况:
该代码所做的操作就是点击按钮后移除.child
的节点,虽然点击后,该节点确实从dom
被移除了,但全局变量child
仍对该节点有引用,所以导致该节点的内存一直无法被释放,可以尝试用Memory
的快照功能来检测一下,如图所示:
同样的先记录一下初始状态的快照,然后点击移除按钮后,再点击一次快照,此时内存大小我们看不出什么变化,因为移除的节点占用的内存实在太小了可以忽略不计,但我们可以点击第二条快照记录,在筛选框里输入detached
,于是就会展示所有脱离了却又未被清除的节点对象
解决办法如下图所示:
改动很简单,就是将对.child
节点的引用移动到了click
事件的回调函数中,那么当移除节点并退出回调函数的执行上文后就会自动清除对该节点的引用,那么自然就不会存在内存泄漏的情况了,我们来验证一下,如下图所示:
结果很明显,这样处理过后就不存在内存泄漏的情况了
4.控制台的打印
控制台的打印也会造成内存泄漏吗????是的呀,如果浏览器不一直保存着我们打印对象的信息,我们为何能在每次打开控制的Console
时看到具体的数据呢?先来看一段测试代码:
我们在按钮的点击回调事件中创建了一个很大的数组对象并打印,用performance
来验证一下:
开始录制,先触发一次垃圾回收清除初始的内存,然后点击三次按钮,即执行了三次点击事件,最后再触发一次垃圾回收。查看录制结果发现JS Heap
曲线成阶梯上升,并且最终保持的高度比初始基准线高很多,这说明每次执行点击事件创建的很大的数组对象obj
都因为console.log
被浏览器保存了下来并且无法被回收
接下来注释掉console.log
,再来看一下结果:
performance
如图所示:
可以看到没有打印以后,每次创建的obj
都立马被销毁了,并且最终触发垃圾回收机制后跟初始的基准线同样高,说明已经不存在内存泄漏的现象了
其实同理,console.log
也可以用Memory
来进一步验证
未注释
console.log
注释掉了
console.log
最后简单总结一下:在开发环境下,可以使用控制台打印便于调试,但是在生产环境下,尽可能得不要在控制台打印数据。所以我们经常会在代码中看到类似如下的操作:
这样就避免了生产环境下无用的变量打印占用一定的内存空间,同样的除了console.log
之外,console.error
、console.info
、console.dir
等等都不要在生产环境下使用
5.遗忘的定时器
其实定时器也是平时很多人会忽略的一个问题,比如定义了定时器后就再也不去考虑清除定时器了,这样其实也会造成一定的内存泄漏。来看一个代码示例:
这段代码是在点击按钮后执行fn1
函数,fn1
函数内创建了一个很大的数组对象largeObj
,同时创建了一个setInterval
定时器,定时器的回调函数只是简单的引用了一下变量largeObj
,我们来看看其整体的内存分配情况吧:
按道理来说点击按钮执行fn1
函数后会退出该函数的执行上下文,紧跟着函数体内的局部变量应该被清除,但图中performance
的录制结果显示似乎是存在内存泄漏问题的,即最终曲线高度比基准线高度要高,那么再用Memory
来确认一次:
在我们点击按钮后,从动态内存分配的图上看到出现一个蓝色柱形,说明浏览器为变量largeObj
分配了一段内存,但是之后这段内存并没有被释放掉,说明的确存在内存泄漏的问题,原因其实就是因为setInterval
的回调函数内对变量largeObj
有一个引用关系,而定时器一直未被清除,所以变量largeObj
的内存也自然不会被释放
那么我们如何来解决这个问题呢,假设我们只需要让定时器执行三次就可以了,那么我们可以改动一下代码:
现在我们再通过performance
和memory
来看看还不会存在内存泄漏的问题
performance
这次的录制结果就能看出,最后的曲线高度和初始基准线的高度一样,说明并没有内存泄漏的情况
memory
这里做一个解释,图中刚开始出现的蓝色柱形是因为我在录制后刷新了页面,可以忽略;然后我们点击了按钮,看到又出现了一个蓝色柱形,此时就是为fn1
函数中的变量largeObj
分配了内存,3s
后该内存又被释放了,即变成了灰色柱形。所以我们可以得出结论,这段代码不存在内存泄漏的问题
简单总结一下: 大家在平时用到了定时器,如果在用不到定时器后一定要清除掉,否则就会出现本例中的情况。除了setTimeout
和setInterval
,其实浏览器还提供了一个 API 也可能就存在这样的问题,那就是requestAnimationFrame
👍 总结
在项目过程中,如果遇到了某些性能问题可能跟内存泄漏有关时,就可以参照本文列举的5
种情况去排查,一定能找到问题所在并给到解决办法的。
虽然JavaScript
的垃圾回收是自动的,但我们有时也是需要考虑要不要手动清除某些变量的内存占用的,例如你明确某个变量在一定条件下再也不需要,但是还会被外部变量引用导致内存无法得到释放时,你可以用null
对该变量重新赋值就可以在后续垃圾回收阶段释放该变量的内存了。
😊 我也是因为在业务中一次因内存泄漏而引起页面卡顿,所以才想起写这样一篇文章。当然并不是说页面卡顿都是因为内存泄漏引起的,可能还有其它原因
大家对于内存泄漏排查的方法有什么建议或者问题的话可以在评论区讨论鸭~ ✌️
原创不易,记得点赞
👍 支持一下哦~ 😘
版权声明: 本文为 InfoQ 作者【零一】的原创文章。
原文链接:【http://xie.infoq.cn/article/aa6b0d97f38a1f8b98a61b024】。文章转载请联系作者。
评论