linux 工具之 perf
描述
Performance counters for Linux are a new kernel-based subsystem
that provide a framework for all things performance analysis. It
covers hardware level (CPU/PMU, Performance Monitoring Unit)
features and software features (software counters, tracepoints) as well.
功能
1)当我们程序的 cpu 使用率增高,使用它就可以快速的找到 cpu 占用率高的函数。
2)当我们需要对整个程序进行性能剖析,使用它配合 FlameGraph 生成火焰图可以很直观的以图片的形式把程序的内部结构展现出来
3) perf 是一个很强大的工具,在工作中,我主要用到了以上两点,还有很多亮点还没发现到,大家有兴趣可以去官网了解https://www.brendangregg.com/perf.html
示例
1) 快速定位程序热点函数
perf top -p $(pid)
2)配合 FlameGraph 生成火焰图
对性能剖析时,我们通常需要分析查找到程序百分比高的热点代码片段,这时我们就要用的 perf record/report
1)生成文件
sudo perf record -e cpu-clock -g -p $(pid)-- sleep 30
-g 选项是告诉 perf record 额外记录函数的调用关系
-e cpu-clock 指 perf record 监控的指标为 cpu 周期
-p 指定需要 record 的进程 pid
-- sleep 30 则是持续 30 秒
2) 查看结果
perf report -i perf.data
3) FlameGraph 使用
下载 FlameGraph
git clone https://github.com/brendangregg/FlameGraph.git
执行如下命令将生成一个 perf.data 文件
perf record -e cpu-clock -g -p 28591 -- sleep 30
使用 perf script 将 perf.data 的内容 dump 到 perf.unfold
perf script -i perf.data &> perf.unfold
将 perf.unfold 中的符号进行折叠
./FlameGraph/stackcollapse-perf.pl perf.unfold &> perf.folded
最后生成 svg 图
./FlameGraph/flamegraph.pl perf.folded > perf.svg
结果展示
备注:
y 轴表示调用栈,每一层都是一个函数。调用栈越深,火焰就越高,顶部就是正在执行的函数,下方都是它的父函数。
x 轴表示抽样数,如果一个函数在 x 轴占据的宽度越宽,就表示它被抽到的次数多,即执行的时间长。注意,x 轴不代表时间,而是所有的调用栈合并后,按字母顺序排列的。
火焰图就是看顶层的哪个函数占据的宽度最大。只要有"平顶"(plateaus),就表示该函数可能存在性能问题。
颜色没有特殊含义,因为火焰图表示的是 CPU 的繁忙程度,所以一般选择暖色调。
参考:https://www.ruanyifeng.com/blog/2017/09/flame-graph.html
评论