0

0

c++如何使用Perf工具分析性能_c++ Linux下的性能剖析神器

下次还敢

下次还敢

发布时间:2025-11-29 04:15:09

|

376人浏览过

|

来源于php中文网

原创

perf是Linux下C++性能调优的核心工具,通过硬件事件采样定位热点函数、缓存未命中和调用栈瓶颈,结合-debug信息与火焰图可精准分析性能问题。

c++如何使用perf工具分析性能_c++ linux下的性能剖析神器

在 Linux 环境下,C++ 程序的性能调优离不开高效的剖析工具。其中,perf(也称为 perf_events)是内核自带的强大性能分析工具,无需额外安装第三方库,即可对程序进行函数级、指令级甚至硬件事件级别的性能采样与统计。

Perf 能做什么?

perf 可以帮助你回答以下问题:

  • 哪些函数占用最多 CPU 时间?
  • 是否存在频繁的缓存未命中或分支预测失败?
  • 程序是否受内存访问延迟影响?
  • 热点代码路径在哪里?

它通过采集硬件性能计数器(如 CPU cycles、instructions、cache-misses 等)和软件事件(如上下文切换),为性能优化提供数据支持。

编译 C++ 程序时的准备

要获得有意义的 perf 分析结果,必须确保程序编译时包含调试信息,并关闭过度优化干扰定位:

立即学习C++免费学习笔记(深入)”;

g++ -O2 -g -fno-omit-frame-pointer your_program.cpp -o your_program
  • -g:生成调试符号,让 perf 显示函数名和行号。
  • -O2:保留合理优化的同时便于调试(避免 -O3 带来的内联过度)。
  • -fno-omit-frame-pointer:保留帧指针,有助于回溯更准确。

常用 perf 命令实战

1. 查看整体 CPU 占用热点(perf top)

实时查看系统或指定进程中最耗 CPU 的函数:

perf top -p 

或监控整个程序运行期间的热点:

perf top -s symbol,dso

界面类似 top,但显示的是采样到的函数名,可快速定位瓶颈函数。

2. 记录程序运行全过程(perf record)

最常用的方式是先记录再分析:

Tellers AI
Tellers AI

Tellers是一款自动视频编辑工具,可以将文本、文章或故事转换为视频。

下载
perf record -g ./your_program arg1 arg2
  • -g:启用调用图(call graph)采样,记录函数调用栈。
  • 运行结束后会生成默认文件 perf.data

3. 分析记录结果(perf report)

查看记录的性能数据:

perf report

进入交互界面后,你可以看到按采样次数排序的函数列表。展开每个函数还能看到其调用栈路径,清晰识别热点路径。

4. 指定关注特定性能事件

perf 支持多种硬件/软件事件。例如监测缓存失效:

perf record -e cache-misses,cache-references -g ./your_program

或查看每秒执行的指令数:

perf stat -e instructions,cycles,instructions-per-cycle ./your_program

perf stat 提供整体统计摘要,适合快速评估程序效率变化。

5. 生成火焰图(Flame Graph)辅助分析

perf report 的文本输出不够直观。推荐结合 FlameGraph 工具生成可视化火焰图:

perf script | stackcollapse-perf.pl | flamegraph.pl > perf.svg

常见问题与注意事项

  • 权限问题:某些系统需要 root 权限运行 perf,可通过调整内核参数放宽限制:
    echo 0 | sudo tee /proc/sys/kernel/kptr_restrict
        echo 1 | sudo tee /proc/sys/kernel/perf_event_paranoid
  • 内联函数可能无法精确显示:高优化级别下函数被内联,导致 perf 难以区分。可临时使用 -O1 或标记关键函数 __attribute__((noinline))
  • 采样频率默认足够,若需更高精度可用 -F 997 指定采样频率(单位:Hz)。

基本上就这些。perf 是 C++ 开发者在 Linux 下做性能剖析的首选工具,配合调试符号和火焰图,能快速定位性能瓶颈。掌握它,能让你的优化工作事半功倍。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

392

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1998

2024.08.16

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1349

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

704

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

294

2023.06.30

linux修改文件名
linux修改文件名

本专题为大家提供linux修改文件名相关的文章,这些文章可以帮助用户快速轻松地完成文件名的修改工作,大家可以免费体验。

776

2023.07.05

linux系统安装教程
linux系统安装教程

linux系统是一种可以免费使用,自由传播,多用户、多任务、多线程、多CPU的操作系统。本专题提供linux系统安装教程相关的文章,大家可以免费体验。

573

2023.07.06

Java JVM 原理与性能调优实战
Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

19

2026.01.20

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.5万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号