0

0

C++如何进行性能分析?(perf与gprof使用指南)

裘德小鎮的故事

裘德小鎮的故事

发布时间:2026-03-04 13:09:12

|

930人浏览过

|

来源于php中文网

原创

perf record 看不到函数名是因为编译未加 -g(缺失调试信息)或未加 -fno-omit-frame-pointer(优化导致栈展开失败),而非 perf 本身问题。

c++如何进行性能分析?(perf与gprof使用指南)

perf record 采样时为什么看不到函数名?

默认用 perf record 抓不到符号,是因为编译没带调试信息或优化干扰了帧指针。不是 perf 本身有问题,是二进制里没留够线索。

  • 编译必须加 -g(生成 DWARF),否则 perf report 只能显示地址,没法映射到函数
  • -fno-omit-frame-pointer,尤其在 -O2 或更高优化下,否则调用栈会断——perf 依赖帧指针做栈展开
  • 避免用 -flto(LTO),它会合并/重命名函数,导致符号丢失或错乱
  • 运行前确认 /proc/sys/kernel/perf_event_paranoid ≤ 2,否则普通用户无法采集内核态事件

gprof 报 “flat profile: no data” 怎么办?

这表示程序根本没生成 gmon.out,不是分析工具坏了,是链接或运行环节漏了关键步骤。

  • 编译和链接都得加 -pg:只编译加不行,链接时没 -pg 会导致监控代码被丢弃
  • 程序必须正常退出(比如 return 或 exit()),靠 kill -9 杀掉不会写 gmon.out
  • 如果用了 fork(),子进程默认不生成 gmon.out;要手动调 moncontrol(1) 开启
  • gprof 只支持 a.out 格式或传统 ELF,对 PIE(-pie)二进制支持差,容易报错或数据为空

perf vs gprof:什么时候该选哪个?

不是“哪个更好”,是“哪个能跑通 + 能回答当前问题”。两者底层机制完全不同,混用会白忙活。

Pixelfox AI
Pixelfox AI

多功能AI图像编辑工具

下载
  • perf 是基于硬件 PMU 的采样器,开销低(~1%),支持 CPU cycle / cache-miss / context-switch 等多维事件,但只能看热点,不能直接给出函数间调用耗时
  • gprof 是插桩(instrumentation),会在每个函数入口/出口埋计数,能出调用图(call graph)和每条调用路径耗时,但开销大(常 >10x),且不支持多线程安全计数
  • 想定位 cache line bouncing?用 perf record -e cache-misses;想查某个函数被谁高频调用?gprof -q 输出调用关系更直接
  • gprof 对 inline 函数、模板实例化、RAII 析构等场景统计失真严重;perf 不受这些影响,但看不到 C++ 异常栈展开细节

perf script 输出里出现大量 [unknown] 或 [kernel.kallsyms]?

说明符号解析失败,不是数据丢了,是 perf 找不到对应符号表位置。

立即学习C++免费学习笔记(深入)”;

  • 检查是否用了 strip 处理过二进制——strip 会删掉 .symtab 和 .dynsym,perf 就只能靠 /proc/kallsyms 或 vmlinux 猜
  • 内核模块没加载 debuginfo 包(如 kernel-debuginfo),[kernel.kallsyms] 就没法映射到具体函数
  • perf buildid-list 确认 build-id 是否匹配;不匹配时 perf report --symfs 指定符号路径也无效
  • 容器环境里,宿主机的 /usr/lib/debug 通常没挂进去,得显式 bind mount 或用 perf archive 打包符号再分析
实际跑起来才发现,perf 的 symbol resolution 和 gprof 的插桩时机,都是悄无声息就失效的点。没看到函数名,先别怀疑工具,去翻编译参数和二进制属性。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
switch语句用法
switch语句用法

switch语句用法:1、Switch语句只能用于整数类型,枚举类型和String类型,不能用于浮点数类型和布尔类型;2、每个case语句后面必须跟着一个break语句,以防止执行其他case的代码块,没有break语句,将会继续执行下一个case的代码块;3、可以在一个case语句中匹配多个值,使用逗号分隔;4、Switch语句中的default代码块是可选的等等。

566

2023.09.21

Java switch的用法
Java switch的用法

Java中的switch语句用于根据不同的条件执行不同的代码块。想了解更多switch的相关内容,可以阅读本专题下面的文章。

440

2024.03.13

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

433

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

600

2023.08.10

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

743

2023.08.10

Python 多线程与异步编程实战
Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧,包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例,帮助学习者掌握 如何构建高性能、多任务并发的 Python 应用。

373

2025.12.24

java多线程相关教程合集
java多线程相关教程合集

本专题整合了java多线程相关教程,阅读专题下面的文章了解更多详细内容。

27

2026.01.21

C++多线程相关合集
C++多线程相关合集

本专题整合了C++多线程相关教程,阅读专题下面的的文章了解更多详细内容。

27

2026.01.21

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

4

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 10.6万人学习

C 教程
C 教程

共75课时 | 5.2万人学习

C++教程
C++教程

共115课时 | 20.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号