C++如何实现简易的内存分配火焰图采样？（malloc hook记录）

裘德小鎮的故事

发布时间：2026-02-20 14:57:11

265人浏览过

来源于php中文网

原创

malloc_hook在现代glibc中不可用，因2.34+已移除__malloc_hook变量，且2.33下ld_preload易触发double free；推荐用ld_preload拦截malloc/free并结合backtrace_symbols_fd采样。

c++如何实现简易的内存分配火焰图采样？（malloc hook记录）

为什么 `malloc_hook` 在现代 glibc 上基本不可用

因为从 glibc 2.34 开始，__malloc_hook 等全局 hook 变量被彻底移除，不是 deprecated，是直接删了。你写代码去赋值 __malloc_hook，链接会报 undefined symbol；即使降级到 2.33，启用 LD_PRELOAD 后也极大概率触发 double free or corruption —— 因为 hook 函数本身可能再次调用 malloc（比如格式化栈帧），形成递归分配。

所以别试 __malloc_hook + backtrace 的老方案，它现在既不安全也不可靠。

用 `LD_PRELOAD` 替换 `malloc`/`free` 更可行

这是目前最稳定、兼容性最好的用户态采样方式：把标准库的内存函数用自定义版本拦截，在入口记录调用栈和大小，再转发给真正的 malloc（通过 dlsym(RTLD_NEXT, "malloc") 获取）。

实操要点：

立即学习“C++免费学习笔记（深入）”；

必须在共享库中实现，并用 extern "C" 导出符号，避免 C++ name mangling
所有 hook 函数里禁止调用任何可能间接 malloc 的东西：std::string、std::cout、printf（它可能 malloc 缓冲区）、甚至 backtrace_symbols（它 malloc）
栈采集用 backtrace + backtrace_symbols_fd 最稳妥，后者不 malloc，直接写 fd
采样频率要控制，比如只对 >1KB 的分配记录，否则小对象爆炸式打点会拖垮程序

示例片段（关键逻辑）：

Cognitive Mill

一个云计算平台，可以分析视频并自动生成预告片

下载

extern "C" {
void* malloc(size_t size) {
    static void* (*real_malloc)(size_t) = nullptr;
    if (!real_malloc) real_malloc = (void*(*)(size_t))dlsym(RTLD_NEXT, "malloc");
    if (size > 1024) {
        void* bt[64];
        int nptrs = backtrace(bt, 64);
        backtrace_symbols_fd(bt, nptrs, STDERR_FILENO); // 或写入 mmap'd buffer
    }
    return real_malloc(size);
}
}

如何把栈帧数据喂给 `flamegraph.pl`

火焰图工具不认原始 backtrace 输出，需要转成它要求的折叠格式（folded stack trace），每行形如 a;b;c;d;main 123（函数名分号分隔，末尾是样本数）。

常见坑：

backtrace_symbols 返回的字符串含地址（如 ./a.out(+0x1234)），flamegraph.pl 默认忽略带括号的，得用 --color 或预处理清洗
不同编译器生成符号风格不同：GCC 带 offset，Clang 可能带 ``，建议用 addr2line -e ./binary -f -C -i 做后处理
别实时 pipe 给 flamegraph.pl —— 高频分配下 I/O 成瓶颈，先存文本，采样结束再批量转换

真正难的是线程安全与性能干扰

所有 hook 函数都运行在应用线程上下文中，而 backtrace 和文件写入都不是轻量操作。多线程下若共用一个 buffer 或 fd，必须加锁，但锁本身又引入竞争和延迟，导致采样失真。

更现实的做法：

每个线程用 thread_local 缓冲区暂存栈帧（固定大小 ring buffer），满后再批量刷出
避免锁：用无锁队列把栈帧指针发给单独的 writer 线程（需原子操作或 hazard pointer）
采样开关做成运行时可调（比如通过 atomic<bool></bool> 控制），方便线上灰度
注意：backtrace 在某些优化级别（-O2 以上）可能无法正确展开内联函数或 tail-call，建议编译时加 -fno-omit-frame-pointer

越想准确实时看内存热点，越得接受它本身会轻微改变内存行为——这是绕不开的观测代价。

C++如何实现对象的延迟反序列化？（仅在访问时解析数据）

C++怎么使用条件编译_C++#ifdef跨平台适配【兼容】

C++如何实现多线程编程？（std::thread实战指南）

C++ 窄化转换（Narrowing Conversions）是什么？（如何使用列表初始化防止数据丢失）

C++如何实现线程安全的计时器管理器？（多定时任务调度）

相关标签:

c++ String printf extern 字符串递归 double thread_local 指针栈线程多线程 pointer undefined symbol 对象

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：C++如何使用原子操作？（std::atomic实战）下一篇：暂无

作者最新文章

Laravel怎么使用Resource资源控制器_Laravel API标准化教程【规范】

2026-02-19 13:17

高德地图怎么找停车场_高德附近车位实时查询【停车】

2026-02-19 13:21

c++如何使用std::unique_c++去除容器相邻重复项【总结】

2026-02-19 13:22

c++如何防止类被继承_c++ final关键字用法说明【避坑】

2026-02-19 13:23

七猫免费小说怎么调语速_七猫小说听书速度设置教程【听书】

2026-02-19 13:23

Word怎么设置行号_Word文档每行显示行号方法【指南】

2026-02-19 13:25

C++如何使用std::is_trivially_assignable判断平凡赋值？（结构体复制优化）

2026-02-19 13:28

C++如何进行大整数的快速乘法（Karatsuba算法）？（分治优化）

2026-02-19 13:31

可灵AI怎么生成双人互动的视频内容_可灵AI复杂场景生成【秘籍】

2026-02-19 13:32

C++中的std::initializer_list是什么？（如何实现类似数组的初始化语法）

2026-02-19 13:33

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

790

2023.08.02

printf用法大全

php中文网为大家提供printf用法大全，以及其他printf函数的相关文章、相关下载资源以及各种相关课程，供大家免费下载体验。

2023.06.20

fprintf和printf的区别

fprintf和printf的区别在于输出的目标不同，printf输出到标准输出流，而fprintf输出到指定的文件流。根据需要选择合适的函数来进行输出操作。更多关于fprintf和printf的相关文章详情请看本专题下面的文章。php中文网欢迎大家前来学习。

298

2023.11.28

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

594

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

217

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1555

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

640

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

966

2024.03.22