Linux 内存泄漏排查与修复实践

舞夢輝影

发布时间：2026-02-18 10:41:02

246人浏览过

来源于php中文网

原创

valgrind定位堆泄漏需带调试符号编译（gcc -g -o0），关注含文件名和行号的分配点；它仅跟踪malloc/new等，不监控mmap/brk；长时服务宜用gdb动态断点或/proc/pid/smaps分析pss。

linux 内存泄漏排查与修复实践

用 `valgrind` 抓住堆内存泄漏的准确位置

多数人跑 valgrind --leak-check=full ./a.out 后只扫一眼“definitely lost”就停了，但真正有用的是它输出中带文件名和行号的那一行——前提是你的程序得带调试符号编译。

必须用 gcc -g -O0 编译，-O2 会让内联和变量优化掩盖真实分配点
valgrind 对 mmap、brk 级别分配不敏感，只管 malloc/calloc/realloc 系列，C++ 的 new 也算在内
如果程序一启动就崩溃，加 --tool=memcheck --track-origins=yes 查未初始化内存是否间接导致后续误释放
注意 suppressions 文件干扰：默认 suppressions 可能过滤掉 glibc 内部的假阳性，但自定义 suppressions 写错会漏报真泄漏

`gdb` 里动态观察 `malloc` 调用栈

不是所有泄漏都适合等程序退出再查；长时运行服务（比如后台 daemon）需要在线盯住谁在不断 malloc 却不 free。

先 gdb -p $(pidof your_service)，然后 catch syscall mmap 或 break malloc，再 command 1; bt; cont; end 让每次分配都打个断点栈
更轻量的做法是 watch *(int*)0xdeadbeef —— 先用 cat /proc/PID/maps 找到堆地址范围，再对某块堆内存设写入观察点，触发时看谁在改它
注意 glibc 的 malloc 实现有 fastbin、tcache，小对象可能复用不走系统调用，这时候 catch syscall brk 就捕不到，得回退到 break __libc_malloc

`/proc/PID/smaps` 看懂 RSS 和 PSS 差异

运维常盯着 top 的 %MEM 或 ps aux 的 VSZ 判断泄漏，但这些数字根本不能定位问题——VSZ 包含没实际映射的虚拟地址，RSS 又包含共享库和 mmap 共享内存。

Nimo.space

智能画布式AI工作台

下载

真正反映进程独占物理内存的是 PSS（Proportional Set Size），在 /proc/PID/smaps 每个内存段后都有，总和才接近真实增长量
重点看 AnonHugePages 和 MMUPageSize 字段：如果某段 Size 很大但 RSS 接近 0，说明只是预留了虚拟地址，还没真正分配物理页
用 awk '/^Size:/ {s+=$2} /^PSS:/ {p+=$2} END {print "Size:", s, "PSS:", p}' /proc/PID/smaps 快速汇总，比单看 top 可靠得多

C++ 中 `std::shared_ptr` 循环引用的真实表现

不是所有 C++ 内存泄漏都报错或 crash，shared_ptr 循环引用会导致对象永远不析构，但 valgrind 也标为 “still reachable”，容易被当成正常缓存。

典型模式：A 持有 shared_ptr<b></b>，B 又持有 shared_ptr<a></a>；用 weak_ptr 替换其中一端才能打破循环
valgrind 输出里如果看到大量 “still reachable” 且堆栈指向 std::shared_ptr<...>::_M_release</...>，基本就是这个原因
不要依赖 std::enable_shared_from_this 自动管理，它本身不解决循环，反而可能让引用关系更隐蔽

堆内存泄漏最难的不是发现，是确认那个 malloc 调用到底该由谁 free——尤其是跨模块、跨线程、或者封装在第三方库回调里的分配。这时候看调用栈比看代码行号还重要。

Linux 磁盘 I/O 性能瓶颈排查

Linux shell 条件判断与循环优化

Linux Podman vs Docker 的 rootless 模式安全优势与迁移 checklist

Linux CRI 兼容性测试（crictl inspect / run / stats）的标准化 checklist

Linux isolcpus 与 nohz_full 的全核隔离配置对抖动的影响对比

相关标签:

linux print 封装 catch break int 循环栈堆线程对象 linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Linux 跨机房数据同步的注意事项下一篇：暂无

作者最新文章

GitHub 怎么配置 SSH？GitHub SSH Key 配置完整教程

2026-02-16 12:24

Python etcd3 的 Python 异步客户端

2026-02-16 12:25

Windows蓝屏错误怎么解决 Windows蓝屏错误排查与修复

2026-02-16 12:34

Python 幂等性设计的常见模式

2026-02-16 12:53

腾讯会议电脑怎么进入会议

2026-02-16 12:54

SQL 主键自增序列 vs UUID 主键的插入性能与索引碎片对比

2026-02-16 13:16

Windows杀毒方法内置防护与第三方安全软件思路

2026-02-16 13:40

Linux shell 管道组合优化技巧

2026-02-16 13:42

Python 抽象基类（ABC）与协议（Protocols）：接口设计的边界

2026-02-16 13:51

Python f-string 的自描述表达式增强

2026-02-16 14:02

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容，供大家免费下载体验。

192

2023.09.27

python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容，阅读专题下面的文章了解更多详细教程。

2026.02.03

java中break的作用

本专题整合了java中break的用法教程，阅读专题下面的文章了解更多详细内容。

120

2025.10.15

java break和continue

本专题整合了java break和continue的区别相关内容，阅读专题下面的文章了解更多详细内容。

259

2025.10.24

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

770

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

572

2024.08.29