Python gc.get_referrers() 如何用来排查内存泄漏源头

冰川箭仙

发布时间：2026-01-23 18:27:09

726人浏览过

来源于php中文网

原创

gc.get_referrers() 能定位泄漏对象的持有者，因为它反向查询当前直接引用该对象的所有对象，从而揭示意外的引用链；它只返回垃圾回收器管理的非原子类型对象的直接引用者，需配合 gc.collect() 和去重使用，并注意性能与误判风险。

python gc.get_referrers() 如何用来排查内存泄漏源头

为什么 `gc.get_referrers()` 能定位泄漏对象的持有者

Python 的内存泄漏往往不是对象没被销毁，而是它被某个“意外的引用链”死死拽住。gc.get_referrers() 不查对象自己做了什么，而是反向查——谁正指着它。只要泄漏对象还活着，就一定有至少一个 referrer（比如全局变量、类属性、闭包、容器等）在持有它。这是最直接的“逆向追踪”手段。

注意：它只返回当前可达的直接引用者（不递归），且要求目标对象在垃圾回收器管理范围内（即非原子类型，如 list/dict/自定义类实例等）。对 int、str 等小常量或 C 扩展对象可能为空或不可靠。

怎么用 `gc.get_referrers()` 锁定可疑引用链

典型流程是“抓活口 → 查引用 → 溯源头”。先通过 gc.get_objects() 或第三方工具（如 objgraph）找出疑似泄漏的长生命周期对象（比如不断增长的 list 实例或自定义类实例），再对其调用 gc.get_referrers()。

确保已启用垃圾回收：gc.enable()（默认开启，但显式确认更稳）
避免干扰：调用前手动触发一次 gc.collect()，清理掉本该被回收的临时对象
聚焦目标：不要对所有对象调用，只对 id(obj) 已知、且你怀疑“不该存在这么久”的对象查
结果去重：返回列表常含重复项（如多个 dict 引用同一对象），建议用 list(set(...)) 初筛

示例：

立即学习“Python免费学习笔记（深入）”；

CreateWise AI

为播客创作者设计的AI创作工具，AI自动去口癖、提交亮点和生成Show notes、标题等

下载

import gc
# 假设 obj 是你从 objgraph.find_backref_chain() 或内存快照中锁定的可疑对象
referrers = gc.get_referrers(obj)
for r in referrers[:3]:  # 只看前几个，避免刷屏
    print(type(r), getattr(r, '__name__', ''), getattr(r, '__class__', ''))

常见 referrer 类型及对应排查方向

返回的 referrer 类型直接暴露泄漏入口点。重点盯以下几类：

dict：检查是否误塞进全局字典、模块级缓存、__dict__ 或日志上下文；特别注意 locals() 或装饰器闭包里偷偷保留的引用
list / tuple：查是否作为全局队列、待处理缓冲区、事件监听器列表未及时 pop/clear
自定义类实例：看其属性名（r.__dict__.keys()），比如 self._cache、self._handlers 是否累积未清理
function 或 method：说明是闭包或绑定方法持有了对象，需 inspect 其 __closure__ 或 __func__.__globals__
module：最危险——说明对象被挂到了模块顶层，比如 my_module.GLOBAL_LIST.append(obj) 后忘记清理

容易踩的坑和性能注意点

gc.get_referrers() 看似简单，但实战中几个细节常导致误判或卡死：

别在生产环境高频调用：它会遍历整个堆内存查找引用，对象多时极慢，甚至引发明显延迟
别信第一个 referrer：返回顺序无保证，首个可能是无关的临时引用（如函数参数栈帧），要结合类型 + 属性综合判断
循环引用场景下，gc.get_referrers() 可能返回 GC 自身的跟踪结构（如 gc.garbage），需过滤掉 type(r) is list and len(r) > 1000 这类异常大列表
多线程下结果可能瞬时失效：引用关系在调用瞬间存在，但下一毫秒就被释放了。务必在稳定复现泄漏的步骤后立即捕获

真正难的不是找到 referrer，而是判断“这个引用是否合理”——比如一个 dict 引用泄漏对象，得立刻查清它是配置缓存、还是本该随请求结束就丢弃的上下文残留。

如何在Python中正确加载并显示Kaggle图像数据集中的图片

SHA1 实现与标准库结果不一致的常见原因及修复方案

如何在Python中正确加载并显示Kaggle数据集中的图像

Python 的 copyreg 模块完全适用于自定义类的序列化定制

Python 的 copyreg 模块完全适用于用户自定义类的序列化定制

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：pandas 如何在 read_csv 时强制某些列为 string 而非 int/float 下一篇：itertools.product 如何高效生成笛卡尔积但避免内存爆炸

作者最新文章

华为荣耀价格最低的一款手机荣耀最便宜机型价格解析

2026-03-11 09:37

微信电脑版文件保存在哪个文件夹微信电脑版文件默认存储路径

2026-03-11 11:40

Linux配置集中管理_配置统一方案

2026-03-11 11:50

Linux服务器频繁重启_硬件与系统排查

2026-03-11 12:11

Adobe怎么把一页拆分成两页 Adobe PDF页面拆分方法

2026-03-11 12:17

Linux系统内核参数查看_sysctl命令详解

2026-03-11 12:27

SQL报表指标口径变更_版本化设计

2026-03-11 12:34

Linux 反向代理性能优化_Nginx网络调优

2026-03-11 13:05

GitHub 网址打不开怎么解决？网络与 DNS 排查方法

2026-03-11 13:44

腾讯会议屏幕比例怎么调

2026-03-11 14:17

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1569

2023.10.24

java基础知识汇总

1569

2023.10.24

全局变量怎么定义

本专题整合了全局变量相关内容，阅读专题下面的文章了解更多详细内容。

2025.09.18

python 全局变量

本专题整合了python中全局变量定义相关教程，阅读专题下面的文章了解更多详细内容。

106

2025.09.18

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1051

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

614

2024.08.29