gc.get_referrers() 能定位泄漏对象的持有者,因为它反向查询当前直接引用该对象的所有对象,从而揭示意外的引用链;它只返回垃圾回收器管理的非原子类型对象的直接引用者,需配合 gc.collect() 和去重使用,并注意性能与误判风险。

为什么 gc.get_referrers() 能定位泄漏对象的持有者
Python 的内存泄漏往往不是对象没被销毁,而是它被某个“意外的引用链”死死拽住。gc.get_referrers() 不查对象自己做了什么,而是反向查——谁正指着它。只要泄漏对象还活着,就一定有至少一个 referrer(比如全局变量、类属性、闭包、容器等)在持有它。这是最直接的“逆向追踪”手段。
注意:它只返回当前可达的直接引用者(不递归),且要求目标对象在垃圾回收器管理范围内(即非原子类型,如 list/dict/自定义类实例等)。对 int、str 等小常量或 C 扩展对象可能为空或不可靠。
怎么用 gc.get_referrers() 锁定可疑引用链
典型流程是“抓活口 → 查引用 → 溯源头”。先通过 gc.get_objects() 或第三方工具(如 objgraph)找出疑似泄漏的长生命周期对象(比如不断增长的 list 实例或自定义类实例),再对其调用 gc.get_referrers()。
- 确保已启用垃圾回收:
gc.enable()(默认开启,但显式确认更稳) - 避免干扰:调用前手动触发一次
gc.collect(),清理掉本该被回收的临时对象 - 聚焦目标:不要对所有对象调用,只对
id(obj)已知、且你怀疑“不该存在这么久”的对象查 - 结果去重:返回列表常含重复项(如多个 dict 引用同一对象),建议用
list(set(...))初筛
示例:
立即学习“Python免费学习笔记(深入)”;
import gc
# 假设 obj 是你从 objgraph.find_backref_chain() 或内存快照中锁定的可疑对象
referrers = gc.get_referrers(obj)
for r in referrers[:3]: # 只看前几个,避免刷屏
print(type(r), getattr(r, '__name__', ''), getattr(r, '__class__', ''))常见 referrer 类型及对应排查方向
返回的 referrer 类型直接暴露泄漏入口点。重点盯以下几类:
-
dict:检查是否误塞进全局字典、模块级缓存、__dict__或日志上下文;特别注意locals()或装饰器闭包里偷偷保留的引用 -
list/tuple:查是否作为全局队列、待处理缓冲区、事件监听器列表未及时 pop/clear - 自定义类实例:看其属性名(
r.__dict__.keys()),比如self._cache、self._handlers是否累积未清理 -
function或method:说明是闭包或绑定方法持有了对象,需 inspect 其__closure__或__func__.__globals__ -
module:最危险——说明对象被挂到了模块顶层,比如my_module.GLOBAL_LIST.append(obj)后忘记清理
容易踩的坑和性能注意点
gc.get_referrers() 看似简单,但实战中几个细节常导致误判或卡死:
- 别在生产环境高频调用:它会遍历整个堆内存查找引用,对象多时极慢,甚至引发明显延迟
- 别信第一个 referrer:返回顺序无保证,首个可能是无关的临时引用(如函数参数栈帧),要结合类型 + 属性综合判断
- 循环引用场景下,
gc.get_referrers()可能返回 GC 自身的跟踪结构(如gc.garbage),需过滤掉type(r) is list and len(r) > 1000这类异常大列表 - 多线程下结果可能瞬时失效:引用关系在调用瞬间存在,但下一毫秒就被释放了。务必在稳定复现泄漏的步骤后立即捕获
真正难的不是找到 referrer,而是判断“这个引用是否合理”——比如一个 dict 引用泄漏对象,得立刻查清它是配置缓存、还是本该随请求结束就丢弃的上下文残留。










