Python中的内存管理机制是怎样的？如何避免内存泄漏？

爱谁谁

发布时间：2025-07-02 17:51:02

365人浏览过

来源于php中文网

原创

python的内存管理通过引用计数和垃圾回收机制自动进行。1. 引用计数记录对象被引用的次数，当计数归零时立即回收内存；2. 循环引用问题由垃圾回收器处理，采用“标记-清除”算法检测并释放不可达对象；3. 使用__slots__可限制实例属性以节省内存，但不能动态添加属性；4. 避免内存泄漏可通过手动打破循环引用、使用weakref模块、减少全局变量等方式；5. 垃圾回收策略可通过gc模块调整阈值或启用/禁用回收器，需在性能与内存占用间权衡。

Python中的内存管理机制是怎样的？如何避免内存泄漏？

Python的内存管理，简单来说，就是Python自己有一套机制来分配和回收内存，不像C/C++那样需要手动管理。这既是优点，也是潜在问题发生的根源。

Python的内存管理主要依赖于引用计数和垃圾回收。

引用计数是说，每个对象都有一个计数器，记录有多少个变量引用它。当引用计数归零时，对象就会被立即回收。但这有个问题，就是循环引用，比如两个对象互相引用，即使程序不再使用它们，它们的引用计数也永远不会是零，导致内存泄漏。

立即学习“Python免费学习笔记（深入）”；

这时候，垃圾回收就派上用场了。Python的垃圾回收器会定期扫描内存中的对象，检测循环引用，并释放这些不再使用的对象。

Python的引用计数是如何工作的？

每个Python对象，实际上都包含一个PyObject结构体，其中就有一个ob_refcnt字段，这就是引用计数。当创建一个对象并赋值给一个变量时，引用计数加1。当变量不再引用该对象，或者变量被重新赋值时，引用计数减1。

例如：

a = [1, 2, 3] # 创建一个列表对象，引用计数为1
b = a         # b也引用这个列表对象，引用计数变为2
del a         # a不再引用这个列表对象，引用计数变为1
del b         # b也不再引用这个列表对象，引用计数变为0，列表对象被回收

需要注意的是，函数调用、容器（列表、字典等）也会影响引用计数。

垃圾回收器如何处理循环引用？

Python的垃圾回收器使用一种叫做“标记-清除”的算法来处理循环引用。

标记阶段: 从根对象（例如全局变量、活动栈帧等）开始，递归地标记所有可达的对象。
清除阶段: 遍历所有对象，将没有被标记的对象（即不可达对象，包括循环引用中的对象）进行回收。

为了提高效率，垃圾回收器还会使用分代回收。它会根据对象存活时间的长短，将对象分为不同的代。新创建的对象属于第0代，每次垃圾回收后仍然存活的对象，会被移到下一代。垃圾回收器会更频繁地回收年轻的对象，因为通常来说，年轻的对象更容易变成垃圾。

如何避免Python中的内存泄漏？

避免内存泄漏，其实就是避免产生不必要的循环引用，或者及时释放不再使用的对象。

打破循环引用: 如果你知道某些对象之间存在循环引用，并且这些对象不再需要使用，可以手动将它们的引用设为None。

class Node:
    def __init__(self, data):
        self.data = data
        self.next = None

a = Node(1)
b = Node(2)
a.next = b
b.next = a  # 循环引用

# 手动打破循环引用
a.next = None
b.next = None
del a
del b

使用weakref: weakref模块允许你创建一个对象的弱引用。弱引用不会增加对象的引用计数。当对象被回收时，所有指向它的弱引用都会自动失效。这可以用来避免循环引用。

云从科技AI开放平台

云从AI开放平台

下载

import weakref

class MyClass:
    def __init__(self, name):
        self.name = name

obj = MyClass("My Object")
weak_ref = weakref.ref(obj)

print(weak_ref())  # 输出 <__main__.MyClass object at ...>

del obj  # 删除obj

print(weak_ref())  # 输出 None，因为obj已经被回收

避免全局变量: 全局变量的生命周期很长，容易导致对象一直存活，无法被回收。尽量使用局部变量，或者在不再需要使用全局变量时，将其设为None。
使用gc.collect(): 虽然Python会自动进行垃圾回收，但你也可以手动调用gc.collect()来强制进行垃圾回收。这在某些情况下可以立即释放内存。但是，频繁调用gc.collect()会降低程序的性能，所以应该谨慎使用。
```
import gc

# ... 一些操作，可能产生垃圾对象 ...

gc.collect()  # 手动进行垃圾回收
```

使用工具进行内存分析: 可以使用一些工具，例如memory_profiler、objgraph等，来分析Python程序的内存使用情况，找出潜在的内存泄漏。

# 使用memory_profiler
from memory_profiler import profile

@profile
def my_function():
    a = [i for i in range(1000000)]
    return a

if __name__ == '__main__':
    my_function()

`slots` 对内存管理有什么影响？

__slots__ 是一个类变量，可以用来限制类的实例可以拥有的属性。默认情况下，Python 类的实例使用 __dict__ 属性来存储所有实例属性，这是一个字典，可以动态地添加属性。但对于有很多实例的类来说，使用 __dict__ 会占用大量的内存。

使用 __slots__ 可以告诉 Python 解释器，该类的实例只会拥有 __slots__ 中定义的属性。这样，Python 就不会为每个实例创建 __dict__，而是使用一种更紧凑的数据结构来存储属性，从而节省内存。

class MyClass:
    __slots__ = ['name', 'age']

    def __init__(self, name, age):
        self.name = name
        self.age = age

obj = MyClass("Alice", 30)
# obj.city = "Beijing"  # 会抛出 AttributeError，因为 city 不在 __slots__ 中

但是，使用 __slots__ 也有一些限制：

不能动态地添加新的属性。
如果一个类使用了 __slots__，那么它的子类也必须使用 __slots__，除非子类重新定义了 __dict__。
使用了 __slots__ 的类，不能使用 weakref。

总的来说，__slots__ 是一种优化内存使用的手段，但需要根据实际情况权衡利弊。

如何选择合适的垃圾回收策略？

Python的垃圾回收策略可以通过gc模块进行配置。常用的配置包括：

gc.enable(): 启用垃圾回收器。
gc.disable(): 禁用垃圾回收器。
gc.isenabled(): 检查垃圾回收器是否启用。
gc.get_threshold(): 获取垃圾回收的阈值。
gc.set_threshold(): 设置垃圾回收的阈值。

垃圾回收的阈值决定了垃圾回收器何时运行。Python使用三个阈值：

threshold0: 第0代对象数量达到这个值时，会触发垃圾回收。
threshold1: 第0代对象回收次数达到这个值时，会触发第1代对象的回收。
threshold2: 第1代对象回收次数达到这个值时，会触发第2代对象的回收。

默认的阈值是 (700, 10, 10)。这意味着，当第0代对象数量达到700时，会触发垃圾回收。当第0代对象回收次数达到10时，会触发第1代对象的回收。当第1代对象回收次数达到10时，会触发第2代对象的回收。

选择合适的垃圾回收策略，需要根据程序的具体情况进行调整。

对于内存使用量大的程序: 可以适当调高垃圾回收的阈值，减少垃圾回收的频率，从而提高程序的性能。但是，如果阈值设置得太高，可能会导致内存占用过高，甚至导致程序崩溃。
对于内存泄漏严重的程序: 可以适当调低垃圾回收的阈值，增加垃圾回收的频率，从而及时释放内存。但是，频繁的垃圾回收会降低程序的性能。
对于实时性要求高的程序: 可以禁用垃圾回收器，避免垃圾回收带来的停顿。但是，禁用垃圾回收器可能会导致内存泄漏。

总的来说，选择合适的垃圾回收策略，需要在内存使用、程序性能和实时性之间进行权衡。可以使用gc.get_stats()来查看垃圾回收的统计信息，从而更好地了解程序的内存使用情况，并调整垃圾回收策略。

Python为什么有GIL_GIL设计原因

Selenium WebDriver 内存泄漏问题：批量打标签页时的优化方案

Python Python3 GIL 改进历史解析

Python 多线程为什么不适合 CPU 密集任务

Python 内存管理机制面试高频问题解析