id()返回对象在生命周期内的唯一标识,在CPython中是PyObject*地址转成的整数,但非标准内存地址;小整数(-5~256)和部分字符串会被缓存导致相同id,可变对象就地修改id不变,新建则变。

Python 中 id() 返回的到底是不是内存地址
是,但不是你 C 语言里理解的那种“裸指针地址”。id() 在 CPython 实现中确实返回对象在内存中的地址(即 PyObject* 指针值),但它被强制转换为一个整数,且该整数只保证在对象生命周期内唯一。不同 Python 实现(如 PyPy、Jython)不承诺这个值是真实内存地址——所以不能跨实现依赖它的数值含义。
常见误解:看到 id(obj) 是个大整数(比如 140234567890128),就以为能用它做指针运算或传给 C 扩展当地址用。实际上,CPython 内部做了对齐和偏移处理,直接 reinterpret_cast 是危险的。
为什么两个相同值的不可变对象可能有相同 id()
因为 CPython 对小整数和短字符串做了对象缓存(interning)。例如:
>>> a = 42 >>> b = 42 >>> id(a) == id(b) True >>> a is b True
这不是巧合,而是优化行为。但仅限于特定范围:
立即学习“Python免费学习笔记(深入)”;
- 小整数:通常
-5到256(CPython 源码中定义为NSMALLPOSINTS和NSMALLNEGINTS) - 字符串:仅当由编译器静态确定、不含空格/特殊字符、长度较短时可能被 intern —— 但运行时拼接的字符串(如
"a" + "b")一般不会自动 intern - 浮点数、元组等不参与此缓存
可变对象的 id() 何时会变
id() 只在对象被销毁重建时改变。对可变对象来说,只要没被 del 或失去所有引用,即使内容变了,id() 也保持不变:
>>> lst = [1, 2] >>> original_id = id(lst) >>> lst.append(3) >>> id(lst) == original_id True
但要注意这些陷阱:
- 赋值语句如
lst = lst + [4]创建了新列表,id()必然变化(因为+返回新对象) -
lst += [4]是就地修改,id()不变(调用的是__iadd__) - 使用
copy.copy()或切片lst[:]都会生成新对象,id()不同
想真正看内存布局?别只信 id()
id() 是调试辅助工具,不是内存分析接口。如果真要验证对象位置或观察内存复用,推荐:
- 用
ctypes.addressof()查看 ctypes 对象地址(需先转成ctypes.py_object) - 用
sys.getsizeof()看对象本身占用字节数(不含引用对象) - 用
gc.get_objects()配合id()追踪存活对象,但注意性能开销大 - 在 CPython 源码中查
Objects/object.c的_Py_NewReference实现,确认地址分配逻辑
最常被忽略的一点:id() 值在对象被回收后可能被新对象重用 —— 所以拿旧 id() 去查当前内存,大概率指向无关数据。










