Python 内置类型缓存机制详解

冷炫風刃

发布时间：2026-01-27 19:32:03

501人浏览过

来源于php中文网

原创

小整数（-5~256）和短字符串能用 is 比较，因 CPython 预缓存这些对象，字面量赋值时指向同一内存；但该行为不跨实现/版本保证，应优先用 == 判断相等，is 仅用于身份比较（如 is None）。

python 内置类型缓存机制详解

小整数和短字符串为什么能用 `is` 比较？

因为 Python 对一部分内置对象做了「缓存复用」，不是每次创建都分配新内存。比如 -5 到 256 的整数、长度较短的标识符风格字符串（如 "hello"），解释器启动时就预创建好并放进全局缓存池。所以 a = 100; b = 100; a is b 返回 True —— 它们指向同一对象。

但这个行为只适用于 CPython 实现，且不保证跨版本一致；更关键的是，它仅在「字面量直接赋值」或「编译期可确定」的场景生效。比如：

a = 1000
b = 1000
a is b  # 可能为 False（超出小整数范围）
<p>s1 = "hello world"
s2 = "hello world"
s1 is s2  # 通常为 True（短字符串驻留）</p><p>s3 = "hello" + " " + "world"  # 编译期拼接，仍驻留
s4 = "hello world" * 1  # 运行时计算，通常不驻留

不要依赖 is 判断数值或字符串相等，一律用 ==
字符串驻留（interning）受 sys.intern() 控制，也受编译器优化影响，不能当作稳定特性使用
is 应仅用于判断是否为同一个对象（如 obj is None）

`id()` 和 `is` 在缓存对象上的表现一致性

id() 返回对象在内存中的地址（CPython 中是实际指针值），而 is 的语义就是 id(a) == id(b)。所以只要两个变量指向缓存池里的同一个预分配对象，id() 就必然相同，is 也返回 True。

但注意：缓存对象一旦被垃圾回收（极罕见，因缓存池对象生命周期与解释器一致），其 id 可能被后续新对象复用 —— 所以 id 值本身不可持久化存储或跨时间比较。

立即学习“Python免费学习笔记（深入）”；

缓存对象的 id 在整个程序运行期间稳定，但仅限于该对象存活期内
不要把 id() 当作唯一标识符用于序列化、日志追踪等场景
is 的结果可预测，id() 的数值含义仅对当前运行实例有效

哪些类型有缓存？哪些没有？

CPython 明确实现缓存的主要是：

知我AI

一款多端AI知识助理，通过一键生成播客/视频/文档/网页文章摘要、思维导图，提高个人知识获取效率；自动存储知识，通过与知识库聊天，提高知识利用效率。

下载

小整数：-5 至 256（含），定义在 Objects/longobject.c 中的 small_ints 数组
单字符字符串：所有 ASCII 字母、数字、下划线（即符合标识符首字符规则的单字符）
部分短字符串：编译期常量、无空格/特殊字符的短串（如 "__name__"），由编译器触发 PyUnicode_InternInPlace

以下类型**没有**内置缓存机制：

浮点数（1.0 is 1.0 为 True 是巧合，源于编译器常量折叠，非缓存）
列表、字典、集合等可变类型（即使内容相同，每次 [] 都新建对象）
长字符串（如 "a" * 1000）、含空格或 Unicode 的字符串（除非显式 sys.intern()）
自定义类实例（无论 __eq__ 如何实现，is 总是 False）

缓存机制对性能和内存的实际影响

缓存本质是空间换时间：避免重复分配、减少 GC 压力、加快对象创建。对小整数来说，效果显著——每秒百万级的 int 创建几乎零开销；对字符串驻留，则大幅降低字典键查找时的哈希与比较成本（尤其在大量重复 key 的场景，如 JSON 解析）。

但副作用也很明确：

启动时多占几 KB 内存（小整数池约 312 个对象，字符串驻留表初始为空，随需增长）
驻留字符串会阻止其被回收，哪怕只在局部作用域短暂使用过
过度依赖驻留可能掩盖逻辑错误（例如误用 is 导致测试通过但线上失败）

真正需要干预缓存行为的场景极少。如果确实要控制字符串驻留，用 sys.intern() 即可，但必须确保传入的是不可变字符串，且调用时机在首次创建后、被其他引用持有前。

Python爬虫乱码怎么修_response.encoding = ‘utf-8’与apparent_encoding自动推断

Python字符串怎么统计子串出现次数_count()方法详解

如何高效解析大型 XML 文件：Python 流式处理实战指南

Python异步事件怎么用_asyncio.Event()实现协程间的通知机制与状态同步(set/wait)

高效实现 NumPy 中基于索引区间的元素累加运算

相关标签:

python js json go 作用域持久化存储 json 常量标识符字符串 int 风格字符串指针对象作用域 ASCII

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何让生成器支持 throw() 抛异常到生成器内部下一篇：Python 带参数装饰器的实现方式

作者最新文章

7723游戏盒官网快速访问_7723游戏盒官方网站手机版下载入口

2026-03-14 12:53

Nginx针对HTTP代理开启Keepalive提升TPS性能

2026-03-14 12:54

SQL报表高峰削峰填谷_削峰缓存策略

2026-03-14 12:54

Path 环境变量中 bin 目录的作用说明

2026-03-14 13:05

Nginx中server块虚拟主机监听端口与地址绑定

2026-03-14 13:06

Linux系统中利用Ionice命令调整进程磁盘访问优先级

2026-03-14 13:25

DockerStart处理依赖服务未就绪的启动策略

2026-03-14 13:45

SQL索引重建策略_索引碎片与重建频率

2026-03-14 14:11

SQL索引失效场景汇总_函数与隐式转换影响

2026-03-14 14:44

Adobe软件装在D盘怎么清理 Adobe跨盘安装清理方法

2026-03-14 15:10

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

458

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

549

2023.08.23