Python 使用生成器优化内存占用

舞夢輝影

发布时间：2026-01-27 18:23:02

359人浏览过

来源于php中文网

原创

生成器比列表节省内存达数量级，如range(10**6)仅占几十字节，而等价列表占用约8MB；必须用yield的场景包括处理大文件、递归结构、无限序列及管道式惰性求值链。

python 使用生成器优化内存占用

生成器比列表节省多少内存？

生成器对象本身只占几十字节，而等价的列表在创建时就得把所有元素装进内存。比如 range(10**6) 返回的是生成器（Python 3），但 [x for x in range(10**6)] 会立刻分配约 8MB 内存（取决于元素类型和系统）。实际差距不是“省一点”，而是“差一个数量级”——尤其当数据源来自文件、数据库或网络流时，列表可能直接 OOM。

什么时候必须用 `yield` 而不是返回列表？

典型场景是处理无法一次性加载的数据：

读大文件时逐行或逐块处理：yield 每次只保留一行字符串，而不是把整个文件读进 list
递归结构遍历（如树、嵌套 JSON）：避免中间结果堆积，用生成器展开子节点
无限序列（如斐波那契、素数流）：根本没法用列表表示
管道式处理链：filter + map + 自定义生成器可形成惰性求值链，全程无临时列表

`yield` 和 `return` 混用会怎样？

函数里只要出现 yield，Python 就把它编译成生成器函数，哪怕同时有 return。但要注意：

return value 在生成器中会触发 StopIteration，且 value 会成为异常的 value 属性（Python 3.3+），不能被 next() 拿到
return 后面的代码不会执行，但 yield 之后仍可继续写逻辑，只要没被提前 return 中断
别试图在生成器里用 return x 当“返回最终结果”——它不等价于函数返回值，调用方拿不到

生成器用完就失效，怎么重复使用？

生成器是一次性的，迭代完就空了，再次 next() 必抛 StopIteration。这不是 bug，是设计使然。常见应对方式：

Fotor

Fotor 在线照片编辑器

下载

立即学习“Python免费学习笔记（深入）”；

重新调用生成器函数，得到新生成器（最常用）
用 itertools.tee() 分叉，但注意它内部会缓存已取数据，内存开销可能反弹
如果只是需要多次遍历，且数据量可控，不如改用元组或冻结集合——生成器的优势本就不在“可重用”

最容易被忽略的是：生成器的“惰性”和“一次性”是一体两面。想绕过后者，往往就牺牲了前者。

Python API数据验证怎么做_Pydantic模型验证与报错处理

Python怎么操作网络驱动器文件_UNC路径与SMB协议处理

Python IDE怎么汉化_PyCharm中文插件安装与界面汉化方法

Python Fixture作用域怎么配_scope=‘session’/‘module’/‘function’控制只执行一次提升效率

Python怎么建有向图_NetworkX库构建复杂图结构与节点分析

相关标签:

python js json 字节内存占用 json for Filter 字符串递归堆 map 对象数据库 bug

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：subprocess 如何在 timeout 时优雅杀死子进程树下一篇：pandas 如何用 pd.Grouper(freq=‘15min’) 处理不规则时间序列

作者最新文章

SQL并发更新冲突排查_行锁竞争与锁等待分析

2026-03-14 14:28

Nginx利用TCP代理实现Redis集群高可用转发

2026-03-14 14:31

Nginx针对视频资源开启TCP_nopush优化传输

2026-03-14 14:37

Docker仓库公有云集成与企业级镜像管理实践

2026-03-14 14:43

GitHub 命令行怎么用？GitHub CLI 基本操作说明

2026-03-14 14:47

MacOS系统df命令在多版本系统并存时卷组识别

2026-03-14 14:55

Windows运维中手动注册域控相关DNS记录的命令操作

2026-03-14 15:16

DockerDaemon日志滚动策略与磁盘溢出预防

2026-03-14 15:20

JavaScript中Boolean布尔值的逻辑判断与转换规则

2026-03-14 15:23

Java中Apache基础架构中请求处理链的模块化流转

2026-03-14 15:26

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

457

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

549

2023.08.23