Python 生成器表达式 vs 列表推导式在内存占用上的真实差距

冷漠man

发布时间：2026-01-24 13:32:37

258人浏览过

来源于php中文网

原创

是的，但仅当不立即消费全部元素时才省内存；生成器表达式创建迭代器仅占几十字节，列表推导式则立即分配约8MB内存，该差异可通过sys.getsizeof()实测验证。

python 生成器表达式 vs 列表推导式在内存占用上的真实差距

生成器表达式真的比列表推导式省内存吗？

是的，但只在你**不立即消费全部元素**时才体现出来。生成器表达式 (x*2 for x in range(10**6)) 创建的是一个迭代器对象，本身只占几十字节；而列表推导式 [x*2 for x in range(10**6)] 会立刻分配约 8MB 内存（假设每个 int 占 24–28 字节，加上列表结构开销）。这个差距不是“理论值”，而是 sys.getsizeof() 可测得的真实差异。

什么时候两者的内存占用几乎一样？

当你对生成器做一次性全量展开时，比如 list(gen_expr) 或 sum(gen_expr)（后者虽不建列表，但内部仍需逐个取值并累加），此时生成器只是“延迟分配”的假象被打破。实际内存峰值可能反而略高——因为生成器对象 + 正在构建的目标容器（如 list）会短暂共存。

list((x for x in range(10**6)))：先建生成器（≈56B），再建列表（≈8MB），GC 前峰值 ≈8MB+56B
[x for x in range(10**6)]：直接建列表（≈8MB），无额外对象
若后续还要用该数据多次，列表推导式反而更稳——生成器只能遍历一次，重用就得重建

真实场景中怎么选？

看数据生命周期和访问模式，不是看“谁更酷”。

管道式处理（如 filter → map → next 找第一个匹配项）：用生成器表达式，可能提前终止，省下 99% 的计算和内存
需要随机访问、切片、反复迭代：必须用列表推导式，生成器不支持 my_gen[5] 或 len(my_gen)
中间结果要传给第三方库（如 pandas.DataFrame()、numpy.array()）：它们内部通常会转成 list 或 array，生成器不会帮你省内存
内存受限但数据量不大（

容易被忽略的陷阱

生成器表达式不是银弹，几个隐蔽问题常导致误判：

MaxAI

MaxAI.me是一款功能强大的浏览器AI插件，集成了多种AI模型。

下载

立即学习“Python免费学习笔记（深入）”；

嵌套生成器（如 ((x,y) for x in A for y in B)）在调试时难以 inspect——print(gen) 只显示类型，看不到内容；列表推导式可以直接 print([...])
闭包变量捕获问题：生成器表达式中的循环变量是“延迟绑定”的，[lambda: i for i in range(3)] 和 (lambda: i for i in range(3)) 都会全部返回 2，但表现更隐蔽
itertools.chain() 等组合操作返回的也是生成器，叠加多层后，错误堆栈里可能只报 StopIteration，而源头早被消耗光了

真正影响内存的从来不是语法符号，而是“是否保留全部中间状态”。别为省几 MB 过早优化，先确认你的数据流是否真能流起来。

Python Schedule 模块中精准输出下一次任务执行时间的正确实践

如何在 Python 中优雅地根据登录结果调用后续函数

Python 中安全高效地解析并验证字典键值对的自定义条件表达式

如何用Python筛选出偶数长度的回文字符串

如何在 Python 中优雅地调用登录成功后的业务函数

相关标签:

python 字节内存占用 numpy pandas Array for Filter int 切片 len map 对象

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在 pytest 中绕过 joblib 缓存直接测试原始函数下一篇：pandas groupby 后 apply 比 agg/transform 慢在哪里？

作者最新文章

Linux进程五种状态转换原理及R与D状态性能影响分析

2026-03-14 12:24

Linux系统中线程Thread与轻量级进程LWP内在联系分析

2026-03-14 12:41

MacOS系统针对外部存储的Spotlight索引禁用设置

2026-03-14 13:02

Windows运维中利用GPO配置无线网络配置文件自动连接

2026-03-14 13:14

Java中Apache缓存雪崩现象的预防与后端保护逻辑

2026-03-14 13:22

Linux系统卡死问题_内核日志分析

2026-03-14 13:34

Linux 大促场景性能优化_削峰填谷策略

2026-03-14 13:43

Linux日志切割配置_logrotate实践

2026-03-14 13:53

SQLSQL注入防护_输入校验与参数化查询

2026-03-14 14:02

SQL批量删除优化_DELETE与TRUNCATE对比

2026-03-14 14:51

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1051

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

617

2024.08.29