Python生成器的核心作用是按需生成数据,节省内存。它通过yield暂停执行并返回值,保留状态供下次继续,适合大数据流、无限序列等场景,比列表推导式更省内存且无需手动实现迭代器协议。

Python生成器的核心作用是**按需生成数据,节省内存**。它不一次性把所有结果存进内存,而是每次调用时才计算并返回一个值,特别适合处理大数据流、无限序列或资源受限的场景。
生成器比列表更省内存
比如要生成100万个数字的平方,用列表需要一次性分配内存存储全部结果:
squares_list = [x**2 for x in range(1000000)] # 占用数百MB内存而用生成器函数,只保存当前状态,几乎不占额外内存:
def squares_gen():for x in range(1000000):
yield x**2
gen = squares_gen() # 此时没算任何值,内存占用极小
- 调用 next(gen) 才算第一个数(0²=0)
- 再调用一次算第二个(1²=1),依此类推
- 中间状态(如当前 x 值)由 Python 自动保存在生成器对象中
yield 是暂停与交出控制权的关键
yield 不是 return:函数遇到 yield 会暂停执行,把值“交出来”,但保留全部局部变量和执行位置;下次继续从 yield 下一行开始。
立即学习“Python免费学习笔记(深入)”;
def countdown(n):print("开始")
while n > 0:
yield n
n -= 1
print("结束")
g = countdown(3)
print(next(g)) # 输出:开始 → 3
print(next(g)) # 输出:2
print(next(g)) # 输出:1
print(next(g)) # 输出:结束 → 抛出 StopIteration
- 第一次 next → 执行到 yield n(n=3),暂停,返回 3
- 第二次 next → 从 n -= 1 开始,n 变成 2,再到 yield,返回 2
- 函数体执行完后,再次调用 next 会触发 StopIteration 异常
生成器表达式:简洁写法
类似列表推导式,但用圆括号,返回生成器对象:
gen = (x**2 for x in range(10)) # 不是 [x**2 for ...]- 比等价的生成器函数更轻量,适合简单逻辑
- 不能复用:一旦遍历完就空了,需重新创建
- 支持 next()、for 循环、sum()、list() 等迭代操作
实际常用场景
- 读大文件逐行处理:避免一次性加载整个文件到内存
- 爬虫分页请求:每 yield 一页数据,配合 requests 流式获取
- 无限序列:如斐波那契、素数生成器,靠 yield 实现“边算边给”
- 管道式数据处理:多个生成器串联(如 filter → transform → limit),每个只处理一个元素
不复杂但容易忽略:生成器本质是实现了 __iter__ 和 __next__ 的迭代器对象,yield 让你不用手动写这些方法。










