py-spy火焰图可直观定位Python性能瓶颈:X轴为采样时间占比,Y轴为调用栈深度,矩形宽度反映函数耗时占比,宽峰即热点;支持对运行中进程(--pid)或新脚本(-- python app.py)采样生成交互式SVG,无需改代码。

Python函数运行慢,别急着重写代码,先用火焰图(Flame Graph)一眼看清哪一行、哪个调用栈在拖后腿——它把耗时可视化成层层叠叠的“火焰”,宽的地方就是热点。
安装和生成火焰图数据
用 py-spy 最省事,无需修改代码,支持正在运行的进程或直接采样脚本:
- 安装:pip install py-spy
- 对已运行的 Python 进程(比如 PID 是 1234)采样 5 秒:py-spy record -p 1234 -o profile.svg --duration 5
- 对脚本直接运行并采样:py-spy record -o profile.svg -- python your_script.py
生成的 profile.svg 可直接用浏览器打开,交互式缩放、搜索函数名都很方便。
看懂火焰图的关键特征
横轴是采样时间(不表示绝对时间,而是相对占比),纵轴是调用栈深度。每一块矩形代表一个函数调用,宽度 = 它被采样到的次数占比,越宽越耗时。
立即学习“Python免费学习笔记(深入)”;
- 顶部宽块:最外层函数(如 main、run、某个 API handler),说明瓶颈就在这一层或其直接子调用
- 中间突然变宽的一层:比如 json.loads 或 pandas.merge 占满半屏,基本就是罪魁祸首
- 底层细长条反复出现:可能是高频小函数,如字符串拼接、列表 append、正则匹配,累积起来也很可观
常见瓶颈及对应优化方向
火焰图不会告诉你“怎么改”,但能精准指出“改哪儿”。对照典型模式快速判断:
- 大量 _PyObject_Call 或 call_function 出现在中层?→ 检查是否在循环里频繁调用函数(尤其是 lambda、闭包、未缓存的 property)
- read / recv / sqlite3_step 占宽?→ I/O 阻塞,考虑异步、批量读写、加索引或换存储
- copy.deepcopy 或 pickle.loads 明显?→ 替换为 copy.copy、dataclasses.replace 或结构化序列化(如 msgpack)
- 全是 __iter__ + next 堆叠?→ 生成器链过深或滥用 list() 强制展开,改用流式处理
进阶技巧:聚焦+过滤提升排查效率
大项目火焰图信息爆炸?用这些命令精简视图:
- 只看指定模块:py-spy record -o profile.svg --pid 1234 --duration 5 --native --subprocesses --filter my_module
- 排除无关库(如日志、监控 SDK):py-spy record ... --exclude-libs 'logging,opentelemetry'
- 导出为文本分析(配合 grep/awk):py-spy top -p 1234 实时查看前 10 热点函数
基本上就这些。火焰图不是万能钥匙,但它能让你从“感觉慢”变成“看见慢”,剩下的优化,就有据可依了。










