用 StreamingHttpResponse 配合生成器逐行 yield CSV 字节流,设 Content-Type 为 text/csv; charset=utf-8、加 UTF-8 BOM 头、数据库用 iterator() 流式查询,避免内存溢出与中文乱码。

怎么用 Django 的 HttpResponse 流式导出 CSV 文件
直接返回 CSV 数据、不生成临时文件、内存占用低——关键在于用 StreamingHttpResponse 配合生成器,而不是 HttpResponse。用 HttpResponse 写大表容易 OOM,尤其当数据来自 QuerySet 且没分页时。
实操建议:
立即学习“Python免费学习笔记(深入)”;
- 用
StreamingHttpResponse替代HttpResponse,传入一个生成器函数(如csv_generator()) - 生成器里逐行调用
csv.writer.writerow(),别把整张表读进内存再写 - 响应头必须设
Content-Type为text/csv; charset=utf-8,不是application/csv(后者不被 Excel 正确识别) - 加
Content-Disposition头指定文件名,注意中文名要 URL 编码,比如filename="data.csv",别用filename*=UTF-8''...(老版本 IE 不认)
Django 视图里怎么配 csv.writer 和编码
csv.writer 默认不支持直接写 Unicode 字符串到二进制流,Django 的 StreamingHttpResponse 要求 yield bytes,所以不能直接 writer.writerow(['姓名', '邮箱'])。
实操建议:
立即学习“Python免费学习笔记(深入)”;
- 用
io.StringIO+encode('utf-8')中转:先写入StringIO,再.getvalue().encode('utf-8') - 更稳妥是用
io.BytesIO配合csv.writer的encoding='utf-8'参数(Python 3.12+ 支持),但 Django 主流环境多是 3.8–3.11,暂不推荐 - 字段含逗号、换行、引号时,
csv.writer会自动加引号和转义,不用手动处理,但确保quoting=csv.QUOTE_MINIMAL(默认值) - 别用
str.encode()粗暴转换整行字符串——会破坏 CSV 格式,比如把换行符变成\n字面量
为什么用 StreamingHttpResponse 而不是 HttpResponse
常见错误现象:HttpResponse(content=csv_content) 导致内存暴涨、请求超时、甚至 502;或者导出 10 万行只显示前 65536 行(Excel 行数限制误判,其实是响应被 Nginx 截断)。
原因很实在:
-
HttpResponse把整个 CSV 字符串加载进内存再发出去,数据量 >10MB 就明显卡顿 -
StreamingHttpResponse每次 yield 一行 bytes,Web 服务器(如 Gunicorn/Nginx)可以边收边转发,客户端也能边下边渲染 - 数据库查询也要配合流式:用
.iterator(chunk_size=2000),避免QuerySet全部缓存 - 注意中间件干扰:某些自定义中间件(如响应压缩、日志记录)可能试图读取完整响应体,导致流式失效
导出 CSV 时中文乱码或 Excel 打不开的坑
最常踩的不是代码逻辑,而是两个隐形配置点:BOM 和 MIME 类型。
实操建议:
立即学习“Python免费学习笔记(深入)”;
- Excel Windows 版默认用 ANSI 或 GBK 解码无 BOM 的 UTF-8 CSV,结果全是乱码。解决办法:在 CSV 内容开头插入 UTF-8 BOM ——
b'\xef\xbb\xbf',放在第一个yield里 -
Content-Type必须是text/csv; charset=utf-8,写成application/octet-stream或漏掉charset,Chrome 可能下载但 Excel 打开报“文件格式与扩展名不匹配” - 字段里有 emoji 或生僻汉字?确保数据库连接、Django 设置里的
DEFAULT_CHARSET = 'utf-8',且 MySQL 表字符集是utf8mb4 - 别信“用
pandas.to_csv()更简单”——它默认不流式,df.to_csv()仍会全量加载内存
流式导出真正难的不是写几行代码,是确认从 DB 查询、编码中转、HTTP 头设置、到客户端解析,每个环节都对齐 UTF-8 和流式语义。少一个 BOM,Excel 就认不出中文;少一个 iterator(),服务器就可能被拖垮。










