json.dump()写入中文需设ensure_ascii=False,否则中文被转义为\uXXXX;文件打开必须用encoding="utf-8",indent和sort_keys仅影响可读性。

json.dump()写入中文变乱码?关键是ensure_ascii=False
默认情况下json.dump()会把非ASCII字符(比如中文)转成\uXXXX形式,不是真乱码,是刻意转义。想原样保留中文,必须显式传ensure_ascii=False。
常见错误现象:{"name": "\u4f60\u597d"}这种输出,看着像乱码,其实是JSON标准行为。
- 不加
ensure_ascii=False,中文一定被转义,无论文件编码设成utf-8还是其他 - 即使文件用
encoding="utf-8"打开,没关ensure_ascii也没用 - Python 3.7+ 默认文件写入是utf-8,但
json.dump()不买账,它只认自己的参数
正确写法示例:
import json
data = {"name": "张三", "city": "上海"}
with open("output.json", "w", encoding="utf-8") as f:
json.dump(data, f, ensure_ascii=False, indent=2)
格式化输出靠indent和sort_keys,但别滥用indent
indent控制缩进空格数,sort_keys=True让键按字母序排列——这两个参数只影响可读性,不影响JSON合法性。
立即学习“Python免费学习笔记(深入)”;
使用场景:调试、配置文件、人工查看的导出数据;不适合日志或API响应体这类对体积敏感的场景。
-
indent=2最常用,indent=None(默认)生成紧凑单行 -
sort_keys=True能避免因字典插入顺序不同导致diff误报,适合做版本控制的配置文件 - 加
indent会让文件体积显著增大,10KB原始数据可能变成30KB+,线上服务慎用
文件打开模式必须用"w"且指定encoding="utf-8"
Python 3里字符串是Unicode,但文件操作最终要落盘为字节。如果打开文件时不声明encoding,Windows下可能用cp1252,Linux/macOS可能用locale默认编码,都会导致中文写入失败或错乱。
- 必须用
open(..., "w", encoding="utf-8"),不能只写"w" - 不能用
"wb"模式配json.dump()——后者写的是字符串,不是bytes - 如果用
json.dumps()先生成字符串再写入,也要确保open()带encoding="utf-8"
错误示范:open("x.json", "w") —— 在中文Windows上大概率报UnicodeEncodeError。
dump()和dumps()选哪个?看你要不要直接写文件
json.dump()直接写文件对象,json.dumps()返回字符串。两者参数一致,但调用方式不同。
容易踩的坑:想用dumps()结果再手动f.write(),却忘了加encoding或用了"wb"模式。
- 一步到位写文件 → 用
json.dump(),更安全简洁 - 需要中间处理字符串(比如拼接、校验、加BOM)→ 用
json.dumps(),再f.write() - 用
dumps()时若要写文件,仍需open(..., "w", encoding="utf-8"),不能省
复杂点在于:一旦涉及BOM、流式写入、追加模式或权限控制,就得切回dumps() + 手动写入,这时候ensure_ascii和encoding两个地方都得盯紧。










