Python JSON 与 Pickle 的使用边界

舞姬之光

发布时间：2026-02-18 12:38:02

335人浏览过

来源于php中文网

原创

该用 json.dumps() 时：数据结构简单且需跨语言或人工可读；否则用 pickle.dump()。json 不支持 datetime 等类型，pickle 可存任意 python 对象但不安全、不可跨语言。

python json 与 pickle 的使用边界

什么时候该用 `json.dumps()`，而不是 `pickle.dump()`

JSON 是跨语言、可读、安全的序列化格式；Pickle 是 Python 专属、可存任意对象、但有执行风险。选 JSON 的前提是：数据结构简单（dict、list、str、int、float、bool、None），且需要被其他语言读取或人工查看。

遇到 TypeError: Object of type X is not JSON serializable，说明你试图序列化 datetime、set、自定义类实例等 —— 这是 JSON 的硬限制，不是写法问题
如果只是临时存 Python 进程间数据（比如缓存函数结果），又含 numpy.ndarray 或带方法的对象，pickle 是更直接的选择
json 默认不保留顺序（Python 3.7+ dict 有序，但 json 不保证输出顺序）；pickle 完全保留对象状态，包括私有属性和内存地址相关行为（如循环引用）

`json.load()` 报 `JSONDecodeError: Expecting value` 怎么快速定位

这个错误几乎都来自输入内容为空、只有空白符，或混入了 BOM、注释、非 UTF-8 字节 —— JSON 标准不允许这些。

先用 open(file, "rb").read() 看前 20 字节，确认有没有 b"\xef\xbb\xbf"（UTF-8 BOM）；有就改用 encoding="utf-8-sig"
别直接 json.load(f)，先 f.read().strip()，空字符串就跳过，避免把日志文件末尾的空行当 JSON 解析
浏览器或 curl 保存的响应体可能含 HTML 标签或重定向提示，用 filetype 库或简单检查是否以 { 或 [ 开头

`pickle` 反序列化时为什么有时能跑，有时报 `AttributeError: Can't get attribute 'X' on <module></module>`

这是 pickle 的模块绑定机制导致的：它只存类名和模块路径，反序列化时会尝试从当前运行环境的 __main__ 或对应模块里重新导入该类。一旦类定义位置变了，就找不到。

v0.dev

Vercel推出的AI生成式UI工具，通过文本描述生成UI组件代码

下载

把要 pickle 的类定义在独立 `.py` 文件中（比如 models.py），不要放在脚本顶层或 Jupyter cell 里
避免用 lambda、嵌套函数、functools.partial 等动态生成的对象 —— 它们没有稳定模块路径
生产环境慎用 pickle 做持久化存储；升级代码后旧 pickle 文件大概率失效，比数据库迁移还难处理

性能和大小：JSON 和 Pickle 在大数据量下到底差多少

实测 10 万条 {"id": int, "name": str, "score": float} 的字典列表，json.dumps() 比 pickle.dumps(..., protocol=4) 慢约 1.5–2 倍，体积大 30%–50%，但差异随数据嵌套深度增加而收窄。

立即学习“Python免费学习笔记（深入）”；

pickle 的 protocol=5（Python 3.8+）支持缓冲区零拷贝，对大 bytes 或 array.array 有明显优势；JSON 始终走字符串编码
如果数据含大量重复 key（如日志字段固定），用 ujson 或 orjson 可提速 3–5 倍，但它们不兼容所有 JSON 标准（比如 orjson 不支持 default 参数）
别为了省几 MB 自动切到 pickle —— 调试成本、跨环境风险、长期可维护性损失远高于磁盘开销

真正麻烦的从来不是选哪个函数，而是同一个项目里混用两种序列化方式：比如用 JSON 存配置、Pickle 存缓存，结果某天有人把缓存文件误当配置加载，或者用 json.loads() 去读 pickle 二进制 —— 错误信息不会告诉你“你读错了格式”，只会抛一堆字节解码异常。

Python 自定义异常的链式抛出（raise from）

Python 内存快照与分析工具使用

Python 网络请求重试的正确姿势

Python micromamba 的轻量环境管理

Python 可迭代对象设计的工程思维

相关标签:

python js json json numpy Float Array Object cURL 字符串 bool int 循环 Lambda 数据结构堆 Attribute 对象 default bom jupyter 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python 服务发现的 DNS SRV 记录使用下一篇：暂无

作者最新文章

俄罗斯搜索引擎浏览器俄罗斯搜索引擎浏览器下载

2026-02-16 12:22

GitHub 如何下载别人的文件？权限与下载方式说明

2026-02-16 12:46

Python datetime 与 timestamp 的双向转换陷阱

2026-02-16 13:01

Python 官方网站是什么？Python 官网入口与下载说明

2026-02-16 13:17

Python 正则匹配中的贪婪与非贪婪陷阱

2026-02-16 13:19

Python 标准输入输出的重定向机制

2026-02-16 13:32

Python Spark 应用的监控指标

2026-02-16 13:51

Linux ethtool -k / -K 的 offload 特性关闭对高延迟场景的影响

2026-02-16 14:03

google浏览器无需下载官网地址_谷歌Chrome官方无需下载官网入口网址

2026-02-16 14:07

SQL EXISTS 与 JOIN 优化实践

2026-02-16 14:29

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

442

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

544

2023.08.23