Python Pickle 序列化的安全隐患

舞夢輝影

发布时间：2026-02-25 19:11:02

741人浏览过

来源于php中文网

原创

pickle.load() 不能读不受信数据，因为它反序列化时会执行任意代码，通过__reduce__等方法调用os.system等危险函数，仅限完全可控的内部系统使用。

python pickle 序列化的安全隐患

为什么 `pickle.load()` 不能直接读不受信的数据

因为 pickle 反序列化时会执行任意代码——不是“可能”，是设计如此。它靠重建对象、调用 __setstate__、__reduce__ 等方法还原状态，而这些方法可以是任意可调用对象，包括 os.system 或 importlib.import_module。

常见错误现象：AttributeError: Can't get attribute 'xxx' on <module></module> 看似只是找不到类，但背后可能是攻击者替换了模块路径或注入了恶意 __reduce__ 返回值。

使用场景：只在完全可控的内部系统中用（比如同一进程写、同一进程读；或严格校验来源的 RPC 内部通信）
绝不能用于 HTTP 请求体、用户上传文件、数据库字段等任何含外部输入的场景
即使数据来自“自己人”，也要确认传输链路未被中间人篡改（pickle 不带签名或校验）

替代方案选哪个：JSON / msgpack / dill / `cloudpickle`

JSON 最安全，但只支持基础类型（dict、list、str、int、float、bool、None），无法保存函数、类实例、闭包。

msgpack 比 JSON 更紧凑、更快，但同样不支持自定义对象，且默认不校验浮点精度，需手动配 strict_float=True 避免 NaN 或 inf 引发解析失败。

立即学习“Python免费学习笔记（深入）”；

医真AI+开放平台

医真AI+ 医学AI开放平台

下载

dill 和 cloudpickle 能序列化更多东西（比如 lambda、模块级函数），但——它们和 pickle 一样危险，反序列化时照样执行代码。

如果你只需要传数据，用 json.dumps() + json.loads()，加一层 object_hook 做类型恢复（比如把 {"_type": "datetime", "value": "2024-01-01"} 转成 datetime）
如果必须传函数/类，考虑用明确的注册表机制（如白名单函数名 + 参数），而不是直接反序列化字节流
cloudpickle 在 Spark/Dask 中常用，但 worker 加载任务前仍需确保 job 提交者可信

想保留 pickle 又降低风险？这三点硬限制必须加

不是“建议”，是底线。少一条都可能绕过防护。

用 pickle.Unpickler 子类重写 find_class()，只允许从预设模块+类名白名单中加载（例如只允许 numpy.ndarray、collections.Counter）
读取前先用 hmac 校验数据完整性（密钥必须保密，且不能硬编码在客户端）
在沙箱进程里反序列化（比如用 subprocess.run() 启一个最小权限子进程，传入数据并限时退出）——别指望 threading 或 seccomp 在主线程里拦住 os.system

调试时误用 `pickle` 的典型翻车点

开发阶段图省事，把整个 self 对象或 globals() 一股脑 pickle.dump() 下去，上线后才发现依赖了临时定义的函数或 IPython 魔法变量。

错误现象：ModuleNotFoundError: No module named 'IPython' 或 AttributeError: module '__main__' has no attribute 'temp_func'。

__main__ 模块里的类/函数无法跨进程反序列化（不同脚本启动时 __main__ 指向不同）
闭包捕获的局部变量、装饰器生成的 wrapper、functools.partial 实例，都可能隐式依赖运行时上下文
用 pickletools.dis() 查看 dump 出的字节码，能快速识别是否引用了可疑模块（比如含 os、subprocess、importlib）

真正难防的不是黑客，是你自己下周写的那个没加类型注解、又顺手 pickle.dump() 的调试脚本。

如何在父类中根据子类动态适配不同数据库模块的类型系统

如何升级 scikit-learn 却始终卡在 1.0.2？根本原因与解决方案

Python 任务队列模型的基本实现

Python Python 虚拟机工作原理

Python 企业级 Python 项目经验

相关标签:

python json numpy ipython Float 子类局部变量 bool int Lambda Attribute 线程主线程闭包对象 spark 数据库 http rpc

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python glob 与 os.walk 的性能与使用场景对比下一篇：如何实现实时刷新 Jupyter Notebook 单元格输出（远程部署场景）

作者最新文章

oppo手机截屏有几种方法按键、三指滑动与控制中心截图

2026-02-25 09:05

公积金贷款利率和商贷利率对比

2026-02-25 09:12

Linux 内存泄漏排查与修复方法

2026-02-25 09:14

苹果手机id号更改苹果手机更改Apple ID账号方法

2026-02-25 09:32

微信更新面对面收照片和文件功能微信怎么面对吗穿文件和照片

2026-02-25 09:33

ao3无需下载安装正版方法_AO3无官方app网页版在线使用入口指南

2026-02-25 09:41

艾诺迪亚4紫装掉落列表_艾诺迪亚4紫装BOSS掉落完整列表

2026-02-25 09:52

苹果手机压缩照片文件包苹果手机照片压缩成文件包教程

2026-02-25 09:57

ao3镜像网址链接2026版_AO3最新镜像链接2026入口详解

2026-02-25 09:58

原神6.5幽境危战平民配队分享原神6.5幽境危战满星保姆教学

2026-02-25 09:58

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

448

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

544

2023.08.23