python序列化的原理和作用_数据存储、传输与状态保存机制详解

幻夢星雲

发布时间：2026-02-02 20:22:43

160人浏览过

来源于php中文网

原创

Python序列化本质是对象到字节流的保真映射，依赖__reduce__等钩子生成指令流；pickle支持复杂类型但仅限Python环境，json跨语言但类型受限；反序列化不可信pickle存在远程代码执行风险。

python序列化的原理和作用_数据存储、传输与状态保存机制详解

Python序列化本质是对象到字节流的映射规则

Python本身不直接“存储对象”，而是把内存中的对象结构（类型、属性、引用关系）按约定规则转成一串可保存或传输的bytes。核心不是压缩或加密，而是**保真还原**：反序列化后得到的对象行为和原对象一致（除部分不可序列化对象外）。这依赖于每个类型注册的__reduce__或__getstate__等钩子函数，pickle模块据此生成操作指令流（如“新建一个dict”“往第0个位置塞key='a'”“调用datetime.datetime构造器”）。

常见误区是认为序列化=转成JSON。其实json只支持有限类型（dict、list、str、int、float、bool、None），而pickle能处理lambda、类实例、文件句柄（虽不推荐）、自定义__slots__类等——代价是只能在Python环境间安全使用。

选`pickle`还是`json`取决于数据用途和信任边界

跨语言传输（如Python服务给JS前端发数据）必须用json；内部微服务间状态同步、任务队列参数传递、缓存计算结果，则优先用pickle（尤其v5协议支持共享内存和大对象零拷贝）。

json.dumps(obj)失败时会报TypeError: Object of type X is not JSON serializable，需手动实现default参数或继承json.JSONEncoder
pickle.dumps(obj)遇到文件对象、线程锁、数据库连接等会抛AttributeError或TypeError，因为这些对象无法脱离当前进程存活
pickle协议版本差异大：v0-v2不支持新语法（如带__slots__的类）；v4起支持bytearray；v5新增out_of_band数据分离机制，适合大数据集

自定义类序列化要显式控制状态边界

默认情况下pickle会尝试保存整个__dict__，但很多字段不该持久化（如临时缓存、外部连接、GUI句柄）。正确做法是实现__getstate__和__setstate__：

立即学习“Python免费学习笔记（深入）”；

Midjourney

当前最火的AI绘图生成工具，可以根据文本提示生成华丽的视觉图片。

下载

class CacheManager:
    def __init__(self):
        self.data = {}
        self._cache = {}  # 不该被序列化
        self._lock = threading.Lock()  # 不可序列化
def __getstate__(self):
    state = self.__dict__.copy()
    state.pop('_cache', None)
    state.pop('_lock', None)
    return state

def __setstate__(self, state):
    self.__dict__.update(state)
    self._cache = {}
    self._lock = threading.Lock()

注意：__slots__类必须在__getstate__中显式构造字典，否则pickle可能因找不到__dict__而失败；若类有C扩展属性（如NumPy数组），通常无需干预——它们已内置序列化逻辑。
反序列化是执行风险点，永远别加载不可信来源的pickle数据
pickle流本质是Python字节码指令，pickle.loads()会执行其中的类构造、方法调用甚至os.system()。攻击者可构造恶意流触发任意代码执行。生产环境必须遵守：

仅从可信路径加载.pkl文件（如本地配置目录，且文件权限为600）
网络传输场景改用json或msgpack（需确认其反序列化不执行代码）
万不得已需用pickle时，用RestrictedUnpickler白名单机制限制可实例化的类

真正难处理的是“半可信”场景：比如用户上传的分析脚本附带预训练模型（.pkl）。此时不能只靠文件后缀判断，得结合签名验证+沙箱执行+资源限额——序列化本身不提供安全隔离，它只是数据载体。

如何在Python中高效搜索文本文件中的多个字符串并在CSV中定位并输出匹配行

如何对 Pandas DataFrame 中数组型列的每行取前 N 个元素

如何在 VSCode 中同时支持 pytest 覆盖率报告与断点调试

如何在Python中高效搜索文本文件中的多个字符串并匹配CSV文件的对应行

如何在Python中高效搜索文本文件中的多个字符串并匹配CSV行

python速学教程(入门到精通)

python怎么学习？python怎么入门？python在哪学？python怎么学才快？不用担心，这里为大家提供了python速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

python js 前端 json 大数据字节 red json numpy Float Object bool int Lambda 继承线程 JS 对象 default 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：python语句序列_程序执行流程与基本语句块的顺序结构下一篇：python中常用的序列化模块_json、pickle、yaml、msgpack性能对比

作者最新文章

芒果TV怎么开倍速播放芒果TV调整播放速度教程

2026-02-02 18:55

Windows 10防火墙怎么彻底关闭？通过组策略禁用系统防火墙分享

2026-02-02 18:58

妖精漫画无弹窗免费入口_妖精漫画纯净版在线阅读入口

2026-02-02 19:04

yy漫画防走失入口_yy漫画永久免费地址发布页

2026-02-02 19:11

Claude 3.5怎么用龙虾机器人基础入门保姆级教程

2026-02-02 19:19

云朵浏览器最新版本官方高速下载入口

2026-02-02 19:21

云朵浏览器备用地址最新防封网址入口

2026-02-02 19:23

龙虾机器人永久免费入口 clawdbot无限制使用入口

2026-02-02 19:38

电脑重装系统后怎么找回原来的激活码？Windows查看密钥全攻略

2026-02-02 19:45

Win7/Win10/Win11通用：Windows各代系统防火墙怎么关闭的操作指南

2026-02-02 19:49

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

424

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

537

2023.08.23

jquery怎么操作json

操作的方法有：1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”；3、“$.each(obj, callback)”；4、“$.ajax()”。更多jquery怎么操作json的详细内容，可以访问本专题下面的文章。

313

2023.10.13

go语言处理json数据方法

本专题整合了go语言中处理json数据方法，阅读专题下面的文章了解更多详细内容。

2025.09.10

css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列，用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容，可以阅读本专题下面的文章。

580

2024.04.28

C++中int、float和double的区别

本专题整合了c++中int和double的区别，阅读专题下面的文章了解更多详细内容。

103

2025.10.23

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

523

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

546

2024.08.29