0

0

Python怎么序列化对象_pickle模块保存字典与对象到文件

P粉602998670

P粉602998670

发布时间:2026-03-17 03:11:32

|

612人浏览过

|

来源于php中文网

原创

用 pickle.dump() 保存字典需以 "wb" 模式打开文件并指定 protocol=2 提高兼容性;含不可序列化对象(如锁、文件句柄)会报 TypeError;自定义类需确保 dict 干净或实现 __getstate__/__setstate__;加载时须用 "rb" 模式配 pickle.load(),且类定义必须已导入。

python怎么序列化对象_pickle模块保存字典与对象到文件

pickle.dump() 保存字典到文件,但要注意协议版本

直接写入最常用,但默认协议(Python 3.8+ 是 protocol 4)可能在旧 Python 版本里打不开。如果目标环境不确定,显式指定 protocol=2 更稳妥——它兼容 Python 2.7 到 3.x,只是不支持某些新类型(比如带循环引用的嵌套对象)。

常见错误现象:UnicodeDecodeErrorEOFError,往往是因为没用二进制模式打开文件。

  • 必须用 open(..., "wb")(不是 "w"),否则报错
  • 字典含不可序列化对象(如 threading.Lock、文件句柄、lambda)会直接抛 TypeError
  • 若字典键是自定义类实例,该类需有可被 pickle 的状态(通常要求所有属性都是基本类型或可 pickle 对象)
import pickle
data = {"name": "alice", "scores": [95, 87]}
with open("data.pkl", "wb") as f:
    pickle.dump(data, f, protocol=2)

pickle.dumps() 序列化对象再手动写入,适合需要加密或压缩的场景

它返回 bytes,不碰文件系统,给你完全控制权。比如你想先用 zlib 压缩再存,或者用 cryptography 加密后写磁盘,就必须走这一步。

性能影响:相比 dump() 直接写文件,多一次内存拷贝;但换来的是灵活性——你可以把结果存在 Redis、发 HTTP 请求、拼进 ZIP 包。

立即学习Python免费学习笔记(深入)”;

  • pickle.dumps(obj) 默认用最高协议,若要兼容老环境,得传 protocol=2
  • 别用 str(pickle.dumps(...)) 转字符串——那会破坏二进制结构,读取时直接 UnpicklingError
  • 若对象很大,dumps() 会一次性占满内存;超大对象建议用 dump() 配合分块或流式处理
import pickle
obj = {"config": {"timeout": 30}}
serialized = pickle.dumps(obj, protocol=2)
# 后续可加密、压缩、base64 编码等
with open("safe.bin", "wb") as f:
    f.write(serialized)

加载时用 pickle.load() 读文件,但必须和保存时用相同模式

对应 dump() 就得用 load(),对应 dumps() 就得用 loads()。混用会出错,比如用 loads() 去读文件对象,会报 TypeError: a bytes-like object is required

Deep Search
Deep Search

智能文献、网页检索与分析工具。AI赋能,洞悉万象,让知识检索与总结触手可及

下载

容易踩的坑:文件路径错、权限不够、文件被其他进程锁住,都会导致 FileNotFoundErrorOSError;更隐蔽的是文件内容被截断或损坏,此时抛 EOFErrorUnpicklingError

  • 务必用 open(..., "rb") 打开,否则 load() 读不到有效字节流
  • 若保存时用了 protocol=2,加载时无需指定协议——load() 自动识别
  • 反序列化不受信任的数据极其危险,pickle 可执行任意代码;生产环境绝不要加载来源不明的 .pkl 文件
import pickle
with open("data.pkl", "rb") as f:
    data = pickle.load(f)  # 不是 pickle.loads(f)

自定义类实例能被 pickle 的关键条件:__dict__ 可控且无不可序列化成员

不是所有类都能直接 pickle.dump()。核心看两点:实例的 __dict__ 是否干净,以及类是否定义了 __getstate__/__setstate__ 来干预序列化过程。

典型失败场景:类里存了 sqlite3.Connectionsocket.socket、闭包函数、__slots__ 但没实现 __getstate__

  • 最简方案:确保所有实例属性都是基本类型、列表、字典、其他可 pickle 类的实例
  • 若必须存不可序列化对象(如缓存、连接),在 __getstate__ 里删掉它们(返回 self.__dict__.copy() 并 pop 掉敏感 key)
  • 类方法、类变量、模块级变量不会被保存;只有实例 __dict__ 中的内容参与序列化
class Config:
    def __init__(self, path):
        self.path = path
        self._cache = {}  # 不可 pickle,需排除
    def __getstate__(self):
        state = self.__dict__.copy()
        state.pop("_cache", None)
        return state

反序列化逻辑依赖类定义在当前运行环境中已导入,哪怕只是空类声明;否则会报 AttributeError: Can't get attribute 'Config' on <module '<strong>main</strong>'>。这点常被忽略,尤其在分布式任务或跨脚本加载时。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
什么是分布式
什么是分布式

分布式是一种计算和数据处理的方式,将计算任务或数据分散到多个计算机或节点中进行处理。本专题为大家提供分布式相关的文章、下载、课程内容,供大家免费下载体验。

433

2023.08.11

分布式和微服务的区别
分布式和微服务的区别

分布式和微服务的区别在定义和概念、设计思想、粒度和复杂性、服务边界和自治性、技术栈和部署方式等。本专题为大家提供分布式和微服务相关的文章、下载、课程内容,供大家免费下载体验。

252

2023.10.07

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1570

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

651

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1249

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

1206

2024.04.29

chatgpt使用指南
chatgpt使用指南

本专题整合了chatgpt使用教程、新手使用说明等等相关内容,阅读专题下面的文章了解更多详细内容。

0

2026.03.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号