0

0

Python 文本模式与二进制模式的真实区别

舞夢輝影

舞夢輝影

发布时间:2026-01-18 18:12:08

|

959人浏览过

|

来源于php中文网

原创

根本区别在于是否自动处理编码、换行符和字节边界:文本模式自动解码/编码并标准化换行符,二进制模式原样读写字节,无任何转换。

python 文本模式与二进制模式的真实区别

Python 中文本模式("r""w")和二进制模式("rb""wb")的根本区别,不在“能不能读写”,而在于 是否自动处理编码、换行符和字节边界。用错模式不会立刻报错,但会在跨平台、含非 ASCII 字符或处理图像/音频等文件时悄悄出问题。

文本模式:自动解码 + 换行符标准化

文本模式下,Python 把底层字节流按指定编码(默认 UTF-8)解码成 str,写入时再把 str 编码回字节。同时,它会把系统换行符(Windows 的 \r\n、Linux/macOS 的 \n)统一转为 \n 供 Python 程序使用;写入时又按当前系统自动转回对应换行序列。

  • 读取 "hello\r\n"(Windows 文件)→ 在 Python 中得到 "hello\n"
  • 写入 "hi\n" → 在 Windows 上实际存为 b"hi\r\n",在 Linux 上存为 b"hi\n"
  • 若文件是 GBK 编码的中文文本,用默认 open("a.txt", "r") 会因解码失败抛 UnicodeDecodeError

二进制模式:字节原样进出,零干预

二进制模式跳过所有编码/换行处理,直接读写 bytes 对象。打开即得原始字节,写入也必须是 bytes,不猜测、不转换、不补删 \r

Python精要参考 pdf版
Python精要参考 pdf版

这本书给出了一份关于python这门优美语言的精要的参考。作者通过一个完整而清晰的入门指引将你带入python的乐园,随后在语法、类型和对象、运算符与表达式、控制流函数与函数编程、类及面向对象编程、模块和包、输入输出、执行环境等多方面给出了详尽的讲解。如果你想加入 python的世界,David M beazley的这本书可不要错过哦。 (封面是最新英文版的,中文版貌似只译到第二版)

下载
  • 读取 "hello\r\n" → 得到 b"hello\r\n",原封不动
  • 写入 b"abc\x00\xff" → 精确写入这 5 个字节,无任何修饰
  • 适合处理图片、PDF、ZIP、加密数据等——它们根本不是文本,也没有“换行”概念

混用模式的典型陷阱

错误往往发生在“以为是文本,其实是二进制”或“想省事用文本处理非 UTF-8 数据”时:

立即学习Python免费学习笔记(深入)”;

  • open("image.jpg", "r").read() → 解码失败(UnicodeDecodeError),因为 JPG 是纯字节
  • open("log.txt", "wb").write("done\n") → 类型错误(TypeError: a bytes-like object is required),因为 "done\n"str,不是 bytes
  • 在 Windows 上用文本模式读取由 Linux 生成的 UTF-8 文件(无 BOM),又没指定 encoding="utf-8" → 可能被误判为 CP1252,导致中文乱码

怎么选?看数据本质,不看文件扩展名

决定模式的关键是内容,不是后缀:

  • 用二进制模式:图片(.png/.jpg)、压缩包(.zip/.tar)、可执行文件(.exe/.so)、序列化数据(.pkl)、网络抓包(.pcap)
  • 用文本模式:代码(.py/.js)、配置(.json/.toml)、日志(.log)、纯文本文档(.txt),且明确知道其编码(推荐显式传 encoding 参数)
  • 不确定编码?先用二进制模式读前几字节判断 BOM 或用 chardet 探测,再选文本模式重开

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

455

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

546

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

334

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

82

2025.09.10

js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

530

2023.06.20

js获取当前时间
js获取当前时间

JS全称JavaScript,是一种具有函数优先的轻量级,解释型或即时编译型的编程语言;它是一种属于网络的高级脚本语言,主要用于Web,常用来为网页添加各式各样的动态功能。js怎么获取当前时间呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

576

2023.07.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

760

2023.08.03

js是什么意思
js是什么意思

JS是JavaScript的缩写,它是一种广泛应用于网页开发的脚本语言。JavaScript是一种解释性的、基于对象和事件驱动的编程语言,通常用于为网页增加交互性和动态性。它可以在网页上实现复杂的功能和效果,如表单验证、页面元素操作、动画效果、数据交互等。

6177

2023.08.17

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.5万人学习

Git 教程
Git 教程

共21课时 | 4.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号