Python 字符串与 bytes 的区别与转换

冰川箭仙

发布时间：2026-02-11 21:12:10

564人浏览过

来源于php中文网

原创

Python 3 严格区分 str（文本）和 bytes（二进制），二者类型、内存表示及操作接口均不同，混用导致 TypeError 或 UnicodeDecodeError；必须用 .encode() 和 .decode() 显式转换，且编码名需准确匹配。

python 字符串与 bytes 的区别与转换

bytes 和 str 在 Python 里不是能自动互转的“同一种东西”

Python 3 强制区分文本（str）和二进制数据（bytes），它们类型不同、内存表示不同、操作接口也不同。试图直接拼接、比较或传参时出错，比如 TypeError: can't concat bytes to str 或 UnicodeDecodeError，根本原因就是混用了这两类对象。

关键判断：只要涉及文件读写、网络传输、编码处理、加密哈希等场景，就必须明确当前变量是 str 还是 bytes，不能靠“看起来像字符串”来猜测。

什么时候必须用 .encode() 和 .decode()

.encode() 把 str 变成 bytes，.decode() 把 bytes 变回 str。这不是可选项，是类型转换的唯一合法方式。漏掉、反向调用、或编码名不匹配，都会立刻报错。

读文件时用 open(..., 'r', encoding='utf-8') → 返回 str；用 open(..., 'rb') → 返回 bytes，此时不能直接 .split('\n')，得先 .decode('utf-8')
HTTP 响应体（如 requests.get(...).content）是 bytes，要转文本必须显式 .decode('utf-8')（注意：不是所有响应都声明了编码，别硬写 response.text 就以为安全）
subprocess.run(..., stdout=subprocess.PIPE) 的 stdout 是 bytes，打印前要么 decode，要么用 text=True 参数让 subprocess 自动处理
错误信息里出现 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0，说明你拿 utf-8 去解码一个其实是 gbk 或带 BOM 的 bytes，得换编码重试

常见坑：encode/decode 的参数不是摆设

编码名写错、省略、或依赖默认值，是隐形雷区。Python 默认编码是 utf-8，但很多老系统、Windows 文件、Excel 导出 CSV 默认用 gbk 或 cp1252。不指定或写错，程序可能在一台机器跑通，换一台就崩。

Perl学习手札 chm版

Perl学习手札是台湾perl高手写的一篇文章，特打包为chm版，方便大家阅读。关于本书 1. 关于Perl 1.1 Perl的历史 1.2 Perl的概念 1.3 特色 1.4 使用Perl的环境 1.5 开始使用 Perl 1.6 你的第一个Perl程序 2. 标量变量(Scalar) 2.1 关于标量 2.1.1 数值 2.1.2 字符串 2.1.3 数字与字符串转换 2.2 使用你自己的变量 2.3 赋值 2.3.1 直接设定 2.3.2 还可以这样 2.4 运算 2.5 变量的输出/输入 2.

下载

立即学习“Python免费学习笔记（深入）”；

'中文'.encode() 等价于 '中文'.encode('utf-8')，没问题；但 b'\xc4\xe3'.decode() 会按 utf-8 解，实际是 gbk 编码，就报错
用 open(..., 'w') 写 str 时，encoding 不写等于用系统默认，Linux 是 utf-8，Windows 控制台可能是 cp936，结果文件在别处打不开
网络协议（如 HTTP header、JSON RPC）通常要求 ASCII-only 的 bytes，传中文 str 过去会直接失败，得先 encode 成 utf-8 再构造成 header 字段

len()、切片、in 操作的行为差异

对 str 和 bytes 同样写 len(s) 或 s[0:3]，结果完全不同：前者按 Unicode 字符数算，后者按字节数算。这个差异在截断、分块、协议解析时极易出错。

len('€') 是 1（一个字符），len('€'.encode('utf-8')) 是 3（UTF-8 下欧元符号占 3 字节）
b'abc\xff'[0:2] 返回 b'ab'；'café'[0:2] 返回 'ca'；但 'café'.encode()[0:2] 是 b'ca'，而 'café'.encode()[0:3] 是 b'caf' —— 因为 é 在 UTF-8 中是 2 字节，开头 3 字节刚好卡在中间，decode 会失败
b'hello' in b'hello world' 是 True；'hello' in b'hello world' 是 False（类型不匹配，直接报错）

真正麻烦的是那些“看起来能过，其实逻辑错”的地方：比如按字节长度切日志行、用 bytes.find() 找 ASCII 关键字、却忘了输入可能是带 emoji 的 str —— 这类问题不会立刻报错，但数据会被截断或错位。

Python 正则表达式的执行机制解析

Python dict 的哈希实现与冲突处理

如何用Python实现基于文本文件的用户登录系统

Python 类型注解对可维护性的影响

Python 偏函数 partial 的典型使用场景

相关标签:

python json 字符串接口切片 len 类型转换对象 bom position ASCII windows http rpc linux excel

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python 装饰器的工作机制详解下一篇：Python deque 在高并发场景下的优势

作者最新文章

苹果官网入口ID登录_苹果官方账户登录及管理入口

2026-02-10 01:45

OPPO官网中国首页访问_OPPO中国官方网站手机旗舰店入口

2026-02-10 02:19

个人所得税住房贷款利息专项扣除_个人所得税住房贷款利息专项扣除怎么申报

2026-02-10 02:31

空调外机太吵教你一招简单有效的降噪方法

2026-02-10 03:35

苹果黑屏开不了机充电没反应？iPhone 无法开机故障排查指南

2026-02-10 08:12

mcgs怎么加模组教程_MCGS模组添加详细视频教程

2026-02-10 09:27

空调外机比内机高50厘米安装高度是否合理

2026-02-10 10:30

最好用的AI专案管理工具居然是Google的「NotebookLM」？这篇告诉你原因

2026-02-10 10:55

用 channel 实现生产者消费者模式（带退出）

2026-02-10 13:32

配备三星2亿像素传感器！REDMI K100系列曝光

2026-02-10 14:30

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

436

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

543

2023.08.23