0

0

Python 字符编码问题产生的根本原因

冷漠man

冷漠man

发布时间:2026-02-14 19:56:02

|

635人浏览过

|

来源于php中文网

原创

python 2的str是字节序列,python 3的str是unicode字符串,这是编码错误的根源;读写文件须显式指定encoding="utf-8",避免依赖默认locale;终端、网络、数据库各层编码需单独校验并保持一致。

python 字符编码问题产生的根本原因

Python 2 和 Python 3 的 str 类型本质不同

Python 2 的 str 是字节序列,Python 3 的 str 是 Unicode 字符串——这是绝大多数编码错误的起点。不是“没设编码”,而是你默认在拿 Python 3 当 Python 2 用。

常见错误现象:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe4 in position 0,或中文显示成 \xe4\xbd\xa0\xe5\xa5\xbd

  • 读文件时没指定 encoding 参数(Python 3 默认用系统 locale,Windows 常是 cp936,Linux 常是 utf-8
  • str(byte_string) 强转字节对象(Python 3 中这会调用 __str__,不是解码)
  • 混用 bytesstr 做拼接,比如 b"hello" + "world"

open() 不加 encoding 就等于开盲盒

Python 3 的 open() 默认使用 locale.getpreferredencoding(),它不等于文件实际编码,也不等于你编辑器保存的编码。

使用场景:读写配置、日志、用户提交的文本文件。

立即学习Python免费学习笔记(深入)”;

LogoMaker
LogoMaker

免费在线制作Logo,在几分钟内完成标志设计

下载
  • 明确写死 encoding="utf-8",除非你确定文件是 GBK(如 Windows 记事本旧版保存)
  • 写文件时也必须加 encoding,否则 print(..., file=f) 可能因默认编码不匹配而报错
  • 遇到乱码先用 chardet.detect() 猜编码,但别依赖它自动解码——它只是启发式估算

示例:with open("data.txt", encoding="utf-8") as f: content = f.read()

sys.stdout.encoding 和终端实际支持的编码经常对不上

Python 启动时会从环境推断 sys.stdout.encoding,但 Windows CMD、PowerShell、IDE 内置终端、SSH 连接各自有一套编码逻辑,print() 出来的是什么,取决于三者是否一致:Python 推断出的编码、终端当前代码页、字符串本身是否已正确解码。

常见错误现象:脚本里 print("你好") 在 PyCharm 正常,在 CMD 报错;或者输出是问号或方块。

  • Windows 上 CMD 默认是 cp936,但 Python 可能设成 utf-8,这时需手动改终端:执行 chcp 65001
  • 不要用 sys.setdefaultencoding() —— 它只在启动初期有效,且强行修改会掩盖真实问题
  • 如果必须兼容老旧终端,把输出先 encode 成目标编码再 write 到 sys.stdout.buffer

HTTP 响应、JSON、数据库字段的编码要单独校验

网络和存储层不认 Python 的字符串抽象,它们只认字节流。你以为传的是字符串,其实中间已经过一次隐式编码/解码。

使用场景:调用 API、存 MySQL、解析 JSON 返回体。

  • requests.get().text 依赖响应头的 charset,若缺失或错误,结果就是乱码;更稳的方式是用 .content.decode("utf-8") 显式控制
  • MySQL 的 CHARSET=utf8mb4 和连接参数 charset="utf8mb4" 必须同时设置,缺一不可
  • JSON 只接受 Unicode 字符串,json.loads() 输入必须是 str,不能是 bytes;而 json.dumps() 输出默认是 str,想得字节要用 ensure_ascii=False + .encode()
真正卡住人的,往往不是“怎么设 utf-8”,而是某一层悄悄用了别的编码,还假装自己很统一。比如数据库连的是 utf8mb4,但 SQLAlchemy 的 create_engine 没传 charset,或者 Nginx 反向代理时加了错误的 charset 头。查的时候得一层层确认字节进来时是谁解的码。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
mysql修改数据表名
mysql修改数据表名

MySQL修改数据表:1、首先查看数据库中所有的表,代码为:‘SHOW TABLES;’;2、修改表名,代码为:‘ALTER TABLE 旧表名 RENAME [TO] 新表名;’。php中文网还提供MySQL的相关下载、相关课程等内容,供大家免费下载使用。

677

2023.06.20

MySQL创建存储过程
MySQL创建存储过程

存储程序可以分为存储过程和函数,MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名),也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容,供大家免费下载使用。

371

2023.06.21

mongodb和mysql的区别
mongodb和mysql的区别

mongodb和mysql的区别:1、数据模型;2、查询语言;3、扩展性和性能;4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容,供大家免费下载体验。

284

2023.07.18

mysql密码忘了怎么查看
mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

519

2023.07.19

mysql创建数据库
mysql创建数据库

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

262

2023.07.25

mysql默认事务隔离级别
mysql默认事务隔离级别

MySQL是一种广泛使用的关系型数据库管理系统,它支持事务处理。事务是一组数据库操作,它们作为一个逻辑单元被一起执行。为了保证事务的一致性和隔离性,MySQL提供了不同的事务隔离级别。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

392

2023.08.08

sqlserver和mysql区别
sqlserver和mysql区别

SQL Server和MySQL是两种广泛使用的关系型数据库管理系统。它们具有相似的功能和用途,但在某些方面存在一些显著的区别。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

537

2023.08.11

mysql忘记密码
mysql忘记密码

MySQL是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。那么忘记mysql密码我们该怎么解决呢?php中文网给大家带来了相关的教程以及其他关于mysql的文章,欢迎大家前来学习阅读。

636

2023.08.14

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

23

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 4.3万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号