Python中文乱码本质是编码不一致,统一用UTF-8并显式声明和指定即可解决:源文件加# -- coding: utf-8 --,文件读写明确encoding参数,终端和IDE设为UTF-8,必要时用sys.stdout.reconfigure。

Python中文乱码本质是编码不一致:源文件、终端、IDE、文件读写等环节的编码设置没对齐。只要统一用UTF-8,并显式声明和指定,基本就能解决。
源代码文件开头加编码声明
Python 2必须加,Python 3默认UTF-8但建议仍加上,避免编辑器误判:
# -*- coding: utf-8 -*-
这行要放在文件最顶部(可紧跟在Shebang之后,如#!/usr/bin/env python3下面)。
立即学习“Python免费学习笔记(深入)”;
读写文件时明确指定encoding参数
不用依赖系统默认编码,每次open都带上encoding='utf-8':
- with open('data.txt', 'r', encoding='utf-8') as f:
- with open('out.txt', 'w', encoding='utf-8') as f:
如果读取的是GBK编码的旧文件(比如Windows记事本默认保存的),就改用encoding='gbk',但建议转成UTF-8再处理。
检查终端/控制台是否支持UTF-8
Linux/macOS一般没问题;Windows命令提示符(cmd)默认是GBK,容易出乱码:
- 临时方案:运行chcp 65001切换到UTF-8模式
- 推荐方案:改用Windows Terminal或VS Code内置终端,它们默认支持UTF-8
- PyCharm等IDE:在Settings → Editor → File Encodings里把Global、Project、Default encoding全设为UTF-8
打印中文时遇到异常?试试sys.stdout.reconfigure
某些环境(尤其是Windows + Python 3.7+)中,print()可能因stdout编码不匹配报错或乱码:
可以加一段兼容处理:
import sys
if sys.stdout.encoding != 'utf-8':
sys.stdout.reconfigure(encoding='utf-8')
放在脚本开头即可,不影响正常环境。
基本上就这些。核心就一条:别让编码“猜”,全部显式写清楚——文件怎么存的,就怎么读;终端用什么编码,就配什么输出。不复杂,但容易忽略。










