根本原因是Windows CMD默认GBK编码与Python UTF-8处理冲突,导致中文显示为问号或方块;解决方法包括运行chcp 65001切换代码页、重定向stdout为gbk编码,或改用PowerShell等UTF-8友好终端。

Python终端输出中文变问号或方块
根本原因是Windows CMD默认用GBK编码,而Python脚本(尤其带UTF-8 BOM或无BOM但声明了# -*- coding: utf-8 -*-)实际按UTF-8读取和处理字符串,print时字节流被CMD以GBK强行解码,自然出错。
这不是Python bug,也不是字体问题,是编码协议不匹配。临时改CMD窗口属性里的字体(比如设成“Lucida Console”)只能让方块显示成空格,不能恢复文字。
- 检查当前CMD编码:运行
chcp,看到类似活动代码页: 936就是GBK - Python 3.7+在启动时会尝试自动适配控制台编码,但仅限于
CP65001(即UTF-8),而CMD默认不启用它 - 直接在脚本开头加
sys.stdout.reconfigure(encoding='utf-8')对CMD无效——底层API不支持
用CHCP临时切到UTF-8代码页(最简方案)
在运行Python脚本前,先在CMD中执行:chcp 65001。之后所有print("你好")都会正常显示。
这个操作只影响当前CMD窗口,关掉就失效,适合调试或单次运行。注意不是所有旧版Windows都原生支持65001,Win7需手动开启Unicode支持(注册表项HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage\OEMCP设为65001,但风险高,不推荐)。
立即学习“Python免费学习笔记(深入)”;
-
chcp 65001后,CMD内部使用UTF-8,但部分老命令(如dir中文路径)可能显示异常,属正常现象 - 如果脚本里用了
input(),输入中文也可能乱码——因为stdin同样受chcp影响,此时也得用65001 - PowerShell不用
chcp,它默认UTF-16,但Python启动后仍可能因sys.stdout.encoding误判为cp1252,需额外处理
Python脚本内绕过CMD编码限制(兼容性更强)
不依赖CMD当前代码页,而是把字符串显式编码成GBK再输出——前提是你的终端确实是GBK环境(CMD默认就是)。这样Python和CMD用同一套规则解码。
示例:print("你好".encode('gbk', errors='ignore').decode('gbk'))看似绕,实则稳定。但更实用的是重定向stdout写法:
import sys import io sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='gbk')
这段必须放在脚本最开头(早于任何print),否则已缓存的输出会失效。
- 该方法对
print、logging、第三方库的print调用都生效 - 若终端其实是
UTF-8(比如WSL、VS Code终端),硬设gbk反而导致乱码——所以它只适合明确知道跑在CMD下的场景 - 别用
sys.setdefaultencoding('gbk'),Python禁止修改默认编码,且该函数在site模块加载后就不可用了
VS Code终端或IDE内乱码怎么处理
VS Code默认终端是PowerShell,但它的python命令常被设成在CMD下启动(看右下角终端类型)。此时chcp 65001依然有效,但更推荐改设置:
打开VS Code设置,搜terminal.integrated.defaultProfile.windows,改成PowerShell;再搜python.defaultInterpreterPath确保指向正确Python。PowerShell本身支持UTF-8,只要Python没主动覆盖sys.stdout.encoding,中文就基本不乱。
- PyCharm用户请检查
Help → Edit Custom VM Options,添加-Dfile.encoding=UTF-8(对Java层有效),但核心仍是确保终端编码与Python一致 - 用
os.system("chcp 65001 >nul")在脚本开头自动切编码页,能避免手动输命令,但每次运行都闪一下CMD窗口 - 真正跨平台稳定的方案是:终端用UTF-8(PowerShell/WSL/Terminal.app),Python脚本不指定
encoding参数,默认走系统locale——Windows上这反而容易翻车,所以生产环境建议统一用PowerShell + UTF-8
最麻烦的不是改哪里,而是不同环节各自记着不同的编码:文件保存用UTF-8、编辑器显示用UTF-8、Python解释器读文件用UTF-8、CMD却坚持用GBK——只要漏掉一环,乱码就回来。盯住chcp输出和sys.stdout.encoding值,比猜快得多。










