Java中文乱码根源在于编码不统一,须确保源文件、编译器(javac -encoding UTF-8)、JVM(-Dfile.encoding=UTF-8)、IDE(文件/控制台/Maven三处UTF-8)、外部交互(HTTP、DB等)全程UTF-8一致。

Java环境默认编码取决于操作系统和JVM启动参数,不显式配置时通常继承系统编码(如Windows是GBK,Linux/macOS多为UTF-8),这极易引发中文乱码。解决核心在于统一源头:确保源文件、编译器、运行时、IDE、控制台全部使用UTF-8。
编译阶段:javac必须指定UTF-8
Java源文件若含中文,未指定编码会导致编译时字节解析错误。即使文件本身是UTF-8保存,javac默认不用UTF-8读取(Windows下用GBK)。
- 编译命令加 -encoding UTF-8:
javac -encoding UTF-8 Hello.java - Maven项目在
pom.xml中配置编译插件:org.apache.maven.plugins maven-compiler-plugin 3.11.0 8 8 UTF-8
JVM运行时:-Dfile.encoding强制生效
file.encoding是JVM内部字符串处理和I/O操作的默认字符集。它不影响class文件加载,但影响new String(byte[])、String.getBytes()、FileReader等行为。
- 启动时显式设置:
java -Dfile.encoding=UTF-8 Hello - Tomcat可在
bin/catalina.sh(Linux)或catalina.bat(Windows)中添加:set JAVA_OPTS=%JAVA_OPTS% -Dfile.encoding=UTF-8 - 注意:
-Dfile.encoding必须在java命令后、类名前,且不能被程序内System.setProperty()覆盖(该调用仅对后续新建String有效,不改变JVM底层编码逻辑)
IDE与编辑器:三处UTF-8需同步
IDEA或Eclipse本身有独立编码设置,若与JVM不一致,写代码时看着正常,运行却乱码。
立即学习“Java免费学习笔记(深入)”;
- 文件编码:设为UTF-8(IDEA:File → Settings → Editor → File Encodings → Global Encoding / Project Encoding / Default encoding for properties files)
- 控制台编码:IDE内置Terminal或Run Console也要设UTF-8(IDEA:Settings → Editor → Color Scheme → Console Font → 勾选“Use console font instead of default”并确认终端支持UTF-8)
-
Maven/Gradle执行编码:IDEA中Settings → Build → Build Tools → Maven → Runner → VM Options 加入
-Dfile.encoding=UTF-8
常见误判点:别被表象迷惑
看到控制台输出中文就以为没问题?不一定。以下情况仍属编码隐患:
- 用
System.out.println("你好")能显示 ≠ 字符串内部编码正确 —— 可能只是控制台恰好用相同编码解码了错误字节 - 读取外部文件(如txt、properties)未指定编码,直接用
new FileReader()会走file.encoding,但Files.readAllLines(path)默认用UTF-8,二者混用易出错 - HTTP请求头未设
Content-Type: text/plain; charset=utf-8,服务端接收时可能按ISO-8859-1解析中文参数 - 数据库连接URL漏掉
useUnicode=true&characterEncoding=UTF-8(MySQL)或characterEncoding=UTF-8(PostgreSQL)










