Java命令行中文乱码本质是JVM默认字符集与终端编码不一致,需统一三者编码:确认终端编码(如Windows CMD用chcp查GBK)、启动时加-Dfile.encoding=对应编码、必要时代码中手动解码。

Java 命令行参数中出现中文乱码,本质是 JVM 启动时默认字符集与操作系统终端编码不一致导致的。关键在于让 JVM 读取参数时使用的编码与终端实际发送的编码保持一致。
确认终端当前编码
不同系统终端默认编码不同:Windows CMD 默认是 GBK(或 GB2312),PowerShell 可能是 UTF-8(取决于版本和设置);Linux/macOS 终端通常为 UTF-8。可通过以下方式确认:
- Windows CMD:运行 chcp,输出如 活动代码页: 936 表示 GBK
- Linux/macOS:运行 locale | grep charset,常见输出为 UTF-8
指定 JVM 输入编码(核心方法)
JVM 本身不直接提供“命令行参数编码”开关,但可通过 -Dfile.encoding 影响 String 构造、控制台输入等行为;更可靠的方式是显式解码参数字节数组。推荐组合使用:
- 启动时添加:-Dfile.encoding=UTF-8(Linux/macOS 推荐)或 -Dfile.encoding=GBK(Windows CMD 推荐)
- 若仍乱码,说明 JVM 未按预期解码 args,需在 Java 代码中手动处理:
String arg = new String(args[0].getBytes(StandardCharsets.ISO_8859_1), "UTF-8"); // 适用于 Windows 下传入 UTF-8 字节被误当 ISO-8859-1 解析的情况
- 更健壮做法:统一要求终端用 UTF-8,并在 JVM 启动时强制指定:java -Dfile.encoding=UTF-8 -Dsun.jnu.encoding=UTF-8 MyApp arg中文
Windows 特殊处理:CMD 与 PowerShell 差异
Windows CMD 默认 GBK,但若文件保存为 UTF-8 且无 BOM,或使用新版 Windows Terminal,默认可能为 UTF-8。混乱常源于不一致:
立即学习“Java免费学习笔记(深入)”;
- 在 CMD 中临时切 UTF-8:chcp 65001,再运行 java 命令
- 避免依赖系统编码:改用 PowerShell 并确保其为 UTF-8($OutputEncoding = [System.Text.UTF8Encoding]::new())
- 最稳妥:Java 程序启动时检测 args 是否乱码(如含字符),自动尝试 GBK/UTF-8 双解码
IDE 运行时的编码配置(如 IntelliJ / Eclipse)
IDE 内置终端和程序运行配置独立于系统终端:
- IntelliJ:File → Settings → Editor → File Encodings → 设置 “Global Encoding”、“Project Encoding”、“Default encoding for properties files” 均为 UTF-8;Run → Edit Configurations → Environment → 添加 VM options:-Dfile.encoding=UTF-8
- Eclipse:Preferences → General → Workspace → Text file encoding → 设为 UTF-8;Run Configurations → Arguments → VM arguments 同样添加 -Dfile.encoding=UTF-8
不复杂但容易忽略的是:JVM 的 -Dfile.encoding 不仅影响文件读写,也影响命令行参数的原始字节到字符串的转换逻辑。只要终端、JVM 参数、代码解码三者编码链对齐,中文参数就能正确传递。










