windows下invalidpathexception常因路径含非法字符(如:、|、?、*)或保留名(如aux)触发,paths.get()会主动校验而new file().topath()不校验,跨平台需统一用paths.get()并清洗不可见字符。

Windows下InvalidPathException常因:、、<code>>触发
Java 7+ 的 Paths.get() 和 FileSystems.getDefault().getPath() 在 Windows 上会主动校验路径非法字符,比如 :(除盘符外)、、<code>>、|、?、*。这不是 JVM 层面的宽松处理,而是底层调用 Win32 API GetFullPathNameW 前做的预检。
常见错误现象:InvalidPathException: Illegal char <:> at index 5: C:/tmp/file:name.txt</:> —— 注意这里不是文件不存在,而是构造 Path 对象时就失败。
- 别在文件名里用冒号,哪怕你只是想拼个日志名
"log-2024-06-12:14-30.txt",得换成"log-2024-06-12_14-30.txt" -
\?前缀路径(Windows 扩展路径)不会被Paths.get()接受,它只认标准格式;要用就得走new File("...").toPath()绕过校验(但后续操作仍可能失败) - 注意
System.getProperty("file.separator")返回,但字符串字面量里写"C: mp est.txt"会因转义崩掉,必须用"C:\tmp\test.txt"或"C:/tmp/test.txt"
Linux/macOS 不校验非法字符,但InvalidPathException仍可能抛出
Unix 系统的 Paths.get() 默认不检查字符合法性,/tmp/file:name.txt 能成功构造 Path。但一旦调用 path.toFile().exists() 或 Files.exists(path),底层 stat() 系统调用返回 ENOENT 或 EINVAL,某些 JDK 版本(如 OpenJDK 17+)会在封装异常时重抛为 InvalidPathException,提示 Malformed input or input contains unmappable characters。
- 根本原因往往是路径含不可见控制字符(如
u0000、u0001)或 UTF-8 编码损坏,而非:这类符号 - 用
path.toString().codePoints().forEach(cp -> System.out.printf("%04x ", cp))查看每个码点,重点排查0000、fffd(替换符) - 从外部读取路径(如 HTTP 请求参数、数据库字段)时,务必做
String.strip()+String.replaceAll("[\x00-\x08\x0b\x0c\x0e-\x1f]", "")清洗
Paths.get() 和 new File().toPath() 行为差异
这是最容易踩坑的地方:前者严格校验,后者几乎不校验(仅检查 null),导致同一段路径字符串,在一个地方能过、另一个地方崩。
立即学习“Java免费学习笔记(深入)”;
-
Paths.get("C:/tmp/aux.txt")→ 直接抛InvalidPathException(AUX是 Windows 保留设备名) -
new File("C:/tmp/aux.txt").toPath()→ 成功返回Path,但Files.createFile(path)会失败,报错AccessDeniedException - 跨平台代码里,别混用两种构造方式;统一用
Paths.get()更安全,它提前暴露问题 - 如果必须兼容脏数据,先用
File.pathSeparator拆分再逐段Paths.get()校验,比全量放行更可控
自定义路径校验工具类要避开 JDK 的隐式编码转换
有人写工具方法判断路径是否合法,用 Paths.get(path).toFile().getCanonicalPath() 捕获异常。这在中文路径下容易误判:JDK 内部会把 String 按系统默认编码转 byte[],再交由 OS 解析。若终端编码是 GBK,而 Java 启动参数没设 -Dfile.encoding=UTF-8,"测试.txt" 可能变成乱码字节,触发 InvalidPathException。
- 校验逻辑里别调用任何涉及文件系统的 API(
toFile()、toUri()、toRealPath()) - 纯字符层校验只需三步:检查空值、检查首尾空格、检查操作系统保留名(
CON、PRN、AUX、NUL、COM[1-9]、LPT[1-9])和非法字符集 - Windows 下保留名匹配需忽略大小写且不带扩展名,
"con.txt"和"CON"都非法,但"console.txt"合法










