Java String不可变,trim()仅处理ASCII空白;split()默认丢弃末尾空串,负limit才保留;substring索引需防越界;大量拼接用StringBuilder;Unicode补充字符需用codePoint相关方法。

Java 中 String 是不可变的,所有“修改”操作都返回新对象——这是绝大多数方法行为异常的根本原因。
为什么 trim() 不去掉中文空格?
trim() 只移除 ASCII 空白字符(U+0000 到 U+0020),不处理全角空格(U+3000)、不间断空格(U+00A0)或零宽空格(U+200B)等。
- 用
replaceAll("^\\s+|\\s+$", "")配合Pattern.UNICODE_CHARACTER_CLASS更可靠 - 若需兼容全角空格,可写:
str.replaceAll("^[\\s\u3000]+|[\\s\u3000]+$", "") - 注意:正则中的
\\s默认不包含 U+3000,必须显式添加
split() 的坑:空字符串和负数 limit
split(String regex) 默认丢弃末尾空串;split(String regex, int limit) 的 limit 为负数时才保留全部分割结果(包括结尾空串)。
-
"a,b,c,".split(",")→["a", "b", "c"](长度 3,末尾空串被丢) -
"a,b,c,".split(",", -1)→["a", "b", "c", ""](长度 4) - 正则中点号
.、星号*必须转义:str.split("\\.") - 避免用
split("")拆字符——应改用toCharArray()或codePoints().toArray()
substring() 的索引边界容易抛 StringIndexOutOfBoundsException
两个参数分别是起始索引(含)和结束索引(不含),但结束索引可以等于字符串长度,不能超过。
立即学习“Java免费学习笔记(深入)”;
-
"abc".substring(1, 3)→"bc"✅ -
"abc".substring(1, 4)→ 抛异常 ❌(最大合法 end 是 3) -
"abc".substring(3, 3)→ 返回空字符串""✅(合法) - 建议配合
Math.min(end, str.length())做防御性截取
性能敏感场景慎用 + 拼接大量字符串
编译器会对常量拼接优化(如 "a" + "b" → "ab"),但运行时循环中用 += 会反复创建新 String 对象。
- 循环内拼接优先用
StringBuilder:sb.append(str) -
String.join(", ", list)比手写循环拼接更简洁且已优化 - JDK 9+ 中
String.concat()比+略快(底层复用数组),但仍不如StringBuilder适合多次追加
真正麻烦的是 Unicode 补充字符(如 emoji ??),它们占两个 char(代理对),length() 和 charAt() 会出错;需要用 codePointCount()、offsetByCodePoints() 或 chars()/codePoints() 流式处理。









