0

0

java截取字符串的函数_String类核心截取API用法与性能分析

月夜之吻

月夜之吻

发布时间:2026-02-06 12:34:54

|

374人浏览过

|

来源于php中文网

原创

substring()最常用但易越界,需校验索引在[0, str.length()]内;split()适合分隔符切分但注意空段和正则性能;StringTokenizer已过时但简单分隔场景仍有低开销优势;strip()仅去空白不截取,需避免链式调用引发NPE。

java截取字符串的函数_string类核心截取api用法与性能分析

substring() 是最常用但容易越界的截取方法

Java 中 substring() 是最直接的字符串截取函数,但它不校验索引合法性——越界会直接抛 StringIndexOutOfBoundsException。尤其在动态计算索引(如配合 indexOf() 或正则匹配结果)时,很容易忽略边界为负或超出长度的情况。

常见错误场景:从日志行中提取中间字段,但某条日志格式异常导致 indexOf() 返回 -1,再传给 substring(-1, 5) 就崩了。

  • 始终先检查起始/结束索引是否在 [0, str.length()] 范围内(注意:结束索引可等于长度,表示截到末尾)
  • 推荐封装一层安全调用,例如:safeSubstring(str, start, end),内部做 Math.max(0, Math.min(start, str.length())) 类处理
  • JDK 7u6 之后 substring() 不再共享底层 char[],内存更可控,但小字符串频繁截取仍可能触发 GC 压力

split() 适合按分隔符切分,但默认丢弃空段且性能敏感

split(String regex) 截取其实是“以分隔符为界切片”,不是传统意义的子串提取。它默认会丢弃末尾连续的空字符串(比如 "a,b,,c,".split(",") 返回长度为 3 的数组),这点常被误认为是 bug。

真正影响性能的是正则编译开销:每次调用 split() 都会隐式编译正则(除非传入已预编译的 Pattern)。对固定字符串分隔符(如逗号、竖线),应优先用 split(",", -1) 并注意第 2 参数控制空段保留逻辑。

立即学习Java免费学习笔记(深入)”;

  • 固定字符分隔,用 split("\\|", -1)(竖线需转义,-1 表示不限制分割次数且保留空项)
  • 高频调用场景,提前缓存 Pattern.compile(","),再用 pattern.split(str)
  • 纯位置截取别硬套 split()——比如只要第 2 个逗号后的 10 个字符,用 substring() + indexOf() 更轻量

StringTokenizer 已过时,但简单空格/制表符切分仍有低开销优势

StringTokenizer 不是正则驱动,也不创建临时对象,对纯字符集分隔(如 " \t\n\r\f")的遍历式切分,吞吐量比 split() 高 2–3 倍。但它已被 Javadoc 标记为“legacy”,不支持正则、不可扩展,且无法返回空 token。

Pebblely
Pebblely

AI产品图精美背景添加

下载

适用场景非常窄:解析配置文件中由空格分隔的命令行参数,或嵌入式环境里避免正则类加载开销。

  • 仅当确定分隔符是固定字符集、且不需要空项、不需正则能力时才考虑
  • 不要用它处理用户输入或含混合分隔符的文本(比如 CSV 中的引号包裹逗号)
  • 替代方案:Guava 的 Splitter.on(' ').omitEmptyStrings().trimResults() 更安全易读

Java 11+ 的 strip()/stripLeading()/stripTrailing() 不是截取,但常被误用作“去首尾空格后取子串”

这三个方法只移除 Unicode 空白字符(包括全角空格、零宽空格等),不改变字符串内容结构,也不接受索引参数。有人写成 str.strip().substring(0, 10) 想“先清理再取前 10”,但若原始字符串首尾无空白,strip() 会返回原引用,而 substring() 又可能新建对象——看似省事,实则语义混杂、调试困难。

真正需要“清理+截断”组合逻辑时,应显式拆解步骤,并明确空字符串、null、超长等情况的处理策略。

  • 避免链式调用掩盖 null 或长度异常,例如 str.strip().substring(0, N)str 为 null 时直接 NPE
  • 如果目标是“最多取前 N 个非空白字符”,用 str.codePoints().takeWhile(cp -> !Character.isWhitespace(cp)).limit(N).collect(...) 更精准(但代价是流开销)
  • 日常开发中,先 Objects.requireNonNull(str, "input must not be null"),再 str = str.strip(),最后做 substring 或其他操作,逻辑更清晰

字符串截取看着简单,但边界判断、编码感知、GC 影响和 null 安全这四点,几乎每个项目都会踩至少一次。别依赖 IDE 自动补全的 API 文档摘要,打开 JDK 源码看一眼 substring 的索引校验逻辑,比读十篇博客更管用。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
guava包作用
guava包作用

guava是一个java库,增强了java标准库,提供更有效率和易于使用的集合、实用程序、缓存和并发工具。想了解更多guava的相关内容,可以阅读本专题下面的文章。

264

2024.05.29

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

585

2023.08.02

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

240

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

580

2024.03.01

登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6298

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

827

2023.09.14

token怎么获取
token怎么获取

获取token值的方法:1、小程序调用“wx.login()”获取 临时登录凭证code,并回传到开发者服务器;2、开发者服务器以code换取,用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容,可以阅读本专题下面的文章。

1076

2023.12.21

token什么意思
token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易,用来购买或出售特定的虚拟货币,也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1467

2024.03.01

1688阿里巴巴货源平台入口与批发采购指南
1688阿里巴巴货源平台入口与批发采购指南

本专题整理了1688阿里巴巴批发进货平台的最新入口地址与在线采购指南,帮助用户快速找到官方网站入口,了解如何进行批发采购、货源选择以及厂家直销等功能,提升采购效率与平台使用体验。

57

2026.02.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 3.3万人学习

C# 教程
C# 教程

共94课时 | 8.7万人学习

Java 教程
Java 教程

共578课时 | 58.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号