0

0

Java中的StringTokenizer类_比split更高效的字符串分词器说明

P粉602998670

P粉602998670

发布时间:2026-02-24 10:05:35

|

469人浏览过

|

来源于php中文网

原创

stringtokenizer 不比 split 更高效,且是已废弃的遗留类;它不支持正则、空分隔符和空字段保留,性能更差;推荐用 split(可配负参数保留空项)或预编译 pattern。

java中的stringtokenizer类_比split更高效的字符串分词器说明

StringTokenizer 不比 split 更高效,而且在绝大多数场景下不推荐使用。

StringTokenizer 已被官方标记为“遗留类”

Java 从 1.0 就带了 StringTokenizer,但它早在 Java 1.4 的文档里就被明确标注为 “legacy class”,意思是“为了向后兼容才保留,新代码不应使用”。它没实现 Iterator,不支持正则,也不能处理空字段(比如连续分隔符),更关键的是——它压根没做性能优化。

  • split() 底层用 Pattern 编译正则,首次调用稍慢,但后续复用 Pattern.compile() 可完全规避开销
  • StringTokenizer 每次都手动扫描字符串,无缓存、无预编译,纯靠 while 循环 + indexOf,对长字符串反而更慢
  • JDK 9+ 中,String.split() 还做了内联优化和分支预测提示,实际基准测试中普遍快 10%~30%

split("") 和 StringTokenizer 处理空字符串的行为完全不同

这是最容易踩坑的地方:想把字符串拆成单字符数组?很多人直觉写 new StringTokenizer(str, ""),结果抛 IllegalArgumentException —— StringTokenizer 的分隔符不能为空字符串。

VISBOOM
VISBOOM

AI虚拟试衣间,时尚照相馆。

下载
  • str.split("") 能正常返回每个字符(首尾会多出空串,需过滤)
  • 想安全切单字符,应该用 str.chars().mapToObj(c -> String.valueOf((char) c)).toArray(String[]::new) 或直接 str.toCharArray()
  • 如果硬要用 StringTokenizer,必须指定非空分隔符,比如逗号或制表符,否则运行时报错

替代方案:简单场景用 split,高频/复杂场景预编译 Pattern

除非你在维护 2002 年的遗留系统,否则别碰 StringTokenizer。现代写法更清晰、更可控、也更快。

立即学习Java免费学习笔记(深入)”;

  • 普通分隔:直接 "a,b,c".split(","),注意它会把 "a,,c" 拆成长度为 3 的数组(跳过空字段),而 StringTokenizer 会返回 2 个 token
  • 要保留空字段?加负数参数:"a,,c".split(",", -1) → 长度为 3 的数组,含中间空串
  • 高频调用(如日志解析)?提前编译:private static final Pattern COMMA_SPLIT = Pattern.compile(",");,然后用 COMMA_SPLIT.split(str)
  • 需要忽略空白或多种分隔符?split("\s+|[,;\t]") 一行搞定,StringTokenizer 做不到

真正影响性能的从来不是选 StringTokenizer 还是 split,而是反复创建正则对象、没考虑空字段语义、或者在循环里对同一字符串反复分词。这些细节比类名选择重要得多。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

850

2023.08.02

while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

103

2023.09.25

登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6435

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

838

2023.09.14

token怎么获取
token怎么获取

获取token值的方法:1、小程序调用“wx.login()”获取 临时登录凭证code,并回传到开发者服务器;2、开发者服务器以code换取,用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容,可以阅读本专题下面的文章。

1087

2023.12.21

token什么意思
token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易,用来购买或出售特定的虚拟货币,也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1684

2024.03.01

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

638

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

217

2023.09.04

Golang 生态工具与框架:扩展开发能力
Golang 生态工具与框架:扩展开发能力

《Golang 生态工具与框架》系统梳理 Go 语言在实际工程中的主流工具链与框架选型思路,涵盖 Web 框架、RPC 通信、依赖管理、测试工具、代码生成与项目结构设计等内容。通过真实项目场景解析不同工具的适用边界与组合方式,帮助开发者构建高效、可维护的 Go 工程体系,并提升团队协作与交付效率。

1

2026.02.24

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 3.9万人学习

C# 教程
C# 教程

共94课时 | 10.1万人学习

Java 教程
Java 教程

共578课时 | 71.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号