Java中如何对中文字符串按拼音排序_Collator类的基本用法

P粉602998670

发布时间：2026-03-18 08:31:24

838人浏览过

来源于php中文网

原创

Collator.getInstance() 默认排序非拼音序，因依赖系统Locale：中文环境可能为拼音序，英文环境则按Unicode码点排序；必须显式传入Locale.CHINA并设STRENGTH为SECONDARY以确保正确中文排序。

java中如何对中文字符串按拼音排序_collator类的基本用法

Collator.getInstance() 默认排序为什么不是拼音顺序

Java 的 Collator 默认行为取决于系统区域设置（Locale），比如用 Collator.getInstance() 在中文 Windows 或 Android 上可能碰巧是拼音序，但在英文环境或服务器上大概率退化为按 Unicode 码点排——“张”会排在“阿”前面。这不是 bug，是设计使然：Collator 本意是做“符合语言习惯的比较”，而“中文排序规则”本身需显式声明。

实操建议：

立即学习“Java免费学习笔记（深入）”；

必须传入明确的 Locale，首选 Locale.CHINA（不是 Locale.SIMPLIFIED_CHINESE，后者不保证排序规则）
避免依赖默认构造，哪怕本地测试通过，上线后容易因 JVM 启动参数（如 -Duser.language=en）失效
若需严格 GB/T 2312 或 Unicode 汉字扩展区支持，得搭配 RuleBasedCollator 自定义规则，但绝大多数业务场景 Collator.getInstance(Locale.CHINA) 足够

用 Collator 做 List.sort() 时的常见空指针和类型错误

直接把 Collator 当作 Comparator 传给 sort() 看似合理，但容易踩两个坑：一是 Collator.compare() 接收 String，若列表含 null 会抛 NullPointerException；二是如果 List 元素是自定义对象（比如 User），没提取字符串字段就传进去，会触发 ClassCastException。

实操建议：

立即学习“Java免费学习笔记（深入）”；

对可能含 null 的列表，先过滤或用 Comparator.nullsFirst() 包一层：

Collator collator = Collator.getInstance(Locale.CHINA);<br>List<String> list = Arrays.asList("王", null, "李");<br>list.sort(Comparator.nullsLast(collator));

对对象列表，必须用方法引用提取字段：

list.sort(Comparator.comparing(User::getName, Collator.getInstance(Locale.CHINA)));

别用 collator::compare 方法引用——它签名是 (String, String) → int，而 Comparator 需要 (T, T) → int，泛型擦除后可能在运行时出错

Collator.STRENGTH 设置影响拼音排序精度

Collator 的 STRENGTH 级别决定它是否区分大小写、音调、甚至全半角。中文排序最常踩的坑是用了 Collator.PRIMARY（只比汉字本体），结果“张”和“章”被当成相同——它们拼音声母韵母一样，仅声调不同；而默认的 Collator.TERTIARY 才会区分声调和大小写。

SongAI

免费AI歌曲和音乐生成平台，支持文字生成歌曲、AI歌词创作、AI翻唱等功能

下载

实操建议：

立即学习“Java免费学习笔记（深入）”；

中文姓名/关键词排序，推荐设为 Collator.SECONDARY（区分声调，忽略大小写）：

Collator collator = Collator.getInstance(Locale.CHINA);<br>collator.setStrength(Collator.SECONDARY);

若业务要求“张”=“章”（比如模糊搜索），才降级到 PRIMARY；但注意这会让“啊”和“阿”也等价（同音不同调）
避免用 TERTIARY 处理纯中文——它会把英文大小写、标点差异也纳入比较，增加无谓开销

Android 和旧版 JDK 的 Collator 兼容性差异

Android（尤其 API 28 以下）和 OpenJDK 8 的 Collator 实现不同：前者基于 ICU，拼音排序更准；后者用较老的 CLDR 数据，对生僻字（如“䶮”、“婠”）或新收录汉字可能返回 0（视为相等）或排序错乱。这不是代码写错，是底层数据版本问题。

实操建议：

立即学习“Java免费学习笔记（深入）”；

服务端若用 JDK 8，建议升级到 JDK 11+ 或显式引入 icu4j 替代：
```
new com.ibm.icu.text.Collator().setLocale(Locale.CHINA)
```
Android 端无需额外处理，但要注意 Collator.getInstance(Locale.CHINA) 在低版本可能 fallback 到 ASCII 序，可加兜底校验：
```
if (collator.compare("张", "李") == 0) { /* 触发告警或切备用排序 */ }
```
跨平台项目（如 Kotlin Multiplatform）必须统一 Collator 来源，不能混用 JDK 和 ICU 版本

真正麻烦的是混合排序：中英文混排时，“iPhone”该排在“苹果”前还是后？Collator 默认按语言区块分组，但具体位置受 CollationKey 缓存和归一化影响——这时候就得测真实数据，别信文档里的“理论上”。

Java中如何优雅地打印Map内容_重写toString与forEach结合Lambda表达式输出

Java while(true) 与定时任务结合的模拟写法

Java 循环中断后 finally 块的执行时机分析

如何配置Java程序的逃逸分析参数_JVM优化指令实战

Java的main方法为什么是public static_程序执行入口的底层要求

相关专题

Kotlin协程编程与Spring Boot集成实践

本专题围绕 Kotlin 协程机制展开，深入讲解挂起函数、协程作用域、结构化并发与异常处理机制，并结合 Spring Boot 展示协程在后端开发中的实际应用。内容涵盖异步接口设计、数据库调用优化、线程资源管理以及性能调优策略，帮助开发者构建更加简洁高效的 Kotlin 后端服务架构。

156

2026.02.12

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1091

2023.08.02

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

256

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

1154

2024.03.01

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

410

2023.09.04

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

761

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

221

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1571

2023.10.24

Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践，系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例，帮助开发者构建高效稳定的实时通信系统，适用于聊天应用、实时数据推送等场景。

2026.03.18

热门下载

网站特效

网站源码

网站素材

前端模板