0

0

在Java里Set接口解决了什么问题_Java不重复集合机制说明

P粉602998670

P粉602998670

发布时间:2026-02-10 14:45:12

|

570人浏览过

|

来源于php中文网

原创

应优先用 Set 而非 List 存不重复数据,因其自动判重、省去人工校验;HashSet 适合高性能无序场景,TreeSet 支持排序与范围查询,LinkedHashSet 保留插入顺序;判重依赖 equals() 和 hashCode() 一致实现。

在java里set接口解决了什么问题_java不重复集合机制说明

为什么用 Set 而不是 List 存不重复数据

当你需要“自动去重”时,List 无法帮你判断是否已存在相同元素——每次 add() 都照单全收,得靠人工遍历 contains() 再决定加不加,既啰嗦又容易漏。而 Set 的契约就是“不接受重复”,底层在插入时直接拦截,省掉显式校验逻辑。

常见误用场景:
- 用 ArrayList 收一堆 ID,再手动去重(比如调 stream().distinct()),其实一开始就该选 Set
- 把 Set 当成“有序容器”用,结果发现 HashSet 迭代顺序不稳定,这是设计使然,不是 bug

HashSetTreeSetLinkedHashSet 怎么选

三者都实现 Set,但行为差异直接影响功能和性能:

  • HashSet:基于 HashMap 实现,增删查平均 O(1),但不保证顺序,且要求元素正确重写 hashCode()equals()
  • TreeSet:基于红黑树,自动按自然序或自定义 Comparator 排序,增删查 O(log n),适合需要范围查询(如 subSet())或天然有序的场景
  • LinkedHashSet:哈希表 + 双向链表,保留插入顺序,性能略低于 HashSet(多维护链表开销),但迭代顺序可预测,适合做缓存去重或需按添加顺序遍历的场合

“重复”的判定标准到底是什么

Set 判重只看两件事:equals() 返回 truehashCode() 值相等。缺一不可。

典型翻车点:
- 自定义类没重写 hashCode(),只重写了 equals() → 同样内容的对象可能被当成两个不同元素存进 HashSet
- 重写了 hashCode() 但用了可变字段(比如某个 status 字段参与计算),之后改了字段值 → 对象可能再也找不到了(因为哈希桶位置变了,但集合没重新散列)
- 使用 TreeSet 时,compareTo()equals() 行为不一致(比如一个按 ID 比,一个按 name 比)→ 集合行为混乱,甚至出现“能 add 却 contains 不到”的诡异现象

Set 到实际业务逻辑的衔接细节

别只盯着“不重复”这个表层能力,几个关键衔接点常被忽略:

HARPA AI
HARPA AI

浏览器插件,ChatGPT自动化助手,将ChatGPT集成到谷歌搜索

下载

立即学习Java免费学习笔记(深入)”;

  • 转成数组或列表时,用 set.toArray(new T[0]),别用 new T[set.size()] —— 后者在某些 JDK 版本下有潜在扩容风险
  • 并发场景下,HashSet 不安全,别直接套 Collections.synchronizedSet() 就完事;高频读写优先考虑 ConcurrentSkipListSetCopyOnWriteArraySet(注意后者写操作成本高)
  • 如果只是临时去重且后续要频繁查“是否包含某值”,SetList + stream().anyMatch() 快一个数量级,但若只查一次,创建 Set 的初始化开销反而可能得不偿失

真正难的不是选哪个实现类,而是想清楚“不重复”背后的真实约束:是值相等即排斥?还是排序后相邻才算重复?抑或需要线程安全下的最终一致性?这些决定了你到底该用什么,以及怎么用。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1346

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

298

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2202

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

35

2026.01.19

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

406

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

585

2023.08.10

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

633

2023.08.10

TensorFlow2深度学习模型实战与优化
TensorFlow2深度学习模型实战与优化

本专题面向 AI 与数据科学开发者,系统讲解 TensorFlow 2 框架下深度学习模型的构建、训练、调优与部署。内容包括神经网络基础、卷积神经网络、循环神经网络、优化算法及模型性能提升技巧。通过实战项目演示,帮助开发者掌握从模型设计到上线的完整流程。

0

2026.02.10

Vue3组合式API与组件开发实战
Vue3组合式API与组件开发实战

本专题讲解 Vue 3 组合式 API 的核心概念与应用技巧,深入分析响应式系统、生命周期管理、组件设计与复用策略。通过完整项目案例,指导前端开发者实现高性能、结构清晰的 Vue 应用,提升开发效率与代码可维护性。

2

2026.02.10

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 3.4万人学习

C# 教程
C# 教程

共94课时 | 9.1万人学习

Java 教程
Java 教程

共578课时 | 62.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号