如何在Java中使用HashSet_基于HashMap的无序不可重复集合实战

P粉602998670

发布时间：2026-03-14 12:27:01

567人浏览过

来源于php中文网

原创

HashSet底层基于HashMap实现，元素作为key存储，value统一使用静态Object实例PRESENT；其性能、扩容、线程安全性均继承自HashMap，必须重写hashCode()和equals()以保证去重正确性。

如何在java中使用hashset_基于hashmap的无序不可重复集合实战

HashSet底层就是HashMap，但value用的是同一个`Object`实例

HashSet不存重复元素，靠的是内部封装的HashMap——它把元素当key存，value统一用一个叫PRESENT的静态Object占位。所以你调add()时，实际在调map.put(e, PRESENT)。

这意味着：HashSet的性能、扩容逻辑、线程安全性，全都继承自HashMap。别以为“只是个集合”就和Map无关，改HashSet容量本质就是在调HashMap的initialCapacity和loadFactor。

HashSet构造时传的initialCapacity，会直接传给内部HashMap；传loadFactor也是同理
如果往HashSet里放大量自定义对象，必须重写hashCode()和equals()——否则HashMap找不到key，就等于“重复元素没被去重”
HashSet不是线程安全的，多线程写入可能破坏内部HashMap结构，抛ConcurrentModificationException或静默出错

add()返回false不一定是重复，也可能是null值被拒绝

HashSet允许存null，但只允许一个。当你连续两次add(null)，第二次返回false，看起来像重复，其实是HashMap对null key的特殊处理：它把null固定放在table[0]的链表/红黑树上，且只存一次。

这个行为容易误判成“业务逻辑冲突”，尤其在集合用于状态标记（比如记录已处理ID）时，null混在里面会让排查变困难。

立即学习“Java免费学习笔记（深入）”；

如果业务中null有明确语义（如“未初始化”），建议提前过滤，别依赖HashSet来“容错”
调试时看到add()返回false，先检查是不是刚加过null，而不是急着查equals()实现
contains(null)是合法操作，返回true或false取决于是否真存过null，不是空指针异常

遍历顺序完全不可预测，别依赖for-each输出顺序

HashSet没有顺序保证，哪怕两次插入相同元素，for-each或iterator()返回的顺序也可能不同。这不是bug，是HashMap桶数组+哈希扰动+链表/红黑树切换共同导致的自然结果。

PatentPal专利申请写作

AI软件来为专利申请自动生成内容

下载

有人在测试环境看到“好像有序”，是因为小数据量下哈希后恰好落在连续桶里，或者JDK版本、JVM参数影响了哈希算法细节——上线后立刻打脸。

需要顺序，请用LinkedHashSet（按插入顺序）或TreeSet（按自然序/比较器）
单元测试里断言集合内容时，别用assertEquals(list, new ArrayList(set))，而要用assertTrue(set.containsAll(expected) && expected.containsAll(set))
日志打印HashSet内容时，如果为可读性临时转ArrayList再sort()，记得注明这只是为了展示，不影响业务逻辑

内存占用比ArrayList高不少，小集合别硬套

一个空HashSet默认初始化16个桶，每个桶是个Node数组引用，加上HashMap自身字段（size、modCount等），基础开销约80字节；而ArrayList空实例才12字节左右。存10个Integer，HashSet可能占300+字节，ArrayList不到200字节。

这不是理论数字——在高频创建短生命周期集合的场景（比如方法内临时去重），差异会放大成GC压力。

元素少于5个、且不频繁增删时，用Arrays.asList() + 手动contains()查重，往往比新建HashSet更轻量
如果确定元素范围小且固定（比如状态码0-9），用boolean[]或BitSet替代，内存和速度都碾压
HashSet的remove()平均O(1)，但最坏O(n)（哈希全碰撞），而ArrayList.remove(Object)稳定O(n)；别只看大O，要看你的数据分布

真正麻烦的从来不是“怎么用HashSet”，而是没想清楚“为什么非得用HashSet”。哈希计算、桶扩容、对象包装——每一步都在悄悄吃资源。用之前，先问自己：这个去重，真的值得扛这一套机制？

Java里的java.util.concurrent并发工具包初探_核心常用类说明

如何在Java中对List进行多条件排序_Comparator.thenComparing链式比较

Java的ArithmeticException除了除以零还有什么情况_大数运算精确度异常

Java 中的“传值”本质：为何对象引用修改能影响外部变量？

如何在Java中处理线程池任务执行中的未捕获异常_重写afterExecute方法与ThreadFactory异常处理器

相关标签:

java jvm Integer Boolean Object NULL sort for 封装指针继承线程多线程空指针 map 对象 table 算法 bug

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：MySQL 中字符串格式日期字段的范围查询解决方案下一篇：Java怎么获取当前时间所在的周一和周末_Calendar类的日期推算逻辑

作者最新文章

悟空浏览器怎么关闭启动时的加载动画闪屏_悟空浏览器秒开优化

2026-03-13 17:04

如何在Golang中通过反射创建并操作切片 Go语言reflect.MakeSlice实战

2026-03-13 17:05

如何避免PL/SQL中的SQL注入_绑定变量Bind Variables的最佳实践

2026-03-13 17:05

Safari浏览器如何关闭网页的安全证书警告_Safari浏览器继续访问

2026-03-13 17:06

宝塔面板下如何安装Node.js的特定版本镜像源？

2026-03-13 17:09

如何在Golang中实现优雅的请求超时控制 Go语言http.TimeoutHandler使用

2026-03-13 17:09

如何在Golang中利用Trace工具分析延迟 Go语言执行链路可视化追踪

2026-03-13 17:09

如何在Golang中利用SQLite进行本地存储 Go语言嵌入式数据库应用

2026-03-13 17:11

如何在Golang中利用Finalizer清理非内存资源 Go语言runtime.SetFinalizer使用

2026-03-13 17:11

如何为Oracle配置多监听器_不同端口的并发监听机制实现

2026-03-13 17:12

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

java中boolean的用法

在Java中，boolean是一种基本数据类型，它只有两个可能的值：true和false。boolean类型经常用于条件测试，比如进行比较或者检查某个条件是否满足。想了解更多java中boolean的相关内容，可以阅读本专题下面的文章。

367

2023.11.13

java boolean类型

本专题整合了java中boolean类型相关教程，阅读专题下面的文章了解更多详细内容。

2025.11.30

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

1089

2024.03.01

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

409

2023.09.04