HashSet通过HashMap底层实现元素唯一性,以元素为key、PRESENT为value存储,依赖hashCode定位桶和equals判断重复;自定义类须重写hashCode与equals保证一致性,null值允许且仅存一个。

HashSet 保证元素唯一,靠的是 HashMap 的底层支撑和 hashCode + equals 的双重校验机制。
底层其实是 HashMap
HashSet 并没有自己实现存储逻辑,而是内部持有一个 HashMap 实例。当你往 HashSet 中添加一个元素(比如 add("abc")),它实际上是把这个元素作为 key,存进内部的 HashMap,value 固定用一个叫 PRESENT 的静态对象占位。
因为 HashMap 的 key 天然不允许重复,所以 HashSet 就“顺便”实现了去重。
去重靠的是 hashCode 和 equals 配合
当调用 add() 方法时,HashSet 会按以下步骤判断是否重复:
立即学习“Java免费学习笔记(深入)”;
- 先算出该元素的 hashCode(),定位到哈希桶(数组下标)
- 如果桶里没元素,直接存入
- 如果桶里已有元素,就遍历这个桶(可能是链表或红黑树),对每个已有元素调用 equals() 方法比对
- 只要有一个返回 true,就认为重复,不添加
⚠️ 注意:如果两个对象 equals() == true,它们的 hashCode() 必须相同;否则可能被分到不同桶里,导致去重失效。
自定义类必须重写 hashCode 和 equals
如果你往 HashSet 里放的是自定义对象(比如 User 类),默认继承自 Object 的 hashCode() 和 equals() 是基于内存地址的,会导致逻辑相同的对象也被视为不同元素。
正确做法是:
- 根据业务上“相等”的字段(如 id、name 等)重写 equals()
- 确保这些字段也参与 hashCode() 计算,保持一致性
- 推荐用 IDE 自动生成(如 IntelliJ 的 Alt+Insert),避免手写出错
null 元素也能存,且只允许一个
HashSet 允许添加一个 null 值。它的处理方式很特别:
- null 的 hashCode() 规定为 0,会被放到数组索引为 0 的位置
- 在比较时,equals(null) 总是 false,但 HashSet 对 null 做了单独判断——只允许一个 null 存在
所以 set.add(null) 多次调用,结果仍是 size=1。
基本上就这些。理解清楚 HashMap 底层 + 重写规范,HashSet 去重就不会踩坑。










