HashSet通过hashCode和equals方法实现去重,添加元素时先计算哈希值定位存储位置,若冲突则调用equals判断是否相等,相等则不重复添加;因此自定义对象需重写这两个方法并保持逻辑一致。使用时可直接add元素,集合自动去重,适用于快速判重、去重大量数据且无需顺序的场景,但不保证有序性,非线程安全,可结合Collections.synchronizedSet用于多线程环境。

在Java中,HashSet 是一个基于 HashMap 实现的无序、不重复集合。它天然支持元素去重,是处理重复数据时常用的数据结构之一。下面从去重原理、使用方法和典型场景三个方面进行解析。
HashSet 去重原理
HashSet 能实现去重,核心依赖于两个方法:equals() 和 hashCode()。其内部通过 HashMap 存储元素,将元素作为 key,value 使用一个固定的 Object 对象(如 PRESENT)。
当调用 add(element) 方法时,HashSet 会:
- 调用该元素的 hashCode() 方法获取哈希值,确定在哈希表中的存储位置
- 若该位置已有元素,则进一步调用 equals() 方法判断是否与新元素相等
- 如果 equals 返回 true,说明元素已存在,添加失败,返回 false
- 否则视为不同元素,存入对应桶中
因此,要让自定义对象在 HashSet 中正确去重,必须重写 hashCode() 和 equals() 方法,且两者逻辑保持一致。
立即学习“Java免费学习笔记(深入)”;
基本使用方法
使用 HashSet 去重非常简单,以下是一些常见操作示例:
1. 去除基本类型包装类重复元素
2. 去除字符串重复项
Set3. 自定义对象去重(需重写 hashCode 和 equals)
class Person { private String name; private int age; public Person(String name, int age) { this.name = name; this.age = age; } @Override public boolean equals(Object o) { if (this == o) return true; if (!(o instanceof Person)) return false; Person person = (Person) o; return age == person.age && Objects.equals(name, person.name); } @Override public int hashCode() { return Objects.hash(name, age); } } Set适用场景与注意事项
HashSet 特别适合以下场景:
- 需要快速判断某个元素是否存在(平均时间复杂度 O(1))
- 去除大量数据中的重复项,尤其是原始数据来自数组或列表时
- 对顺序没有要求,只关注唯一性
但也要注意几点:
- HashSet 不保证元素顺序,如需有序可考虑 LinkedHashSet(按插入顺序)或 TreeSet(自然排序/定制排序)
- 允许存储 null 值,但只能有一个 null
- 非线程安全,多线程环境下需手动同步或使用 Collections.synchronizedSet()
基本上就这些。只要理解了 hashCode 和 equals 的协同作用,就能高效利用 HashSet 实现去重功能。实际开发中,尤其是在处理用户数据、日志记录、标签系统等场景下,HashSet 是提升效率的利器。










