HashSet通过hashCode和equals方法实现去重,添加元素时先比较哈希值再判断相等性,自定义类需重写这两个方法;String等内置类型已默认实现,可直接去重;注意HashSet无序、允许一个null、非线程安全,大量数据去重性能优越。

在Java中,HashSet 是一个基于哈希表实现的 Set 接口集合类,它天然具备去除重复元素的能力。这是因为 Set 集合的设计原则就是不允许存储重复值,而 HashSet 正是这一特性的典型实现。
HashSet 去重的基本原理
HashSet 判断两个对象是否重复,依赖于对象的 equals() 方法和 hashCode() 方法:
- 添加元素时,HashSet 会先调用该元素的 hashCode() 方法计算哈希值,确定其在哈希表中的存储位置。
- 若该位置已有元素,再调用 equals() 方法判断是否真正相等。
- 只有当两个对象的 hashCode 相同且 equals 返回 true 时,才被视为重复元素,添加操作被拒绝。
因此,为了保证去重正确工作,存入 HashSet 的对象必须正确重写 hashCode() 和 equals() 方法。
基本使用示例:去除简单类型重复元素
对于 Java 内置类型(如 String、Integer),这些类已经重写了 hashCode 和 equals 方法,可直接用于去重:
立即学习“Java免费学习笔记(深入)”;
Set
自定义对象去重的关键:重写 hashCode 与 equals
如果想对自定义对象(如 Person 类)进行去重,必须手动重写这两个方法:
}
class Person {
private String name;
private int age;
public Person(String name, int age) {
this.name = name;
this.age = age;
}
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (!(o instanceof Person)) return false;
Person person = (Person) o;
return age == person.age && name.equals(person.name);
}
@Override
public int hashCode() {
return name.hashCode() * 31 + age;
}
这样,当两个 Person 对象的 name 和 age 相同时,HashSet 就能识别为同一对象,避免重复添加。
实用技巧与注意事项
- HashSet 不保证元素顺序,若需有序去重,可使用 LinkedHashSet(保持插入顺序)或 TreeSet(自然排序或自定义排序)。
- HashSet 允许一个 null 元素,多次添加 null 只会被保留一次。
- 在多线程环境下,HashSet 不是线程安全的,需自行同步或使用 Collections.synchronizedSet() 包装。
- 若从数据库或接口获取大量数据并去重,使用 HashSet 可显著提升性能,平均添加和查找时间复杂度为 O(1)。
基本上就这些。只要理解了 hashCode 和 equals 的协同作用,并在自定义类中正确实现它们,HashSet 就能高效帮你完成去重任务。不复杂但容易忽略细节。










