HashSet通过hashCode和equals方法实现去重,需重写这两个方法以确保自定义对象正确去重,如Student类按姓名和年龄判断重复;使用HashSet可高效去除List中重复元素,但需注意初始化容量、避免null值及线程安全问题。

在Java中,HashSet 是基于哈希表实现的 Set 接口的集合类,它最大的特点就是不允许重复元素,并且不保证元素的顺序。这使得 HashSet 成为去重操作中最常用的数据结构之一。下面介绍如何使用 HashSet 实现元素去重以及一些实用技巧。
HashSet 去重的基本原理
HashSet 判断元素是否重复依赖于对象的 equals() 和 hashCode() 方法。当添加一个元素时,HashSet 会先计算该对象的哈希值,确定存储位置;如果该位置已有元素,则调用 equals() 方法进一步比较。只有两个方法都判定相等时,才认为是重复元素,不会再次插入。
因此,要正确实现去重:
- 自定义类必须重写 hashCode() 和 equals() 方法
- 基本类型(如 String、Integer)已内置实现,可直接去重
使用 HashSet 进行去重的示例
以下是一个去除整数列表中重复元素的简单例子:
立即学习“Java免费学习笔记(深入)”;
import java.util.*;
public class RemoveDuplicates {
public static void main(String[] args) {
List list = Arrays.asList(1, 2, 3, 2, 4, 1, 5);
Set set = new HashSet<>(list);
List noDuplicates = new ArrayList<>(set);
System.out.println(noDuplicates); // 输出:[1, 2, 3, 4, 5](顺序可能不同)
}
}
只需将原列表传入 HashSet 构造函数,即可自动完成去重,再转回列表即可。
对自定义对象去重的关键技巧
假设有一个 Student 类,我们希望根据姓名和年龄判断是否重复,就必须重写 hashCode 和 equals 方法:
class Student {
private String name;
private int age;
public Student(String name, int age) {
this.name = name;
this.age = age;
}
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (!(o instanceof Student)) return false;
Student student = (Student) o;
return age == student.age && Objects.equals(name, student.name);
}
@Override
public int hashCode() {
return Objects.hash(name, age);
}
@Override
public String toString() {
return "Student{" + "name='" + name + '\'' + ", age=" + age + '}';
}
}
测试去重效果:
Liststudents = Arrays.asList( new Student("Alice", 20), new Student("Bob", 21), new Student("Alice", 20) ); Set uniqueStudents = new HashSet<>(students); System.out.println(uniqueStudents); // 输出仅包含两个元素,重复的被自动去除
性能优化与注意事项
使用 HashSet 时,注意以下几点可以提升效率和避免常见问题:
- 初始化时指定初始容量,减少扩容开销:
new HashSet(initialCapacity) - 避免在 HashSet 中存储 null 值(虽然允许一个 null)
- HashSet 不是线程安全的,多线程环境下需手动同步或使用 Collections.synchronizedSet()
- 遍历时不能修改集合结构,否则会抛出 ConcurrentModificationException










