HashSet通过hashCode和equals方法实现去重,添加元素时先计算hashCode确定存储位置,若存在冲突则调用equals判断是否相等,相等则不重复添加;因此自定义对象需重写hashCode和equals方法以确保正确去重。

在Java中,HashSet 是一个常用的集合类,用于存储不重复的元素。它基于 HashMap 实现,能够高效地进行添加、删除和查找操作,同时自动去除重复元素。下面详细介绍 HashSet 的去重原理及其使用方法。
HashSet 去重的基本使用
要使用 HashSet 去除集合中的重复元素,只需将元素添加到 HashSet 中即可。由于其内部机制保证了元素唯一性,重复添加相同元素不会生效。
示例代码:import java.util.HashSet;
import java.util.Arrays;
public class HashSetExample {
public static void main(String[] args) {
HashSetset = new HashSet<>();
set.add("apple");
set.add("banana");
set.add("apple"); // 重复元素,不会被添加
set.add("orange");
System.out.println(set); // 输出:[apple, banana, orange]
}
}
从输出可以看出,"apple" 只出现一次,说明 HashSet 成功实现了去重。
立即学习“Java免费学习笔记(深入)”;
HashSet 去重的底层原理
HashSet 的去重依赖于 hashCode() 和 equals() 方法。其工作流程如下:
- 当调用 add(E e) 方法时,HashSet 会先计算该元素的 hashCode 值,确定其在底层 HashMap 中的存储位置(桶)。
- 如果该位置没有其他元素,则直接存入。
- 如果该位置已有元素,则通过 equals() 方法比较新旧元素是否相等。
- 若 equals() 返回 true,说明元素已存在,添加失败;返回 false 则允许添加。
因此,为了确保自定义对象能正确去重,必须重写类中的 hashCode 和 equals 方法。
自定义对象去重示例:
class Person {
private String name;
private int age;
public Person(String name, int age) {
this.name = name;
this.age = age;
}
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (!(o instanceof Person)) return false;
Person person = (Person) o;
return age == person.age && name.equals(person.name);
}
@Override
public int hashCode() {
return name.hashCode() * 31 + age;
}
@Override
public String toString() {
return "Person{" + "name='" + name + '\'' + ", age=" + age + '}';
}
}
public class Main {
public static void main(String[] args) {
HashSet people = new HashSet<>();
people.add(new Person("Alice", 25));
people.add(new Person("Bob", 30));
people.add(new Person("Alice", 25)); // 重复对象
System.out.println(people);
}
}
如果没有重写 hashCode 和 equals,两个内容相同的 Person 对象仍会被视为不同元素。重写后,HashSet 才能正确识别并去重。
注意事项与最佳实践
使用 HashSet 时需注意以下几点以确保去重效果:
- 存储在 HashSet 中的对象,如果参与比较的字段发生变化,可能导致集合行为异常,建议使用不可变对象。
- 必须同时重写 hashCode 和 equals 方法,且逻辑保持一致:equals 相等的两个对象,hashCode 必须相同。
- HashSet 不保证元素顺序,如需有序去重,可使用 LinkedHashSet。
- HashSet 允许一个 null 元素。
基本上就这些。掌握 HashSet 的去重机制,关键在于理解其依赖 hashCode 和 equals 的判断逻辑。只要合理重写这两个方法,就能在实际开发中高效实现数据去重。










