HashSet通过hashCode和equals方法实现去重,添加元素时先计算hashCode确定存储位置,若存在冲突则调用equals判断是否相等,相等则不重复添加;因此自定义对象需重写hashCode和equals方法以确保正确去重。

在Java中,HashSet 是一个常用的集合类,用于存储不重复的元素。它基于 HashMap 实现,能够高效地进行添加、删除和查找操作,同时自动去除重复元素。下面详细介绍 HashSet 的去重原理及其使用方法。
HashSet 去重的基本使用
要使用 HashSet 去除集合中的重复元素,只需将元素添加到 HashSet 中即可。由于其内部机制保证了元素唯一性,重复添加相同元素不会生效。
示例代码:import java.util.HashSet;<br>import java.util.Arrays;<br><br>public class HashSetExample {<br> public static void main(String[] args) {<br> HashSet<String> set = new HashSet<>();<br> set.add("apple");<br> set.add("banana");<br> set.add("apple"); // 重复元素,不会被添加<br> set.add("orange");<br><br> System.out.println(set); // 输出:[apple, banana, orange]<br> }<br>}
从输出可以看出,"apple" 只出现一次,说明 HashSet 成功实现了去重。
立即学习“Java免费学习笔记(深入)”;
HashSet 去重的底层原理
HashSet 的去重依赖于 hashCode() 和 equals() 方法。其工作流程如下:
- 当调用 add(E e) 方法时,HashSet 会先计算该元素的 hashCode 值,确定其在底层 HashMap 中的存储位置(桶)。
- 如果该位置没有其他元素,则直接存入。
- 如果该位置已有元素,则通过 equals() 方法比较新旧元素是否相等。
- 若 equals() 返回 true,说明元素已存在,添加失败;返回 false 则允许添加。
因此,为了确保自定义对象能正确去重,必须重写类中的 hashCode 和 equals 方法。
自定义对象去重示例:
class Person {<br> private String name;<br> private int age;<br><br> public Person(String name, int age) {<br> this.name = name;<br> this.age = age;<br> }<br><br> @Override<br> public boolean equals(Object o) {<br> if (this == o) return true;<br> if (!(o instanceof Person)) return false;<br> Person person = (Person) o;<br> return age == person.age && name.equals(person.name);<br> }<br><br> @Override<br> public int hashCode() {<br> return name.hashCode() * 31 + age;<br> }<br><br> @Override<br> public String toString() {<br> return "Person{" + "name='" + name + '\'' + ", age=" + age + '}';<br> }<br>}<br><br>public class Main {<br> public static void main(String[] args) {<br> HashSet<Person> people = new HashSet<>();<br> people.add(new Person("Alice", 25));<br> people.add(new Person("Bob", 30));<br> people.add(new Person("Alice", 25)); // 重复对象<br><br> System.out.println(people);<br> }<br>}
如果没有重写 hashCode 和 equals,两个内容相同的 Person 对象仍会被视为不同元素。重写后,HashSet 才能正确识别并去重。
注意事项与最佳实践
使用 HashSet 时需注意以下几点以确保去重效果:
- 存储在 HashSet 中的对象,如果参与比较的字段发生变化,可能导致集合行为异常,建议使用不可变对象。
- 必须同时重写 hashCode 和 equals 方法,且逻辑保持一致:equals 相等的两个对象,hashCode 必须相同。
- HashSet 不保证元素顺序,如需有序去重,可使用 LinkedHashSet。
- HashSet 允许一个 null 元素。
基本上就这些。掌握 HashSet 的去重机制,关键在于理解其依赖 hashCode 和 equals 的判断逻辑。只要合理重写这两个方法,就能在实际开发中高效实现数据去重。










