0

0

如何在Java中使用HashSet存储唯一元素

P粉602998670

P粉602998670

发布时间:2025-09-18 14:24:02

|

629人浏览过

|

来源于php中文网

原创

hashset通过哈希表实现元素唯一性,添加元素时自动去重,适用于快速查找、去重及集合操作,但需重写自定义类的hashcode与equals方法以确保正确性。

如何在java中使用hashset存储唯一元素

Java中要存储唯一元素,

HashSet
无疑是首选,它通过其内部的哈希机制确保了集合中不会出现重复项。你只需要将元素添加到
HashSet
中,它就会自动处理去重逻辑。

解决方案

HashSet
是Java集合框架中
Set
接口的一个实现,它底层基于哈希表(
HashMap
)实现。当你向
HashSet
中添加一个元素时,它会先计算该元素的哈希码(
hashCode()
方法),然后根据哈希码找到存储位置。接着,它会检查该位置是否已经存在一个与新元素“相等”(
equals()
方法)的元素。如果存在,新元素就不会被添加进来;如果不存在,新元素才会被成功加入。这个过程是自动且高效的。

这里有个简单的例子,展示了

HashSet
如何工作:

import java.util.HashSet;
import java.util.Set;

public class UniqueElementsExample {
    public static void main(String[] args) {
        Set<String> uniqueNames = new HashSet<>();

        System.out.println("尝试添加元素...");
        // 添加一些字符串
        System.out.println("添加 'Alice': " + uniqueNames.add("Alice")); // 第一次添加,通常返回true
        System.out.println("添加 'Bob': " + uniqueNames.add("Bob"));
        System.out.println("添加 'Alice' (重复): " + uniqueNames.add("Alice")); // 重复添加,返回false
        System.out.println("添加 'Charlie': " + uniqueNames.add("Charlie"));
        System.out.println("添加 'Bob' (重复): " + uniqueNames.add("Bob")); // 重复添加,返回false

        System.out.println("\nHashSet中的唯一元素:");
        for (String name : uniqueNames) {
            System.out.println(name);
        }

        System.out.println("\nHashSet的大小: " + uniqueNames.size()); // 预期大小为3
    }
}

运行这段代码,你会发现输出结果中“Alice”和“Bob”只出现了一次,

HashSet
的大小也是3,而不是5。这正是
HashSet
的魅力所在,它在后台默默地为你处理了元素的唯一性。

立即学习Java免费学习笔记(深入)”;

自定义对象在HashSet中如何保证唯一性?

对于像

String
Integer
这类Java内置类型,它们已经正确地重写了
hashCode()
equals()
方法,所以直接放入
HashSet
就能保证唯一性。但当我们处理自定义对象时,情况就有些不同了。如果你直接将自定义对象放入
HashSet
,很可能会发现即使内容完全相同的两个对象也被视为不同的元素,因为
Object
类默认的
hashCode()
equals()
方法是基于对象的内存地址来判断的。

要让

HashSet
正确识别自定义对象的唯一性,你必须在自定义类中重写
hashCode()
equals()
方法。这是Java中一个非常重要的契约:如果两个对象
equals()
返回
true
,那么它们的
hashCode()
值必须相同。反之,如果
hashCode()
值相同,
equals()
不一定返回
true
(这会导致哈希冲突,但仍能通过
equals
判断唯一性)。

飞书多维表格
飞书多维表格

表格形态的AI工作流搭建工具,支持批量化的AI创作与分析任务,接入DeepSeek R1满血版

下载

举个例子,假设我们有一个

Person
类:

class Person {
    private String name;
    private int age;

    public Person(String name, int age) {
        this.name = name;
        this.age = age;
    }

    public String getName() {
        return name;
    }

    public int getAge() {
        return age;
    }

    @Override
    public String toString() {
        return "Person{" +
               "name='" + name + '\'' +
               ", age=" + age +
               '}';
    }

    // 默认情况下,HashSet会认为两个内容相同的Person对象是不同的
    // 因为它们在内存中的地址不同。
    // 必须重写hashCode()和equals()
    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        Person person = (Person) o;
        return age == person.age && name.equals(person.name);
    }

    @Override
    public int hashCode() {
        // 通常使用Objects.hash()来生成哈希码,它会综合考虑所有参与equals比较的字段
        return java.util.Objects.hash(name, age);
    }
}

在上面的

Person
类中,我们重写了
equals()
hashCode()
equals()
方法现在会比较
name
age
字段是否相同,而
hashCode()
则会基于这两个字段生成一个哈希码。这样,当
HashSet
处理
Person
对象时,它就能正确地判断两个
Person
对象是否“相等”,从而保证了集合中
Person
对象的唯一性。

如果你忘记重写或者重写不当,比如只重写了

equals()
而没有重写
hashCode()
,那么程序在运行时可能会出现意想不到的行为,甚至导致
HashSet
无法正常工作,因为哈希码的冲突处理机制会失效。所以,这两个方法总是应该一起重写,并且遵循它们之间的契约。

HashSet的性能特点和适用场景是什么?

HashSet
以其出色的性能,在许多场景下都表现得游刃有余。它的核心优势在于查找、添加和删除操作的平均时间复杂度都是O(1)。这意味着无论集合中有多少元素,这些操作的耗时理论上都是常数级别的,非常快。当然,这是在没有大量哈希冲突的理想情况下。如果哈希函数设计不佳导致大量冲突,最坏情况下性能可能会退化到O(n)。

性能特点:

  • 快速查找、添加、删除: 平均O(1)时间复杂度,这得益于哈希表的数据结构。
  • 无序性:
    HashSet
    不保证元素的存储顺序,你不能指望迭代时元素会按照添加的顺序或者任何特定顺序出现。
  • 非线程安全:
    HashSet
    不是线程安全的。在多线程环境下,如果多个线程同时修改
    HashSet
    ,可能会导致数据不一致或运行时错误。如果需要线程安全,可以使用
    Collections.synchronizedSet(new HashSet<>())
    java.util.concurrent.ConcurrentHashMap
    的键集(
    keySet()
    )。
  • 空间换时间: 为了实现O(1)的平均时间复杂度,
    HashSet
    通常会占用比
    ArrayList
    更多的内存空间,因为它需要存储哈希表结构以及可能存在的空槽。

适用场景:

  • 去重: 这是
    HashSet
    最典型的应用。当你有一个包含重复元素的列表,想快速得到一个只包含唯一元素的新列表时,
    HashSet
    是最佳选择。
    List<String> rawList = Arrays.asList("apple", "banana", "apple", "orange", "banana");
    Set<String> uniqueItems = new HashSet<>(rawList); // 快速去重
    System.out.println(uniqueItems); // 输出: [orange, banana, apple] (顺序不确定)
  • 快速判断元素是否存在: 如果你需要频繁地检查某个元素是否在集合中,
    HashSet
    contains()
    方法效率极高。
    Set<String> dictionary = new HashSet<>(Arrays.asList("cat", "dog", "bird"));
    boolean found = dictionary.contains("dog"); // O(1)查找
  • 实现缓存: 比如,记录已经处理过的ID,避免重复处理。
  • 数学集合操作: 比如计算两个集合的交集、并集、差集,
    HashSet
    提供了便捷的方法(如
    retainAll()
    ,
    addAll()
    ,
    removeAll()
    )。

总的来说,当你关注元素的唯一性,并且需要对元素进行快速的添加、删除和查找操作,同时对元素的顺序没有要求时,

HashSet
是一个非常强大且高效的选择。理解它的工作原理,尤其是
hashCode()
equals()
的契约,能帮助你更好地驾驭它,避免在处理自定义对象时踩坑。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1010

2023.08.02

treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

549

2023.12.01

C++ 高效算法与数据结构
C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化,涵盖排序算法(快速排序、归并排序)、查找算法、图算法、动态规划、贪心算法等,并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构(链表、树、堆、哈希表等),帮助开发者提升 在复杂应用中的算法设计与性能优化能力。

30

2025.12.22

深入理解算法:高效算法与数据结构专题
深入理解算法:高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念,适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用,如数组、链表、栈、队列、哈希表、树、图等;以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析,帮助开发者不仅能熟练运用这些基础知识,还能在实际编程中优化性能,提高代码的执行效率。本专题适合准备面试的开发者,也适合希望提高算法思维的编程爱好者。

44

2026.01.06

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1925

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

656

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2395

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

47

2026.01.19

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.3万人学习

C# 教程
C# 教程

共94课时 | 11.2万人学习

Java 教程
Java 教程

共578课时 | 81万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号