0

0

在Java中HashSet是如何保证元素唯一的_Java哈希机制解析

P粉602998670

P粉602998670

发布时间:2026-01-21 13:05:02

|

160人浏览过

|

来源于php中文网

原创

HashSet唯一性依赖equals()与hashCode()协同校验:若equals()为true则hashCode()必须相同,否则可能跳过equals比较导致重复;自定义类须同时重写二者,且加入后勿修改参与哈希计算的字段。

在java中hashset是如何保证元素唯一的_java哈希机制解析

HashSet 的唯一性靠的是 equals() + hashCode() 两层校验

不是只看哈希值,也不是只比内容。Java 要求:如果两个对象 equals() 返回 true,它们的 hashCode() 必须相同;反过来不强制,但若不同,HashSet 会直接认为它们不在同一个桶里,根本不会调用 equals() 去比较。

所以唯一性失效的常见原因只有一个:重写了 equals() 却没重写 hashCode()

  • 自定义类加入 HashSet 前,必须同时重写 equals(Object)hashCode()
  • IDE(如 IntelliJ)生成的 hashCode() 默认基于所有参与 equals 判断的字段,别手动删掉某字段的哈希计算
  • 字段值在对象加入 HashSet 后被修改,且该字段参与了 hashCode() 计算 → 后续 contains()remove() 可能失败

HashSet 底层是 HashMap,元素存在 key 位置,value 固定为 Presentation 静态对象

翻 JDK 源码能看到:HashSetadd(E) 实际调用的是内部 HashMapput(e, PRESENT)。这意味着:

  • HashSet 的性能、扩容逻辑、线程不安全性,完全继承自 HashMap
  • 初始容量默认是 16,负载因子 0.75 → 实际能存约 12 个元素才触发扩容
  • 哈希冲突时,JDK 8+ 会将链表转为红黑树(当桶中节点 ≥ 8 且 table.length ≥ 64),前提是 key 类型实现了 Comparable

常见误判场景:浮点数、时间、数据库实体做 HashSet 元素时容易重复

不是哈希机制出错,而是对象语义和 equals() 实现不匹配:

立即学习Java免费学习笔记(深入)”;

AI小聚
AI小聚

一站式多功能AIGC创作平台,支持AI绘画、AI视频、AI聊天、AI音乐

下载
  • Double.NaNequals() 返回 true,但 NaN == NaNfalse;而 Double.hashCode() 对所有 NaN 返回同一固定值(0x7ff8000000000000L),所以多个 NaNHashSet 中仍视为一个
  • java.util.Dateequals() 比毫秒值,但若用 new Date() 创建两个“看起来一样”的时间(比如都格式化为 "2024-01-01"),实际毫秒数可能差几毫秒 → equals()false,就会被当成不同元素
  • JPA 实体若未重写 equals()/hashCode(),默认用内存地址比较,即使主键相同也会被当作不同对象加入 HashSet

验证是否真唯一:别只看 size(),要查 contains() 行为

有时候你以为加进去了两个相同对象,其实是 add() 返回 false,但你没检查返回值:

HashSet<String> set = new HashSet<>();
boolean r1 = set.add("hello");
boolean r2 = set.add("hello"); // r2 == false
System.out.println(set.size()); // 输出 1
System.out.println(r1 + ", " + r2); // true, false

更隐蔽的问题是:自定义类的 hashCode() 返回常量(比如永远返回 1),会导致所有元素挤进同一个桶,退化成链表遍历,add() 仍能保证唯一,但性能暴跌 —— 这时候 size() 是对的,但响应时间暴露问题。

哈希机制本身很稳,真正出问题的地方,永远在你怎么定义“相同”。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1567

2023.10.24

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

334

2025.08.29

C++中int、float和double的区别
C++中int、float和double的区别

本专题整合了c++中int和double的区别,阅读专题下面的文章了解更多详细内容。

108

2025.10.23

length函数用法
length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度,以便在查询和处理字符串数据时进行操作和判断。 需要注意的是length函数计算的是字符串的字符数,而不是字节数。对于多字节字符集,一个字符可能由多个字节组成。因此,length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法,大家可以阅读本专题下面的文章。

954

2023.09.19

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

765

2023.08.10

数据库三范式
数据库三范式

数据库三范式是一种设计规范,用于规范化关系型数据库中的数据结构,它通过消除冗余数据、提高数据库性能和数据一致性,提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

386

2023.06.29

如何删除数据库
如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构,作用包括:1、释放存储空间;2、确保数据的安全性;3、提高数据库的整体性能,加速查询和操作的执行速度。尽管删除数据库具有一些好处,但在执行任何删除操作之前,务必谨慎操作,并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构,无法回滚。

2111

2023.08.14

vb怎么连接数据库
vb怎么连接数据库

在VB中,连接数据库通常使用ADO(ActiveX 数据对象)或 DAO(Data Access Objects)这两个技术来实现:1、引入ADO库;2、创建ADO连接对象;3、配置连接字符串;4、打开连接;5、执行SQL语句;6、处理查询结果;7、关闭连接即可。

357

2023.08.31

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.3万人学习

C# 教程
C# 教程

共94课时 | 11.2万人学习

Java 教程
Java 教程

共578课时 | 81万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号