如何在Java中使用HashMap_键值对存储、哈希冲突与链表转红黑树原理

P粉602998670

发布时间：2026-03-13 14:27:13

237人浏览过

来源于php中文网

原创

HashMap put过程：先计算hash并确定下标，空则直接插入；非空则先equals比对，相等覆盖value，不等再处理哈希冲突；key为null固定放索引0；自定义key须重写hashCode和equals且保持一致；修改影响hashCode的字段会导致get失败；链表转红黑树需同时满足桶内长度≥8且数组长度≥64；扩容触发条件为size>threshold，新容量翻倍并全量rehash；get平均O(1)，最坏O(log n)（红黑树）或O(n)（链表）。

如何在java中使用hashmap_键值对存储、哈希冲突与链表转红黑树原理

HashMap 的 put 过程到底发生了什么

往 HashMap 里放一个键值对，不是简单地算个 hash 然后塞进数组。它实际会走一整套判断链：先算 hash(key)，再用这个值和数组长度做与运算得到下标；如果该位置为空，直接新建 Node 放进去；如果不为空，得先比对 key 是否相等（equals()），相等就覆盖 value；不相等才考虑哈希冲突处理。

常见错误现象：put 后取不到刚存的值，大概率是 key 的 hashCode() 和 equals() 没写一致——比如只重写了 hashCode()，或者两个方法逻辑矛盾。

自定义类作 key 时，必须同时重写 hashCode() 和 equals()，且保证“相等的 key 一定有相同 hash 值”
key 为 null 是特例：它总被放在数组索引 0 的位置，且只允许一个 null key
不要在 key 对象存入后修改影响 hashCode() 的字段，否则后续 get() 找不到——因为 hash 值变了，查的就不是原来那个桶了

链表转红黑树的阈值和触发条件

当某个桶里链表长度达到 8，且整个 HashMap 的数组长度 ≥ 64 时，才会把链表转成红黑树。这两个条件缺一不可。

为什么不是“只要链表够长就转”？因为小容量数组下，链表长更多是扩容没跟上，而不是真有大量哈希冲突；盲目转树反而增加维护开销。而数组 ≥ 64 意味着哈希分布本应比较均匀，此时还出现长度 ≥ 8 的链表，更可能是 key 的 hashCode() 实现不合理或数据本身有偏态。

立即学习“Java免费学习笔记（深入）”；

可通过 -XX:AutoBoxCacheMax=200 等 JVM 参数间接影响 Integer 等缓存对象的 hash 分布，但不建议这么调
若频繁触发树化，优先检查 key 类型的 hashCode() 是否过于集中（比如只返回固定值或低比特全零）
红黑树退化回链表的阈值是 6，不是 7 或 8 的一半——这是为了防止在 7 附近反复树化/退化造成抖动

扩容机制如何影响性能和线程安全

HashMap 在 size > threshold（即 capacity × loadFactor）时触发扩容，新容量是原来的 2 倍，并重新计算所有已有元素的位置。这个过程是全量 rehash，时间复杂度 O(n)，且期间整个 map 不可用。

容易踩的坑是：初始化时没预估大小，导致频繁扩容。例如已知要存 1000 个元素，用默认构造函数（初始容量 16，负载因子 0.75），会触发约 6 次扩容，每次都要搬运之前所有元素。

推荐显式指定初始容量：new HashMap(1024)，让 threshold = 1024 × 0.75 = 768，可容纳 768 个元素不扩容
扩容不是线程安全的：多线程 put 可能引发死循环（JDK 7）或数据丢失（JDK 8+），必须用 ConcurrentHashMap 替代
loadFactor 设太小（如 0.5）会浪费内存；设太大（如 0.9）则链表/树更易变长，查找变慢——0.75 是空间与时间的平衡点，一般别动

为什么 get 操作在 JDK 8 后平均是 O(1)，但最坏是 O(log n)

理想情况下，hash 均匀、无冲突，get 就是算 hash + 定位桶 + 直接取值，O(1)。但一旦发生哈希冲突，就得在桶内遍历；如果是链表，最坏 O(n)；如果是红黑树，最坏 O(log n)。

注意：这里的“最坏”不是指整个 map 只有一个桶，而是单个桶内节点数很多。而红黑树的 O(log n) 是相对于该桶内节点数而言，不是整个 map 大小。

即使开了树化，也改变不了“哈希设计差 → 冲突集中 → 单桶节点爆炸”的根本问题
用 System.identityHashCode() 代替自定义 hashCode() 并不能解决业务语义上的冲突，只是换了一种 hash 方式
调试时可用 map.size() 和 map.entrySet().stream().map(e -> e.getKey().hashCode()).distinct().count() 粗略看 hash 分布是否离散

哈希冲突本身不可消除，只能缓解；真正决定性能上限的，从来不是“用了红黑树”，而是 key 的 hash 函数质量、数据分布特征、以及你有没有在一开始就避开明显陷阱。

Java中基于集合元素值构建索引映射数组的正确实现方法

如何在Java编程中使用一维数组_Java数组初始化与访问

Java中的嵌套类(Nested Class)分类汇总_四种内部类对比

什么是Java虚拟线程(Virtual Threads)_Java 19协程Project Loom的千万级并发初探

如何精准提取XML/HTML中特定标签的纯文本内容（排除子元素干扰）

相关标签:

java jvm Integer NULL count 构造函数循环线程多线程 map 对象

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Java的ParNew收集器有什么特点_配合CMS使用的多线程新生代GC 下一篇：Java中的CyclicBarrier怎么用_循环栅栏同步多线程到达屏障点的应用场景

作者最新文章

mysql如何使用BETWEEN范围查询_mysql数值与日期区间筛选

2026-03-13 09:52

mysql如何配置日志目录_mysql自定义日志路径设置

2026-03-13 09:53

Java中的方法内联(Method Inlining)是什么_减少方法调用开销原理

2026-03-13 09:53

如何理解Java中的协同进化_父类与子类功能的同步更新

2026-03-13 09:54

Python怎么画柱状图_多维分类数据对比与堆叠柱状图颜色映射实现

2026-03-13 09:55

如何在Java中获取Map的所有Value_values方法与集合流转换

2026-03-13 09:56

mysql如何处理升级后SQL_MODE变化_mysql严格模式兼容调整

2026-03-13 09:56

怎么在Spring Boot中使用RedisTemplate序列化对象_JSON序列化器的自定义设置

2026-03-13 09:56

深度掌握Navicat全局查找与替换字符技巧_高级开发者实战

2026-03-13 09:57

Python Django怎么跑定时任务_Celery分布式集成与异步任务队列Redis Broker配置

2026-03-13 09:57

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

1089

2024.03.01

counta和count的区别

Count函数用于计算指定范围内数字的个数，而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

203

2023.11.20

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

765

2023.08.10

Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧，包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例，帮助学习者掌握如何构建高性能、多任务并发的 Python 应用。

377

2025.12.24

java多线程相关教程合集

本专题整合了java多线程相关教程，阅读专题下面的文章了解更多详细内容。

2026.01.21

C++多线程相关合集

本专题整合了C++多线程相关教程，阅读专题下面的的文章了解更多详细内容。

2026.01.21

C# 多线程与异步编程

本专题深入讲解 C# 中多线程与异步编程的核心概念与实战技巧，包括线程池管理、Task 类的使用、async/await 异步编程模式、并发控制与线程同步、死锁与竞态条件的解决方案。通过实际项目，帮助开发者掌握如何在 C# 中构建高并发、低延迟的异步系统，提升应用性能和响应速度。

103

2026.02.06

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

热门下载

网站特效

网站源码

网站素材

前端模板