详解HashMap在扩容时的Rehash操作_JDK 1.8的优化位移算法

P粉602998670

发布时间：2026-02-12 17:18:57

226人浏览过

来源于php中文网

原创

jdk 1.8 扩容时通过 e.hash & oldcap 判断新桶位置：为0则留原索引，非0则置原索引+oldcap；不触发 treeifybin()；链表用头插法拆分致顺序反转；threshold 更新为 newcap × loadfactor。

详解hashmap在扩容时的rehash操作_jdk 1.8的优化位移算法

扩容时 `resize()` 怎么算新桶位置？

JDK 1.8 不再用 hash % newCapacity 或 hash & (newCapacity - 1) 重算所有键的哈希值，而是靠一个位移判断：只看新增的最高位比特是否为 1。因为容量始终是 2 的幂，扩容即左移一位（如 16→32），相当于多出一个高位 bit。

所以每个旧桶里的节点，要么留在原位置 index，要么移到 index + oldCap —— 只需判断 e.hash & oldCap 是否为非零：

若为 0 → 原位置不动
若非 0 → 新位置 = 原索引 + oldCap

这个判断比重新哈希快得多，也避免了取模或额外位运算。但前提是 hash 值本身分布均匀，否则仍可能堆积。

`treeifyBin()` 在扩容时会触发红黑树转换吗？

不会。扩容过程中，即使某个桶已链化且长度 ≥ 8，resize() 也不会调用 treeifyBin()。它只做最简拆分：把原链表按 e.hash & oldCap 拆成两条子链（lo 链和 hi 链），然后分别插入新数组的对应位置。

红黑树转换只发生在 putVal() 的常规插入路径中，且满足两个条件：binCount >= TREEIFY_THRESHOLD(8) 且 table.length >= MIN_TREEIFY_CAPACITY(64)。扩容时哪怕旧桶是树，也会先 split() 成两棵子树，不降级也不升级。

为什么扩容后链表顺序可能反转？

因为 JDK 1.8 用的是头插法拆分链表：遍历旧链时，每个节点都插到对应子链（lo 或 hi）的头部。这导致子链内部顺序与原链相反。

例如原链：A → B → C，在 lo 链中变成 C → B → A
这不是 bug，是设计选择：避免尾插需要遍历查尾，性能更稳
但如果你代码依赖遍历顺序（比如靠插入顺序做隐式排序），这里会出问题
并发场景下更危险——多个线程同时 resize 可能成环（JDK 1.7 的经典死循环），1.8 虽用单线程 resize 规避了这点，但顺序反转仍是事实

扩容阈值 `threshold` 是怎么更新的？

每次 resize() 后，threshold 会设为 newCap * loadFactor。但注意：这个值不是“下次必须扩容的精确键数”，而是“当前容量下允许的最多键数”。实际触发扩容的条件是 size >= threshold，而 size 是键值对总数，不是桶数。

初始 threshold = 12（默认容量 16 × 0.75）
第一次扩容后，容量变 32，threshold = 24
如果中途删除大量元素，size 下降，但 threshold 不会自动下调——缩容要靠手动 clear() 或重建
所以长期增删频繁的 Map，可能一直维持大容量却低负载，浪费内存

位移算法省了哈希重算，但没解决“扩容易、缩难”的本质问题；真正影响性能的，往往是误估初始容量导致频繁 resize，而不是位移本身。

相关标签:

循环堆 Length 线程 map 并发 table 算法 bug

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在任意屏幕尺寸下精准居中并定位两个 Lottie 动画下一篇：什么是集合的内存对齐与填充_影响大规模集合性能的底层硬件因素

作者最新文章

Golang中如何使用指针实现对象的在位(in-place)更新_节省内存分配

2026-02-12 17:20

CSS图片模糊到清晰过渡_filter:blur在动画中的艺术化应用

2026-02-12 17:21

CSS伪类:defined应用_自定义组件注册后的样式显示

2026-02-12 17:21

Java开发环境_UOS下JDK与IDE（Eclipse/IDEA）安装

2026-02-12 17:22

什么是集合的内存对齐与填充_影响大规模集合性能的底层硬件因素

2026-02-12 17:23

Golang与Kube-batch集成实战_实现批量任务调度

2026-02-12 17:24

详解Java中的构造器与方法的本质区别_内存分配与调用的时机

2026-02-12 17:25

如何在测试中自动生成API的示例代码段

2026-02-12 17:26

Golang运算符优先级详解_算术、逻辑与位运算符

2026-02-12 17:27

打印机/扫描仪连不上_麒麟OS通用驱动安装与故障排除

2026-02-12 17:28

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

410

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

587

2023.08.10

length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度，以便在查询和处理字符串数据时进行操作和判断。需要注意的是length函数计算的是字符串的字符数，而不是字节数。对于多字节字符集，一个字符可能由多个字节组成。因此，length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法，大家可以阅读本专题下面的文章。

939

2023.09.19