0

0

详解HashMap在扩容时的Rehash操作_JDK 1.8的优化位移算法

P粉602998670

P粉602998670

发布时间:2026-02-12 17:18:57

|

226人浏览过

|

来源于php中文网

原创

jdk 1.8 扩容时通过 e.hash & oldcap 判断新桶位置:为0则留原索引,非0则置原索引+oldcap;不触发 treeifybin();链表用头插法拆分致顺序反转;threshold 更新为 newcap × loadfactor。

详解hashmap在扩容时的rehash操作_jdk 1.8的优化位移算法

扩容时 resize() 怎么算新桶位置?

JDK 1.8 不再用 hash % newCapacityhash & (newCapacity - 1) 重算所有键的哈希值,而是靠一个位移判断:只看新增的最高位比特是否为 1。因为容量始终是 2 的幂,扩容即左移一位(如 16→32),相当于多出一个高位 bit。

所以每个旧桶里的节点,要么留在原位置 index,要么移到 index + oldCap —— 只需判断 e.hash & oldCap 是否为非零:

  • 若为 0 → 原位置不动
  • 若非 0 → 新位置 = 原索引 + oldCap

这个判断比重新哈希快得多,也避免了取模或额外位运算。但前提是 hash 值本身分布均匀,否则仍可能堆积。

treeifyBin() 在扩容时会触发红黑树转换吗?

不会。扩容过程中,即使某个桶已链化且长度 ≥ 8,resize() 也不会调用 treeifyBin()。它只做最简拆分:把原链表按 e.hash & oldCap 拆成两条子链(lo 链和 hi 链),然后分别插入新数组的对应位置。

红黑树转换只发生在 putVal() 的常规插入路径中,且满足两个条件:binCount >= TREEIFY_THRESHOLD(8)table.length >= MIN_TREEIFY_CAPACITY(64)。扩容时哪怕旧桶是树,也会先 split() 成两棵子树,不降级也不升级。

为什么扩容后链表顺序可能反转?

因为 JDK 1.8 用的是头插法拆分链表:遍历旧链时,每个节点都插到对应子链(lo 或 hi)的头部。这导致子链内部顺序与原链相反。

  • 例如原链:A → B → C,在 lo 链中变成 C → B → A
  • 这不是 bug,是设计选择:避免尾插需要遍历查尾,性能更稳
  • 但如果你代码依赖遍历顺序(比如靠插入顺序做隐式排序),这里会出问题
  • 并发场景下更危险——多个线程同时 resize 可能成环(JDK 1.7 的经典死循环),1.8 虽用单线程 resize 规避了这点,但顺序反转仍是事实

扩容阈值 threshold 是怎么更新的?

每次 resize() 后,threshold 会设为 newCap * loadFactor。但注意:这个值不是“下次必须扩容的精确键数”,而是“当前容量下允许的最多键数”。实际触发扩容的条件是 size >= threshold,而 size 是键值对总数,不是桶数。

  • 初始 threshold = 12(默认容量 16 × 0.75)
  • 第一次扩容后,容量变 32,threshold = 24
  • 如果中途删除大量元素,size 下降,但 threshold 不会自动下调——缩容要靠手动 clear() 或重建
  • 所以长期增删频繁的 Map,可能一直维持大容量却低负载,浪费内存

位移算法省了哈希重算,但没解决“扩容易、缩难”的本质问题;真正影响性能的,往往是误估初始容量导致频繁 resize,而不是位移本身。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

410

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

587

2023.08.10

length函数用法
length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度,以便在查询和处理字符串数据时进行操作和判断。 需要注意的是length函数计算的是字符串的字符数,而不是字节数。对于多字节字符集,一个字符可能由多个字节组成。因此,length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法,大家可以阅读本专题下面的文章。

939

2023.09.19

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

653

2023.08.10

golang map内存释放
golang map内存释放

本专题整合了golang map内存相关教程,阅读专题下面的文章了解更多相关内容。

75

2025.09.05

golang map相关教程
golang map相关教程

本专题整合了golang map相关教程,阅读专题下面的文章了解更多详细内容。

36

2025.11.16

golang map原理
golang map原理

本专题整合了golang map相关内容,阅读专题下面的文章了解更多详细内容。

64

2025.11.17

java判断map相关教程
java判断map相关教程

本专题整合了java判断map相关教程,阅读专题下面的文章了解更多详细内容。

44

2025.11.27

c语言 数据类型
c语言 数据类型

本专题整合了c语言数据类型相关内容,阅读专题下面的文章了解更多详细内容。

2

2026.02.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号