0

0

C++如何实现简单的哈希表_C++处理哈希冲突常用算法模板【手撕】

冰火之心

冰火之心

发布时间:2026-02-09 15:30:10

|

349人浏览过

|

来源于php中文网

原创

std::unordered_map已足够,其底层用分离链表法(GCC)或线性探测,含负载控制与rehash;手写推荐链地址法(vector+forward_list),桶数取质数,需自定义哈希与相等比较。

c++如何实现简单的哈希表_c++处理哈希冲突常用算法模板【手撕】

std::unordered_map 就够了,但得知道它背后怎么处理冲突

绝大多数场景下,直接用 std::unordered_map 是最稳妥的选择——它默认用开放定址法(具体是探测步长为 1 的线性探测)或分离链表法(GCC 实现用的是链地址法),底层已做内存对齐、负载因子控制和 rehash 逻辑。你不需要手写,除非在嵌入式、算法题、教学或想控制内存布局。

手写链地址法哈希表:核心是 std::vector + std::liststd::forward_list

这是最易理解、插入删除稳定、且避免假阴性(false negative)的方案。关键点不是“怎么存”,而是“怎么算桶号”和“怎么比较键”:

  • hash(key) % bucket_count 得桶索引,bucket_count 建议设为质数(如 101、1009),减少聚集
  • 必须重载 operator== 或提供自定义 EqualKey 函数对象,否则 find 会失败
  • 不要用 std::vector<:pair>> 模拟桶——每次查找都要遍历整个 vector,失去哈希意义
  • 示例片段:
    struct SimpleHashMap {
      std::vector>> buckets;
      size_t sz = 0;
      SimpleHashMap(size_t n = 101) : buckets(n) {}
      size_t hash(int k) { return (k * 2654435761U) % buckets.size(); } // 简单乘法哈希
      void insert(int k, int v) {
        auto& list = buckets[hash(k)];
        for (auto& p : list) if (p.first == k) { p.second = v; return; }
        list.emplace_front(k, v); ++sz;
      }
    };

线性探测开放定址法:要小心删除标记和二次探测退化

优势是缓存友好、无指针开销;劣势是删除难处理、容易形成“聚集”。常见错误包括:

  • 直接把被删元素置为 nullptr 或空值 → 后续查找会中断,必须用“墓碑(tombstone)”标记
  • 不控制负载因子(建议 ≤ 0.7)→ 查找性能急剧下降,平均探查次数飙升
  • 只用 (hash + i) % size 线性探测 → 遇到连续占用块就雪崩;可用二次探测:(hash + i*i) % size,但需保证 size 为质数且 ≡ 3 (mod 4)
  • 别忘了在 insert 时检查是否需要 rehash —— 否则 find 可能永远找不到

自定义哈希函数与 key 类型:std::hash 不是万能的

当你用 std::stringstd::pair 作 key 时,std::hash 已有特化;但自定义结构体必须显式提供:

AdsGo AI
AdsGo AI

全自动 AI 广告专家,助您在数分钟内完成广告搭建、优化及扩量

下载

立即学习C++免费学习笔记(深入)”;

  • 要么特化 std::hash,重载 operator()
  • 要么传入 lambda 或 functor 作为第 3 个模板参数:
    std::unordered_map m(101, hash_fn);
  • 别用 reinterpret_cast(this) 当哈希值——不同对象地址可能只差几个字节,导致严重冲突
  • 哈希函数输出应尽量“打散”,推荐 FNV-1a 或 murmur3 的简化版,而非简单求和

真正难的从来不是写一个能跑的哈希表,而是让它的分布足够均匀、扩容足够平滑、边界情况(如全相同 key、极端负载)不崩。这些细节,往往在压测时才暴露。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

646

2023.08.02

golang结构体相关大全
golang结构体相关大全

本专题整合了golang结构体相关大全,想了解更多内容,请阅读专题下面的文章。

302

2025.06.09

golang结构体方法
golang结构体方法

本专题整合了golang结构体相关内容,请阅读专题下面的文章了解更多。

196

2025.07.04

lambda表达式
lambda表达式

Lambda表达式是一种匿名函数的简洁表示方式,它可以在需要函数作为参数的地方使用,并提供了一种更简洁、更灵活的编码方式,其语法为“lambda 参数列表: 表达式”,参数列表是函数的参数,可以包含一个或多个参数,用逗号分隔,表达式是函数的执行体,用于定义函数的具体操作。本专题为大家提供lambda表达式相关的文章、下载、课程内容,供大家免费下载体验。

211

2023.09.15

python lambda函数
python lambda函数

本专题整合了python lambda函数用法详解,阅读专题下面的文章了解更多详细内容。

191

2025.11.08

Python lambda详解
Python lambda详解

本专题整合了Python lambda函数相关教程,阅读下面的文章了解更多详细内容。

58

2026.01.05

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

434

2023.08.14

Golang处理数据库错误教程合集
Golang处理数据库错误教程合集

本专题整合了Golang数据库错误处理方法、技巧、管理策略相关内容,阅读专题下面的文章了解更多详细内容。

125

2026.02.06

java多线程方法汇总
java多线程方法汇总

本专题整合了java多线程面试题、实现函数、执行并发相关内容,阅读专题下面的文章了解更多详细内容。

49

2026.02.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
CSS3 教程
CSS3 教程

共18课时 | 5.3万人学习

Sass 教程
Sass 教程

共14课时 | 0.8万人学习

Pandas 教程
Pandas 教程

共15课时 | 1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号