c++中如何实现简单哈希表_c++手动实现hashmap逻辑

穿越時空

发布时间：2026-01-05 14:25:13

622人浏览过

来源于php中文网

原创

手动实现哈希表主要用于教学、面试、嵌入式或需精细控制哈希策略/内存布局/冲突处理；常见选择为线性探测（开放寻址）或拉链法，需关注负载因子扩容、删除标记、哈希均匀性及边界安全。

c++中如何实现简单哈希表_c++手动实现hashmap逻辑

为什么不用 `std::unordered_map` 而要手动实现

通常是因为教学、面试、嵌入式环境限制，或需要完全控制哈希策略、内存布局、冲突处理方式。手动实现能暴露关键设计点：哈希函数选择、桶数组大小、开放寻址 vs 链地址法、扩容时机与方式。注意：std::unordered_map 默认用链地址法 + 素数桶数 + 二次哈希，而手写常选更易理解的线性探测（开放寻址）或简单拉链法。

用线性探测实现插入和查找（C++11+）

线性探测简单直观，但容易聚集；适合教学和小规模数据。核心是：计算 hash(key) % bucket_size 得到初始位置，冲突时顺序往后找空位或匹配键。

哈希函数建议用 std::hash<key>()(key)</key>，避免自己写低质量散列
桶数组用 std::vector<:pair value>></:pair>，空位用特殊标记（如 std::optional 或布尔数组标记有效位）
删除操作不能真删，需设为“已删除”状态（deleted），否则会断开后续查找链
负载因子超过 0.7 就该扩容——重新分配更大桶数组，再逐个 rehash 插入

template<typename Key, typename Value>
class SimpleHashMap {
    struct Entry {
        std::optional<std::pair<Key, Value>> data;
        bool deleted = false;
    };
    std::vector<Entry> buckets;
    size_t size_ = 0;
    static constexpr float MAX_LOAD_FACTOR = 0.7f;
<pre class='brush:php;toolbar:false;'>size_t hash(const Key& k) const {
    return std::hash<Key>{}(k) & (buckets.size() - 1); // 要求 bucket_size 是 2 的幂
}

public: void insert(const Key& k, const Value& v) { if (staticcast(size) / buckets.size() >= MAX_LOAD_FACTOR) rehash(buckets.size() * 2);

    size_t idx = hash(k);
    while (buckets[idx].data.has_value() && !buckets[idx].deleted) {
        if (buckets[idx].data->first == k) {
            buckets[idx].data->second = v; // 更新
            return;
        }
        idx = (idx + 1) & (buckets.size() - 1); // 线性探测，要求 size 是 2 的幂
    }
    buckets[idx].data = std::make_pair(k, v);
    buckets[idx].deleted = false;
    ++size_;
}

Value* find(const Key& k) {
    size_t idx = hash(k);
    while (buckets[idx].data.has_value()) {
        if (!buckets[idx].deleted && buckets[idx].data->first == k)
            return &buckets[idx].data->second;
        idx = (idx + 1) & (buckets.size() - 1);
    }
    return nullptr;
}

private: void rehash(size_t new_size) { std::vector old = std::move(buckets); buckets.assign(newsize, Entry{}); size = 0; for (auto& e : old) { if (e.data && !e.deleted) { insert(e.data->first, e.data->second); } } } };

拉链法实现更简洁但指针管理要小心

每个桶存一个 std::vector 或 std::list，插入即 push_back，查找遍历桶内链表。优势是删除干净、逻辑清晰；劣势是额外指针开销、缓存不友好。

FormX

AI自动从表格和文档中提取数据

下载

不要用裸指针管理节点，优先用 std::vector<:pair value>></:pair> 存桶，避免内存泄漏
桶数组大小建议用素数（如 31、101、1009），减少哈希分布偏斜；可用静态素数表或运行时计算
查找时仍要遍历桶内所有元素，最坏 O(n)，但平均 O(1) —— 前提是哈希函数够均匀

常见崩溃和未定义行为点

手动实现哈希表最容易栽在边界和状态管理上：

立即学习“C++免费学习笔记（深入）”；

hash(key) % bucket_size 中若 bucket_size == 0（初始化没做），会触发除零错误
没处理自赋值或移动语义，insert(k, std::move(v)) 后又访问 v 导致悬垂引用
扩容时没正确处理 deleted 标记，导致旧数据被跳过或重复插入
用 std::string 或自定义类型作 key 时，忘了重载 operator== 或提供等价比较谓词，find 永远失败
多线程环境下未加锁，insert 和 find 并发引发数据竞争

真正难的不是写完，而是让 erase、clear、迭代器、异常安全、移动构造这些边缘操作都稳住——多数人卡在这一步就退回 std::unordered_map 了。

C++如何实现一个A*寻路算法？C++游戏AI与路径规划【算法实战】

c++在Unreal Engine中的应用_c++ UE4/5游戏开发基础

如何用C++实现一个有限状态机（FSM）？C++游戏AI与协议解析【设计模式】

c++如何实现一个简单的神经网络推理框架_c++ ONNX Runtime集成【AI】

c++如何使用TensorRT进行模型部署优化_c++ NVIDIA推理引擎入门【AI】

c++速学教程(入门到精通)

c++怎么学习？c++怎么入门？c++在哪学？c++怎么学才快？不用担心，这里为大家提供了c++速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

930

2023.08.02

css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列，用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容，可以阅读本专题下面的文章。

594

2024.04.28

C++中int、float和double的区别

本专题整合了c++中int和double的区别，阅读专题下面的文章了解更多详细内容。

105

2025.10.23

if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词，用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章，供大家免费阅读。

839

2023.08.22

c语言const用法

const是关键字，可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍：1、声明常量，const关键字可用于声明常量，常量的值在程序运行期间不可修改，常量可以是基本数据类型，如整数、浮点数、字符等，也可是自定义的数据类型；2、函数参数中的const修饰符，const关键字可用于函数的参数中，表示该参数在函数内部不可修改等等。

557

2023.09.20

javascriptvoid(o)怎么解决

javascriptvoid(o)的解决办法：1、检查语法错误；2、确保正确的执行环境；3、检查其他代码的冲突；4、使用事件委托；5、使用其他绑定方式；6、检查外部资源等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

186

2023.11.23

java中void的含义

本专题整合了Java中void的相关内容，阅读专题下面的文章了解更多详细内容。

125

2025.11.27

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

743

2023.08.10

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

2026.03.04

热门下载

网站特效

网站源码

网站素材

前端模板