c++如何使用unordered_set去重_c++哈希集合操作【详解】

穿越時空

发布时间：2026-02-17 16:46:38

240人浏览过

来源于php中文网

原创

unordered_set插入时自动去重，因其基于哈希表实现，插入前先计算hash值并用operator==比较判等，相等则跳过；自定义类型需提供hash特化和operator==，内置类型默认支持。

c++如何使用unordered_set去重_c++哈希集合操作【详解】

unordered_set 插入时自动去重的原理

unordered_set 是 C++ 标准库中基于哈希表实现的无序集合，它在插入元素时会自动检查是否已存在相同值——如果 hash 值相同且 operator== 判定相等，就跳过插入。这不是“额外去重步骤”，而是其底层行为本身。

注意：自定义类型需提供哈希函数和相等比较，否则编译失败。内置类型（如 int、string）已默认支持。

重复调用 insert() 同一值，返回值的 second 字段为 false，表示未插入成功
不保证元素顺序，遍历时顺序不可预测
平均时间复杂度为 O(1)，但最坏情况（大量哈希冲突）退化为 O(n)

常见去重场景下的写法对比

比如从 vector 中提取唯一整数：

vector<int> nums = {1, 2, 2, 3, 3, 4};
unordered_set<int> unique_nums(nums.begin(), nums.end()); // 构造时直接去重

或逐个插入并判断：

立即学习“C++免费学习笔记（深入）”；

unordered_set<int> s;
for (int x : nums) {
    if (s.insert(x).second) {
        // 插入成功，x 是新元素
    }
}

构造初始化更简洁，适合一次性去重；逐个 insert() 适合需要在插入时做逻辑分支的场景
不要用 find() + insert() 组合，效率更低（查一次、再插一次），insert() 自带查找
若需保留原始顺序，unordered_set 不适用，应配合 vector + unordered_set 辅助判断

自定义类型使用 unordered_set 的必要条件

例如对 struct Point { int x, y; }; 使用 unordered_set<point></point>，必须显式提供：

Synthesys

Synthesys是一家领先的AI虚拟媒体平台，用户只需点击几下鼠标就可以制作专业的AI画外音和AI视频

下载

特化 std::hash<point></point>，重载 operator()
提供 operator==（成员函数或非成员函数均可）

否则编译报错：error: call to implicitly-deleted default constructor of 'std::hash<point>'</point>

简单示例：

struct Point {
    int x, y;
    bool operator==(const Point& o) const { return x == o.x && y == o.y; }
};

namespace std {
template<> struct hash<Point> {
    size_t operator()(const Point& p) const {
        return hash<int>{}(p.x) ^ (hash<int>{}(p.y) << 1);
    }
};
}

注意：异或（^）不是最佳哈希组合方式，易导致碰撞；生产环境建议用 boost::hash_combine 或更健壮的混入位移。

性能与内存使用的实际影响

unordered_set 默认负载因子上限是 1.0，当元素数 / 桶数 > 1.0 时自动 rehash，触发内存重新分配和所有元素重散列——这会导致短时停顿，且内存占用通常是实际数据的 2–3 倍。

若已知最终大小，构造时用 unordered_set<t>(n)</t> 预留桶数，避免多次 rehash
频繁增删场景下，unordered_set 比 set 更快；但若需遍历有序结果，别指望它排序，得转 vector 后 sort()
小数据量（如 vector + unique 可能更快，因无哈希开销和内存碎片

哈希表的“快”是有前提的：分布均匀、冲突少、对象拷贝/移动廉价。一旦自定义类型的哈希函数写歪了，或者 operator== 逻辑有误，去重就会失效或崩溃。

C++的std::lock_guard和std::unique_lock该用哪个？ (锁管理策略)

C++ 纯虚函数与抽象类是什么？（如何设计良好的接口层）

C++中std::unreachable怎么优化分支_C++23提示编译器不可达代码【底层】

c++如何判断文件是否存在_c++检查文件路径有效性【核心】

c++如何操作位运算_c++位运算符实战技巧【实战】

c++速学教程(入门到精通)

c++怎么学习？c++怎么入门？c++在哪学？c++怎么学才快？不用担心，这里为大家提供了c++速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

c++ red String sort 成员函数 Error int Struct operator 对象 default constructor

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：C语言数据类型分类_基本类型、派生类型与用户自定义类型体系下一篇：暂无

作者最新文章

民政通app怎么查询地名文化遗产民政通app特色地名搜索方法【实用】

2026-02-16 17:27

composer怎么指定php版本_composer多版本PHP切换使用方法

2026-02-16 17:31

sublime如何一键格式化所有代码_Sublime全文本格式化【技巧】

2026-02-16 17:34

MAC如何开启高刷模式_MAC设置120Hz刷新率详细步骤【显示】

2026-02-16 17:35

win11怎么关闭搜索栏_Windows 11任务栏搜索图标隐藏设置【指南】

2026-02-16 17:37

composer.json中repositories怎么写_composer配置仓库地址

2026-02-16 17:38

composer怎么查看缓存目录路径_composer查看缓存位置方法

2026-02-16 17:40

轻小说文库如何设置横屏阅读轻小说文库屏幕旋转设置【实用】

2026-02-16 17:44

千问AI怎么写周报_利用通义千问快速生成职场总结操作指南【锦囊】

2026-02-16 17:45

win11怎么同步系统设置_Windows 11使用微软账号同步个性化【方法】

2026-02-16 17:45

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

750

2023.08.02

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

401

2023.09.04

scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

371

2023.10.18

500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

339

2023.10.25

string转int

750

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

572

2024.08.29