c++如何删除vector中的重复元素_c++ sort+unique去重【技巧】

冰火之心

发布时间：2026-02-18 15:41:43

485人浏览过

来源于php中文网

原创

std::unique不能单独删除重复元素，因为它仅将相邻重复项移至容器末尾并返回新逻辑结尾迭代器，不改变容器大小，必须配合erase才能真正删除；且前提是先sort，否则无法处理非相邻重复。

c++如何删除vector中的重复元素_c++ sort+unique去重【技巧】

为什么 `std::unique` 不能单独删除重复元素

std::unique 并不真正“删除”元素，它只是把重复项移到容器末尾，并返回一个指向新逻辑结尾的迭代器。原 vector 大小不变，内存里那些“被移走”的重复值依然存在——如果你不配合 erase，后续遍历时还会看到它们。

常见错误现象：vector 调用 unique 后打印长度没变、重复值还在输出里、甚至出现未定义行为（比如越界访问旧 end 迭代器）。

必须先 sort：因为 unique 只能去除**相邻重复项**，无序数据中相同值分散在各处，unique 完全无效
unique 返回的是新逻辑终点，不是原 end()，必须用这个返回值配合 erase
对 vector<int></int> 等基础类型安全；但自定义类型需重载 operator==，否则比较行为不可控

正确写法：三步组合拳 `sort + unique + erase`

这是最常用、最稳妥的去重方式，适用于需要保留原始顺序以外所有重复项（即只留第一次出现的）且允许排序的场景。

vector<int> v = {3, 1, 4, 1, 5, 9, 2, 6, 5};
sort(v.begin(), v.end());                          // → {1,1,2,3,4,5,5,6,9}
auto new_end = unique(v.begin(), v.end());         // → {1,2,3,4,5,6,9,6,9}，返回指向第7个元素的迭代器
v.erase(new_end, v.end());                         // 真正删掉后面两个残留

注意：unique 不改变容器 size，erase 才触发内存收缩。

立即学习“C++免费学习笔记（深入）”；

Latent Labs

下载

不要写成 v.erase(unique(...), v.end()) 而不接 sort——结果完全不可预测
不要漏掉 auto new_end = 这一步，直接传 unique(...) 给 erase 语法虽对，但可读性差且难调试
如果 vector 很大，sort 的 O(n log n) 开销显著，此时要考虑是否真需要排序

不想排序？用 `unordered_set` 辅助去重

当必须保持原始顺序（比如去重后还要按输入顺序处理），就不能依赖 sort+unique。这时用哈希集合记录已见元素，边遍历边过滤。

vector<int> v = {3, 1, 4, 1, 5, 9, 2, 6, 5};
unordered_set<int> seen;
vector<int> result;
for (int x : v) {
    if (seen.insert(x).second) {  // insert 返回 pair<iter, bool>，second 为 true 表示新插入
        result.push_back(x);
    }
}

优点是稳定保持顺序、平均 O(n) 时间；缺点是额外 O(n) 空间，且不支持重复值较多时的内存优化（比如原地操作）。

seen.insert(x).second 比先 find 再 insert 更高效，避免两次哈希查找
若 vector 元素类型不可哈希（如自定义 struct），需提供 hash 特化和 operator==
该方法无法原地修改原 vector，必须新建容器或手动移动——若内存敏感，得权衡

容易忽略的边界与性能坑

实际项目里，几个细节常导致 bug 或性能骤降：

空 vector 或单元素 vector 调用 sort+unique 没问题，但若用 unordered_set 方式，别忘了 seen 初始化开销虽小，高频调用下也值得测
对 vector<string></string> 去重，sort 比较开销大，且 unique 按字典序去重，不是按长度或内容哈希——这点常被误以为“去重失败”
多线程环境下，vector 和 unordered_set 都非线程安全，若需并发去重，得加锁或改用无锁结构（如 tbb::concurrent_unordered_set）
如果只是检测是否有重复，不用真去重，用 set 插入时检查 insert 返回值就够了，别白跑一遍 sort

真正麻烦的从来不是语法怎么写，而是想清楚：要不要保序？重复值分布特征如何？内存和时间哪个更紧？这些判断比敲几行代码花的时间多得多。

C++如何实现HTTP服务器？（基于asio或cpp-httplib）

c++如何使用std::accumulate_c++数组求和函数用法【示例】

C++如何连接PostgreSQL数据库？（libpq使用示例）

C++如何调用ICMP Ping目标主机？（原始套接字实现）

C++ 运算符重载是什么？（如何实现自定义类型的数学运算）

c++速学教程(入门到精通)

c++怎么学习？c++怎么入门？c++在哪学？c++怎么学才快？不用担心，这里为大家提供了c++速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

c++ String sort auto int Struct operator 线程多线程并发 bug

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：C++虚函数怎么理解_带你吃透C++多态底层原理【面试】下一篇：暂无

作者最新文章

byrutor官网登录入口 byrutor最新网页入口

2026-02-18 10:35

PS怎么制作倒影效果照片_Photoshop垂直翻转与渐变使用【案例】

2026-02-18 10:36

Laravel怎么使用数据收集器 _ Laravel Collection常用函数方法【经验】

2026-02-18 10:39

c++如何遍历unordered_map_c++哈希表遍历方法【指南】

2026-02-18 10:40

MAC怎么开启隔空投送功能_MAC无法搜到AirDrop解决【避坑】

2026-02-18 10:43

Word怎么查看最近打开的文档_Word历史记录管理教程【快速】

2026-02-18 10:44

1尺等于多少厘米裤子尺寸3尺是多大

2026-02-18 10:48

CAD怎么在图纸中输入直径符号_AutoCAD特殊符号输入代码【基础】

2026-02-18 10:52

手机通话声音小听不清？打开这个设置音量倍增【通话】

2026-02-18 11:05

Win11蓝牙搜不到设备怎么办 Win11蓝牙驱动修复与设置指南【教程】

2026-02-18 11:07

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

770

2023.08.02

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

401

2023.09.04

string转int

770

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

572

2024.08.29