0

0

c++中如何实现数组去重并保持顺序_c++ vector高效去重技巧【汇总】

冰火之心

冰火之心

发布时间:2026-01-26 14:35:32

|

991人浏览过

|

来源于php中文网

原创

用std::unordered_set边遍历边查重插入是保持顺序且O(n)平均复杂度的首选,关键在于只保留首次出现元素;原地去重需双指针配合unordered_set,避免erase导致O(n²)退化。

c++中如何实现数组去重并保持顺序_c++ vector高效去重技巧【汇总】

std::unordered_set 遍历去重最常用也最稳

直接边遍历边查重插入,是保持顺序 + O(n) 平均复杂度的首选。关键不是“删重复”,而是“只保留第一次出现的元素”。

常见错误是先排序再 unique,那顺序就没了;或者用 std::set 导致 O(n log n),没必要。

  • std::unordered_set 存已见元素值,哈希查找均摊 O(1)
  • 遍历原 vector,遇到没在 set 里的才 push 到结果 vector
  • 注意:元素类型必须支持 operator== 和哈希(内置类型、std::string 都 OK;自定义类需提供 std::hash 特化)
std::vector vec = {1, 2, 3, 2, 4, 1, 5};
std::unordered_set seen;
std::vector result;

for (int x : vec) {
    if (seen.find(x) == seen.end()) {
        seen.insert(x);
        result.push_back(x);
    }
}

原地去重(不额外分配结果 vector)用 erase + remove_if 不行,得手写循环

std::remove_if 依赖谓词,但判断“是否为首次出现”需要状态(已见过哪些),无法无状态表达。强行用它会出错或逻辑混乱。

真正安全的原地去重,还是得用双指针思路:一个读位置 i,一个写位置 write,配合 unordered_set 判断。

立即学习C++免费学习笔记(深入)”;

NeoAgent
NeoAgent

销售易推出的AI‑CRM智能体平台

下载
  • 避免反复调用 erase —— 每次都移动后续元素,O(n²) 退化
  • 最后用 vec.resize(write) 截断多余部分
  • 如果 vector 很大且内存敏感,这个方案比新建 vector 更省空间
std::vector vec = {1, 2, 3, 2, 4, 1, 5};
std::unordered_set seen;
size_t write = 0;

for (size_t i = 0; i < vec.size(); ++i) {
    if (seen.find(vec[i]) == seen.end()) {
        seen.insert(vec[i]);
        vec[write++] = vec[i];
    }
}
vec.resize(write); // now vec = {1, 2, 3, 4, 5}

字符串或小对象用 std::unordered_set<:string> 没问题,但要注意移动语义

std::stringstd::vector 等可移动类型,插入 unordered_set 时建议用 std::move 避免深拷贝——尤其当字符串很长或 vector 元素很多时。

  • 插入前用 std::move(x),set 内部会 move 构造
  • 但注意:move 后原变量进入有效但未定义状态,别再读它
  • 如果只是去重 const std::string&,那不用 move,引用传参即可
std::vector strs = {"a", "bb", "a", "ccc"};
std::unordered_set seen;
std::vector result;

for (auto& s : strs) {
    if (seen.find(s) == seen.end()) {
        seen.insert(std::move(s)); // move into set
        result.emplace_back(std::move(s)); // but s is now invalid — don't use it again
    }
}

上面这段有隐患:第二次迭代时 s 可能已被 move。更安全写法是用值捕获或索引访问。

性能临界点:元素少于 10 个时,std::find + vector 查重反而更快

哈希表有常数级开销:建桶、计算 hash、处理冲突。当元素极少(比如配置项、枚举名列表),用 std::vector 当临时 set,配合 std::find,实测可能更快、更省内存、无哈希冲突风险。

  • 适用于编译期可知的小规模数据(
  • 代码更简单,无头文件依赖(不用
  • 注意:std::find 是 O(k) 每次,总复杂度 O(n·k),k 是已见元素数,所以只适合 k 极小
std::vector vec = {1, 2, 1, 3};
std::vector seen;
std::vector result;

for (int x : vec) {
    if (std::find(seen.begin(), seen.end(), x) == seen.end()) {
        seen.push_back(x);
        result.push_back(x);
    }
}

真正要压榨性能时,别迷信“哈希一定快”——测一下你的典型数据规模再说。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

401

2023.08.02

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

527

2023.09.20

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

298

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1497

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

623

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

592

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

587

2024.04.29

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

31

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
10分钟--Midjourney创作自己的漫画
10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合
Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号