c++如何实现字符串去重_c++ unique与erase配合使用【技巧】

穿越時空

发布时间：2026-03-03 12:55:03

867人浏览过

来源于php中文网

原创

std::unique仅去除相邻重复元素且不改变容器大小，需先排序再配合erase才能实现全量去重；若需保持原始顺序，应使用unordered_set遍历去重。

c++如何实现字符串去重_c++ unique与erase配合使用【技巧】

为什么 `std::unique` 不能直接去重？

std::unique 并不是“字符串去重”函数，它只对**相邻重复元素**做去重，且不会改变容器大小——它只是把重复元素“挤到末尾”，返回一个指向新逻辑结尾的迭代器。如果你直接对未排序的 std::string 或 std::vector<char></char> 调用 unique，结果往往不符合预期。

常见错误现象："abac" 经 unique 后仍是 "abac"（因为 'a' 不相邻），而你以为会变成 "abc"。

必须先排序（如 std::sort），再 unique，才能实现“全量去重”
但注意：排序会破坏原始字符顺序，如果需要保持首次出现顺序（如 "abac" → "abc"），unique 就不适用
std::unique 只适用于支持随机访问和可比较的序列，对 std::string 本身可用，但操作的是字符层面

用 `unique` + `erase` 做有序去重（保留字典序）

这是最典型的配合用法，适合你明确接受排序后结果的场景，比如生成去重后的字符集合。

std::string s = "hello world";
std::sort(s.begin(), s.end());
auto last = std::unique(s.begin(), s.end());
s.erase(last, s.end()); // → " dehlorw"

关键点：

立即学习“C++免费学习笔记（深入）”；

LibLib AI

中国领先原创AI模型分享社区，拥有LibLib等于拥有了超多模型的模型库、免费的在线生图工具，不考虑配置的模型训练工具

下载

std::sort 和 std::unique 都作用于 [begin, end)，确保迭代器类型匹配
erase 的参数必须是 unique 返回的迭代器（新逻辑结尾）和原 end()，缺一不可
对 std::string 使用时，unique 比较的是 char，区分大小写；若需忽略大小写，得自己传入二元谓词，例如 [](char a, char b) { return std::tolower(a) == std::tolower(b); }

保持原始顺序的真正去重：别硬套 `unique`

想实现 "abac" → "abc" 这种效果，unique 无能为力。正确做法是遍历 + 查重 + 构建新串。

推荐用 std::unordered_set<char></char> 记录已见字符：

std::string s = "abac";
std::unordered_set<char> seen;
std::string result;
for (char c : s) {
    if (seen.insert(c).second) { // insert 返回 pair<iter, bool>，second 为 true 表示新插入
        result += c;
    }
}
// result == "abc"

注意事项：

不要用 std::set（有序，有额外 log n 开销）；unordered_set 平均 O(1)，更合适
如果字符串含 Unicode（如 UTF-8 多字节字符），char 级去重会出错——此时应改用 std::u8string + 正确编码切分，unique 更是完全失效
性能敏感场景下，预分配 result.reserve(s.size()) 可避免多次内存重分配

误用 `unique` 导致的崩溃或越界

最常踩的坑是忘记 erase，或 erase 范围错误：

只调 std::unique 不 erase：容器长度不变，末尾残留脏数据（如 "hello" 变成 "helo\0o"，但 size() 还是 5）
写成 s.erase(std::unique(...), s.end()) 是对的；写成 s.erase(std::unique(...), s.begin() + s.size()) 看似等价，但若 unique 返回 s.end()，加法可能越界（尤其 debug 模式下迭代器调试检查会报错）
对空字符串调用 unique 是安全的，但若后续代码假设返回迭代器非 end()，就可能出问题

复杂点在于：去重目标到底是“字符”还是“子串”、是否区分大小写、是否要保留顺序、输入是否可信——这些都会让 unique 从“技巧”变成“陷阱”。

C++如何实现一个带LRU淘汰策略的高性能线程安全本地缓存？（组件设计）

C++中的局部类（Local Class）是什么？（有哪些使用限制）

C++怎么实现深拷贝_C++拷贝控制教程【内存】

C++怎么使用future和promise_C++异步结果获取【并发】

C++如何实现带权重优先级的协程任务调度策略？（异步并发控制）

c++速学教程(入门到精通)

c++怎么学习？c++怎么入门？c++在哪学？c++怎么学才快？不用担心，这里为大家提供了c++速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

910

2023.08.02

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

406

2023.09.04

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

678

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

219

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1561

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

645

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

1108

2024.03.22