用std::unordered_set判断重复最高效,平均O(1)插入,内置类型无需额外配置;std::set次之,O(log n);排序扫描O(n log n)但省空间;避免O(n²)的count或嵌套循环。

用 std::set 判断数组是否有重复元素最简单
直接把所有元素插入 std::set,利用其自动去重特性:插入时如果元素已存在,insert() 返回的 pair 为 false,遇到第一个 false 就能立刻返回 true(表示有重复)。
注意别用 std::set::size() 对比原数组长度——这要等全部插入完,浪费时间且无法提前退出。
bool hasDuplicate(const std::vector& arr) { std::set seen; for (int x : arr) { if (!seen.insert(x).second) { return true; // 插入失败,说明已存在 } } return false; }
想更快?改用 std::unordered_set
std::set 是红黑树,单次插入平均 O(log n);std::unordered_set 是哈希表,平均 O(1),整体更优,尤其数据量大时。
但要注意:自定义类型作 key 时,必须提供 hash 和 operator==;内置类型(如 int、std::string)可直接用。
立即学习“C++免费学习笔记(深入)”;
- 空间换时间:哈希表可能有额外内存开销和哈希冲突
- 不保证顺序,但查重不需要顺序
- 最坏情况(大量哈希冲突)退化成
O(n)插入,但实践中极少发生
原地排序后扫描也能做,但会破坏原始顺序
对数组排序后,相邻相等即说明重复。时间复杂度 O(n log n),空间 O(1)(若允许修改原数组)。
适用场景有限:
- 输入是可修改的
std::vector,且后续不再需要原始顺序 - 内存极度受限,连
unordered_set的哈希桶都扛不住 - 编译环境不支持 C++11(
unordered_set是 C++11 引入)
示例:
std::vectorarr = {/* ... */}; std::sort(arr.begin(), arr.end()); for (size_t i = 1; i < arr.size(); ++i) { if (arr[i] == arr[i-1]) return true; }
用 std::count 或遍历嵌套循环?别这么干
std::count 对每个元素都扫一遍数组,复杂度 O(n²);两层 for 也一样。小数组(
常见误写:
// ❌ 错!每次调用 count 都从头扫
for (int x : arr) {
if (std::count(arr.begin(), arr.end(), x) > 1) return true;
}真正要避免的是「没意识到代价」——不是语法错,是算法选择错。
哈希查重的逻辑看似简单,但容易忽略插入返回值的语义,或盲目选 set 而不用 unordered_set;排序法看似省空间,却常被遗忘“是否允许改原数组”这个前提。










