std::set_intersection 返回空结果最常见的原因是两输入范围未排序;必须确保两容器均升序排列(或使用相同自定义比较器),vector/array 需显式 sort,set/map 可直接用;存入 vector 应用 std::back_inserter;自定义类型需提供 operator< 或传比较器。

std::set_intersection 为什么返回空结果
最常见的原因是两个输入范围没排好序——std::set_intersection 要求两段迭代器区间都必须是升序(默认 std::less),哪怕你用的是 std::set,传给它的是 begin()/end(),也没问题;但如果你从 std::vector 或数组里取数据,忘了 std::sort,结果一定是错的,而且不报错、不抛异常,只是默默输出空序列。
- 检查是否对两个容器都调用了
std::sort(或确保它们天然有序) -
std::set和std::map的键天然有序,可直接传迭代器;std::vector、std::array必须先排序 - 注意:升序是默认行为,如果用了自定义比较函数(比如
std::greater),两个范围必须用**同一个**比较器,且保持一致顺序
怎么把交集存进 vector 而不是手写循环
别用 push_back 一边遍历一边插——效率低还容易错。标准做法是用 std::back_inserter 配合 std::vector,让算法自动在尾部追加:
std::vector<int> a = {1, 2, 3, 4, 5};
std::vector<int> b = {3, 4, 5, 6, 7};
std::vector<int> result;
std::sort(a.begin(), a.end());
std::sort(b.begin(), b.end());
std::set_intersection(a.begin(), a.end(),
b.begin(), b.end(),
std::back_inserter(result));
-
result初始为空,std::back_inserter会调用push_back,但这是封装好的、符合算法要求的写法 - 不能直接传
result.begin()——那会覆盖原内存,而result是空的,导致越界或未定义行为 - 如果已知交集大小上限,可以先
reserve提前分配空间,避免多次重分配
自定义类型用 set_intersection 报错:no match for ‘operator<’
编译失败通常是因为你的结构体或类没定义 operator<,或者定义了但签名不对(比如没加 const)。std::set_intersection 内部要比较元素,必须能用小于运算符排序。
- 最简方案:在类内加
bool operator<(const MyType& rhs) const { return key < rhs.key; } - 如果不想改类定义,可用 lambda + 第五个参数传比较器,但注意 lambda 不能有捕获(否则无法作为模板实参),所以得写成函数对象或静态 lambda(C++20 起支持)
- 用
std::set存自定义类型时也一样依赖operator<,这里和容器要求完全一致,不是算法特例
性能陷阱:反复调用 set_intersection 做增量交集
如果你在循环里对同一组大容器反复求交(比如“当前结果 ∩ 新集合”),每次都从头跑一遍 std::set_intersection,时间复杂度是 O(n+m),但实际可能远高于必要——尤其当交集结果越来越小,却还在扫描整个右容器。
立即学习“C++免费学习笔记(深入)”;
- 更优思路是把“当前结果”维护成
std::set,然后用std::set::find或std::set::count单次判断,或直接用std::set_intersection时把左操作数换成这个std::set(它本身有序) - 注意:
std::vector排序后虽然也能用,但插入/删除成本高;频繁增删交集成员,std::set或std::unordered_set更合适 - 如果数据量不大(
真正容易被忽略的是:算法本身不管理内存,也不验证输入有效性。传错迭代器范围(比如 end 在 begin 前)、用未初始化的指针、混用不同排序规则,都会导致未定义行为——它不会提醒你,只会给你一个看似合理但错误的结果。










