set求交集在多数场景下最快,时间复杂度约o(n+m),但会丢失顺序与重复信息;双指针适合已排序数组,保序且可控重复,空间复杂度o(1)。

用 set() 求交集快不快?看场景
绝大多数情况下,set(nums1) & set(nums2) 是最简、最快的选择——前提是不关心顺序、不保留重复元素、且数组不是超大(比如上亿元素)。
Python 的 set 底层是哈希表,求交集时间复杂度接近 O(min(len(nums1), len(nums2))),但建集合本身要遍历一次数组,总开销约 O(n + m)。内存会多占一份去重后的副本。
常见错误现象:list(set(nums1) & set(nums2)) 返回结果顺序不定;如果原数组有重复值(如 [1,1,2] 和 [1,2,2]),交集只留一个 1 和一个 2,丢失频次信息。
- 需要去重 + 无视顺序 → 直接用
set最省事 - 输入已排序,且想保持升序输出 →
set会打乱顺序,不如双指针 - 内存敏感(如嵌入式或流式处理)→
set额外占内存,慎用
双指针法适合什么情况?
当两个数组都已排序,且你要求结果也有序、或需保留重复逻辑(比如“每个元素在交集中出现次数 = 两数组中该元素最小出现次数”),双指针是更精准的解法。
立即学习“Python免费学习笔记(深入)”;
它不依赖哈希,空间复杂度仅 O(1)(不算输出列表),遍历过程天然保序,还能灵活控制重复行为。
典型使用场景:LeetCode 350 “两个数组的交集 II”,要求返回带重复的交集;或者你在处理数据库分页结果、时间序列对齐等已排好序的数据流。
- 两数组必须事先升序排列,否则指针移动会漏匹配
- 边界判断容易错:任一指针越界就得停,别写成
while i 后还继续访问 <code>nums1[i] - 重复处理逻辑要明确:遇到相等时 append 后,两个指针都进一;不等时只动小数那边的指针
set.intersection() 和 & 有区别吗?
没实质区别。set1 & set2 是运算符语法糖,底层调用的就是 set1.intersection(set2)。但注意:后者支持多个参数,比如 set1.intersection(set2, set3, set4),而 & 只能两两连用(set1 & set2 & set3 也行,但本质还是左结合)。
性能上几乎无差异,Cython 层都走同一套逻辑。不过 intersection() 支持传入任意可迭代对象(比如 set1.intersection([1,2,3])),而 & 要求右边也得是 set 类型,否则报 TypeError: unsupported operand type(s)。
- 想一行写多个集合交集 → 用
.intersection()更直白 - 右边可能是 list/tuple 且不想显式转 set → 只能用
.intersection() - 做类型检查或 lint 报警时,有些工具对运算符重载提示较弱,用方法名更易追踪
实际选哪个?关键看这三点
别纠结“哪个更高级”,就盯住输入特征和输出需求:
- 输入是否已排序?是 → 优先双指针;否 →
set省心 - 是否要保留重复?是 → 双指针可精确控频次;
set天然去重,绕不开 - 内存 or 速度优先?大数据量且内存紧 → 双指针;中小数据且写快为主 →
set
最容易被忽略的是:很多人直接对未排序数组硬套双指针,结果逻辑全错;或者在需要频次的题里盲目用 set,提交后发现用例过不了。顺序和重复性这两个约束,比“哪个快”重要得多。









