Java原生List计算对称差集需先复制再组合removeAll和addAll;推荐用Apache Commons Collections4的CollectionUtils.disjunction(),它返回新集合、不修改原List,但依赖正确实现的equals()且不支持泛型推断。

Java原生List怎么算对称差集(A⊕B)
对称差集 = 属于A或B但不同时属于两者的元素,即 (A - B) ∪ (B - A)。Java标准库没直接提供这个操作,得自己组合 removeAll 和 addAll,但必须注意顺序和副作用。
- 别直接在原始List上做
removeAll—— 它会修改原集合,后续再用就错了 - 推荐先复制:用
new ArrayList(listA)和new ArrayList(listB)起手 - 计算步骤是:①
listA_copy.removeAll(listB);②listB_copy.removeAll(listA);③listA_copy.addAll(listB_copy) - 如果List含null或自定义对象,确保
equals()和hashCode()正确实现,否则removeAll会漏匹配
Apache Commons Collections的CollectionUtils.disjunction()真能省事?
能,但有隐含前提:它底层调用的是 CollectionUtils.retainAll() 和 CollectionUtils.removeAll() 的组合逻辑,仍依赖 equals(),且返回的是新集合(不改原List)。
- 必须引入
commons-collections4(不是老版commons-collections),Maven坐标是org.apache.commons:commons-collections4:4.4 - 用法简单:
CollectionUtils.disjunction(listA, listB),返回Collection类型,通常要显式转成ArrayList - 性能上比手写略低——它内部做了两次遍历+构造新集合,大数据量时不如预分配容量的手写版本
- 不支持泛型推断(Java 8),得写
CollectionUtils.<string>disjunction(listA, listB)</string>或接收为Collection>再转型
交集、并集、补集这些也顺手一起算?
原生和Commons都有对应方法,但命名和行为细节容易混淆:
- 交集:
CollectionUtils.intersection(A, B)或手写new ArrayList(A); retainAll(B) - 并集:
CollectionUtils.union(A, B)(去重) vs 原生new ArrayList(A); addAll(B)(不去重)——注意语义差异 - 补集(A - B):
CollectionUtils.subtract(A, B),等价于new ArrayList(A); removeAll(B) - 所有操作都要求元素可比较;若List含重复元素,
subtract和disjunction会按出现次数“抵消”,比如 A=[1,1,2]、B=[1,3] →subtract(A,B)结果是 [1,2],不是 [2]
为什么用Stream API写对称差集反而容易出错
有人想用 stream().filter() + !other.contains() 实现,但实际踩坑不少:
立即学习“Java免费学习笔记(深入)”;
-
contains()在ArrayList里是O(n)复杂度,嵌套两层stream会变成O(n²),10k元素就明显卡顿 - 写成
A.stream().filter(x -> !B.contains(x)).collect(...) ∪ B.stream().filter(x -> !A.contains(x)).collect(...)时,两次contains都走线性扫描,没复用 - 若想优化,得先转
HashSet:Set<t> setB = new HashSet(B)</t>,再用setB.contains(x)—— 但这手动管理Set,代码反而比CollectionUtils.disjunction()更长 - Stream结果默认是无序的,而原List顺序可能重要;若需保序,得用
LinkedHashSet中转,又多一层转换成本
真正需要保序+高性能+去重的场景,老实用 HashSet 手写更可控,但日常开发里,Commons那几个工具方法已经够用——只要记得它不处理null安全,也不做深比较。










