0

0

如何在Java中获取List的交集并保留重复项_Apache Commons Collection的Bag结构应用

P粉602998670

P粉602998670

发布时间:2026-03-17 11:52:31

|

887人浏览过

|

来源于php中文网

原创

Java中List交集默认不保留重复项,因retainAll()等基于Set语义只判断存在性;需用HashBag(最小频次)或Map手撸实现频次交集,并明确业务定义。

如何在java中获取list的交集并保留重复项_apache commons collection的bag结构应用

Java里List交集默认不保留重复项,得换思路

Java原生的 retainAll() 或 Stream + filter() 求交集,本质是基于元素存在性判断,重复次数全丢光——比如 [a,a,b][a,b,b] 交集只返回 [a,b],不是你想要的 [a,b](各取最小频次)或 [a,a,b,b](各取最大频次)。这不是bug,是设计使然:Set语义主导了交集逻辑。

Bag模拟带频次的交集:Apache Commons Collections的HashBag

Apache Commons Collections 的 Bag 接口专为计数设计,HashBag 是最常用实现。它把每个元素当“可堆叠物品”,记录出现次数,交集就变成“取两袋中同一物品的较小计数”。

实操建议:

  • 添加依赖:org.apache.commons:commons-collections4:4.4(注意是 v4,v3 不支持泛型且已停更)
  • 把两个 List 分别转成 HashBagnew HashBag(list1)new HashBag(list2)
  • 调用 retainAll() —— 这里行为和 List 不同:它会修改当前 Bag,只保留与参数 Bag 共有的元素,且频次取两者中的较小值
  • 再用 toArrayList() 转回 List,得到带重复的交集结果

示例:list1 = ["a","a","b"]list2 = ["a","b","b"] → 交集 Bag 含 "a":1"b":1 → 转 List 得 ["a","b"](最小频次交集)

立即学习Java免费学习笔记(深入)”;

想保留“最大频次”交集?addAll() 不行,得手写合并逻辑

Bag.addAll() 是并集(频次相加),不是交集;retainAll() 只支持最小频次。要“取各自最大出现次数的交集”,比如 ["a","a"] ∩ ["a","a","a"] → ["a","a","a"],没有现成方法。

必须手动遍历一个 Bag 的唯一元素,对每个元素取 Math.max(bag1.getCount(e), bag2.getCount(e)),再往新 Bag 里 add 对应次数。

皮卡智能
皮卡智能

AI驱动高效视觉设计平台

下载

注意点:

  • 别用 getCount() 前不检查是否存在——对不存在的元素它返回 0,安全
  • 避免在循环里反复调用 uniqueSet(),它每次新建 Set;先存一份引用
  • 如果 List 很大,HashBag 构建本身有哈希开销,比纯 List 遍历略慢

替代方案:不用第三方库,用Map<T, Integer>手撸频次统计

如果项目禁用 Commons Collections,用 HashMap 统计频次完全可行,代码稍长但无额外依赖。

步骤:

  • 写个工具方法,输入 List<T>,输出 Map<T, Integer>(键=元素,值=出现次数)
  • 对两个 Map,取 key 交集(keySet().retainAll()),再对每个 key 计算最小/最大频次
  • 按频次生成结果 List:Collections.nCopies(count, key) + flatMap 或循环 add

兼容性更好,Java 8+ 原生支持;但要注意 null 元素——HashMap 允许一个 null key,而 HashBag 默认不允许,这点容易漏判。

真正麻烦的不是选 Bag 还是 Map,而是业务里“交集”的定义模糊:用户说“保留重复”,没说清是要最小频次、最大频次,还是按顺序匹配。定好规则再动手,比调通代码还关键。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

255

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

1153

2024.03.01

counta和count的区别
counta和count的区别

Count函数用于计算指定范围内数字的个数,而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

203

2023.11.20

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

2010

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

681

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2440

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

49

2026.01.19

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

448

2023.07.18

抖漫入口地址合集
抖漫入口地址合集

本专题整合了抖漫入口地址相关合集,阅读专题下面的文章了解更多详细地址。

12

2026.03.17

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.5万人学习

C# 教程
C# 教程

共94课时 | 11.5万人学习

Java 教程
Java 教程

共578课时 | 83.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号