手动用map计数最通用可控,推荐map.merge()或stream.collect(),guava的multiset语义最匹配;注意null、线程安全、类型转换及性能陷阱。

用 Map 手动计数是最通用且可控的方式
Java 没有内置的“一键统计集合频次”方法,Collections 工具类也不提供。最稳妥的做法是遍历集合,用 HashMap 累计每个元素的出现次数。这种方式兼容所有元素类型(只要 equals() 和 hashCode() 正确),也便于后续做条件过滤或排序。
常见错误是直接用 ArrayList::indexOf 或嵌套循环暴力统计,时间复杂度升到 O(n²),尤其在千级以上数据时明显卡顿。
- 键类型必须与集合元素类型一致(如
String、Integer,或自定义类——需确保重写了equals()和hashCode()) - 推荐使用
Map.merge()简化逻辑,避免显式判空:Map<String, Integer> countMap = new HashMap<>(); list.forEach(s -> countMap.merge(s, 1, Integer::sum));
- 若集合含
null元素,HashMap允许一个null键,但ConcurrentHashMap不允许——多线程场景下需提前处理或换用compute()
Java 8+ 用 Stream.collect() 一行解决但要注意陷阱
借助 Collectors.groupingBy() 和 Collectors.counting() 可以写出简洁代码,但默认返回的是 Long 计数值,不是 Integer;且底层仍构造新 HashMap,对超大集合内存压力不比手动方式小。
典型误用是把 stream().collect() 套在频繁调用的热点路径里,每次新建中间对象,GC 压力陡增。
立即学习“Java免费学习笔记(深入)”;
- 基础写法:
Map<String, Long> counts = list.stream() .collect(Collectors.groupingBy(Function.identity(), Collectors.counting())); - 想得到
Integer类型计数,改用summingInt:.collect(Collectors.groupingBy(Function.identity(), Collectors.summingInt(e -> 1)))
- 如果集合本身是
LinkedList或未实现RandomAccess,流式遍历性能可能略低于传统 for-each(JVM 优化已大幅缩小差距,但极端场景仍需实测)
guava 的 Multiset 是语义最匹配的工具
如果你项目已引入 guava,Multiset 是专为“可重复元素集合”设计的接口,HashMultiset 内部就是带计数的 HashMap,调用 count(Object) 直接查频次,语义清晰、API 直观。
注意它不是 Collection 子接口,不能直接当 List/Set 用;插入重复元素不会报错,但也不会自动去重——这点和初学者直觉可能相反。
- 初始化并添加:
Multiset<String> multiset = HashMultiset.create(list);
- 查某个元素出现次数:
multiset.count("apple"),不存在则返回0 - 获取全部元素及频次:
multiset.entrySet()返回Multiset.Entry<t></t>集合,其中getElement()和分别取值和数量</li> </ul> <H3>不要用 <code>Collections.frequency()
统计整个集合Collections.frequency(Collection, Object)只适合查“某一个特定元素”的出现次数。如果硬要靠它遍历去统计全部元素,会反复全量扫描集合,时间复杂度是O(n²),数据量稍大就明显变慢。比如对含 10,000 个字符串的
ArrayList统计全部频次,用frequency()循环调用可能耗时百毫秒以上;而一次遍历的Map方式通常在 1–2 毫秒内完成。- 仅适用于单次查询:
Collections.frequency(list, "target") - 它内部就是个简单 for 循环,没有缓存、无并发安全,也不支持自定义比较逻辑
- 对
LinkedList调用该方法更慢——因为get(i)是O(n),而frequency()内部用的是Iterator,其实影响不大;真正伤性能的是外部反复调用它
Collections.frequency(),只在调试或临时脚本里查一两个值时用。 - 仅适用于单次查询:










