最简洁的频率统计方案是用Collectors.groupingBy+Collectors.counting一行生成Map<String, Long>,但需确保元素重写equals/hashCode,注意返回Long类型、空列表处理、最高频元素遍历取值更可控,避免低效操作和未定义相等语义。

用 Collectors.groupingBy + Collectors.counting 一行搞定频率统计
Java 8+ 最简洁的方案不是手写循环,而是靠 Stream 配合两个收集器组合。它自动把每个元素当 key,出现次数当 value,生成 Map<t long></t>。
- 必须确保元素类型重写了
equals和hashCode,否则相同逻辑值可能被当成不同 key(比如自定义对象没重写就全算 distinct) -
Collectors.counting()返回的是Long,不是Integer,后续取最大值时别用int强转,容易溢出或抛ClassCastException - 空
List会返回空Map,不抛异常,但后续找最大值前得判空
Map<String, Long> freq = list.stream()
.collect(Collectors.groupingBy(Function.identity(), Collectors.counting()));
找频率最高的元素:Map.Entry 遍历比 maxBy 更稳
很多人直接链式调 .maxBy(Map.Entry.comparingByValue()),但要注意:如果多个元素并列最高频,它只返回其中一个(按迭代顺序),且返回的是 Optional,不判空会 NullPointerException。
- 更可控的做法是手动遍历
entrySet(),记录当前最大频次和对应元素;遇到相等频次可选择跳过、覆盖或收集全部(视业务而定) - 不要用
keySet()再对每个 key 调get()查频次——重复查哈希表,O(n²) 时间 - 如果 List 很大(>10⁵),避免在循环里反复装箱/拆箱
Long,可先用long maxCount = 0存基准值
TreeMap 或 LinkedHashMap 不适合直接替代 HashMap 做频率统计
有人想靠 TreeMap 自动排序来省掉找最大值步骤,或者用 LinkedHashMap 记住插入顺序——这反而引入额外开销,且解决不了核心问题。
-
TreeMap插入是 O(log n),总统计时间从 O(n) 变成 O(n log n),纯属浪费 -
LinkedHashMap插入顺序 ≠ 频次高低顺序,不能靠它“第一个就是最高频” - 真要排序,应该在统计完再对
entrySet()调sorted(),而不是换 Map 实现类
原始类型数组或 int/long 场景别硬套 Stream<Integer>
如果处理的是 int[],转成 List<Integer> 再流式处理,会产生大量包装对象,GC 压力明显。这时候传统 for 循环 + HashMap<Integer, Integer> 更实际。
立即学习“Java免费学习笔记(深入)”;
-
IntStream.of(arr).boxed().collect(...)看似一行,但 boxing 成本高,尤其数组大时 - 对于已知范围的整数(如 0~1000),用
int[] count = new int[1001]数组计数,O(1) 查、O(n) 总耗时,快一个数量级 -
Stream的优势在逻辑表达清晰,不在所有场景都性能最优
entrySet() 时怎么写比较条件——别等上线后才发现“最高频”结果每次都不一样。









