Java中Stream分组主要用Collectors.groupingBy(),返回Map;支持基础分组、二级分组、自定义逻辑(含空值处理)及聚合统计(如counting、averagingDouble),需注意keyMapper类型、null安全与下游收集器选择。

Java中Stream的分组功能主要通过 Collectors.groupingBy() 实现,它能把流中的元素按指定规则分类,返回一个 Map,键是分组依据,值是该组内所有元素的集合。
基础分组:按字段或简单条件分组
最常见的是按对象的某个属性分组。比如有一个 List
Map> byAge = people.stream() .collect(Collectors.groupingBy(Person::getAge));
这时 Map 的 key 是 Integer(年龄),value 是对应年龄的所有 Person 对象组成的 List。
- 如果属性值为 null,会抛出 NullPointerException,可先用 Objects::nonNull 过滤或用 groupingBy(keyMapper, HashMap::new, …) 自定义 map 类型
- keyMapper 函数必须返回可比较、可哈希的类型,否则可能出错或分组异常
二级分组:嵌套 groupingBy 实现多级分类
需要按多个维度分组时,可以把另一个 groupingBy 作为下游收集器:
立即学习“Java免费学习笔记(深入)”;
Map>> byAgeAndCity = people.stream() .collect(Collectors.groupingBy( Person::getAge, Collectors.groupingBy(Person::getCity) ));
结果是 Map>>,适合做交叉统计或层级报表。
- 下游收集器不限于 groupingBy,也可以是 counting()、summingInt() 等,实现聚合统计
- 注意嵌套过深会影响可读性,必要时可封装成独立方法
自定义分组逻辑与空值处理
当分组逻辑较复杂(如按年龄段分组:0-18、19-35、36+),或源数据含 null 字段时,推荐用 lambda 显式定义 key:
Map> byAgeRange = people.stream() .collect(Collectors.groupingBy(p -> { int age = p.getAge() == null ? -1 : p.getAge(); if (age < 0) return "未知"; else if (age <= 18) return "未成年"; else if (age <= 35) return "青年"; else return "成年"; }));
这样既避免空指针,又灵活支持业务语义分组。
- 可配合 Collectors.toMap() 或 Collectors.collectingAndThen 做后处理(如排序、去重)
- 若需保持插入顺序,用 LinkedHashMap::new 作为 map 工厂参数
分组后聚合统计(不存全量数据)
有时只需统计数量、平均值等,不必保留原始列表,节省内存:
// 按部门统计人数 MapcountByDept = employees.stream() .collect(Collectors.groupingBy(Employee::getDept, Collectors.counting())); // 按状态统计平均薪资 Map avgSalaryByStatus = employees.stream() .collect(Collectors.groupingBy( Employee::getStatus, Collectors.averagingDouble(Employee::getSalary) ));
这类组合使用让 Stream 分组兼具灵活性和性能优势。
- counting() 返回 Long,summingInt/Double/Long 返回对应数值类型
- 若某组无数据,对应 key 仍存在,value 为 0 或 0.0(取决于聚合器)
基本上就这些。Stream 分组不复杂但容易忽略细节,关键是选对 keyMapper 和下游收集器,再结合业务场景做空值和异常处理。









