
本文介绍在 java 中利用 stream api 按指定字段(如城市)对对象列表分组,并高效提取每组第一个元素的多种实现方式,涵盖标准 collectors.groupingby、自定义分组工具方法及注意事项。
本文介绍在 java 中利用 stream api 按指定字段(如城市)对对象列表分组,并高效提取每组第一个元素的多种实现方式,涵盖标准 collectors.groupingby、自定义分组工具方法及注意事项。
在实际开发中,常需从一组对象中“按某属性去重”,但不是简单丢弃重复项(如 distinct() 仅支持全对象或 hashCode/equals),而是保留每个分组中的代表项——例如“每个城市的首位人员”。Java 8+ 的 Stream API 提供了灵活且函数式的方式来实现这一需求,核心思路是:先分组,再取每组首元素。
✅ 推荐方案:使用 Collectors.groupingBy + Collectors.collectingAndThen
最简洁、可读性高且无需额外工具方法的实现如下:
import java.util.*;
import java.util.stream.Collectors;
List<Person> people = Arrays.asList(
new Person("New York", "foo", "bar"),
new Person("New York", "bar", "foo"),
new Person("New Jersey", "foo", "bar"),
new Person("New Jersey", "bar", "foo")
);
// 按 city 分组,取每组第一个 Person
List<Person> uniqueByCity = people.stream()
.collect(Collectors.groupingBy(
Person::getCity, // 分组键:city
LinkedHashMap::new, // 保持插入顺序(可选,但利于测试)
Collectors.collectingAndThen(
Collectors.toList(), // 先收集为 List<Person>
list -> list.get(0) // 再取首元素
)
))
.values() // 获取所有“首元素”组成的 Collection
.stream()
.collect(Collectors.toList()); // 转为 List<Person>
System.out.println(uniqueByCity);
// 输出: [{ city: New York, firstName: foo, lastName: bar },
// { city: New Jersey, firstName: foo, lastName: bar }]? 关键点说明:
- 使用 LinkedHashMap::new 可确保结果顺序与输入中首次出现的 city 顺序一致;若不关心顺序,可省略(默认为 HashMap)。
- collectingAndThen 是组合式收集器,它先执行内部收集(toList()),再对其结果应用函数(list -> list.get(0)),语义清晰、无中间集合开销。
?️ 进阶方案:封装通用分组工具方法
若项目中频繁需要“按某字段分组并取首项”,可封装为静态工具方法,提升复用性与类型安全:
立即学习“Java免费学习笔记(深入)”;
public class StreamUtils {
/**
* 按 keyFn 分组,返回 Map<K, E>,其中每个 K 对应第一个匹配的 E
*/
public static <E, K> Map<K, E> groupToFirst(
Collection<E> collection,
Function<E, K> keyFn) {
return collection.stream()
.collect(Collectors.toMap(
keyFn,
Function.identity(),
(existing, replacement) -> existing, // 遇到重复 key 时保留第一个
LinkedHashMap::new
));
}
}
// 使用示例:
Map<String, Person> firstByCityMap = StreamUtils.groupToFirst(people, Person::getCity);
List<Person> firstByCity = new ArrayList<>(firstByCityMap.values());该方法本质是利用 Collectors.toMap 的合并函数 (e, r) -> e 显式指定“保留已有值”,天然实现“取第一个”的语义,性能优于先 groupingBy(..., toList()) 再取 .get(0)。
⚠️ 注意事项与最佳实践
- 空集合安全:上述所有方案均假设 people 非空。若源列表可能为空,请在调用前校验或使用 Optional.ofNullable(...).orElse(Collections.emptyList()) 包装。
- null 键处理:若 Person::getCity 可能返回 null,toMap 或 groupingBy 将抛出 NullPointerException。建议提前过滤:.filter(p -> p.getCity() != null)。
- 性能对比:toMap 方案时间复杂度为 O(n),空间为 O(k)(k 为唯一 city 数);groupingBy + toList 方案空间为 O(n),因需暂存全部子列表。优先选用 toMap 方案。
- 不可变性考虑:若需返回不可变列表,最后可链式调用 .collect(Collectors.collectingAndThen(Collectors.toList(), Collections::unmodifiableList))。
综上,Collectors.toMap 结合合并策略是最轻量、高效且符合函数式编程思想的解决方案;而 groupingBy + collectingAndThen 则更直观易懂,适合教学或逻辑简单场景。根据团队规范与性能要求合理选择即可。










