
本文详细介绍了如何使用Java Stream API高效处理复杂数据聚合需求,特别是针对多条件分组、数值求和以及计算唯一实体数量的场景。我们将通过`Collectors.groupingBy`结合`Collectors.teeing`(适用于JDK 12+)来解决按月统计总值和唯一人员数量的问题,并提供完整的代码示例和注意事项。
1. 理解问题与数据模型
在实际开发中,我们经常需要对数据进行复杂的统计分析。本教程将解决一个典型场景:给定一系列人员活动记录,我们需要按月份统计两个关键指标:
- 总值 (Total Sum):特定月份内所有相关活动的总数值。
- 唯一人员数量 (Person Count):特定月份内参与活动的唯一人员数量。
1.1 数据结构定义
首先,我们定义核心数据模型。Person类代表一个人员的活动记录,包含ID、事件类型、事件日期和相关数值。Statement枚举定义了不同的事件类型。
import java.math.BigDecimal;
import java.time.LocalDate;
import java.util.HashSet;
import java.util.List;
import java.util.Map;
import java.util.Set;
import java.util.Comparator;
import static java.util.stream.Collectors.*;
// 定义事件类型枚举
enum Statement {
STATUS1, STATUS2, STATUS3, STATUS4
}
// Person记录类 (JDK 14+ Record)
record Person(String id,
Statement event,
LocalDate eventDate,
int value) {}
// 最终结果DTO类
class DTO {
private int month;
private BigDecimal totalSum;
private int totalPersons;
// 构造函数
public DTO(int month, BigDecimal totalSum, int totalPersons) {
this.month = month;
this.totalSum = totalSum;
this.totalPersons = totalPersons;
}
// 默认构造函数(供Collectors.teeing内部使用)
public DTO() {
this.totalSum = BigDecimal.ZERO; // 初始化BigDecimal
}
// Getters and Setters
public int getMonth() { return month; }
public void setMonth(int month) { this.month = month; }
public BigDecimal getTotalSum() { return totalSum; }
public void setTotalSum(BigDecimal totalSum) { this.totalSum = totalSum; }
public int getTotalPersons() { return totalPersons; }
public void setTotalPersons(int totalPersons) { this.totalPersons = totalPersons; }
@Override
public String toString() {
return "DTO{month=" + month + ", totalSum=" + totalSum + ", totalPersons=" + totalPersons + '}';
}
}1.2 示例数据
为了演示,我们使用以下示例数据。请注意,per1在1月份出现了两次,但我们期望在“Person Count”中只计算一次。
立即学习“Java免费学习笔记(深入)”;
ListpersonRecords = List.of( new Person("per1", Statement.STATUS1, LocalDate.of(2022, 1, 10), 1), new Person("per2", Statement.STATUS2, LocalDate.of(2022, 1, 10), 2), new Person("per3", Statement.STATUS3, LocalDate.of(2022,










