0

0

Java Stream API实战:实现多条件过滤、按日期月份分组及聚合计数

心靈之曲

心靈之曲

发布时间:2025-10-13 12:30:00

|

341人浏览过

|

来源于php中文网

原创

Java Stream API实战:实现多条件过滤、按日期月份分组及聚合计数

本文详细介绍了如何利用java stream api高效处理复杂数据。通过一个具体案例,演示了如何结合多条件过滤、自定义分组键(按日期月份和事件类型)、以及使用`collectors.counting()`进行聚合计数,最终将处理结果转换为结构化的dto列表,帮助开发者掌握java 8+流式编程的高级技巧。

在现代Java应用开发中,数据处理是核心任务之一。Java 8引入的Stream API极大地简化了集合数据的操作,使其更具可读性和表达力。本文将深入探讨如何利用Stream API实现复杂的数据转换需求,包括多条件过滤、按日期字段(月份)分组,并对分组结果进行聚合计数。我们将通过一个具体的场景来演示这些高级特性。

场景描述与数据模型

假设我们有一个包含人员事件信息的列表。每个Person对象记录了一个事件(如JOIN入职或EXIT离职)及其发生的日期。我们的目标是统计每个月不同事件类型(JOIN或EXIT)的总人数。

首先,我们定义相关的数据模型:

  1. Person 类:表示一个人员事件。

    立即学习Java免费学习笔记(深入)”;

    import java.time.LocalDate;
    
    public class Person {
        private String id;
        private String name;
        private String surname;
        private State event; // JOIN, EXIT
        private Object value; // 示例中未用到,可忽略
        private LocalDate eventDate;
    
        public Person(String id, String name, String surname, State event, LocalDate eventDate) {
            this.id = id;
            this.name = name;
            this.surname = surname;
            this.event = event;
            this.eventDate = eventDate;
        }
    
        public String getId() { return id; }
        public State getEvent() { return event; }
        public LocalDate getEventDate() { return eventDate; }
    
        // 假设 State 是一个枚举类型
        public enum State {
            JOIN, EXIT, OTHER
        }
    
        @Override
        public String toString() {
            return "Person{" +
                   "id='" + id + '\'' +
                   ", event=" + event +
                   ", eventDate=" + eventDate +
                   '}';
        }
    }
  2. DTO 类:表示最终的统计结果。

    public class DTO {
        private int month;
        private Person.State info;
        private int totalEmployees;
    
        public DTO(int month, Person.State info, int totalEmployees) {
            this.month = month;
            this.info = info;
            this.totalEmployees = totalEmployees;
        }
    
        public int getMonth() { return month; }
        public Person.State getInfo() { return info; }
        public int getTotalEmployees() { return totalEmployees; }
    
        @Override
        public String toString() {
            return "DTO{" +
                   "Month=" + month +
                   ", Info=" + info +
                   ", Total Number=" + totalEmployees +
                   '}';
        }
    }

核心挑战:自定义分组键

为了实现按月份和事件类型同时分组,我们需要一个复合键。Java 16及更高版本推荐使用record类型来简洁地定义这样的数据载体;对于早期版本,可以使用一个普通的class。

// Java 16+ 的 record
public record MonthState(int month, Person.State info) {}

// Java 8-15 的 class 等效实现
/*
public class MonthState {
    private final int month;
    private final Person.State info;

    public MonthState(int month, Person.State info) {
        this.month = month;
        this.info = info;
    }

    public int getMonth() { return month; }
    public Person.State getInfo() { return info; }

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        MonthState that = (MonthState) o;
        return month == that.month && info == that.info;
    }

    @Override
    public int hashCode() {
        return Objects.hash(month, info);
    }
}
*/

注意:如果使用class,必须正确实现equals()和hashCode()方法,以确保Map能够正确地将具有相同月份和事件状态的对象视为相同的键。record类型会自动生成这些方法。

Stream API 解决方案详解

我们将从一个Map>类型的数据源开始,其中键是pId,值是该pId对应的Person对象列表。

import java.util.*;
import java.util.stream.Collectors;
import java.time.LocalDate;

public class StreamGroupingExample {

    public static void main(String[] args) {
        // 示例数据初始化
        Map> personListById = new HashMap<>();
        personListById.put("per1", Arrays.asList(
            new Person("per1", "John", "Doe", Person.State.JOIN, LocalDate.of(2022, 1, 10))
        ));
        personListById.put("per2", Arrays.asList(
            new Person("per2", "Jane", "Smith", Person.State.JOIN, LocalDate.of(2022, 1, 10))
        ));
        personListById.put("per3", Arrays.asList(
            new Person("per3", "Bob", "Johnson", Person.State.EXIT, LocalDate.of(2022, 1, 10)),
            new Person("per3", "Bob", "Johnson", Person.State.EXIT, LocalDate.of(2022, 2, 10))
        ));
        personListById.put("per4", Arrays.asList(
            new Person("per4", "Alice", "Williams", Person.State.JOIN, LocalDate.of(2022, 3, 10))
        ));
        personListById.put("per5", Arrays.asList( // 包含其他事件类型的示例
            new Person("per5", "Charlie", "Brown", Person.State.OTHER, LocalDate.of(2022, 1, 15))
        ));

        // Stream 管道处理
        List result = personListById.values().stream()
            // 1. 扁平化处理:将Map中所有List合并成一个Person流
            .flatMap(List::stream)
            // 2. 多条件过滤:只保留JOIN或EXIT事件类型的Person对象
            .filter(per -> per.getEvent() == Person.State.EXIT || per.getEvent() == Person.State.JOIN)
            // 3. 核心分组与计数:
            //    - 使用MonthState作为分组键,结合月份和事件类型
            //    - 使用Collectors.counting()作为下游收集器,计算每个分组中的元素数量
            .collect(Collectors.groupingBy(
                p -> new MonthState(p.getEventDate().getMonthValue(), p.getEvent()),
                Collectors.counting() // 统计每个分组的元素数量
            ))
            // 4. 将Map的entrySet转换为Stream>
            .entrySet().stream()
            // 5. 映射为DTO对象:将Map.Entry转换为我们期望的DTO格式
            .map(entry -> new DTO(entry.getKey().month(), entry.getKey().info(), entry.getValue().intValue()))
            // 6. 排序:按月份升序排列
            .sorted(Comparator.comparing(DTO::getMonth))
            // 7. 收集结果:将Stream收集为List
            .toList(); // Java 16+,等同于 .collect(Collectors.toList())

        // 打印结果
        result.forEach(System.out::println);
        /* 预期输出:
        DTO{Month=1, Info=JOIN, Total Number=2}
        DTO{Month=1, Info=EXIT, Total Number=1}
        DTO{Month=2, Info=EXIT, Total Number=1}
        DTO{Month=3, Info=JOIN, Total Number=1}
        */
    }
}

Stream 管道分解:

  1. personListById.values().stream():

    Talefy
    Talefy

    一个AI故事创作和角色扮演平台

    下载
    • 首先,我们从Map中获取所有List的集合,并将其转换为一个Stream>。
  2. .flatMap(List::stream):

    • flatMap操作用于将Stream>扁平化为一个Stream。这意味着所有嵌套在列表中的Person对象都被提取出来,形成一个单一的流,以便后续处理。
  3. .filter(per -> per.getEvent() == Person.State.EXIT || per.getEvent() == Person.State.JOIN):

    • 这一步执行多条件过滤。我们只关心事件类型为JOIN或EXIT的Person对象,排除了其他不相关的事件。
  4. .collect(Collectors.groupingBy(p -> new MonthState(p.getEventDate().getMonthValue(), p.getEvent()), Collectors.counting())):

    • 这是整个管道的核心。Collectors.groupingBy()是一个强大的收集器,它将流中的元素根据提供的分类函数进行分组。
      • 分类函数 (p -> new MonthState(...)): 为每个Person对象创建一个MonthState实例作为分组键。这个键包含了事件发生的月份 (p.getEventDate().getMonthValue()) 和事件类型 (p.getEvent())。
      • 下游收集器 (Collectors.counting()): 对于每个分组,Collectors.counting()会计算该分组中元素的数量,其结果类型为Long。
    • 这一步结束后,我们得到一个Map,其中键是月份和事件类型的组合,值是对应的计数。
  5. .entrySet().stream():

    • 为了将Map转换成我们最终的DTO列表,我们需要遍历Map的键值对。entrySet().stream()将Map的条目集转换为一个Stream>。
  6. .map(entry -> new DTO(entry.getKey().month(), entry.getKey().info(), entry.getValue().intValue())):

    • map操作将每个Map.Entry对象转换为一个DTO对象。
      • entry.getKey().month() 和 entry.getKey().info() 用于获取MonthState中的月份和事件类型。
      • entry.getValue().intValue() 将计数(Long类型)转换为int类型以适应DTO。
  7. .sorted(Comparator.comparing(DTO::getMonth)):

    • 对最终的DTO流进行排序,按照月份的升序排列,使输出结果更具可读性。
  8. .toList():

    • 将处理并排序后的DTO流收集到一个List中,作为最终结果。

关键点与注意事项

  • 自定义分组键的重要性:当需要根据多个属性进行分组时,创建一个包含这些属性的自定义对象(如MonthState)作为分组键是最佳实践。对于Java 16+,record提供了极简的实现方式。
  • flatMap的使用场景:当处理包含嵌套集合的集合时,flatMap是不可或缺的,它能将多层结构扁平化为单一流,方便后续操作。
  • Collectors.groupingBy的灵活性:groupingBy可以接受一个下游收集器,这使得它能够执行各种聚合操作,如counting()、summingInt()、averagingDouble()等。
  • 类型转换:在将Long类型的计数转换为int时,需要注意潜在的溢出问题,尽管在大多数计数场景中不太可能发生。
  • 日期处理:LocalDate提供了方便的方法来获取日期的各个部分,如getMonthValue()获取月份。

总结

通过本文的详细讲解和示例,我们展示了如何利用Java Stream API的强大功能,结合多条件过滤、自定义分组键以及Collectors.groupingBy和counting()等高级特性,高效地处理复杂的数据聚合需求。掌握这些技巧将使您在日常开发中能够编写出更简洁、更具表达力且性能优越的数据处理代码。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

837

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

741

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

736

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

399

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

446

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

430

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16926

2023.08.03

微信聊天记录删除恢复导出教程汇总
微信聊天记录删除恢复导出教程汇总

本专题整合了微信聊天记录相关教程大全,阅读专题下面的文章了解更多详细内容。

36

2026.01.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.7万人学习

C# 教程
C# 教程

共94课时 | 7万人学习

Java 教程
Java 教程

共578课时 | 47.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号