0

0

Java Stream实战:高效处理对象列表去重,保留最新记录

碧海醫心

碧海醫心

发布时间:2025-08-05 13:40:12

|

625人浏览过

|

来源于php中文网

原创

Java Stream实战:高效处理对象列表去重,保留最新记录

本文详细介绍了如何利用Java Stream API高效处理包含重复ID的对象列表,并根据日期字段保留最新的记录。核心方法是运用Collectors.toMap的三参数重载,结合Function.identity()和BinaryOperator.maxBy(Comparator.comparing())作为合并函数,实现按ID去重并筛选出具有最新日期的对象,最终得到一个去重后的唯一对象列表。

核心问题:列表对象去重与筛选

在数据处理中,我们经常会遇到需要从列表中移除重复对象的情况。一个常见的场景是,列表中存在多个具有相同唯一标识(如id)的对象,但我们只希望保留其中一个,并且这个保留的对象需要满足特定的条件,例如拥有最新的时间戳。传统的方法可能涉及循环遍历和手动比较,但在java 8及更高版本中,通过stream api可以以更简洁、高效的方式实现这一目标。

假设我们有一个Student对象列表,每个Student对象包含一个id和startDatetime字段。我们的目标是:如果存在多个Student对象具有相同的id,则只保留startDatetime最新的那个对象。

首先,定义我们的Student类:

import java.time.LocalDateTime;
import java.util.Objects; // 导入Objects类用于hashCode和equals

class Student {
    private String id;
    private LocalDateTime startDatetime;

    public String getId() {
        return id;
    }

    public void setId(String id) {
        this.id = id;
    }

    public LocalDateTime getStartDatetime() {
        return startDatetime;
    }

    public void setStartDatetime(LocalDateTime startDatetime) {
        this.startDatetime = startDatetime;
    }

    public Student(String id, LocalDateTime startDatetime) {
        this.id = id;
        this.startDatetime = startDatetime;
    }

    @Override
    public String toString() {
        return "Student{id='" + id + "', startDatetime=" + startDatetime + "}";
    }

    // 建议重写equals和hashCode,尽管在此特定Stream操作中非必需,但良好的实践
    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        Student student = (Student) o;
        return Objects.equals(id, student.id) && Objects.equals(startDatetime, student.startDatetime);
    }

    @Override
    public int hashCode() {
        return Objects.hash(id, startDatetime);
    }
}

Java Stream解决方案:Collectors.toMap的应用

解决此问题的关键在于利用Collectors.toMap()的强大功能,特别是其三参数重载版本。这个版本允许我们定义如何处理键冲突(即当两个或多个元素映射到同一个键时)。

Collectors.toMap(keyMapper, valueMapper, mergeFunction)的三个参数分别是:

立即学习Java免费学习笔记(深入)”;

  1. keyMapper: 一个函数,用于从流中的每个元素提取作为Map键的值。
  2. valueMapper: 一个函数,用于从流中的每个元素提取作为Map值的值。
  3. mergeFunction: 一个BinaryOperator,用于在发生键冲突时,决定如何合并两个冲突的值。

1. keyMapper:定义唯一键

在这个场景中,我们希望根据Student的id进行去重。因此,keyMapper将是Student::getId,它从每个Student对象中提取id作为Map的键。

2. valueMapper:保留原始对象

我们希望Map的值仍然是完整的Student对象。因此,valueMapper将是Function.identity(),它返回流中的元素本身。

3. mergeFunction:解决冲突,保留最新记录

这是实现去重并保留最新记录的核心。当两个Student对象具有相同的id时,mergeFunction会被调用。我们需要在这个函数中比较这两个Student对象的startDatetime,并返回日期最新的那个。

Videoleap
Videoleap

Videoleap是一个一体化的视频编辑平台

下载

我们可以使用BinaryOperator.maxBy()结合Comparator.comparing()来构建这个合并函数。BinaryOperator.maxBy(Comparator)会返回一个BinaryOperator,它在两个输入之间选择“更大”的那个,这里的“更大”由提供的Comparator定义。

对于我们的需求,Comparator将基于Student::getStartDatetime进行比较: Comparator.comparing(Student::getStartDatetime)

因此,完整的mergeFunction将是: BinaryOperator.maxBy(Comparator.comparing(Student::getStartDatetime))

当发生键冲突时,此函数会比较两个具有相同id的Student对象,并选择startDatetime更大的(即更新的)那个作为Map中该id对应的值。

示例代码

以下是完整的示例代码,演示了如何使用Java Stream实现上述逻辑:

import java.time.LocalDateTime;
import java.util.ArrayList;
import java.util.Comparator;
import java.util.List;
import java.util.function.Function;
import java.util.function.BinaryOperator;
import java.util.stream.Collectors;

public class StudentProcessor {

    public static void main(String[] args) {
        // 示例数据
        List students = new ArrayList<>() {{
            add(new Student("1", LocalDateTime.now())); // 最新时间
            add(new Student("1", LocalDateTime.of(2000, 2, 1, 1, 1))); // 较旧时间
            add(new Student("1", LocalDateTime.of(1990, 2, 1, 1, 1))); // 最旧时间
            add(new Student("2", LocalDateTime.of(1990, 2, 1, 1, 1))); // 唯一ID
            add(new Student("3", LocalDateTime.of(2023, 1, 1, 1, 1))); // 唯一ID
            add(new Student("3", LocalDateTime.of(2022, 1, 1, 1, 1))); // 较旧时间
        }};

        System.out.println("原始学生列表:");
        students.forEach(System.out::println);
        System.out.println("\n---");

        // 使用Stream进行去重和筛选
        List uniqueStudents = students.stream()
            .collect(Collectors.toMap(
                Student::getId, // keyMapper: 以id作为键
                Function.identity(), // valueMapper: 以Student对象本身作为值
                BinaryOperator.maxBy(Comparator.comparing(Student::getStartDatetime)) // mergeFunction: 冲突时保留startDatetime最新的
            ))
            .values() // 获取Map中所有的值(即去重后的Student对象)
            .stream() // 将Map的值再次转换为Stream
            .sorted(Comparator.comparing(Student::getStartDatetime)) // 可选:根据startDatetime排序
            .toList(); // 将Stream收集为List (Java 16+) 或 Collectors.toList() (Java 8-15)

        System.out.println("去重并保留最新记录后的学生列表 (按日期排序):");
        uniqueStudents.forEach(System.out::println);
    }
}

运行结果示例:

原始学生列表:
Student{id='1', startDatetime=2023-10-27T10:30:00.123456}
Student{id='1', startDatetime=2000-02-01T01:01}
Student{id='1', startDatetime=1990-02-01T01:01}
Student{id='2', startDatetime=1990-02-01T01:01}
Student{id='3', startDatetime=2023-01-01T01:01}
Student{id='3', startDatetime=2022-01-01T01:01}

---
去重并保留最新记录后的学生列表 (按日期排序):
Student{id='2', startDatetime=1990-02-01T01:01}
Student{id='1', startDatetime=2023-10-27T10:30:00.123456} // 注意:实际运行时的LocalDateTime.now()会有毫秒级差异
Student{id='3', startDatetime=2023-01-01T01:01}

(请注意,LocalDateTime.now()的输出会根据实际运行时间而变化,上述示例输出中的时间戳是假设值。)

注意事项与扩展

  • Java版本兼容性: 示例代码中使用了.toList()方法,这是Java 16及更高版本提供的便捷方法。如果您的项目使用的是Java 8到Java 15,您需要使用collect(Collectors.toList())来替代。
  • 保留最旧记录: 如果您的需求是保留具有最旧startDatetime的记录,只需将BinaryOperator.maxBy替换为BinaryOperator.minBy即可: BinaryOperator.minBy(Comparator.comparing(Student::getStartDatetime))
  • 最终结果的排序: 在将Map的值转换回List后,我们额外添加了.sorted(Comparator.comparing(Student::getStartDatetime))来对最终结果进行排序。这一步是可选的,取决于您是否需要一个特定顺序的输出列表。如果不进行排序,元素的顺序将取决于Map的迭代顺序(通常是插入顺序或HashMap的内部哈希顺序)。
  • 性能考量: Collectors.toMap在内部会构建一个Map。对于非常大的数据集,这会带来一定的内存和CPU开销。然而,对于大多数常见场景,这种Stream方式的性能是完全可接受的,并且其代码的简洁性和可读性优势显著。
  • 自定义合并逻辑: mergeFunction的灵活性非常高。除了maxBy和minBy,您还可以提供一个自定义的lambda表达式来处理更复杂的合并逻辑,例如,如果日期相同,则根据另一个字段进行选择。

通过这种方式,我们可以利用Java Stream API以声明式、高效且易于理解的方式解决列表对象的去重和筛选问题,极大地提升了代码质量和开发效率。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
lambda表达式
lambda表达式

Lambda表达式是一种匿名函数的简洁表示方式,它可以在需要函数作为参数的地方使用,并提供了一种更简洁、更灵活的编码方式,其语法为“lambda 参数列表: 表达式”,参数列表是函数的参数,可以包含一个或多个参数,用逗号分隔,表达式是函数的执行体,用于定义函数的具体操作。本专题为大家提供lambda表达式相关的文章、下载、课程内容,供大家免费下载体验。

208

2023.09.15

python lambda函数
python lambda函数

本专题整合了python lambda函数用法详解,阅读专题下面的文章了解更多详细内容。

191

2025.11.08

Python lambda详解
Python lambda详解

本专题整合了Python lambda函数相关教程,阅读下面的文章了解更多详细内容。

55

2026.01.05

golang map内存释放
golang map内存释放

本专题整合了golang map内存相关教程,阅读专题下面的文章了解更多相关内容。

75

2025.09.05

golang map相关教程
golang map相关教程

本专题整合了golang map相关教程,阅读专题下面的文章了解更多详细内容。

36

2025.11.16

golang map原理
golang map原理

本专题整合了golang map相关内容,阅读专题下面的文章了解更多详细内容。

61

2025.11.17

java判断map相关教程
java判断map相关教程

本专题整合了java判断map相关教程,阅读专题下面的文章了解更多详细内容。

42

2025.11.27

function是什么
function是什么

function是函数的意思,是一段具有特定功能的可重复使用的代码块,是程序的基本组成单元之一,可以接受输入参数,执行特定的操作,并返回结果。本专题为大家提供function是什么的相关的文章、下载、课程内容,供大家免费下载体验。

484

2023.08.04

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

14

2026.01.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
10分钟--Midjourney创作自己的漫画
10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合
Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号