Java中按属性分组并构建带关联列表的对象集合

碧海醫心

发布时间：2026-02-28 10:39:10

218人浏览过

来源于php中文网

原创

Java中按属性分组并构建带关联列表的对象集合

本文详解如何使用Java Stream API（支持Java 11+）对候选对象按personId分组，提取每个分组中updateDate最新的主记录，并将其余codeHswCandId归入codeHswCandIdRelated列表。

本文详解如何使用java stream api（支持java 11+）对候选对象按`personid`分组，提取每个分组中`updatedate`最新的主记录，并将其余`codehswcandid`归入`codehswcandidrelated`列表。

在实际业务开发中，常需将一批同质对象按某个标识（如personId）聚合，并基于时间戳等字段选出“主代表”，再将其余成员信息结构化地挂载为关联字段——例如本例中，每个Candidate需保留其最新更新的codeHswCandId作为主ID，其余同personId的codeHswCandId则统一收纳进codeHswCandIdRelated列表。

该需求本质是分组 + 主记录选取 + 关联数据提取三步逻辑的组合。Java 12 引入的 Collectors.teeing 提供了优雅的单次遍历解决方案；而 Java 11 及以下版本则可通过两次流式处理实现等效效果，兼顾可读性与性能。

✅ 推荐方案（Java 12+）：使用 Collectors.teeing

teeing 支持并行收集两个独立的中间结果（如主记录Map和ID列表Map），再通过合并函数构造最终对象。代码简洁、语义清晰，且仅遍历原始列表一次：

Getimg.ai

getimg.ai是一套神奇的ai工具。生成大规模的原始图像

下载

List<Candidate> result = candidateList.stream()
    .collect(Collectors.teeing(
        // 分支1：按 personId 分组，取 updateDate 最大的 Candidate
        Collectors.toMap(
            Candidate::getPersonId,
            Function.identity(),
            BinaryOperator.maxBy(Comparator.comparing(Candidate::getUpdateDate))
        ),
        // 分支2：按 personId 分组，收集所有 codeHswCandId 到 List<String>
        Collectors.groupingBy(
            Candidate::getPersonId,
            Collectors.mapping(Candidate::getCodeHswCandId, Collectors.toList())
        ),
        // 合并函数：遍历主记录Map，构建新Candidate
        (mainMap, idListMap) -> mainMap.entrySet().stream()
            .map(entry -> {
                Integer pid = entry.getKey();
                Candidate main = entry.getValue();
                List<String> allIds = idListMap.getOrDefault(pid, List.of());
                // 过滤掉主记录自身的 codeHswCandId
                List<String> related = allIds.stream()
                    .filter(id -> !id.equals(main.getCodeHswCandId()))
                    .collect(Collectors.toList());
                return Candidate.builder()
                    .personId(pid)
                    .codeHswCandId(main.getCodeHswCandId())
                    .codeHswCandIdRelated(related)
                    .build();
            })
            .collect(Collectors.toList())
    ));

⚙️ 兼容方案（Java 11 及以下）：两次流处理

若项目受限于 JDK 版本，可拆分为两步：先构建主记录映射，再构建ID列表映射，最后合并。虽多一次遍历，但逻辑更直观，调试友好：

立即学习“Java免费学习笔记（深入）”；

// Step 1: 获取每个 personId 对应的最新 Candidate
Map<Integer, Candidate> mainCandidates = candidateList.stream()
    .collect(Collectors.toMap(
        Candidate::getPersonId,
        Function.identity(),
        BinaryOperator.maxBy(Comparator.comparing(Candidate::getUpdateDate))
    ));

// Step 2: 获取每个 personId 对应的所有 codeHswCandId 列表
Map<Integer, List<String>> idGroups = candidateList.stream()
    .collect(Collectors.groupingBy(
        Candidate::getPersonId,
        Collectors.mapping(Candidate::getCodeHswCandId, Collectors.toList())
    ));

// Step 3: 合并生成目标列表
List<Candidate> result = mainCandidates.entrySet().stream()
    .map(entry -> {
        Integer pid = entry.getKey();
        Candidate main = entry.getValue();
        List<String> allIds = idGroups.getOrDefault(pid, List.of());
        List<String> related = allIds.stream()
            .filter(id -> !id.equals(main.getCodeHswCandId()))
            .collect(Collectors.toList());
        return Candidate.builder()
            .personId(pid)
            .codeHswCandId(main.getCodeHswCandId())
            .codeHswCandIdRelated(related)
            .build();
    })
    .collect(Collectors.toList());

⚠️ 注意事项与最佳实践

空值防护：getOrDefault(pid, List.of()) 避免 NullPointerException；若原始数据中存在 null 的 codeHswCandId，建议在映射前过滤（如 .filter(Objects::nonNull)）。
时间精度一致性：LocalDateTime 比较依赖纳秒级精度，确保数据中无因时区或格式化导致的意外偏差。
性能考量：对于超大数据集（>10⁵ 条），两次流处理的内存与CPU开销略高于 teeing，但差异通常可忽略；若追求极致性能，可考虑预排序后手动分组。
Builder 安全性：Lombok @Builder 默认允许部分字段为空，此处所有字段均显式赋值，无需额外校验。

通过上述任一方式，输入的6个候选人即可精准转换为目标结构：每个personId仅保留一条最新记录作为主体，其余ID自动归入关联列表，满足典型主从聚合建模需求。

如何在Java中安全读取并规范用户输入的0到100范围整数

如何安装Oracle JDK与OpenJDK_商业版与开源版的差异对比

如何解决Java序列化中的版本兼容性问题_serialVersionUID作用说明

Java中的ArrayList和LinkedList有什么区别_性能对比与选型指南

Java 多线程中 wait()/notify() 的正确使用与常见陷阱

相关专题

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

248

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

927

2024.03.01

golang map内存释放

本专题整合了golang map内存相关教程，阅读专题下面的文章了解更多相关内容。

2025.09.05

golang map相关教程

本专题整合了golang map相关教程，阅读专题下面的文章了解更多详细内容。

2025.11.16

golang map原理

本专题整合了golang map相关内容，阅读专题下面的文章了解更多详细内容。

2025.11.17

java判断map相关教程

本专题整合了java判断map相关教程，阅读专题下面的文章了解更多详细内容。

2025.11.27

Golang 测试体系与代码质量保障：工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链（如go test）、单元测试、集成测试及端到端测试实践，结合代码覆盖率分析、静态代码扫描（如go vet）和动态分析工具，建立全链路质量监控机制。通过自动化测试框架、持续集成（CI）流水线配置及代码审查规范，实现测试用例管理、缺陷追踪与质量门禁控制，确保代码健壮性与可维护性，为高可靠性工程系统提供质量保障。

2026.02.28

Golang 工程化架构设计：可维护与可演进系统构建

Go语言工程化架构设计专注于构建高可维护性、可演进的企业级系统。本专题深入探讨Go项目的目录结构设计、模块划分、依赖管理等核心架构原则，涵盖微服务架构、领域驱动设计(DDD)在Go中的实践应用。通过实战案例解析接口抽象、错误处理、配置管理、日志监控等关键工程化技术，帮助开发者掌握构建稳定、可扩展Go应用的最佳实践方法。

2026.02.28

Golang 性能分析与运行时机制：构建高性能程序

Go语言以其高效的并发模型和优异的性能表现广泛应用于高并发、高性能场景。其运行时机制包括 Goroutine 调度、内存管理、垃圾回收等方面，深入理解这些机制有助于编写更高效稳定的程序。本专题将系统讲解 Golang 的性能分析工具使用、常见性能瓶颈定位及优化策略，并结合实际案例剖析 Go 程序的运行时行为，帮助开发者掌握构建高性能应用的关键技能。

2026.02.28

热门下载

网站特效

网站源码

网站素材

前端模板