0

0

Java中高效过滤列表对象:基于关联键值移除不匹配元素

心靈之曲

心靈之曲

发布时间:2025-11-02 19:06:01

|

972人浏览过

|

来源于php中文网

原创

Java中高效过滤列表对象:基于关联键值移除不匹配元素

本文详细介绍了在java中如何根据另一个列表的键值来过滤一个对象列表。我们将探讨在java 8及更高版本中使用stream api的优化方法,以及在早期java版本中通过构建hashset和迭代器进行处理的传统策略,旨在提供高效且可读的代码实现,确保数据一致性与性能优化。

在Java开发中,我们经常会遇到需要根据一个列表的特定属性值来筛选另一个列表的需求。例如,从一个包含所有商品信息的列表中,移除那些在库存列表中不存在的商品。本教程将以具体的代码示例,详细阐述如何高效地实现这一目标。

场景描述与数据模型

假设我们有两个不同的对象列表,需要根据它们之间共享的唯一标识符进行匹配和过滤。

数据模型定义:

我们有两个Java类,RetailerExcelConversionDto 和 RetailerDto,它们分别代表不同来源的零售商信息。

立即学习Java免费学习笔记(深入)”;

public class RetailerExcelConversionDto {
    private String retailerCode; // 零售商唯一编码
    private Integer isActive;    // 是否活跃
    // 省略构造函数、getter和setter
}

public class RetailerDto {
    private String code; // 零售商唯一编码
    private Integer age; // 年龄
    private String name; // 名称
    // 省略构造函数、getter和setter
}

初始列表:

我们拥有这两个类的实例列表:

List retailerConversionDtoList = getAllRetailerConversionDtoList(); // 包含所有待处理的零售商转换数据
List retailerDtoList = getAllRetailer(); // 包含所有有效的零售商数据

我们的目标是:从 retailerConversionDtoList 中移除所有其 retailerCode 不存在于 retailerDtoList 中任何 code 的元素。简而言之,只保留那些在 retailerDtoList 中有对应匹配项的 retailerConversionDto 对象。

Java 8+ 高效解决方案:Stream API

对于Java 8及更高版本,Stream API提供了一种声明式且高度优化的方式来处理集合操作。其核心思想是利用 Set 的O(1)平均时间复杂度查找特性,将查找过程优化到极致。

实现步骤:

  1. 提取有效键集合: 从 retailerDtoList 中提取所有有效的 code 值,并将它们收集到一个 Set 中。使用 Set 而非 List 的原因是 Set 提供了更快的查找速度(contains() 方法)。
  2. 过滤目标列表: 使用Stream API对 retailerConversionDtoList 进行过滤。对于列表中的每个 RetailerExcelConversionDto 对象,检查其 retailerCode 是否存在于第一步构建的 Set 中。
  3. 收集结果: 将通过过滤条件的元素收集到一个新的 List 中。

示例代码:

Clay AI
Clay AI

Clay AI 是一款可以将人物照片转换为粘土风格图像的AI工具,Clay AI:利用粘土动画让角色栩栩如生

下载
import java.util.List;
import java.util.Set;
import java.util.stream.Collectors;

// 假设 RetailerExcelConversionDto 和 RetailerDto 类已定义,并有相应的getter方法

public class ListFilterExample {

    public static void main(String[] args) {
        // 模拟数据
        List retailerConversionDtoList = List.of(
            new RetailerExcelConversionDto("R001", 1),
            new RetailerExcelConversionDto("R002", 0),
            new RetailerExcelConversionDto("R003", 1),
            new RetailerExcelConversionDto("R005", 1) // 这个将不存在于retailerDtoList中
        );

        List retailerDtoList = List.of(
            new RetailerDto("R001", 25, "零售商A"),
            new RetailerDto("R002", 30, "零售商B"),
            new RetailerDto("R003", 28, "零售商C"),
            new RetailerDto("R004", 35, "零售商D")
        );

        // 1. 提取所有有效的零售商编码到Set中
        Set validRetailerCodes = retailerDtoList.stream()
            .map(RetailerDto::getCode) // 假设 RetailerDto 有 getCode() 方法
            .collect(Collectors.toSet());

        // 2. 过滤 retailerConversionDtoList
        retailerConversionDtoList = retailerConversionDtoList.stream()
            .filter(dto -> validRetailerCodes.contains(dto.getRetailerCode())) // 假设 RetailerExcelConversionDto 有 getRetailerCode() 方法
            .collect(Collectors.toList());

        // 输出结果
        System.out.println("过滤后的 retailerConversionDtoList:");
        retailerConversionDtoList.forEach(dto -> 
            System.out.println("Code: " + dto.getRetailerCode() + ", Active: " + dto.getIsActive()));
        // 预期输出:
        // Code: R001, Active: 1
        // Code: R002, Active: 0
        // Code: R003, Active: 1
    }
}

说明: 这种方法利用了函数式编程的优势,代码简洁、可读性强,并且在处理大量数据时表现出良好的性能。Collectors.toSet() 操作会将 retailerDtoList 中的所有 code 收集到一个 HashSet 中,后续的 contains() 操作平均时间复杂度为 O(1),使得整个过滤过程非常高效。

Java 8 以前的解决方案:传统迭代

在Java 8以前的版本,或者在某些不适合使用Stream API的场景下,我们可以采用传统的循环和迭代器方式来实现相同的过滤逻辑。同样,为了优化性能,我们依然会利用 Set 来存储有效键。

方案一:构建新列表

这种方法通过遍历原始列表,将符合条件的元素添加到一个新的列表中。

实现步骤:

  1. 提取有效键集合: 同Stream API方案,首先将 retailerDtoList 中的 code 收集到一个 HashSet 中。
  2. 遍历并添加: 遍历 retailerConversionDtoList,对于每个元素,检查其 retailerCode 是否存在于 HashSet 中。如果存在,则将其添加到一个新的 List 中。

示例代码:

import java.util.ArrayList;
import java.util.HashSet;
import java.util.List;
import java.util.Set;

public class ListFilterPreJava8Example1 {

    public static void main(String[] args) {
        // 模拟数据(同上)
        List retailerConversionDtoList = new ArrayList<>(List.of(
            new RetailerExcelConversionDto("R001", 1),
            new RetailerExcelConversionDto("R002", 0),
            new RetailerExcelConversionDto("R003", 1),
            new RetailerExcelConversionDto("R005", 1)
        ));

        List retailerDtoList = new ArrayList<>(List.of(
            new RetailerDto("R001", 25, "零售商A"),
            new RetailerDto("R002", 30, "零售商B"),
            new RetailerDto("R003", 28, "零售商C"),
            new RetailerDto("R004", 35, "零售商D")
        ));

        // 1. 提取所有有效的零售商编码到Set中
        Set validRetailerCodes = new HashSet<>();
        for (RetailerDto retailer : retailerDtoList) {
            validRetailerCodes.add(retailer.getCode());
        }

        // 2. 构建新的列表
        List newRetailerConversionDtoList = new ArrayList<>();
        for (RetailerExcelConversionDto dto : retailerConversionDtoList) {
            if (validRetailerCodes.contains(dto.getRetailerCode())) {
                newRetailerConversionDtoList.add(dto);
            }
        }
        retailerConversionDtoList = newRetailerConversionDtoList; // 更新引用

        // 输出结果
        System.out.println("过滤后的 retailerConversionDtoList (新列表方式):");
        retailerConversionDtoList.forEach(dto -> 
            System.out.println("Code: " + dto.getRetailerCode() + ", Active: " + dto.getIsActive()));
    }
}

优点: 不会修改原列表,如果需要保留原列表的完整性,这是一个不错的选择。 缺点: 会创建新的列表对象,可能产生额外的内存开销。

方案二:使用迭代器进行原地移除

如果允许修改原始列表,并且希望避免创建新列表的开销,可以使用迭代器进行原地移除。

实现步骤:

  1. 提取有效键集合: 同上,构建 HashSet。
  2. 使用迭代器遍历并移除: 获取 retailerConversionDtoList 的迭代器。在循环中,使用迭代器的 next() 方法获取当前元素,并检查其 retailerCode 是否存在于 HashSet 中。如果不存在,则使用迭代器的 remove() 方法将当前元素从列表中移除。

示例代码:

import java.util.ArrayList;
import java.util.HashSet;
import java.util.Iterator;
import java.util.List;
import java.util.Set;

public class ListFilterPreJava8Example2 {

    public static void main(String[] args) {
        // 模拟数据(同上)
        List retailerConversionDtoList = new ArrayList<>(List.of(
            new RetailerExcelConversionDto("R001", 1),
            new RetailerExcelConversionDto("R002", 0),
            new RetailerExcelConversionDto("R003", 1),
            new RetailerExcelConversionDto("R005", 1)
        ));

        List retailerDtoList = new ArrayList<>(List.of(
            new RetailerDto("R001", 25, "零售商A"),
            new RetailerDto("R002", 30, "零售商B"),
            new RetailerDto("R003", 28, "零售商C"),
            new RetailerDto("R004", 35, "零售商D")
        ));

        // 1. 提取所有有效的零售商编码到Set中
        Set validRetailerCodes = new HashSet<>();
        for (RetailerDto retailer : retailerDtoList) {
            validRetailerCodes.add(retailer.getCode());
        }

        // 2. 使用迭代器原地移除不匹配的元素
        for (Iterator it = retailerConversionDtoList.iterator(); it.hasNext(); ) {
            RetailerExcelConversionDto next = it.next();
            if (!validRetailerCodes.contains(next.getRetailerCode())) {
                it.remove(); // 移除不匹配的元素
            }
        }

        // 输出结果
        System.out.println("过滤后的 retailerConversionDtoList (迭代器移除方式):");
        retailerConversionDtoList.forEach(dto -> 
            System.out.println("Code: " + dto.getRetailerCode() + ", Active: " + dto.getIsActive()));
    }
}

优点: 避免了创建新列表的内存开销,原地修改原列表。 注意事项: 在循环中直接通过 List.remove(index) 或 List.remove(object) 修改列表可能会导致 ConcurrentModificationException 或跳过某些元素。因此,当需要在迭代过程中修改集合时,必须使用迭代器自身的 remove() 方法

性能考量与最佳实践

  • 使用 Set 进行查找: 无论采用哪种Java版本或实现方案,将参考列表的键值收集到一个 HashSet 中是提高性能的关键。HashSet 的 contains() 方法平均时间复杂度为 O(1),而 ArrayList 的 contains() 方法平均时间复杂度为 O(n)。对于两个列表大小分别为 M 和 N 的情况,如果直接嵌套循环并使用 List.contains(),总时间复杂度将是 O(M*N)。而使用 Set,总时间复杂度可以优化到 O(M + N)。
  • 选择合适的方案:
    • Java 8+ 环境: 优先使用Stream API。它不仅代码简洁、可读性高,而且内部实现经过高度优化,能够充分利用多核处理器进行并行处理(如果使用 parallelStream())。
    • Java 8 以前环境或特定需求:
      • 如果需要保留原始列表不变,或对内存开销不敏感,构建新列表是更安全的选择。
      • 如果对内存使用有严格要求,且允许修改原始列表,使用迭代器原地移除是更高效的选择。
  • 代码可读性 尽管传统循环也能实现功能,但Stream API在表达意图上更为清晰,尤其是在复杂的链式操作中。

总结

本文详细介绍了在Java中如何根据另一个列表的键值来过滤一个对象列表的多种实现方法。核心思想是利用 Set 的高效查找特性来优化过滤过程。对于现代Java应用,推荐使用Java 8+的Stream API,它提供了简洁、高效且功能强大的解决方案。对于旧版Java环境或特定场景,传统的迭代器配合 Set 同样能实现高性能的过滤。理解这些方法的优缺点和适用场景,有助于我们编写出更健壮、更高效的Java代码。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

846

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

745

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

741

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

420

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

447

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

431

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16947

2023.08.03

c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

58

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 13.4万人学习

成为PHP架构师-自制PHP框架
成为PHP架构师-自制PHP框架

共28课时 | 2.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号