
本教程旨在探讨如何在java中高效地从一个对象列表中移除那些其特定键值不存在于另一个列表中的元素。文章将详细介绍java 8及更高版本中利用stream api的优化方案,以及java 8之前版本通过循环和迭代器实现相同功能的多种方法,并提供相应的代码示例和性能考量。
场景概述
在数据处理中,我们经常遇到需要根据一个参考列表来过滤另一个列表的场景。例如,给定两个包含不同类型对象但具有关联键(如编码)的列表:
public class RetailerExcelConversionDto {
private String retailerCode;
private Integer isActive;
// Getters and Setters
public String getRetailerCode() { return retailerCode; }
public void setRetailerCode(String retailerCode) { this.retailerCode = retailerCode; }
public Integer getIsActive() { return isActive; }
public void setIsActive(Integer isActive) { this.isActive = isActive; }
}
public class RetailerDto {
private String code;
private Integer age;
private String name;
// Getters and Setters
public String getCode() { return code; }
public void setCode(String code) { this.code = code; }
public Integer getAge() { return age; }
public void setAge(Integer age) { this.age = age; }
public String getName() { return name; }
public void setName(String name) { this.name = name; }
}假设我们有两个列表实例:
ListretailerConversionDtoList = getAllRetailerConversionDtoList(); List retailerDtoList = getAllRetailer();
我们的目标是从 retailerConversionDtoList 中移除所有 retailerCode 不存在于 retailerDtoList 中任何 code 的元素。简而言之,我们希望保留那些在两个列表中都有对应编码的零售商数据。
Java 8+ Stream API 优化方案
在Java 8及更高版本中,Stream API提供了一种简洁且高效的方式来处理这类集合操作。核心思想是首先从参考列表(retailerDtoList)中提取所有关联键到一个 Set 集合中,然后利用 Set 的高效查找特性(平均O(1)时间复杂度)来过滤目标列表(retailerConversionDtoList)。
立即学习“Java免费学习笔记(深入)”;
import java.util.List; import java.util.Set; import java.util.stream.Collectors; import java.util.ArrayList; // 假设 getAllRetailerConversionDtoList 和 getAllRetailer 返回 ArrayList 或类似的可变列表 // 假设 retailerConversionDtoList 和 retailerDtoList 已经被初始化并填充数据 // 1. 从 retailerDtoList 中提取所有 code 到一个 Set 集合中,用于快速查找 SetretailerCodes = retailerDtoList.stream() .map(RetailerDto::getCode) // 提取 code 属性 .collect(Collectors.toSet()); // 收集到 Set 中 // 2. 使用 Stream API 过滤 retailerConversionDtoList retailerConversionDtoList = retailerConversionDtoList.stream() .filter(dto -> retailerCodes.contains(dto.getRetailerCode())) // 仅保留 retailerCode 存在于 retailerCodes Set 中的元素 .collect(Collectors.toList()); // 收集结果到一个新的 List 中
优点:
- 简洁性与可读性: Stream API 提供了声明式编程风格,代码意图清晰。
- 效率: 使用 HashSet 进行查找,对于大量数据,其平均时间复杂度远优于线性查找。
- 不变性: 默认情况下,Stream 操作会生成新的集合,避免了对原始集合的副作用,有助于编写更健壮的代码。
Java 8 之前版本解决方案
对于Java 8之前的版本,我们无法使用Stream API。此时,通常需要通过循环和集合操作来完成任务。以下是两种常见的实现方式。
1. 构建新的列表
这种方法首先从参考列表中提取所有关联键到一个 HashSet,然后遍历目标列表,将符合条件的元素添加到一个新的列表中。
import java.util.ArrayList; import java.util.HashSet; import java.util.List; import java.util.Set; // 假设 retailerConversionDtoList 和 retailerDtoList 已经被初始化并填充数据 SetretailerCodes = new HashSet<>(); for (RetailerDto retailer : retailerDtoList) { retailerCodes.add(retailer.getCode()); } List newRetailerConversionDtoList = new ArrayList<>(); for (RetailerExcelConversionDto dto : retailerConversionDtoList) { if (retailerCodes.contains(dto.getRetailerCode())) { newRetailerConversionDtoList.add(dto); } } // 此时,newRetailerConversionDtoList 包含了过滤后的结果 // 如果需要更新原始列表,可以:retailerConversionDtoList = newRetailerConversionDtoList;
优点:
- 逻辑清晰: 逐步构建新列表,易于理解。
- 安全性: 不会修改原始列表,避免并发修改问题(如果原始列表在其他地方被引用)。
缺点:
- 内存消耗: 需要额外的内存来存储新的列表。
2. 使用迭代器原地移除
如果希望直接修改原始列表而不是创建新列表,可以使用 Iterator 来安全地在循环中移除元素。直接使用增强for循环(for-each)在遍历时调用 list.remove() 会导致 ConcurrentModificationException。
import java.util.ArrayList; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Set; // 假设 retailerConversionDtoList 和 retailerDtoList 已经被初始化并填充数据 SetretailerCodes = new HashSet<>(); for (RetailerDto retailer : retailerDtoList) { retailerCodes.add(retailer.getCode()); } // 使用迭代器进行遍历和移除 for (Iterator it = retailerConversionDtoDtoList.iterator(); it.hasNext(); ) { RetailerExcelConversionDto next = it.next(); if (!retailerCodes.contains(next.getRetailerCode())) { it.remove(); // 使用迭代器的 remove 方法安全移除元素 } } // 此时,retailerConversionDtoList 已经被原地修改,包含了过滤后的结果
优点:
- 内存效率: 不需要创建新的列表,节省内存。
- 原地修改: 直接操作原始列表。
缺点:
- 可读性稍差: 相较于Stream API或构建新列表,迭代器操作可能略显繁琐。
- 潜在风险: 如果不正确使用迭代器(例如在循环内部直接调用 list.remove()),容易引发 ConcurrentModificationException。
性能与最佳实践考量
- 使用 HashSet 进行查找: 无论是Java 8+还是Java 8之前的版本,将参考列表的关联键收集到 HashSet 中是提高性能的关键。HashSet 提供了平均 O(1) 的查找时间复杂度,而如果直接在列表中进行 contains() 操作,则会是 O(N) 的时间复杂度,导致整体算法复杂度从 O(M+N) 变为 O(M*N),其中 M 和 N 分别是两个列表的大小。对于大型列表,这会带来巨大的性能差异。
-
选择合适的方案:
- Java 8+项目: 强烈推荐使用Stream API,因为它兼具简洁性、可读性和高效性。
-
Java 8之前项目:
- 如果内存不是瓶颈,且希望保持原始列表不变,或需要将结果赋值给新的引用,则选择“构建新的列表”方案。
- 如果内存是关键考虑因素,且允许原地修改原始列表,则选择“使用迭代器原地移除”方案。
- 对象属性的 hashCode() 和 equals(): 确保作为关联键的属性(例如 RetailerDto.code)在 Set 中能够正确工作,通常字符串类型已经实现了正确的 hashCode() 和 equals()。如果关联键是自定义对象,则需要确保这些对象正确重写了 hashCode() 和 equals() 方法。
总结
从一个列表中移除不存在于另一个列表中的元素是一个常见的编程需求。通过合理利用 HashSet 进行高效查找,并结合Java 8+的Stream API或Java 8之前的循环与迭代器,我们可以高效且优雅地解决这个问题。在实际开发中,应根据项目所使用的Java版本、性能要求以及代码的可读性偏好来选择最合适的实现方案。










