
本文详细介绍了在java中如何根据另一个列表的键值来过滤一个对象列表。我们将探讨在java 8及更高版本中使用stream api的优化方法,以及在早期java版本中通过构建hashset和迭代器进行处理的传统策略,旨在提供高效且可读的代码实现,确保数据一致性与性能优化。
在Java开发中,我们经常会遇到需要根据一个列表的特定属性值来筛选另一个列表的需求。例如,从一个包含所有商品信息的列表中,移除那些在库存列表中不存在的商品。本教程将以具体的代码示例,详细阐述如何高效地实现这一目标。
场景描述与数据模型
假设我们有两个不同的对象列表,需要根据它们之间共享的唯一标识符进行匹配和过滤。
数据模型定义:
我们有两个Java类,RetailerExcelConversionDto 和 RetailerDto,它们分别代表不同来源的零售商信息。
立即学习“Java免费学习笔记(深入)”;
public class RetailerExcelConversionDto {
private String retailerCode; // 零售商唯一编码
private Integer isActive; // 是否活跃
// 省略构造函数、getter和setter
}
public class RetailerDto {
private String code; // 零售商唯一编码
private Integer age; // 年龄
private String name; // 名称
// 省略构造函数、getter和setter
}初始列表:
我们拥有这两个类的实例列表:
ListretailerConversionDtoList = getAllRetailerConversionDtoList(); // 包含所有待处理的零售商转换数据 List retailerDtoList = getAllRetailer(); // 包含所有有效的零售商数据
我们的目标是:从 retailerConversionDtoList 中移除所有其 retailerCode 不存在于 retailerDtoList 中任何 code 的元素。简而言之,只保留那些在 retailerDtoList 中有对应匹配项的 retailerConversionDto 对象。
Java 8+ 高效解决方案:Stream API
对于Java 8及更高版本,Stream API提供了一种声明式且高度优化的方式来处理集合操作。其核心思想是利用 Set 的O(1)平均时间复杂度查找特性,将查找过程优化到极致。
实现步骤:
-
提取有效键集合: 从 retailerDtoList 中提取所有有效的 code 值,并将它们收集到一个 Set
中。使用 Set 而非 List 的原因是 Set 提供了更快的查找速度(contains() 方法)。 - 过滤目标列表: 使用Stream API对 retailerConversionDtoList 进行过滤。对于列表中的每个 RetailerExcelConversionDto 对象,检查其 retailerCode 是否存在于第一步构建的 Set 中。
- 收集结果: 将通过过滤条件的元素收集到一个新的 List 中。
示例代码:
import java.util.List;
import java.util.Set;
import java.util.stream.Collectors;
// 假设 RetailerExcelConversionDto 和 RetailerDto 类已定义,并有相应的getter方法
public class ListFilterExample {
public static void main(String[] args) {
// 模拟数据
List retailerConversionDtoList = List.of(
new RetailerExcelConversionDto("R001", 1),
new RetailerExcelConversionDto("R002", 0),
new RetailerExcelConversionDto("R003", 1),
new RetailerExcelConversionDto("R005", 1) // 这个将不存在于retailerDtoList中
);
List retailerDtoList = List.of(
new RetailerDto("R001", 25, "零售商A"),
new RetailerDto("R002", 30, "零售商B"),
new RetailerDto("R003", 28, "零售商C"),
new RetailerDto("R004", 35, "零售商D")
);
// 1. 提取所有有效的零售商编码到Set中
Set validRetailerCodes = retailerDtoList.stream()
.map(RetailerDto::getCode) // 假设 RetailerDto 有 getCode() 方法
.collect(Collectors.toSet());
// 2. 过滤 retailerConversionDtoList
retailerConversionDtoList = retailerConversionDtoList.stream()
.filter(dto -> validRetailerCodes.contains(dto.getRetailerCode())) // 假设 RetailerExcelConversionDto 有 getRetailerCode() 方法
.collect(Collectors.toList());
// 输出结果
System.out.println("过滤后的 retailerConversionDtoList:");
retailerConversionDtoList.forEach(dto ->
System.out.println("Code: " + dto.getRetailerCode() + ", Active: " + dto.getIsActive()));
// 预期输出:
// Code: R001, Active: 1
// Code: R002, Active: 0
// Code: R003, Active: 1
}
} 说明: 这种方法利用了函数式编程的优势,代码简洁、可读性强,并且在处理大量数据时表现出良好的性能。Collectors.toSet() 操作会将 retailerDtoList 中的所有 code 收集到一个 HashSet 中,后续的 contains() 操作平均时间复杂度为 O(1),使得整个过滤过程非常高效。
Java 8 以前的解决方案:传统迭代
在Java 8以前的版本,或者在某些不适合使用Stream API的场景下,我们可以采用传统的循环和迭代器方式来实现相同的过滤逻辑。同样,为了优化性能,我们依然会利用 Set 来存储有效键。
方案一:构建新列表
这种方法通过遍历原始列表,将符合条件的元素添加到一个新的列表中。
实现步骤:
- 提取有效键集合: 同Stream API方案,首先将 retailerDtoList 中的 code 收集到一个 HashSet 中。
- 遍历并添加: 遍历 retailerConversionDtoList,对于每个元素,检查其 retailerCode 是否存在于 HashSet 中。如果存在,则将其添加到一个新的 List 中。
示例代码:
import java.util.ArrayList;
import java.util.HashSet;
import java.util.List;
import java.util.Set;
public class ListFilterPreJava8Example1 {
public static void main(String[] args) {
// 模拟数据(同上)
List retailerConversionDtoList = new ArrayList<>(List.of(
new RetailerExcelConversionDto("R001", 1),
new RetailerExcelConversionDto("R002", 0),
new RetailerExcelConversionDto("R003", 1),
new RetailerExcelConversionDto("R005", 1)
));
List retailerDtoList = new ArrayList<>(List.of(
new RetailerDto("R001", 25, "零售商A"),
new RetailerDto("R002", 30, "零售商B"),
new RetailerDto("R003", 28, "零售商C"),
new RetailerDto("R004", 35, "零售商D")
));
// 1. 提取所有有效的零售商编码到Set中
Set validRetailerCodes = new HashSet<>();
for (RetailerDto retailer : retailerDtoList) {
validRetailerCodes.add(retailer.getCode());
}
// 2. 构建新的列表
List newRetailerConversionDtoList = new ArrayList<>();
for (RetailerExcelConversionDto dto : retailerConversionDtoList) {
if (validRetailerCodes.contains(dto.getRetailerCode())) {
newRetailerConversionDtoList.add(dto);
}
}
retailerConversionDtoList = newRetailerConversionDtoList; // 更新引用
// 输出结果
System.out.println("过滤后的 retailerConversionDtoList (新列表方式):");
retailerConversionDtoList.forEach(dto ->
System.out.println("Code: " + dto.getRetailerCode() + ", Active: " + dto.getIsActive()));
}
} 优点: 不会修改原列表,如果需要保留原列表的完整性,这是一个不错的选择。 缺点: 会创建新的列表对象,可能产生额外的内存开销。
方案二:使用迭代器进行原地移除
如果允许修改原始列表,并且希望避免创建新列表的开销,可以使用迭代器进行原地移除。
实现步骤:
- 提取有效键集合: 同上,构建 HashSet。
- 使用迭代器遍历并移除: 获取 retailerConversionDtoList 的迭代器。在循环中,使用迭代器的 next() 方法获取当前元素,并检查其 retailerCode 是否存在于 HashSet 中。如果不存在,则使用迭代器的 remove() 方法将当前元素从列表中移除。
示例代码:
import java.util.ArrayList;
import java.util.HashSet;
import java.util.Iterator;
import java.util.List;
import java.util.Set;
public class ListFilterPreJava8Example2 {
public static void main(String[] args) {
// 模拟数据(同上)
List retailerConversionDtoList = new ArrayList<>(List.of(
new RetailerExcelConversionDto("R001", 1),
new RetailerExcelConversionDto("R002", 0),
new RetailerExcelConversionDto("R003", 1),
new RetailerExcelConversionDto("R005", 1)
));
List retailerDtoList = new ArrayList<>(List.of(
new RetailerDto("R001", 25, "零售商A"),
new RetailerDto("R002", 30, "零售商B"),
new RetailerDto("R003", 28, "零售商C"),
new RetailerDto("R004", 35, "零售商D")
));
// 1. 提取所有有效的零售商编码到Set中
Set validRetailerCodes = new HashSet<>();
for (RetailerDto retailer : retailerDtoList) {
validRetailerCodes.add(retailer.getCode());
}
// 2. 使用迭代器原地移除不匹配的元素
for (Iterator it = retailerConversionDtoList.iterator(); it.hasNext(); ) {
RetailerExcelConversionDto next = it.next();
if (!validRetailerCodes.contains(next.getRetailerCode())) {
it.remove(); // 移除不匹配的元素
}
}
// 输出结果
System.out.println("过滤后的 retailerConversionDtoList (迭代器移除方式):");
retailerConversionDtoList.forEach(dto ->
System.out.println("Code: " + dto.getRetailerCode() + ", Active: " + dto.getIsActive()));
}
} 优点: 避免了创建新列表的内存开销,原地修改原列表。 注意事项: 在循环中直接通过 List.remove(index) 或 List.remove(object) 修改列表可能会导致 ConcurrentModificationException 或跳过某些元素。因此,当需要在迭代过程中修改集合时,必须使用迭代器自身的 remove() 方法。
性能考量与最佳实践
- 使用 Set 进行查找: 无论采用哪种Java版本或实现方案,将参考列表的键值收集到一个 HashSet 中是提高性能的关键。HashSet 的 contains() 方法平均时间复杂度为 O(1),而 ArrayList 的 contains() 方法平均时间复杂度为 O(n)。对于两个列表大小分别为 M 和 N 的情况,如果直接嵌套循环并使用 List.contains(),总时间复杂度将是 O(M*N)。而使用 Set,总时间复杂度可以优化到 O(M + N)。
-
选择合适的方案:
- Java 8+ 环境: 优先使用Stream API。它不仅代码简洁、可读性高,而且内部实现经过高度优化,能够充分利用多核处理器进行并行处理(如果使用 parallelStream())。
-
Java 8 以前环境或特定需求:
- 如果需要保留原始列表不变,或对内存开销不敏感,构建新列表是更安全的选择。
- 如果对内存使用有严格要求,且允许修改原始列表,使用迭代器原地移除是更高效的选择。
- 代码可读性: 尽管传统循环也能实现功能,但Stream API在表达意图上更为清晰,尤其是在复杂的链式操作中。
总结
本文详细介绍了在Java中如何根据另一个列表的键值来过滤一个对象列表的多种实现方法。核心思想是利用 Set 的高效查找特性来优化过滤过程。对于现代Java应用,推荐使用Java 8+的Stream API,它提供了简洁、高效且功能强大的解决方案。对于旧版Java环境或特定场景,传统的迭代器配合 Set 同样能实现高性能的过滤。理解这些方法的优缺点和适用场景,有助于我们编写出更健壮、更高效的Java代码。










