0

0

Java Stream:合并从多个 CSV 文件读取的数据

花韻仙語

花韻仙語

发布时间:2025-10-26 10:16:31

|

825人浏览过

|

来源于php中文网

原创

java stream:合并从多个 csv 文件读取的数据

本文档介绍了如何使用 Java Stream 将从多个 CSV 文件读取的数据进行合并,特别是当第二个数据集的获取依赖于第一个数据集的结果时。我们将通过一个城市和国家数据的示例,展示如何根据城市信息中的国家代码,从国家数据集中获取对应的国家名称,并保持原始数据的顺序。

数据模型

首先,定义两个实体类 City 和 Country,分别对应城市和国家的数据结构。

import com.opencsv.bean.CsvBindByPosition;

public class City {

    @CsvBindByPosition(position = 0)
    private Integer id;

    @CsvBindByPosition(position = 1)
    private String name;

    @CsvBindByPosition(position = 2)
    private String countryCode;

    private String countryName; // 用于存储合并后的国家名称

    // Getters and setters
    public Integer getId() {
        return id;
    }

    public void setId(Integer id) {
        this.id = id;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public String getCountryCode() {
        return countryCode;
    }

    public void setCountryCode(String countryCode) {
        this.countryCode = countryCode;
    }

    public String getCountryName() {
        return countryName;
    }

    public void setCountryName(String countryName) {
        this.countryName = countryName;
    }

    @Override
    public String toString() {
        return "City{" +
                "id=" + id +
                ", name='" + name + '\'' +
                ", countryCode='" + countryCode + '\'' +
                ", countryName='" + countryName + '\'' +
                '}';
    }
}
import com.opencsv.bean.CsvBindByPosition;

public class Country {

    @CsvBindByPosition(position = 0)
    private Integer id;

    @CsvBindByPosition(position = 1)
    private String name;

    @CsvBindByPosition(position = 2)
    private String code;

    // Getters and setters

    public Integer getId() {
        return id;
    }

    public void setId(Integer id) {
        this.id = id;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public String getCode() {
        return code;
    }

    public void setCode(String code) {
        this.code = code;
    }

    @Override
    public String toString() {
        return "Country{" +
                "id=" + id +
                ", name='" + name + '\'' +
                ", code='" + code + '\'' +
                '}';
    }
}

合并数据

以下代码展示了如何使用 Java Stream 将城市和国家数据合并,并将国家名称添加到对应的城市对象中。

import java.util.Arrays;
import java.util.List;

public class DataMerger {

    public static void main(String[] args) {
        // 模拟从 CSV 文件读取数据
        List<Country> countries = Arrays.asList(
                new Country(100, "Germany", "DE"),
                new Country(105, "France", "FR"),
                new Country(108, "Denmark", "DK")
        );

        List<City> cities = Arrays.asList(
                new City(1, "Berlin", "DE"),
                new City(2, "Munich", "DE"),
                new City(3, "Köln", "DE"),
                new City(4, "Paris", "FR"),
                new City(5, "Kopenhag", "DK")
        );

        // 使用 Stream 合并数据
        cities.forEach(city -> city.setCountryName(countries.stream()
                .filter(country -> country.getCode().equals(city.getCountryCode()))
                .map(Country::getName)
                .findAny()
                .orElse(null)));

        // 打印合并后的结果
        cities.forEach(System.out::println);
    }
}

代码解释:

Vozo
Vozo

Vozo是一款强大的AI视频编辑工具,可以帮助用户轻松重写、配音和编辑视频。

下载

立即学习Java免费学习笔记(深入)”;

  1. 数据准备: 首先,模拟从 CSV 文件读取城市和国家数据。实际应用中,需要使用 CSV 解析库(如 opencsv)将 CSV 文件内容转换为 List 和 List
  2. Stream 处理:
    • 使用 cities.forEach() 遍历城市列表,保证处理顺序与城市列表一致。
    • 对于每个城市,使用 countries.stream() 创建一个国家数据流。
    • filter(country -> country.getCode().equals(city.getCountryCode())) 过滤国家数据流,只保留国家代码与城市国家代码匹配的国家。
    • map(Country::getName) 将过滤后的国家数据流映射为国家名称流。
    • findAny() 从国家名称流中找到任意一个国家名称。由于一个城市只对应一个国家,因此找到任意一个即可。
    • orElse(null) 如果找不到匹配的国家,则返回 null。
    • city.setCountryName(...) 将找到的国家名称设置到对应的城市对象中。
  3. 结果输出: 打印合并后的城市数据,包含国家名称。

输出结果:

City{id=1, name='Berlin', countryCode='DE', countryName='Germany'}
City{id=2, name='Munich', countryCode='DE', countryName='Germany'}
City{id=3, name='Köln', countryCode='DE', countryName='Germany'}
City{id=4, name='Paris', countryCode='FR', countryName='France'}
City{id=5, name='Kopenhag', countryCode='DK', countryName='Denmark'}

注意事项

  • 数据量: 如果城市和国家数据量非常大,上述方法可能会影响性能。可以考虑使用 HashMap 提前将国家代码和国家名称进行映射,以提高查找效率。
  • 异常处理: 在实际应用中,需要考虑 CSV 文件读取异常、数据格式错误等情况,并进行适当的异常处理。
  • 并发处理: 如果对性能要求较高,并且可以接受一定的顺序错乱,可以考虑使用并行流或 CompletableFuture 来加速数据合并过程。但需要仔细评估并发带来的复杂性,并确保线程安全。

总结

本文展示了如何使用 Java Stream 将从多个 CSV 文件读取的数据进行合并。通过 forEach 循环和 Stream 的 filter、map 等操作,可以方便地实现数据的关联和转换。在实际应用中,需要根据数据量、性能要求和并发情况选择合适的解决方案。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

253

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

1089

2024.03.01

php中foreach用法
php中foreach用法

本专题整合了php中foreach用法的相关介绍,阅读专题下面的文章了解更多详细教程。

245

2025.12.04

treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

548

2023.12.01

C++ 高效算法与数据结构
C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化,涵盖排序算法(快速排序、归并排序)、查找算法、图算法、动态规划、贪心算法等,并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构(链表、树、堆、哈希表等),帮助开发者提升 在复杂应用中的算法设计与性能优化能力。

30

2025.12.22

深入理解算法:高效算法与数据结构专题
深入理解算法:高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念,适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用,如数组、链表、栈、队列、哈希表、树、图等;以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析,帮助开发者不仅能熟练运用这些基础知识,还能在实际编程中优化性能,提高代码的执行效率。本专题适合准备面试的开发者,也适合希望提高算法思维的编程爱好者。

44

2026.01.06

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

764

2023.08.10

golang map内存释放
golang map内存释放

本专题整合了golang map内存相关教程,阅读专题下面的文章了解更多相关内容。

77

2025.09.05

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

4

2026.03.10

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.3万人学习

C# 教程
C# 教程

共94课时 | 11.1万人学习

Java 教程
Java 教程

共578课时 | 80.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号