0

0

Java中将CSV数据转换为带属性的XML文件教程

聖光之護

聖光之護

发布时间:2025-10-05 10:10:14

|

189人浏览过

|

来源于php中文网

原创

Java中将CSV数据转换为带属性的XML文件教程

本文旨在指导开发者如何使用Java将CSV格式数据转换为包含属性而非子元素的XML文件。通过分析传统DOM解析方法的局限性,我们推荐并详细演示了基于JAXB(Java Architecture for XML Binding)的解决方案,该方案利用注解实现CSV数据到POJO对象的映射,进而高效生成符合特定属性格式要求的XML输出。

引言

在数据交换和存储中,csv(comma separated values)和xml(extensible markup language)是两种常见格式。有时,我们需要将结构化的csv数据转换为xml,并且要求csv的列数据在xml中以元素的属性(attributes)形式呈现,而非子元素(child elements)。例如,将如下csv数据:

Col1,Col2,Col3,Col4,Col5
All,0,,0,0
All,935,231,0,30
None,1011,257,0,30

转换为如下XML格式:



    
    
    

传统的基于DocumentBuilder和Transformer的DOM操作在处理将CSV列映射为XML属性时,往往需要更复杂的逻辑来手动创建和设置属性。当列数量增多或结构复杂时,这种方式会变得繁琐且易出错。为此,JAXB提供了一种更简洁、声明式的方法来解决这类问题。

传统DOM方法的局限性

原始的DOM操作代码示例尝试读取CSV文件,并为每一行创建一个元素,然后为每个CSV字段创建一个子元素。例如,它会生成:


    
        All
        0
        
        0
        0
    
    

这与我们期望的属性格式()不符。要通过DOM API实现属性,需要使用Element.setAttribute()方法,而非Element.appendChild(newDoc.createElement(fieldName))。手动管理这些细节会增加代码的复杂性。

立即学习Java免费学习笔记(深入)”;

推荐方案:使用JAXB进行CSV到XML属性转换

JAXB(Java Architecture for XML Binding)提供了一种将Java对象(POJO)与XML文档相互映射的机制。通过在POJO类上使用特定的注解,我们可以声明性地控制Java对象的哪些字段应映射为XML元素、哪些应映射为XML属性。

1. 定义POJO类

首先,我们需要定义两个POJO类:一个用于表示XML的根元素(),另一个用于表示每个数据行()。

一键职达
一键职达

AI全自动批量代投简历软件,自动浏览招聘网站从海量职位中用AI匹配职位并完成投递的全自动操作,真正实现'一键职达'的便捷体验。

下载

Root.java (用于表示XML的根元素)

import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlRootElement;
import java.util.ArrayList;
import java.util.List;

@XmlRootElement(name = "root") // 映射到XML的根元素 
public class Root {
    private List rows = new ArrayList<>();

    @XmlElement(name = "row") // 映射到XML的子元素 
    public List getRows() {
        return rows;
    }

    public void setRows(List rows) {
        this.rows = rows;
    }
}

RowData.java (用于表示XML的每一行 元素及其属性)

import javax.xml.bind.annotation.XmlAttribute;
import javax.xml.bind.annotation.XmlRootElement; // 也可以不加,因为它是作为Root的子元素

public class RowData {
    private String col1;
    private String col2;
    private String col3;
    private String col4;
    private String col5;

    // JAXB需要一个无参构造函数
    public RowData() {}

    public RowData(String col1, String col2, String col3, String col4, String col5) {
        this.col1 = col1;
        this.col2 = col2;
        this.col3 = col3;
        this.col4 = col4;
        this.col5 = col5;
    }

    @XmlAttribute(name = "col1") // 映射到XML属性 col1
    public String getCol1() { return col1; }
    public void setCol1(String col1) { this.col1 = col1; }

    @XmlAttribute(name = "Col2") // 映射到XML属性 Col2 (注意大小写与期望输出一致)
    public String getCol2() { return col2; }
    public void setCol2(String col2) { this.col2 = col2; }

    @XmlAttribute(name = "Col3") // 映射到XML属性 Col3
    public String getCol3() { return col3; }
    public void setCol3(String col3) { this.col3 = col3; }

    @XmlAttribute(name = "Col4") // 映射到XML属性 Col4
    public String getCol4() { return col4; }
    public void setCol4(String col4) { this.col4 = col4; }

    @XmlAttribute(name = "Col5") // 映射到XML属性 Col5
    public String getCol5() { return col5; }
    public void setCol5(String col5) { this.col5 = col5; }
}

注解说明:

  • @XmlRootElement(name = "root"): 标记一个类为XML文档的根元素,并指定其名称。
  • @XmlElement(name = "row"): 标记一个字段或方法为XML元素,并指定其名称。在这里,它告诉JAXB Root 类的 rows 列表中的每个 RowData 对象都应被序列化为 元素。
  • @XmlAttribute(name = "col1"): 标记一个字段或方法为XML属性,并指定其名称。这是实现CSV列到XML属性转换的关键。

2. 实现CSV解析和JAXB转换逻辑

接下来,我们将编写一个方法来读取CSV文件,将每一行数据解析并填充到 RowData 对象中,最后使用JAXB将这些对象集合转换为XML文件。

import javax.xml.bind.JAXBContext;
import javax.xml.bind.Marshaller;
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.File;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

public class CsvToXmlConverter {

    public void convertCsvToXmlWithAttributes(String csvFileName, String xmlFileName, String delimiter) {
        try {
            // 1. 读取CSV文件并解析数据
            List rowDataList = new ArrayList<>();
            try (BufferedReader csvReader = new BufferedReader(new FileReader(csvFileName))) {
                String line;
                boolean isFirstLine = true; // 用于跳过CSV头行

                while ((line = csvReader.readLine()) != null) {
                    if (isFirstLine) {
                        isFirstLine = false;
                        // 假设CSV文件的第一行是标题,我们跳过它
                        // 如果CSV文件没有标题行,请移除此if块
                        continue;
                    }

                    String[] fields = line.split(delimiter, -1); // -1 参数保留空字符串

                    // 确保字段数量与POJO的属性数量匹配
                    if (fields.length == 5) {
                        RowData row = new RowData(
                            fields[0], fields[1], fields[2], fields[3], fields[4]
                        );
                        rowDataList.add(row);
                    } else {
                        System.err.println("警告: CSV行字段数量不匹配,跳过此行: " + line);
                    }
                }
            }

            // 2. 将解析后的数据封装到根对象中
            Root root = new Root();
            root.setRows(rowDataList);

            // 3. 使用JAXB进行对象到XML的转换(Marshalling)
            JAXBContext jaxbContext = JAXBContext.newInstance(Root.class);
            Marshaller jaxbMarshaller = jaxbContext.createMarshaller();

            // 设置JAXB Marshaller的属性
            jaxbMarshaller.setProperty(Marshaller.JAXB_FORMATTED_OUTPUT, true); // 格式化输出,使其可读
            jaxbMarshaller.setProperty(Marshaller.JAXB_ENCODING, "UTF-8");      // 设置编码

            // 将对象写入XML文件
            jaxbMarshaller.marshal(root, new File(xmlFileName));

            System.out.println("CSV文件 '" + csvFileName + "' 已成功转换为XML文件 '" + xmlFileName + "'。");

        } catch (IOException e) {
            System.err.println("文件操作异常: " + e.getMessage());
            e.printStackTrace();
        } catch (Exception e) {
            System.err.println("JAXB转换或未知异常: " + e.getMessage());
            e.printStackTrace();
        }
    }

    public static void main(String[] args) {
        // 创建一个示例CSV文件
        String csvContent = "Col1,Col2,Col3,Col4,Col5\n" +
                            "All,0,,0,0\n" +
                            "All,935,231,0,30\n" +
                            "None,1011,257,0,30";
        String csvFileName = "input.csv";
        String xmlFileName = "output.xml";
        String delimiter = ",";

        try {
            java.nio.file.Files.write(java.nio.file.Paths.get(csvFileName), csvContent.getBytes());
            System.out.println("示例CSV文件 '" + csvFileName + "' 已创建。");
        } catch (IOException e) {
            System.err.println("创建示例CSV文件失败: " + e.getMessage());
            return;
        }

        CsvToXmlConverter converter = new CsvToXmlConverter();
        converter.convertCsvToXmlWithAttributes(csvFileName, xmlFileName, delimiter);
    }
}

要运行此代码,您可能需要确保您的Java环境支持JAXB。 对于Java 9及更高版本,JAXB API已从JDK中移除,需要手动添加Maven/Gradle依赖:



    jakarta.xml.bind
    jakarta.xml.bind-api
    2.3.3 


    org.glassfish.jaxb
    jaxb-runtime
    2.3.3 
    runtime

3. 运行结果

执行 main 方法后,将生成 output.xml 文件,其内容将严格按照我们期望的属性格式:



    
    
    

注意事项与最佳实践

  1. 错误处理: 在实际应用中,需要对文件I/O、CSV解析(例如,行字段数量不一致、数据类型转换失败)和JAXB操作进行更健壮的异常处理。
  2. CSV解析: 示例代码使用了 String.split() 方法,这对于简单的CSV文件足够。对于包含逗号、引号等复杂情况的CSV,推荐使用专业的CSV解析库,如 Apache Commons CSV 或 OpenCSV,它们能更好地处理各种CSV格式规范。
  3. 性能与内存: JAXB在转换时通常会将整个对象图加载到内存中。对于非常大的CSV文件,这可能会导致内存问题。在这种情况下,可以考虑使用流式XML写入(如StAX或SAX),但这会增加代码的复杂性,需要手动管理属性的写入。
  4. JAXB版本: 确保您的Java环境与JAXB库版本兼容。如前所述,Java 9+ 需要额外的JAXB运行时依赖。
  5. XML命名规范: CSV列名可能不总是符合XML属性的命名规范(例如,不能以数字开头,不能包含某些特殊字符)。在POJO中通过 @XmlAttribute(name = "...") 指定属性名时,可以进行必要的映射和清理。

总结

通过JAXB提供的注解机制,我们可以以声明式的方式将Java对象映射到XML结构,包括将对象的字段映射为XML元素的属性。这种方法比手动使用DOM API创建和设置属性更为简洁、高效且易于维护,特别适用于将CSV数据转换为具有特定属性结构的XML文件。理解并熟练运用JAXB,能够极大地简化Java中XML数据处理的开发工作。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Java Maven专题
Java Maven专题

本专题聚焦 Java 主流构建工具 Maven 的学习与应用,系统讲解项目结构、依赖管理、插件使用、生命周期与多模块项目配置。通过企业管理系统、Web 应用与微服务项目实战,帮助学员全面掌握 Maven 在 Java 项目构建与团队协作中的核心技能。

0

2025.09.15

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

308

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

222

2025.10.31

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

422

2023.08.02

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1897

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2091

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1056

2024.11.28

C++类型转换方式
C++类型转换方式

本专题整合了C++类型转换相关内容,想了解更多相关内容,请阅读专题下面的文章。

299

2025.07.15

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

10

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.9万人学习

C# 教程
C# 教程

共94课时 | 7.7万人学习

Java 教程
Java 教程

共578课时 | 51.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号