0

0

DOM4J是什么 如何用它在Java中灵活地解析XML

畫卷琴夢

畫卷琴夢

发布时间:2026-02-02 09:45:45

|

187人浏览过

|

来源于php中文网

原创

DOM4J 是需显式引入的 Java 开源 XML 库,以简洁 API 支持读取、XPath 查询、动态修改和格式化输出,但需注意编码设置、命名空间处理、依赖冲突及安全配置等细节。

dom4j是什么 如何用它在java中灵活地解析xml

DOM4J 是一个 Java 平台下功能强大、性能良好且 API 友好的开源 XML 处理库,它不是 JDK 内置类,需显式引入依赖。它的核心价值不在于“能不能解析 XML”,而在于“如何用最少代码、最直观方式完成常见 XML 操作”——比如读取特定节点、按条件筛选、动态修改结构、或与 XPath 高度集成。

DOM4J 的定位很清晰:比原生 DOM 更轻量,比 SAX 更易用,比 JDOM 更活跃(尤其在老项目中仍广泛存在)。 它对中文字符、命名空间、大文件流式处理的支持也相对成熟,但要注意——它默认不开启 DTD 或 XSD 验证,若 XML 含外部实体或恶意引用,需手动禁用。

如何添加 dom4j 依赖并避免常见 classpath 错误

使用 Maven 时,推荐用最新稳定版(截至 2024 年主流是 2.1.4),注意不要混用旧版(如 1.6.1)和新包名冲突的 snapshot 版本:


  org.dom4j
  dom4j
  2.1.4

常见错误包括:

  • 仅加了 dom4j.jar 却没带 jaxen(XPath 支持依赖),导致 document.selectNodes("//item")NoClassDefFoundError: org/jaxen/JaxenException
  • Spring Boot 2.5+ 项目中,若已引入 spring-boot-starter-web,其内嵌的 xmlpullxpp3 可能与 dom4j 冲突,建议排除:xpp3
  • Android 项目慎用——dom4j 依赖部分 Java SE 类(如 javax.xml.parsers.DocumentBuilder),在低版本 Android 上会 ClassNotFound

用 SAXReader 快速加载 XML 并安全处理编码与异常

SAXReader 是 dom4j 最常用的入口类,但它不是 SAX 实现,而是封装了底层解析器(默认用 Xerces)。关键点在于:它默认按系统编码读取,遇到 UTF-8 BOM 或 GBK 文件极易乱码。

正确做法是显式指定输入源和编码:

立即学习Java免费学习笔记(深入)”;

SAXReader reader = new SAXReader();
reader.setEncoding("UTF-8"); // 必须在 read() 前设置
Document doc = reader.read(new FileInputStream("config.xml")); // 不推荐:未指定编码
// 推荐写法:
Document doc = reader.read(new InputSource(new FileInputStream("config.xml")) {{
    setEncoding("UTF-8");
}});

更健壮的方式是用 InputStreamReader 包装:

try (InputStream is = getClass().getResourceAsStream("/data.xml");
     Reader readerStream = new InputStreamReader(is, StandardCharsets.UTF_8)) {
    Document doc = new SAXReader().read(readerStream);
}

注意:SAXReader.read(File) 会自动探测编码(依赖文件 BOM),但不可靠;read(String)(路径字符串)默认用系统编码,Windows 上极易出错。

用 XPath 提取节点时绕开命名空间陷阱

XML 带命名空间(如 )时,直接写 //item 会返回空列表——这是 dom4j 用户最常卡住的点。

简单AI
简单AI

搜狐推出的AI图片生成社区

下载

解决方法有两种:

  • 注册命名空间前缀:Map nsMap = Map.of("r", "http://purl.org/rss/1.0/"); doc.valueOf("//r:item/title", nsMap);
  • 忽略命名空间(适合只读场景):reader.setFeature("http://apache.org/xml/features/nonvalidating/load-external-dtd", false); reader.setFeature("http://xml.org/sax/features/namespaces", false);

另外,selectSingleNode() 返回 Node,需强转为 Element 才能调用 getText();而 valueOf() 直接返回字符串,更安全:

// ❌ 危险:可能 NPE
String title = ((Element) doc.selectSingleNode("//item/title")).getText();

// ✅ 推荐
String title = doc.valueOf("//item/title"); // 空路径返回空字符串,不抛 NPE

修改 XML 结构后写回文件的注意事项

dom4j 修改文档后,用 XMLWriter 输出时,默认不缩进、不换行、不声明编码,生成的 XML 难以调试。

要输出可读格式,必须配置 OutputFormat

OutputFormat format = OutputFormat.createPrettyPrint();
format.setEncoding("UTF-8");
format.setIndentSize(2);
try (XMLWriter writer = new XMLWriter(new FileWriter("output.xml"), format)) {
    writer.write(doc);
}

容易忽略的点:

  • format.setNewLineAfterDeclaration(true) 控制是否在 后换行
  • 若 XML 中有 CDATA 段,需设 format.setExpandEmptyElements(false),否则 可能被改写成 (看似一样,但某些解析器对空格敏感)
  • 写入时若目标文件被其他进程占用,FileWriter 默认覆盖而非报错,建议先 Files.deleteIfExists(Paths.get("output.xml"))
DOM4J 的灵活性体现在它把“解析”“查询”“修改”“输出”四步拆得足够细,但每一步都藏着默认行为陷阱——编码、命名空间、空元素处理、异常边界,这些细节不主动控制,就容易在上线后突然失败。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
spring框架介绍
spring框架介绍

本专题整合了spring框架相关内容,想了解更多详细内容,请阅读专题下面的文章。

117

2025.08.06

Java Spring Security 与认证授权
Java Spring Security 与认证授权

本专题系统讲解 Java Spring Security 框架在认证与授权中的应用,涵盖用户身份验证、权限控制、JWT与OAuth2实现、跨站请求伪造(CSRF)防护、会话管理与安全漏洞防范。通过实际项目案例,帮助学习者掌握如何 使用 Spring Security 实现高安全性认证与授权机制,提升 Web 应用的安全性与用户数据保护。

68

2026.01.26

spring boot框架优点
spring boot框架优点

spring boot框架的优点有简化配置、快速开发、内嵌服务器、微服务支持、自动化测试和生态系统支持。本专题为大家提供spring boot相关的文章、下载、课程内容,供大家免费下载体验。

135

2023.09.05

spring框架有哪些
spring框架有哪些

spring框架有Spring Core、Spring MVC、Spring Data、Spring Security、Spring AOP和Spring Boot。详细介绍:1、Spring Core,通过将对象的创建和依赖关系的管理交给容器来实现,从而降低了组件之间的耦合度;2、Spring MVC,提供基于模型-视图-控制器的架构,用于开发灵活和可扩展的Web应用程序等。

392

2023.10.12

Java Spring Boot开发
Java Spring Boot开发

本专题围绕 Java 主流开发框架 Spring Boot 展开,系统讲解依赖注入、配置管理、数据访问、RESTful API、微服务架构与安全认证等核心知识,并通过电商平台、博客系统与企业管理系统等项目实战,帮助学员掌握使用 Spring Boot 快速开发高效、稳定的企业级应用。

70

2025.08.19

Java Spring Boot 4更新教程_Java Spring Boot 4有哪些新特性
Java Spring Boot 4更新教程_Java Spring Boot 4有哪些新特性

Spring Boot 是一个基于 Spring 框架的 Java 开发框架,它通过 约定优于配置的原则,大幅简化了 Spring 应用的初始搭建、配置和开发过程,让开发者可以快速构建独立的、生产级别的 Spring 应用,无需繁琐的样板配置,通常集成嵌入式服务器(如 Tomcat),提供“开箱即用”的体验,是构建微服务和 Web 应用的流行工具。

37

2025.12.22

Java Spring Boot 微服务实战
Java Spring Boot 微服务实战

本专题深入讲解 Java Spring Boot 在微服务架构中的应用,内容涵盖服务注册与发现、REST API开发、配置中心、负载均衡、熔断与限流、日志与监控。通过实际项目案例(如电商订单系统),帮助开发者掌握 从单体应用迁移到高可用微服务系统的完整流程与实战能力。

209

2025.12.24

Java Maven专题
Java Maven专题

本专题聚焦 Java 主流构建工具 Maven 的学习与应用,系统讲解项目结构、依赖管理、插件使用、生命周期与多模块项目配置。通过企业管理系统、Web 应用与微服务项目实战,帮助学员全面掌握 Maven 在 Java 项目构建与团队协作中的核心技能。

0

2025.09.15

go语言 注释编码
go语言 注释编码

本专题整合了go语言注释、注释规范等等内容,阅读专题下面的文章了解更多详细内容。

61

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 3.1万人学习

C# 教程
C# 教程

共94课时 | 8.3万人学习

Java 教程
Java 教程

共578课时 | 55.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号