Java如何读取XML配置文件_DOM与SAX解析方法对比

P粉602998670

发布时间：2026-03-16 15:40:03

839人浏览过

来源于php中文网

原创

DOM适合小文件但内存占用高，超5MB易OOM；SAX内存恒定但逻辑复杂需手动维护上下文；读取时须显式指定UTF-8编码并优先用ClassLoader加载资源。

java如何读取xml配置文件_dom与sax解析方法对比

DOM解析适合小文件但内存吃紧

DOM会把整个XML加载进内存构建成树状结构，读取快、支持随机访问，但文件稍大（比如超过5MB）就容易触发OutOfMemoryError。你改配置时手动加了个几百行的<bean>块，重启后服务起不来——八成是DOM撑爆堆了。

用DocumentBuilder.parse()前务必设好DocumentBuilderFactory.setFeature("http://apache.org/xml/features/disallow-doctype-decl", true)，否则XML外部实体（XXE）漏洞直接暴露
别对生产环境的application-config.xml无脑用DOM，尤其当它被多个模块include或动态生成时
getElementsByTagName("property")返回的是动态NodeList，循环里删节点要倒序遍历，不然漏处理

SAX解析不占内存但逻辑绕

SAX是事件驱动，边读边触发startElement()、characters()这些回调，内存几乎恒定，但没法回退、不能查父节点——你找<datasource url="...">时，得自己用栈记url在哪个<datasource>下，稍不留神就配错库。

必须重写DefaultHandler.startElement()和endElement()，characters()拿到的文本前后常带换行/空格，要用trim()再判断
如果XML里有<value>${db.host}</value>这类占位符，SAX不会自动展开，得自己集成PropertyPlaceholderConfigurer逻辑
遇到SAXParseException: Element type "xxx" must be declared，基本是DTD或XSD校验开着，关掉setValidating(false)就行

Java原生API读取时路径和编码最易翻车

用FileInputStream读config.xml，本地跑得好好的，扔到Linux服务器就报Invalid byte 1 of 1-byte UTF-8 sequence——八成是Windows下存的GBK编码文件，没指定InputStreamReader编码。

绝对别用new FileInputStream("conf/config.xml")，优先走ClassLoader.getResourceAsStream("config.xml")，避免路径硬编码
DOM/SAX都得包一层InputStreamReader，显式传StandardCharsets.UTF_8，别信System.getProperty("file.encoding")
如果XML声明是<?xml version="1.0" encoding="GBK"?>，而你用UTF-8读，characters()回调里的字符串直接乱码，且无法恢复

Spring的XmlBeanDefinitionReader其实默认用SAX

你以为ClassPathXmlApplicationContext在后台默默用DOM？其实它委托给XmlBeanDefinitionReader，底层调的是SAXParser——只是把事件解析结果缓存成BeanDefinition对象，对你屏蔽了回调细节。所以你自定义BeanFactoryPostProcessor去改XML配置时，别试图去操作Document对象，那根本不是它用的模型。

Seed-Music

字节跳动推出的AI音乐生成与编辑工具

下载

立即学习“Java免费学习笔记（深入）”；

想干预解析过程，该重写EntityResolver.resolveEntity()来拦截spring-beans.dtd等远程引用，而不是去动DocumentBuilder
XmlBeanDefinitionReader.setValidationMode(XmlBeanDefinitionReader.VALIDATION_NONE)能跳过DTD校验，比关SAX的setValidating更精准
如果你的XML里混用了<import resource="xxx.xml"/>，注意ResourcePatternResolver默认只扫classpath*:，file:路径得自己注册UrlResource

DOM和SAX不是非此即彼的选择，而是看住你的XML有多大、谁在改它、出错时能不能快速定位到那一行——很多时候，先用head -n 50 config.xml瞄一眼文件头，比翻API文档管用。

Java中的标记接口是什么_Serializable与Cloneable的底层检测机制

如何在Java中使用ForkJoinTask处理海量数据累加_RecursiveTask与RecursiveAction拆分实战

什么是Java中的组合优于继承原则_降低类耦合度的设计模式实践

Java中如何将对象数组转为字符串_Arrays.toString与deepToString

Java中的ThreadLocal怎么用_线程本地变量隔离防串数据的实战指南

相关标签:

java spring Resource include xml 字符串循环栈堆 Property 委托对象事件 dom windows apache http linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在Java中定义泛型类和泛型方法_T与E占位符的基础用法下一篇：暂无

作者最新文章

mysql如何给用户分配表权限_mysql表级权限配置

2026-03-16 15:36

爱奇艺怎么领取会员_爱奇艺免费会员活动

2026-03-16 15:36

如何分析AWR中的In-Memory指标_列存数据装载与查询命中率评估

2026-03-16 15:37

宝塔面板如何配置网站的SSI指令？在宝塔面板开启服务器端包含功能

2026-03-16 15:37

如何在Golang中编写高性能的测试桩 Go语言Stub模式进阶应用

2026-03-16 15:38

如何在Golang中实现一个简单的对象存储前端接口

2026-03-16 15:38

如何在宝塔面板中设置定期清理PHP运行产生的Session文件？

2026-03-16 15:38

如何在Golang中减少内存分配Allocations Go语言零拷贝Zero Copy技术

2026-03-16 15:39

如何在Java中定义泛型类和泛型方法_T与E占位符的基础用法

2026-03-16 15:40

Java如何读取XML配置文件_DOM与SAX解析方法对比

2026-03-16 15:40

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

spring框架介绍

本专题整合了spring框架相关内容，想了解更多详细内容，请阅读专题下面的文章。

161

2025.08.06

Java Spring Security 与认证授权

本专题系统讲解 Java Spring Security 框架在认证与授权中的应用，涵盖用户身份验证、权限控制、JWT与OAuth2实现、跨站请求伪造（CSRF）防护、会话管理与安全漏洞防范。通过实际项目案例，帮助学习者掌握如何使用 Spring Security 实现高安全性认证与授权机制，提升 Web 应用的安全性与用户数据保护。

2026.01.26