0

0

Java XMLInputFactory createXMLStreamReader StAX读取XML流

幻夢星雲

幻夢星雲

发布时间:2026-02-14 08:11:03

|

375人浏览过

|

来源于php中文网

原创

xmlstreamreader默认停在xml声明处,需调用nexttag()跳过空白和声明直达根节点;inputstream须全程有效,编码声明须与字节一致,且需禁用dtd和外部实体以防阻塞。

java xmlinputfactory createxmlstreamreader stax读取xml流

XMLInputFactory.createXMLStreamReader 读不到根节点?

不是工厂没创建成功,而是默认跳过了空白和声明——XMLInputFactory 创建的 XMLStreamReader 默认不自动推进到第一个元素节点,你调用 next()nextTag() 前,游标还停在 XML 声明或文档开头。

  • nextTag() 替代 next(),它会自动跳过 COMMENTSPACEPROCESSING_INSTRUCTION,直奔下一个 START_ELEMENT
  • 如果 XML 没有声明(比如纯片段),next() 可能直接返回 START_ELEMENT;但只要有 <?xml version="1.0"?>,就必须先跳过
  • 别依赖 getEventType() == XMLStreamConstants.START_DOCUMENT 来判断是否就绪——它只在最开始出现一次,之后游标移动就失效

InputStream 被提前关闭导致 Stream closed 异常

createXMLStreamReader(InputStream) 不会复制字节流,只是持有引用。一旦你在外层关了 InputStream,再调用 next() 就抛 java.io.IOException: Stream closed

  • 确保 InputStream 生命周期覆盖整个 XMLStreamReader 遍历过程,别在 try-with-resources 里只包住 factory 创建那行
  • 推荐把 InputStreamXMLStreamReader 放进同一个 try-with-resources,但得手动实现 AutoCloseable 包装器,或者改用 File/URL 重载方法(它们内部会管理流)
  • 测试时用 new ByteArrayInputStream(xmlBytes) 最安全,避免文件句柄干扰

中文乱码或解析失败:encoding 声明和实际字节不匹配

StAX 解析器严格按 XML 声明里的 encoding 解码字节流。如果声明写 encoding="UTF-8" 但传入的是 GBK 字节,会抛 javax.xml.stream.XMLStreamException: Invalid byte 2 of 3-byte UTF-8 sequence

HaloTool
HaloTool

AI工具在线集合网站

下载
  • 优先让源头输出真实 UTF-8 字节,并确保 XML 声明中 encoding="UTF-8" 存在且拼写正确(大小写敏感)
  • 不要靠 InputStreamReader 转码再塞给 createXMLStreamReader——XMLStreamReader 不接受 Reader,且 StAX 要求原始字节流才能识别 BOM 和声明
  • 实在要处理非 UTF-8 源头,先用对应编码读成字符串,再用 String.getBytes(StandardCharsets.UTF_8) 转,同时把 XML 声明中的 encoding 替换为 UTF-8

性能卡在 next() 上?检查是否启用了 DTD 或外部实体

默认情况下 XMLInputFactory 允许解析 DTD 和外部实体,遇到 /code> 或 <code>&xxx; 实体时可能触发网络请求或本地文件读取,造成阻塞甚至 XXE 漏洞。

立即学习Java免费学习笔记(深入)”;

  • 必须禁用:factory.setProperty("javax.xml.stream.isSupportingExternalEntities", false)
  • 同时设 factory.setProperty("javax.xml.stream.supportDTD", false),否则即使没 DTD 声明,某些老 JDK 版本仍会尝试预加载
  • 如果 XML 确实含合法实体(如  ),改用字符引用   或预处理替换掉 & 开头的非法实体

StAX 的轻量优势全建立在“你控制底层字节流 + 显式推进游标”上。一旦漏掉 nextTag()、提前关流、编码错位或放任 DTD,它就从快变成谜。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

730

2023.08.02

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1927

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2102

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1120

2024.11.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

531

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

214

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1552

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

640

2023.11.24

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

23

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 3.5万人学习

C# 教程
C# 教程

共94课时 | 9.4万人学习

Java 教程
Java 教程

共578课时 | 65.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号