浏览器用 DOMParser 解析 XML 最轻量,Node.js 需 fast-xml-parser;二者均需手动映射字段,注意空格、类型转换、命名空间及注释处理。

JavaScript 原生不提供 DOM 解析器直接解析 XML 字符串为可遍历的 XML 文档对象(像浏览器中 DOMParser 那样),但 Node.js 环境下必须借助第三方库;浏览器环境则可以直接用 DOMParser,但映射逻辑需手动编写,不能自动绑定字段。
浏览器中用 DOMParser 解析 XML 并提取数据
这是最轻量、无需安装依赖的方式,适用于前端加载配置、RSS、SOAP 响应等场景。注意它只在浏览器中可用,Node.js 会报 DOMParser is not defined。
-
DOMParser返回的是Document对象,不是 JSON,所有节点都得用getElementsByTagName、querySelector或getAttribute手动取值 - XML 命名空间(如
xmlns)会让getElementsByTagName失效,此时必须用getElementsByTagNameNS - 文本内容藏在
textContent或firstChild.nodeValue中,空格和换行也会被当作文本节点,容易误读
const xmlStr = ``; const parser = new DOMParser(); const xmlDoc = parser.parseFromString(xmlStr, "application/xml"); JS Guide Alex if (xmlDoc.querySelector("parsererror")) { console.error("XML parse error"); } else { const title = xmlDoc.querySelector("title")?.textContent || ""; const author = xmlDoc.querySelector("author")?.textContent || ""; console.log({ title, author }); // { title: "JS Guide", author: "Alex" } }
Node.js 中解析 XML 的可靠选择:使用 fast-xml-parser
Node.js 没有内置 DOMParser,xml2js 过于老旧且回调风格难维护,fast-xml-parser 是目前最接近“开箱即用”的方案——它能输出 JS 对象,支持属性、CDATA、命名空间,并可反向生成 XML。
- 默认不保留属性(如
中的id),需显式设置ignoreAttributes: false - 属性名默认带
@_前缀(如{"@_id": "123"}),可通过attributeNamePrefix: ""去掉 - 同名子元素多个时,默认转成数组;若只有一个,它默认不包数组——用
alwaysCreateTextNode: true或arrayMode: true统一行为
const { XMLParser } = require("fast-xml-parser");
const xmlStr = `- A
- B
`;
const parser = new XMLParser({
ignoreAttributes: false,
attributeNamePrefix: "",
isArray: (tagName) => tagName === "item",
});
const result = parser.parse(xmlStr);
// → { root: { item: [{ id: "101", "#text": "A" }, { id: "102", "#text": "B" }] } }
手动映射 XML 到 JS 对象时最容易漏掉的三件事
所谓“XML 映射”,本质是把树状结构按业务规则转成扁平或嵌套对象。很多开发者卡在这几步,不是库不行,而是没处理好语义边界。
本文档主要讲述的是使用JSON进行网络数据交换传输;JSON(JavaScript ObjectNotation)是一种轻量级的数据交换格式,易于阅读和编写,同时也易于机器解析和生成,非常适合于服务器与客户端的交互。JSON采用与编程语言无关的文本格式,但是也使用了类C语言的习惯,这些特性使JSON成为理想的数据交换格式。 和 XML 一样,JSON 也是基于纯文本的数据格式。由于 JSON 天生是为 JavaScript 准备的,因此,JSON的数据格式非常简单,您可以用 JSON 传输一个简单的 St
立即学习“Java免费学习笔记(深入)”;
- XML 元素可能为空标签(
)或只有空白字符,textContent会返回"\n \t",直接.trim()不够,建议用el.textContent?.replace(/\s+/g, " ").trim() - 数字、布尔值全为字符串,
不会自动转成42 42,需按 schema 显式转换,否则后续计算出错 - XML 注释(
)和处理指令()在DOMParser中是节点,但querySelector查不到,遍历时要用nodeType === 8(注释)或nodeType === 7(处理指令)过滤
映射的核心从来不在解析器选型,而在于你是否定义了字段语义:哪些是必填、哪些要转类型、哪些允许缺失、哪些需去重合并。XML 本身不带类型系统,这部分必须手写,绕不开。









