XML转扁平JSON首选xml2js(ignoreAttrs: true),禁用JSON.stringify(XMLDocument);复杂场景用fast-xml-parser;浏览器端可DOM API应急但限制多。

XML字符串直接转为扁平JSON对象(无嵌套)
如果XML结构简单、没有重复标签、不关心属性和文本混合,xml2js 的默认解析器配合 ignoreAttrs: true 和 mergeAttrs: false 是最轻量的路径。它把每个元素转成键值对,值是其文本内容,忽略所有属性。
常见错误:直接用 JSON.stringify(xmlDoc) —— 浏览器原生 XMLDocument 对象不能这样序列化,会得到空对象或报错 TypeError: Converting circular structure to JSON。
- 适用场景:配置文件、单层API响应(如
)ok 200 - 不适用:含同名子节点(如多个
)、含属性()、含 CDATA 或注释 - 性能影响:小XML(xml2js.Parser({ async: true }))
保留属性和文本内容的通用映射(推荐默认方案)
真实XML往往含属性(id、type)和混合内容(文本+子节点),此时必须区分 #text 和 @attributes。用 xml2js 配置 explicitArray: false 和 explicitChildren: true 可避免冗余数组包装,让结构更贴近直觉。
const xml2js = require('xml2js');
const parser = new xml2js.Parser({
explicitArray: false,
explicitChildren: true,
childkey: '$',
charsAsChildren: true,
mergeAttrs: true
});
// 输入:Tom 30
// 输出:{ user: { $: { id: "123" }, name: "Tom", age: "30" } }
关键点:
-
$键固定存放属性(由childkey: '$'指定),避免与子元素名冲突 -
charsAsChildren: true确保纯文本节点也作为子项出现,否则顶层文本会被丢弃 - 若XML有多个同名子节点(如
),- A
- B
explicitArray: false会把它变成对象而非数组 —— 这是坑,需手动检测类型再归一化
处理重复子节点( 多次出现)
XML中重复标签是常见痛点:xml2js 默认把多个 合并为一个对象(只保留最后一个),除非启用 explicitArray: true。但开启后所有子节点都变数组,哪怕只有一个 —— 不够干净。
折中做法:保持 explicitArray: false,解析后递归扫描值是否为数组,对已知重复标签(如 item、entry)做后处理:
PageAdmin企业网站管理系统V4.0,基于微软最新的MVC框架全新开发,强大的后台管理功能,良好的用户操作体验,可热插拔的插件功能让扩展更加灵活和开放,全部信息表采用自定义表单,可任意自定义扩展字段,支持一对一,一对多的表映射.....各种简单到复杂的网站都可以轻松应付。 PageAdmin V4.0.25更新日志: 1、重写子栏目功能,解决之前版本子栏目数据可能重复的问题 2
function normalizeRepeated(obj, keys = ['item', 'entry']) {
if (obj == null || typeof obj !== 'object') return obj;
for (const key of keys) {
if (Array.isArray(obj[key])) continue;
if (obj[key] !== undefined && !Array.isArray(obj[key])) {
obj[key] = [obj[key]];
}
}
Object.keys(obj).forEach(k => obj[k] = normalizeRepeated(obj[k], keys));
return obj;
}
注意:
- 必须在
parser.parseString回调里调用,不能对原始XML字符串操作 - 如果XML层级深且重复标签多,此函数需加循环深度限制,否则栈溢出
-
浏览器端可用
fast-xml-parser替代,它原生支持ignoreAttributes: false+arrayMode: 'strict',无需后处理
浏览器环境零依赖方案(仅限简单XML)
不想引入 xml2js 或 fast-xml-parser?DOM API 可应急,但仅适用于格式良好、无命名空间、无DOCTYPE 声明的XML字符串。
步骤:用 DOMParser 解析 → 递归遍历 Element 节点 → 手动构造JSON对象。核心逻辑如下:
function xmlToJSON(xmlStr) {
const doc = new DOMParser().parseFromString(xmlStr, 'application/xml');
if (doc.querySelector('parsererror')) throw new Error('Invalid XML');
function walk(node) {
if (node.nodeType !== Node.ELEMENT_NODE) return null;
const obj = {};
// 属性
for (let attr of node.attributes) {
obj['@' + attr.name] = attr.value;
}
// 子节点文本或元素
let children = Array.from(node.childNodes)
.map(n => n.nodeType === Node.TEXT_NODE ? n.textContent.trim() : walk(n))
.filter(x => x != null && x !== '');
if (children.length === 0) {
// 纯空元素,返回 null 或 '',按需调整
return obj;
}
if (children.length === 1 && typeof children[0] === 'string') {
obj['#text'] = children[0];
} else {
Object.assign(obj, Object.assign({}, ...children));
}
return { [node.nodeName]: obj };
}
return walk(doc.documentElement);
}
限制明显:
- 无法处理命名空间(
会被当成ns:item键名) - 属性名加
@前缀是惯例,但和xml2js的$不兼容,跨环境需统一约定 - 遇到
时,textContent会包含字符串,需正则清洗
真正复杂或高频的XML/JSON互转,别省那几十KB包体积——选 fast-xml-parser,它的 parse 方法默认就处理重复标签、属性、CDATA 和注释,且无依赖、TypeScript友好。手写解析器容易在边缘情况翻车,比如自闭合标签 或带前导空格的文本节点。









