Python怎么把XML扁平化处理

煙雲

发布时间：2026-02-06 13:05:03

962人浏览过

来源于php中文网

原创

Python XML扁平化核心是递归遍历+路径拼接生成键值对，常用xml.etree.ElementTree（轻量）或lxml（支持命名空间/CData），亦可用pandas.read_xml处理表格型XML。

python怎么把xml扁平化处理

Python把XML扁平化，核心是把嵌套的树状结构转成一维的键值对（如字典或列表），常用方法是递归遍历+路径拼接。关键在于如何定义“扁平化”——多数场景指生成形如 {"root.child.grandchild": "value"} 的结构，或带类型/属性信息的展平结果。

用xml.etree.ElementTree递归提取（轻量、标准库）

适合结构较规则、不需保留命名空间或复杂属性的XML。思路是深度优先遍历，用点号连接路径，遇到文本内容就存入字典：

跳过纯空白文本和注释节点
对同一层级多个同名子元素，可加序号后缀（如 "items.item.0.name"）避免覆盖
若需保留属性，可拼在路径末尾（如 "div.@class"）或单独存为 "div.attr.class"

示例代码片段：

import xml.etree.ElementTree as ET
def flatten_xml(element, path="", result=None):
if result is None:
result = {}
当前路径（去掉开头的点）
current_path = f"{path}.{element.tag}" if path else element.tag
# 存文本内容（非None且非空白）
if element.text and element.text.strip():
    result[current_path] = element.text.strip()
# 处理属性
for k, v in element.attrib.items():
    result[f"{current_path}.@{k}"] = v
# 递归子元素
for child in element:
    flatten_xml(child, current_path, result)
return result
tree = ET.fromstring("12")
print(flatten_xml(tree))
输出：{'root.a': '1', 'root.b.c': '2', 'root.b.c.@attr': 'x'}用lxml增强处理（支持命名空间、XPath、更健壮）
当XML含命名空间、CDATA、混合内容或需按条件筛选时，lxml 更可靠。它提供 iter()、XPath 和 getchildren() 等灵活接口：
立即学习“Python免费学习笔记（深入）”；

							
								
								
									Pebblely
									AI产品图精美背景添加
								
								下载 
							
						

用 etree.XPath 提前获取所有含文本的叶子节点，再反推路径
通过 node.getparent() 向上追溯，构造完整路径
对命名空间，注册前缀后使用 {http://ns}tag 或用 namespaces 参数

用pandas.read_xml（适合表格型XML）
如果XML本质是二维数据（如Excel导出、RSS条目、配置列表），直接用 pandas.read_xml() 最省事。它能自动识别重复标签为行，属性转列为列：

指定 xpath 定位记录节点（如 "//item"）
用 attrs 参数声明哪些属性要提升为列
结果是DataFrame，天然“扁平”，可直接导出CSV/Excel

例如：pd.read_xml("data.xml", xpath="//product", attrs=["id", "category"])
注意事项与边界情况
扁平化不是万能转换，需提前明确需求：

父子同名标签（如 ...）必须用索引或上下文区分，否则丢失结构
文本与子元素混用（mixed content）时，element.text 只返回第一个文本块，后续需遍历 element.itertext()

空元素（）或只有属性无文本的节点，需主动存空字符串或None，避免漏项

Office Open XML是什么如何用它来操作Word和Excel文档

XML Schema (XSD)在数据映射中的作用是什么？

Excel的XLSX文件内部XML结构是什么

XML文件怎么导入到Excel XML数据导入表格教程

在VBA中怎么处理XML文件 Excel VBA解析XML

相关标签:

excel python node go csv xml处理键值对标准库 pandas print 命名空间 xml 字符串递归接口 class http excel

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何用程序自动生成XSD文件下一篇：暂无

作者最新文章

三角洲行动如何分辨AI和真人玩家行为特征与索敌技巧

2026-02-06 09:43

c#学习路线图 2025最新

2026-02-06 09:46

PHP DOMDocument怎么格式化保存XML

2026-02-06 09:48

1公担等于多少斤？农业粮食收购重量单位换算

2026-02-06 10:07

eclipse中建立jsp文件_在src/main/webapp目录下的正确位置创建

2026-02-06 10:11

考研帮专业课资料怎么找考研帮搜索特定专业课资源全攻略【方法】

2026-02-06 10:31

C#文件操作权限检查 C#如何判断当前用户是否有权读写文件

2026-02-06 10:33

ASP.NET Core文件上传 C#如何实现Web API文件上传

2026-02-06 10:34

C#解析上传的XML文件 XmlDocument如何加载Stream

2026-02-06 10:38

1夸脱等于多少升 1夸脱是多少毫升

2026-02-06 10:39

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容，供大家免费下载体验。

190

2023.09.27

python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容，阅读专题下面的文章了解更多详细教程。

2026.02.03

pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法：1. 使用在线转换器；2. 使用桌面软件（如 adobe acrobat、itext）；3. 使用命令行工具（如 pdftoxml）。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1914

2024.04.01

xml怎么变成word

步骤：1. 导入 xml 文件；2. 选择 xml 结构；3. 映射 xml 元素到 word 元素；4. 生成 word 文档。提示：确保 xml 文件结构良好，并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容，可以阅读本专题下面的文章。

2097

2024.08.01

xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言，标准通用标记语言的子集，是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容，可阅读本专题下面的相关文章。

1100

2024.11.28

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

402

2023.08.03

1688阿里巴巴货源平台入口与批发采购指南

本专题整理了1688阿里巴巴批发进货平台的最新入口地址与在线采购指南，帮助用户快速找到官方网站入口，了解如何进行批发采购、货源选择以及厂家直销等功能，提升采购效率与平台使用体验。

2026.02.06

热门下载

网站特效

网站源码

网站素材

前端模板