XML文件转YAML Python脚本 PyYAML库转换配置文件

月夜之吻

发布时间：2026-03-05 09:36:12

428人浏览过

来源于php中文网

原创

xml转yaml需先用elementtree或lxml解析为python结构，再用pyyaml转换；须处理命名空间、空标签、混合内容、重复子节点、属性分离、中文编码、时间格式及引号控制等问题。

xml文件转yaml python脚本 pyyaml库转换配置文件

XML转YAML时`xml.etree.ElementTree`解析失败：空标签、命名空间、属性混排

PyYAML本身不处理XML，必须先用xml.etree.ElementTree或lxml解析成Python结构，再转YAML。常见错误是直接读XML字符串就喂给yaml.dump()，结果输出全是None或报TypeError: object of type 'Element' is not serializable。

真实场景里，XML常含命名空间（如xmlns="http://example.com/ns"）、自闭合标签（<item></item>）、混合文本+子节点（<p>hello<b>world</b></p>），这些都会让默认ElementTree解析后结构难映射到YAML的键值逻辑。

用xml.etree.ElementTree.fromstring()前，先用re.sub()剥离命名空间（除非你主动用{http://...}tag方式访问）
空标签（<flag></flag>）默认解析为element.text == None，建议统一转成""或False，避免YAML里出现null歧义
含混合内容的节点（文本+子元素）不要硬塞进dict；要么提取纯文本（"".join(element.itertext())），要么跳过——YAML不适合表达这种HTML式嵌套

`PyYAML` dump时中文乱码、单引号绕过、时间格式崩坏

直接yaml.dump(data)默认用ASCII编码、自动加单引号包裹字符串、把datetime对象转成不可读的!!python/object/apply:datetime.datetime——这在配置文件里完全不可用。

核心是控制default_flow_style、allow_unicode和default_style三个参数，且必须显式传入，不能依赖全局设置。

立即学习“Python免费学习笔记（深入）”；

XYZ SCIENCE

免费论文AIGC检测，一键改写降AI率

下载

中文输出必须加allow_unicode=True，否则全变\u4f60\u597d
避免无意义单引号：设default_style=None（不是"None"字符串）
时间类型要提前转成ISO字符串：str(dt)或dt.isoformat()，别指望PyYAML自动格式化
如果原始XML有数字字符串如"00123"，ElementTree会当str读入，但YAML可能解析成整数123——需要手动补引号或加yaml.dump(..., default_flow_style=False)保格式

嵌套层级深、重复标签名导致字典key冲突

XML里常见<list><item>a</item><item>b</item></list>，ElementTree解析后list下多个同名item子节点，若直接转dict会只保留最后一个——因为Python dict key不能重复。

这不是PyYAML的问题，是XML→Python结构映射阶段就断掉了。必须在生成dict前识别重复标签，并强制转为list。

检查elem.findall("item")长度是否>1，若是，把所有item节点内容收集进list，而非逐个赋值给同一key
别用elem.attrib直接合并进内容字典——属性和文本语义不同，强行合在一起会让YAML结构模糊（比如id="123"和text="name"都变成同级key）
简单方案：对每个节点，生成{"@attrs": {...}, "#text": "...", "child": {...}}三层结构；复杂项目建议用xmltodict库替代手写解析

脚本跑通但生成YAML和预期结构不符：缩进、换行、注释全丢

XML带注释（）或人为换行缩进，在ElementTree里直接被忽略；PyYAML dump也默认不保留空行、不支持写注释。所谓“结构不符”，其实是把XML的排版习惯错当成语义要求。

配置文件YAML的关键是可读性+机器可解析，不是像素级还原XML格式。强行模拟只会增加维护成本。

PyYAML不支持输出注释——别试yaml.dump(..., comment="xxx")，没这个参数
缩进用indent=2控制，但无法对某一层单独设；设indent=4后所有嵌套都变4空格，别指望“根层2格、子层4格”
换行靠default_flow_style=False + width=1000（禁掉折行），但长列表仍会换行——这是YAML规范行为，不是bug

真正该花时间的地方，是定义清楚哪些字段必须保留顺序（用collections.OrderedDict）、哪些值必须加引号（字符串含冒号/井号时）、哪些空节点要显式写成null而不是省略——这些细节比缩进更影响下游使用。

Python生成RSS Feed XML 使用feedgen库创建订阅源

Word的docx文件内容怎么读取如何用程序解析docx中的XML

Python xml.etree.ElementTree TreeBuilder 自定义构建器

Python lxml html.fromstring 解析HTML为XML树

Python xml.dom.minidom获取属性 getAttribute方法使用详解

相关标签:

python 配置文件 python脚本 yy Object NULL 命名空间 xml 字符串对象 ASCII http bug

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Android vector矢量图转换 SVG转Vector Drawable XML工具下一篇：XML文件上传Content-Type 设置application/xml还是text/xml

作者最新文章

C# IAsyncResult异步模式 C#传统的APM Begin/End方法如何使用

2026-03-03 10:41

C# WebAssembly文件操作 C#在WASM中如何与浏览器文件系统交互

2026-03-03 11:10

XML文件如何设置权限控制谁可以读取或修改XML

2026-03-03 11:16

XSLT中如何调用外部JavaScript函数

2026-03-03 11:19

Clawdbot/Claude免费版和付费版Pro有什么区别？

2026-03-03 11:46

Java XMLOutputFactory createXMLStreamWriter StAX写入XML流

2026-03-03 11:55

考研帮学校库网页版考研帮院校查询入口

2026-03-03 12:52

com.tencent.mm朋友圈视频怎么保存 com.tencent.mm朋友圈缓存提取

2026-03-03 12:56

Windows 11画图3D怎么制作透明背景图片？实用操作步骤详解

2026-03-03 13:20

谷歌浏览器账号头像怎么更换 Chrome个人资料设置【指南】

2026-03-03 14:15

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

252

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

1008

2024.03.01

pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法：1. 使用在线转换器；2. 使用桌面软件（如 adobe acrobat、itext）；3. 使用命令行工具（如 pdftoxml）。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1940

2024.04.01

xml怎么变成word

步骤：1. 导入 xml 文件；2. 选择 xml 结构；3. 映射 xml 元素到 word 元素；4. 生成 word 文档。提示：确保 xml 文件结构良好，并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容，可以阅读本专题下面的文章。

2117

2024.08.01

xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言，标准通用标记语言的子集，是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容，可阅读本专题下面的相关文章。

1155

2024.11.28

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

698

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

219

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1561

2023.10.24

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

2026.03.04

热门下载

网站特效

网站源码

网站素材

前端模板