用 xmltodict + pyyaml 是最简洁可靠的 XML 转 YAML 方案:xmltodict 将 XML 解析为嵌套字典(属性转 @ 开头键,重复标签转列表),PyYAML 再格式化输出为可读 YAML;支持文件读写、UTF-8 编码和异常处理。

用 Python 将 XML 转为 YAML,核心思路是:先解析 XML 成 Python 原生数据结构(如字典、列表),再用 YAML 库将其序列化输出。关键在于 XML 结构到嵌套字典的合理映射,而非简单字符串替换。
用 xmltodict + pyyaml 是最简洁可靠的方式
red">xmltodict 能把 XML 树直接转成接近 JSON 的嵌套字典(保留属性、文本、子元素关系),PyYAML 则负责把字典格式化输出为可读 YAML。两者配合,几行代码就能完成转换。
- 安装依赖:
pip install xmltodict pyyaml - 基础示例(字符串输入):
import xmltodict import yamlxml_str = '''
''' Alice 30 reading swimming 解析 XML → OrderedDict → 转普通 dict(可选)
data = xmltodict.parse(xml_str)
输出为 YAML 字符串(默认不带引号,缩进2空格)
yaml_str = yaml.dump(data, default_flow_style=False, indent=2, allow_unicode=True) print(yaml_str)
处理常见 XML 特性:属性、文本混合、重复标签
xmltodict 默认把属性转为以 @ 开头的键(如 @id),把元素内纯文本转为 #text 键。这对多数场景足够清晰,但需注意以下情况:
立即学习“Python免费学习笔记(深入)”;
- 若某元素只有文本(无子元素、无属性),它的值就是字符串,不是
{'#text': 'xxx'} - 若多个同名子元素(如多个
),会被自动转为列表 —— 这正是 YAML 中数组的自然表示 - 如果想把属性名去掉
@前缀或自定义键名,可在parse()时传入attr_prefix=''或attr_prefix='_'等参数
从文件读取并写入 YAML 文件
实际使用中多为文件间转换,注意编码和异常处理:
- 读 XML 文件建议用
encoding='utf-8'显式指定编码 - 写 YAML 文件时也用
encoding='utf-8',并设allow_unicode=True避免中文乱码 - 可加 try/except 捕获解析失败(如 XML 格式错误)
import xmltodict import yamltry: with open('input.xml', encoding='utf-8') as f: xml_data = f.read() data = xmltodict.parse(xml_data)
with open('output.yaml', 'w', encoding='utf-8') as f: yaml.dump(data, f, default_flow_style=False, indent=2, allow_unicode=True)except Exception as e: print(f"转换失败:{e}")
替代方案:用标准库 xml.etree.ElementTree + 手动构建字典
如果不想引入第三方库(如受限环境),可用 Python 内置
xml.etree.ElementTree,但需自己递归遍历节点、处理属性/文本/子元素,并决定如何表示空元素或混合内容。工作量大、易出错,仅建议用于极简 XML 或学习目的。
- 优点:零依赖
- 缺点:不自动处理重复标签(需手动判断是否转列表)、不区分属性与子元素、对复杂结构(如 CDATA、命名空间)支持弱
- 一般不推荐用于生产转换
基本上就这些。用 xmltodict + pyyaml 是目前最实用、稳定、可读性高的组合,能应对绝大多数真实 XML 场景,且代码干净易维护。










