XML文件转Word Python python-docx-template模板填充

幻夢星雲

发布时间：2026-03-17 16:25:00

920人浏览过

来源于php中文网

原创

XML解析首选xml.etree.ElementTree，轻量标准无依赖；命名空间需预定义字典，取值用itertext()防空；XML须转dict或Context供docx-template渲染，复杂结构推荐xmltodict；重复节点强制转list并补默认值；模板加载须二进制模式，中文指定UTF-8编码。

xml文件转word python python-docx-template模板填充

XML解析用`xml.etree.ElementTree`最稳，别碰`minidom`或第三方XML库

Python原生xml.etree.ElementTree足够处理绝大多数结构化XML，轻量、标准、无额外依赖。用minidom容易在命名空间、编码、空白文本上翻车；用lxml虽强但引入C依赖，CI环境常出问题。

直接import xml.etree.ElementTree as ET，ET.parse("file.xml")加载，.getroot()拿到根节点
遇到带命名空间的XML（比如{http://schemas.openxmlformats.org/wordprocessingml/2006/main}p），先定义ns = {"w": "http://schemas.openxmlformats.org/wordprocessingml/2006/main"}，再用root.findall(".//w:p", ns)
别用.text直接取值——空元素、换行、子标签混排时返回None或意外空白；改用"".join([t for t in elem.itertext()]).strip()

`docx-template`只认字典，XML数据得先扁平化成`dict`或`Context`对象

docx-template底层靠Jinja2渲染，模板里写{{ user.name }}，它就真要你传一个带name属性的user对象，或者一个{"user": {"name": "张三"}}字典。XML是树状结构，不能直接喂进去。

简单XML：用递归函数把Element转成嵌套dict，注意同名多节点要转成list（比如多个<item></item>）
复杂XML：别手写转换，用xmltodict.parse(xml_str)（需pip install xmltodict），它会把XML转成接近JSON结构的dict，再按模板字段路径取值
避免深层嵌套传参——模板里写{{ data.section.list.0.title }}可读性差还易错；提前在Python里拆好，比如context = {"title": data["section"]["list"][0]["title"]}

模板里用`{% for %}`循环填表，但XML中重复节点必须显式转成`list`

XML里<row><cell>A</cell></row><row><cell>B</cell></row>这种结构，解析后默认是单个row对象（最后那个覆盖前面的），docx-template的{% for row in rows %}会报TypeError: 'NoneType' object is not iterable。

阶跃星辰开放平台

阶跃星辰旗下开放平台，提供文本大模型、多模态大模型、繁星计划

下载

解析时强制转list：rows = root.findall("row") if root.findall("row") else []，再用[{"cell": r.find("cell").text.strip()} for r in rows]
模板里写{% for row in rows %}<t>{{ row.cell }}</t>{% endfor %}，注意docx-template生成的是Word XML片段，不是HTML，别漏掉<t></t>标签（如果用docxtpl的RichText等高级功能另说）
空列表会导致整个{% for %}块消失——如果“无数据”也要显示“暂无记录”，得在Python里补默认值："rows": rows or [{"cell": "暂无记录"}]

中文乱码、样式丢失、图片不显示？检查`docx-template`初始化和`render()`参数

常见问题不是XML或模板本身，而是DocxTemplate实例化或渲染时漏了关键参数。

立即学习“Python免费学习笔记（深入）”；

加载模板必须用二进制模式：DocxTemplate("template.docx")，别用open("template.docx", "r")——会破坏ZIP结构
中文必须指定encoding="utf-8"（虽然默认是UTF-8，但某些Windows环境会fallback到GBK，导致{{ name }}渲染成乱码）
含图片的模板，XML里<drawing></drawing>部分不会被docx-template自动替换；图片得用inline_images参数传入bytes或PIL.Image对象，并在模板里用{% docx_replace_image "img1" %}标记
样式继承失效？确保原始.docx模板里段落/表格样式已定义（比如“标题1”“正文”），docx-template不会创建新样式，只复用已有样式名

XML转Word真正卡点不在解析也不在渲染，而在“XML怎么映射到模板变量”这一层——同一份XML，有人写三行代码搞定，有人调三天才发现items被当成了字符串而不是列表。动手前，先用print(json.dumps(context, indent=2, ensure_ascii=False))看看你塞进去的到底是什么。

python速学教程(入门到精通)

python怎么学习？python怎么入门？python在哪学？python怎么学才快？不用担心，这里为大家提供了python速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

json pip print Object if for 命名空间 xml 字符串递归循环继承对象 windows http word

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：XSLT怎么根据条件动态选择应用的模板下一篇：暂无

作者最新文章

c++ object pool实现 c++如何实现一个对象池以提高性能

2026-03-17 15:09

Minimax私有化部署方案及硬件需求说明

2026-03-17 15:12

bootstrap如何设置响应式的嵌入视频

2026-03-17 15:16

Minimax海螺AI表情包生成教程

2026-03-17 15:20

海螺AI怎么生成微缩景观视频海螺AI移轴摄影提示词

2026-03-17 15:46

Bootstrap图片画廊布局 Bootstrap如何制作一个响应式相册

2026-03-17 15:51

bootstrap模态框怎么设置垂直居中显示

2026-03-17 15:52

Minimax生成未来城市提示词 Minimax城市建筑指令写法

2026-03-17 16:00

Minimax怎么生成视频 Minimax视频生成方法

2026-03-17 16:01

bootstrap如何修改导航链接的内边距

2026-03-17 16:15

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

458

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

549

2023.08.23

jquery怎么操作json

操作的方法有：1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”；3、“$.each(obj, callback)”；4、“$.ajax()”。更多jquery怎么操作json的详细内容，可以访问本专题下面的文章。

337

2023.10.13

go语言处理json数据方法

本专题整合了go语言中处理json数据方法，阅读专题下面的文章了解更多详细内容。

2025.09.10

pip安装使用方法

安装步骤：1、确保Python已经正确安装在您的计算机上；2、下载“get-pip.py”脚本；3、按下Win + R键，然后输入cmd并按下Enter键来打开命令行窗口；4、在命令行窗口中，使用cd命令切换到“get-pip.py”所在的目录；5、执行安装命令；6、验证安装结果即可。大家可以访问本专题下的文章，了解pip安装使用方法的更多内容。

373

2023.10.09

更新pip版本

更新pip版本方法有使用pip自身更新、使用操作系统自带的包管理工具、使用python包管理工具、手动安装最新版本。想了解更多相关的内容，请阅读专题下面的文章。

437

2024.12.20

pip设置清华源

设置方法：1、打开终端或命令提示符窗口；2、运行“touch ~/.pip/pip.conf”命令创建一个名为pip的配置文件；3、打开pip.conf文件，然后添加“[global];index-url = https://pypi.tuna.tsinghua.edu.cn/simple”内容，这将把pip的镜像源设置为清华大学的镜像源；4、保存并关闭文件即可。

806

2024.12.23