解决 docxtpl 渲染 Word 文档时图片丢失的问题

霞舞

发布时间：2025-08-24 22:52:31

439人浏览过

来源于php中文网

原创

解决 docxtpl 渲染 word 文档时图片丢失的问题

在使用 docxtpl (python-docx-template) 渲染 Word 文档时，图片丢失的问题通常是由于 Word 文档内部的图片 ID 冲突造成的。为了解决这个问题，我们需要深入了解 Word 文档的内部结构，并找到冲突的 ID。

诊断图片丢失问题

当使用 docxtpl 渲染 Word 文档时，如果发现图片丢失，可以按照以下步骤进行诊断：

解压 .docx 文件： .docx 文件实际上是一个压缩包，可以使用 7-Zip 或其他解压工具将其解压。
检查内部 XML 文件： 解压后，你会看到多个文件夹和 XML 文件。我们需要关注以下两个文件：
- word/document.xml: 包含文档正文的内容。
- word/header.xml (或 word/footer.xml): 包含页眉或页脚的内容。如果存在多个页眉或页脚，可能会有 header1.xml、header2.xml 等。
查找图片 ID： 在 document.xml 和 header.xml (以及其他页眉/页脚文件) 中，查找与图片相关的 XML 元素，通常是 <a:blipFill> 元素。在该元素中，会有一个 r:embed 属性，其值类似于 rId8。这个 rId8 就是图片的 ID。
确认 ID 是否冲突： 检查 document.xml 和所有 header.xml 文件，确认是否存在相同的 rId 值。如果发现相同的 rId 出现在不同的文件中，那么就存在 ID 冲突，这很可能导致图片丢失。

解决 ID 冲突

一旦确认存在 ID 冲突，可以采取以下方法解决：

手动修改 XML 文件： 这是最直接的方法，但需要小心操作。
- 找到冲突的 rId。
- 在一个文件中（例如 header.xml），将冲突的 rId 修改为新的、唯一的 ID（例如 rId99）。
- 同时，需要修改所有引用该 rId 的地方，确保它们指向新的 ID。
- 修改完成后，重新压缩所有文件和文件夹，并将扩展名改回 .docx。
注意： 手动修改 XML 文件容易出错，建议在修改前备份原始文件。
重新插入图片： 更安全的方法是在 Word 中重新插入图片。

B12
B12是一个由AI驱动的一体化网站建设平台

下载
- 删除原始图片。
- 重新插入图片。Word 会自动分配新的、唯一的 ID。
- 保存文档。

使用编程方法避免冲突： 如果你需要通过编程方式生成包含多个子文档的 Word 文档，可以考虑在合并文档之前，预先处理每个子文档，确保它们的图片 ID 不会冲突。以下是一个示例代码，展示了如何使用 lxml 库来修改 Word 文档中的图片 ID：

from docx import Document
from docxcompose.composer import Composer
from lxml import etree
import zipfile
import os

def fix_image_ids(docx_path, id_offset):
    """
    修复 Word 文档中的图片 ID，避免冲突。

    Args:
        docx_path (str): Word 文档的路径。
        id_offset (int): ID 偏移量，用于生成新的 ID。
    """
    # 解压 docx 文件
    with zipfile.ZipFile(docx_path, 'r') as zip_ref:
        zip_ref.extractall("temp_docx")

    # 解析 document.xml 文件
    tree = etree.parse("temp_docx/word/document.xml")
    root = tree.getroot()

    # 定义命名空间
    namespaces = {
        'a': 'http://schemas.openxmlformats.org/drawingml/2006/main',
        'r': 'http://schemas.openxmlformats.org/officeDocument/2006/relationships'
    }

    # 查找所有 blipFill 元素
    blip_fills = root.xpath('//a:blipFill', namespaces=namespaces)

    for blip_fill in blip_fills:
        # 获取 r:embed 属性值 (例如 rId8)
        embed_attr = blip_fill.xpath('./a:blip/@r:embed', namespaces=namespaces)[0]
        old_id = int(embed_attr[3:])  # 提取数字部分 (例如 8)
        new_id = old_id + id_offset
        new_embed_attr = f"rId{new_id}"

        # 更新 r:embed 属性
        blip_fill.xpath('./a:blip', namespaces=namespaces)[0].set('{http://schemas.openxmlformats.org/officeDocument/2006/relationships}embed', new_embed_attr)

    # 保存修改后的 document.xml
    tree.write("temp_docx/word/document.xml", encoding="utf-8", xml_declaration=True)

    # 修改 .rels 文件
    rels_path = "temp_docx/word/_rels/document.xml.rels"
    if os.path.exists(rels_path):
        rels_tree = etree.parse(rels_path)
        rels_root = rels_tree.getroot()

        for relationship in rels_root.xpath('//Relationship'):
            old_id_rel = relationship.get('Id')
            old_id_num = int(old_id_rel[3:])
            new_id_num = old_id_num + id_offset
            new_id_rel = f"rId{new_id_num}"
            relationship.set('Id', new_id_rel)

        rels_tree.write(rels_path, encoding="utf-8", xml_declaration=True)

    # 重新压缩 docx 文件
    with zipfile.ZipFile(f"fixed_{os.path.basename(docx_path)}", 'w', zipfile.ZIP_DEFLATED) as zipf:
        for root, dirs, files in os.walk("temp_docx"):
            for file in files:
                zipf.write(os.path.join(root, file), os.path.relpath(os.path.join(root, file), "temp_docx"))

    # 清理临时文件夹
    import shutil
    shutil.rmtree("temp_docx")

# 示例用法
if __name__ == '__main__':
    # 创建两个示例 Word 文档
    doc1 = Document()
    doc1.add_paragraph("Document 1 with an image.")
    doc1.add_picture("example.png") # 确保 example.png 存在
    doc1.save("doc1.docx")

    doc2 = Document()
    doc2.add_paragraph("Document 2 with an image.")
    doc2.add_picture("example.png") # 确保 example.png 存在
    doc2.save("doc2.docx")

    # 修改 doc2.docx 的图片 ID，偏移量为 100
    fix_image_ids("doc2.docx", 100)

    # 合并文档
    master_document = Document("doc1.docx")
    composer = Composer(master_document)
    composer.append(Document("fixed_doc2.docx"))
    composer.save("merged_document.docx")

    print("文档已合并，并修复了图片 ID 冲突。")

代码解释：

fix_image_ids(docx_path, id_offset) 函数接收 Word 文档的路径和 ID 偏移量作为参数。
它首先解压 Word 文档，然后使用 lxml 库解析 document.xml 文件。
它找到所有包含图片 ID 的 a:blipFill 元素，并将其 r:embed 属性值（例如 rId8）中的数字部分提取出来。
将提取的数字加上偏移量，生成新的 ID（例如 rId108）。
更新 a:blipFill 元素的 r:embed 属性，以及 .rels 文件中对应的关系 ID。
最后，重新压缩所有文件，生成新的 Word 文档。

使用说明：

确保你已经安装了 lxml 库： pip install lxml
将代码保存为 Python 文件（例如 fix_ids.py）。
将需要合并的 Word 文档（例如 doc1.docx 和 doc2.docx）放在同一个目录下。
根据需要修改 id_offset 的值，确保偏移量足够大，可以避免与其他文档中的 ID 冲突。
运行脚本： python fix_ids.py
脚本会生成一个新的 Word 文档 merged_document.docx，其中包含了合并后的内容，并且图片 ID 已经过修复。

注意事项：

这个示例代码只处理了 document.xml 文件中的图片 ID。如果你的 Word 文档包含页眉、页脚或其他类型的图片，你可能需要修改代码，使其能够处理这些情况。
在实际使用中，你需要根据你的具体需求修改代码。例如，你可以将代码封装成一个函数，或者将其集成到你的文档生成流程中。

总结

解决 docxtpl 渲染 Word 文档时图片丢失的问题，关键在于理解 Word 文档的内部结构，并找到并解决图片 ID 冲突。通过手动修改 XML 文件、重新插入图片，或者使用编程方法预处理文档，可以有效地避免这个问题。在处理 Word 文档时，务必小心操作，并在修改前备份原始文件。

如何用Python筛选出偶数长度的回文字符串

如何在 Python 中优雅地调用登录成功后的业务函数

如何在 Python 中优雅地调用登录成功后的函数

Python API数据验证怎么做_Pydantic模型验证与报错处理

Python怎么操作网络驱动器文件_UNC路径与SMB协议处理

相关专题

pip安装使用方法

安装步骤：1、确保Python已经正确安装在您的计算机上；2、下载“get-pip.py”脚本；3、按下Win + R键，然后输入cmd并按下Enter键来打开命令行窗口；4、在命令行窗口中，使用cd命令切换到“get-pip.py”所在的目录；5、执行安装命令；6、验证安装结果即可。大家可以访问本专题下的文章，了解pip安装使用方法的更多内容。

373

2023.10.09

更新pip版本

更新pip版本方法有使用pip自身更新、使用操作系统自带的包管理工具、使用python包管理工具、手动安装最新版本。想了解更多相关的内容，请阅读专题下面的文章。

437

2024.12.20

pip设置清华源

设置方法：1、打开终端或命令提示符窗口；2、运行“touch ~/.pip/pip.conf”命令创建一个名为pip的配置文件；3、打开pip.conf文件，然后添加“[global];index-url = https://pypi.tuna.tsinghua.edu.cn/simple”内容，这将把pip的镜像源设置为清华大学的镜像源；4、保存并关闭文件即可。

804

2024.12.23

python升级pip

本专题整合了python升级pip相关教程，阅读下面的文章了解更多详细内容。

371

2025.07.23

pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法：1. 使用在线转换器；2. 使用桌面软件（如 adobe acrobat、itext）；3. 使用命令行工具（如 pdftoxml）。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1950

2024.04.01

xml怎么变成word

步骤：1. 导入 xml 文件；2. 选择 xml 结构；3. 映射 xml 元素到 word 元素；4. 生成 word 文档。提示：确保 xml 文件结构良好，并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容，可以阅读本专题下面的文章。

2119

2024.08.01

xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言，标准通用标记语言的子集，是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容，可阅读本专题下面的相关文章。

1173

2024.11.28

word背景色怎么改成白色

Word是微软公司的一个文字处理器软件。word为用户提供了专业而优雅的文档工具，帮助用户节省时间并得到优雅美观的结果。word提供了许多易于使用的文档创建工具，同时也提供了丰富的功能供创建复杂的文档使用。怎么word背景色怎么该呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

3738

2023.07.21