0

0

将 Docx4j 文档转换为 PDF 时如何避免在 /tmp 目录下生成临时图片

霞舞

霞舞

发布时间:2025-08-05 20:42:17

|

967人浏览过

|

来源于php中文网

原创

将 docx4j 文档转换为 pdf 时如何避免在 /tmp 目录下生成临时图片

本文旨在解决在使用 Docx4j 将 Word 文档转换为 PDF 时,页眉/页脚中的图片默认保存在 /tmp 目录下,导致无法清理的问题。文章将阐述问题的根源,并提供一种规避方案,帮助开发者在 Linux 环境下更有效地管理 Docx4j 生成的临时文件。

在使用 Docx4j 将 Word 文档转换为 PDF 时,尤其是在 Linux 环境下,可能会遇到一个问题:文档中的图片,特别是位于页眉和页脚中的图片,会被保存在 /tmp 目录下。这主要是由于 AbstractConversionImageHandler.java 的默认行为以及 FopAreeTreeHelper 在处理页眉/页脚区域时使用了带有默认设置的 FOP 导致的。虽然可以通过 FOSettings 设置 ImageDirPath 来指定文档主体中图片的保存路径,但这个设置对页眉/页脚中的图片无效。

以下是一个转换 Docx 文档为 PDF 的示例代码:

private static final String TEMP_IMAGE_DIR_PATH = "/tmp/images";

public static void convert(WordprocessingMLPackage wordMLPackage, OutputStream output) throws Exception {

    Mapper fontMapper = new BestMatchingMapper();
    wordMLPackage.setFontMapper(fontMapper);

    FOSettings foSettings = new FOSettings(wordMLPackage);
    foSettings.setApacheFopMime("application/pdf");
    foSettings.setImageDirPath(TEMP_IMAGE_DIR_PATH);
    foSettings.setFoDumpFile(null);

    FopFactoryBuilder fopFactoryBuilder = FORendererApacheFOP.getFopFactoryBuilder(foSettings) ;
    FopFactory fopFactory = fopFactoryBuilder.build();

    FOUserAgent foUserAgent = FORendererApacheFOP.getFOUserAgent(foSettings, fopFactory);

    Docx4J.toFO(foSettings, output, Docx4J.FLAG_EXPORT_PREFER_XSL);

    // Clean up, so any ObfuscatedFontPart temp files can be deleted
    if (wordMLPackage.getMainDocumentPart().getFontTablePart()!=null) {
        wordMLPackage.getMainDocumentPart().getFontTablePart().deleteEmbeddedFontTempFiles();
    }
    foSettings = null;
    wordMLPackage = null;

    FileUtils.deleteDirectory(new File(TEMP_IMAGE_DIR_PATH));
}

这段代码会将文档主体中的图片保存到 TEMP_IMAGE_DIR_PATH 指定的目录,并在转换完成后删除该目录。但是,页眉/页脚中的图片仍然会被保存在 /tmp 目录下,并且无法通过上述方式进行清理。

解决方案:

炫图AI
炫图AI

全能AI修图神器,AI换装、修图、改图、P图

下载

目前,Docx4j 存在一个缺陷,即无法通过配置来指定页眉/页脚图片的临时存储目录。 一个临时的规避方案是避免在页眉和页脚中使用图片。 这可能需要重新设计文档布局,将原本位于页眉/页脚的图片移动到文档主体部分。

注意事项:

  • 请注意,这只是一个临时解决方案。Docx4j 团队已经意识到这个问题,并在未来的版本中可能会提供更完善的解决方案。
  • 在设计文档时,尽量避免在页眉/页脚中使用图片,以减少对临时文件的依赖。
  • 定期检查 /tmp 目录,手动清理不再需要的临时文件。

总结:

虽然 Docx4j 在处理图片时存在一些限制,但通过合理的文档设计和适当的规避方案,仍然可以有效地将 Word 文档转换为 PDF。希望本文能帮助你更好地理解和解决这个问题。 建议关注 Docx4j 的官方 issue 跟踪系统,以便及时获取最新的解决方案和更新。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1542

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

716

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

300

2023.06.30

linux修改文件名
linux修改文件名

本专题为大家提供linux修改文件名相关的文章,这些文章可以帮助用户快速轻松地完成文件名的修改工作,大家可以免费体验。

797

2023.07.05

linux系统安装教程
linux系统安装教程

linux系统是一种可以免费使用,自由传播,多用户、多任务、多线程、多CPU的操作系统。本专题提供linux系统安装教程相关的文章,大家可以免费体验。

586

2023.07.06

linux查看文件夹大小
linux查看文件夹大小

Linux是一种自由和开放源码的类Unix操作系统,存在着许多不同的Linux版本,但它们都使用了Linux内核。Linux可安装在各种计算机硬件设备中,比如手机、平板电脑、路由器、视频游戏控制台、台式计算机、大型机和超级计算机。linux怎么查看文件夹大小呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

568

2023.07.20

linux查看ip命令
linux查看ip命令

本专题为大家提供linux查看ip命令相关文章内容,感兴趣的朋友可以免费下载体验试试。

311

2023.07.20

linux查看cpu使用率
linux查看cpu使用率

在linux的系统维护中,可能需要经常查看cpu使用率,分析系统整体的运行情况。本专题为大家带来了linux查看cpu使用率的相关文章,感兴趣的朋友千万不要错过了。

399

2023.07.25

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

4

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.1万人学习

Git 教程
Git 教程

共21课时 | 4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号