HTML定时转PDF需服务端工具,Puppeteer最常用,配合cron每日执行;关键设printBackground:true,注意路径、字体和权限。

HTML 定时转 PDF 不是浏览器原生能力,必须借助服务端工具或自动化脚本实现。纯前端 JavaScript 无法直接生成带样式的 PDF 文件,更无法“定时”执行——那需要操作系统级调度(如 cron)或后台服务(如 Node.js 进程)。
用 Puppeteer 在 Node.js 中定时生成 PDF
Puppeteer 是最常用、最可控的方案:它启动真实 Chromium 实例,能完整渲染 CSS、字体、JavaScript 动态内容,生成高质量 PDF。
- 需先安装:
npm install puppeteer - 定时靠
setInterval()或系统 cron 调用脚本,推荐后者(避免 Node 进程长期运行出错) - 关键参数:
page.pdf({ format: 'A4', printBackground: true })——printBackground: true必须设为true,否则背景色/图不显示 - 注意路径:本地 HTML 文件要用
file://协议加载,或起一个临时 HTTP 服务(推荐后者,避免跨域和资源加载失败)
const puppeteer = require('puppeteer');
async function htmlToPdf() {
const browser = await puppeteer.launch();
const page = await browser.newPage();
await page.goto('https://www.php.cn/link/4b98e90ba839623e88d5b3d6dce56562', { waitUntil: 'networkidle0' });
await page.pdf({
path: report_${Date.now()}.pdf,
format: 'A4',
printBackground: true
});
await browser.close();
}
// 每天上午 9 点执行(实际应由 cron 控制,此处仅示意)
// setInterval(htmlToPdf, 24 60 60 * 1000);
Linux 下用 cron 每日自动触发 PDF 生成
cron 是稳定可靠的定时机制,比在 Node 中用 setInterval() 更适合生产环境。
- 确保脚本可执行:
chmod +x /path/to/generate-pdf.js - 编辑 crontab:
crontab -e - 添加一行(每天 9:00 执行):
0 9 * * * cd /path/to/project && /usr/bin/node /path/to/generate-pdf.js >> /var/log/pdf-gen.log 2>&1 - 务必写全路径:
/usr/bin/node而非node,cron 环境无 shell PATH 继承 - 日志重定向很重要,否则失败时完全无迹可寻
替代方案:wkhtmltopdf(轻量但兼容性差)
如果服务器资源紧张、不需要 JS 渲染,wkhtmltopdf 启动快、内存低,但对 Flex/Grid、现代 CSS 支持弱,中文常需手动指定字体。
立即学习“前端免费学习笔记(深入)”;
- 安装:
apt-get install wkhtmltopdf(Ubuntu/Debian) - 命令行直接调用:
wkhtmltopdf --enable-local-file-access --print-media-type --encoding utf-8 https://www.php.cn/link/4b98e90ba839623e88d5b3d6dce56562 report.pdf -
--enable-local-file-access是关键,否则读取本地 HTML 或 CSS 失败 - 中文乱码?加参数:
--font-family "Noto Sans CJK SC"并确保系统已安装该字体
常见失败原因和绕过方法
90% 的“转 PDF 失败”其实不是代码问题,而是环境或路径陷阱:
- 页面加载超时 → 加
waitUntil: 'networkidle2'或显式await page.waitForSelector('#content') - PDF 空白/只有一半 → 检查是否漏了
printBackground: true,或 CSS 中用了@media print把内容隐藏了 - 字体不显示 → Puppeteer 默认不加载系统字体;要么用 Web 字体(
@font-face),要么在 Docker 中挂载字体目录 - 权限错误(尤其 cron)→ 用
whoami和env对比 cron 环境与手动执行环境差异
真正麻烦的从来不是“怎么写那几行代码”,而是让 PDF 在凌晨三点准时、稳定、样式分毫不差地落进指定目录——这取决于你是否提前压测过并发、是否监控了磁盘空间、是否验证过字体 fallback 链。别跳过日志和权限检查。











