XSL-FO是一种用于精确控制文档排版和页面布局的XML标记语言,需通过XSLT将原始XML转换为XSL-FO格式,再由FO处理器(如Apache FOP)渲染为PDF等可打印格式。其核心结构包括页面模板(fo:simple-page-master)、页面序列(fo:page-sequence)和格式对象(fo:block等),支持分页控制、字体嵌入、复杂表格与合规输出,适用于发票、报表等对格式稳定性要求高的场景。

XSL-FO(Extensible Stylesheet Language Formatting Objects)是一种基于XML的标记语言,专门用于定义文档的**排版格式和页面布局**,它本身不是渲染引擎,而是一份“印刷说明书”——告诉处理器“这段文字该在哪一页、用什么字体、缩进多少、是否分栏、图片怎么浮动”,最终由FO处理器(如Apache FOP、Antenna House、RenderX)将其转换为PDF、PostScript、AFP等可打印或出版的格式。
XSL-FO是XSL的一部分,不是独立样式表
它和XSLT(用于转换XML结构)配合使用:先用XSLT把原始XML数据转换成语义清晰、结构规整的XSL-FO文档(即*.fo文件),这个FO文档本质仍是XML,但所有元素都属于fo:命名空间(如fo:block、fo:table、fo:inline),专为格式化设计。
常见流程如下:
- 原始XML(如订单数据、产品目录)
- → 经XSLT模板处理 → 生成符合XSL-FO规范的XML文件(含页面模板、区域划分、样式指令)
- → 输入FO处理器(如fop命令行工具)→ 渲染为PDF
核心机制:页面模板 + 内容流 + 格式对象
XSL-FO通过三层结构控制输出:
- 页面布局(fo:simple-page-master):定义纸张大小、页边距、页眉页脚区域(region-before/after)、主体内容区(region-body)
- 页面序列(fo:page-sequence):把内容流(flow)“装入”某个页面模板,并可按章节切换不同模板(如奇偶页不同、首页无页眉)
- 格式对象(fo:block、fo:table-cell等):对应实际内容单元,每个都支持丰富属性(font-size、text-align、keep-together、border、padding等),直接控制视觉呈现
为什么用XSL-FO生成PDF?关键优势在可控性与合规性
相比HTML+CSS转PDF,XSL-FO对印刷级排版更可靠:
- 原生支持分页控制(如避免表格跨页断裂、标题不单独落页)
- 精确指定字体嵌入、CMYK色彩、PDF/A归档标准
- 复杂表格、多栏文本、脚注尾注、自动编号、交叉引用均可声明式定义
- 不依赖浏览器渲染引擎,输出稳定一致,适合发票、报表、法律文书等正式场景
基本上就这些。它不复杂但容易忽略:FO不是写完就能出PDF,中间必须经过XSLT转换和FO处理器渲染两步,且调试常需查看生成的.fo文件是否符合预期结构。











