
本文详细阐述了如何利用mpdf库在pdf/a格式的文档中嵌入xml发票文件,特别针对如zatca等合规性要求。核心在于正确使用setassociatedfiles方法来链接预先生成的xml文件,并区分其与xmp rdf元数据嵌入功能。通过实例代码,读者将掌握在pdf中实现xml附件的专业技巧。
理解PDF/A与嵌入式文件
PDF/A(Portable Document Format/Archive)是一种专门为长期归档而设计的PDF标准,它要求文档内容自包含且独立于外部资源。为了满足某些特定合规性要求(例如,沙特阿拉伯ZATCA对电子发票的要求),可能需要在PDF文档中嵌入结构化的数据,例如XML格式的发票。mPDF通过“关联文件”(Associated Files)功能支持这一需求。
关联文件允许将外部文件作为附件嵌入到PDF中,使其成为PDF文档的一部分。尤其是在PDF/A-3等版本中,这项功能对于电子发票的交换和验证至关重要,因为它确保了视觉呈现的PDF与机器可读的XML数据能够捆绑在一起。
mPDF中的核心功能解析
mPDF提供了特定的方法来处理PDF/A兼容性以及文件嵌入。理解这些方法的用途是成功实现XML发票嵌入的关键。
SetAssociatedFiles() 方法:嵌入现有文件
此方法用于将一个或多个外部文件作为附件嵌入到生成的PDF文档中。它是实现将XML发票附加到PDF的核心机制。它接受一个数组,每个元素代表一个要关联的文件,包含以下重要参数:
- name (字符串): 在PDF阅读器中显示的文件名。
- mime (字符串): 文件的MIME类型,例如 text/xml。
- description (字符串,可选): 文件的描述。
- AFRelationship (字符串): 定义关联文件与主文档的关系,常见的选项包括:
- Alternative:作为主文档的替代表示。
- Supplement:作为主文档的补充信息。
- Source:作为主文档的来源。
- path (字符串): 本地文件系统上待嵌入XML文件的完整路径。这是最关键的参数,确保XML文件在mPDF处理时已经存在于此路径。mPDF会读取此路径下的文件内容并嵌入。
SetAdditionalXmpRdf() 方法:嵌入XMP RDF元数据
此方法用于在PDF文档中嵌入额外的XMP(Extensible Metadata Platform)RDF(Resource Description Framework)元数据。它通常用于描述PDF文档自身的属性,例如文档类型、版本、合规级别等,而不是用于嵌入完整的业务数据文件(如XML发票)。
尽管两者都涉及XML和元数据,但SetAdditionalXmpRdf()主要处理PDF的结构化元数据,而SetAssociatedFiles()则用于嵌入独立的外部文件。在处理电子发票时,通常会同时使用这两个功能:SetAssociatedFiles嵌入实际的XML发票数据,而SetAdditionalXmpRdf则可能用于声明PDF文档符合ZUGFeRD或Factur-X等标准。
配置PDF/A模式
为了确保生成的PDF符合PDF/A标准,需要在mPDF初始化时启用PDF/A模式。
- 'PDFA' => true:启用PDF/A模式。
- 'PDFAauto' => true:自动处理PDF/A兼容性所需的字体嵌入和颜色配置文件等。
- 'PDFAversion' => 'A-3':如果需要特定版本的PDF/A(例如PDF/A-3,它支持嵌入文件),可以明确指定。
实现步骤与示例代码
以下是使用mPDF将预先生成的XML发票嵌入PDF文档的详细步骤和代码示例。
步骤1:准备XML发票文件
在mPDF生成PDF之前,必须确保您的XML发票文件(例如TaxInvoice.xml)已经生成并存储在服务器的某个可访问路径下。这是进行文件关联的前提。
<?php
// 假设您已经生成了ZATCA兼容的XML发票内容
$xmlContent = '<?xml version="1.0" encoding="UTF-8"?>
<Invoice xmlns="urn:oasis:names:specification:ubl:schema:xsd:Invoice-2"
xmlns:cac="urn:oasis:names:specification:ubl:schema:xsd:CommonAggregateComponents-2"
xmlns:cbc="urn:oasis:names:specification:ubl:schema:xsd:CommonBasicComponents-2">
<cbc:ProfileID>EN16931</cbc:ProfileID>
<cbc:ID>INV-2023-001</cbc:ID>
<cbc:IssueDate>2023-10-26</cbc:IssueDate>
<cac:AccountingSupplierParty>
<cac:Party>
<cbc:IndustryClassificationCode>3000</cbc:IndustryClassificationCode>
<cac:PartyLegalEntity>
<cbc:RegistrationName>Supplier Co.</cbc:RegistrationName>
</cac:PartyLegalEntity>
</cac:Party>
</cac:AccountingSupplierParty>
<cac:AccountingCustomerParty>
<cac:Party>
<cac:PartyLegalEntity>
<cbc:RegistrationName>Customer Inc.</cbc:RegistrationName>
</cac:PartyLegalEntity>
</cac:Party>
</cac:AccountingCustomerParty>
<cac:TaxTotal>
<cbc:TaxAmount currencyID="SAR">15.00</cbc:TaxAmount>
</cac:TaxTotal>
<cac:LegalMonetaryTotal>
<cbc:LineExtensionAmount currencyID="SAR">100.00</cbc:LineExtensionAmount>
<cbc:TaxExclusiveAmount currencyID="SAR">100.00</cbc:TaxExclusiveAmount>
<cbc:TaxInclusiveAmount currencyID="SAR">115.00</cbc:TaxInclusiveAmount>
<cbc:AllowanceTotalAmount currencyID="SAR">0.00</cbc:AllowanceTotalAmount>
<cbc:ChargeTotalAmount currencyID="SAR">0.00</cbc:ChargeTotalAmount>
<cbc:PayableAmount currencyID="SAR">115.00</cbc:PayableAmount>
</cac:LegalMonetaryTotal>
</Invoice>';
$xmlFilePath = __DIR__ . '/TaxInvoice.xml';
file_put_contents($xmlFilePath, $xmlContent);
echo "XML发票文件已生成: " . $xmlFilePath . "\n";
?>步骤2:配置mPDF生成PDF/A
初始化mPDF时,启用PDF/A模式以确保生成的PDF符合相关标准。
<?php
require_once __DIR__ . '/vendor/autoload.php'; // 假设mPDF通过Composer安装
$mpdf = new \Mpdf\Mpdf([
'PDFA' => true, // 启用PDF/A模式
'PDFAauto' => true, // 自动处理PDF/A兼容性
// 'PDFAversion' => 'A-3', // 如果需要特定版本,可在此指定
]);
?>步骤3:关联XML文件
使用SetAssociatedFiles()方法将步骤1中










