0

0

C#分割PDF文件 C#如何将一个多页PDF拆分成多个单页文件

幻夢星雲

幻夢星雲

发布时间:2026-03-04 09:39:21

|

644人浏览过

|

来源于php中文网

原创

最直接方法是用iTextSharp的PdfReader和PdfCopy:先用PdfReader读取源PDF,再用PdfCopy.AddPage配合GetImportedPage逐页导出。需注意资源释放、页码格式化、避免复用PdfCopy实例,并校验NumberOfPages和IsEncrypted等状态。

c#分割pdf文件 c#如何将一个多页pdf拆分成多个单页文件

用 iTextSharp 提取单页 PDF 文件最直接

iTextSharp 是 C# 生态里最成熟的免费 PDF 操作库(注意:v5.x 是免费的,v7+ 需商业授权),iTextSharp.text.pdf.PdfReaderiTextSharp.text.pdf.PdfCopy 配合就能稳定拆页。别用 System.Drawing 或硬解析二进制——PDF 不是图像,强行读字节会丢文字、矢量图和元数据。

常见错误现象:IOException: The process cannot access the file,往往是因为 PdfReader 未释放或输出流没关闭;还有人误用 PdfWriter.GetInstance 写单页,结果生成损坏文件——必须用 PdfCopy 复制页面结构。

  • 确保 NuGet 安装的是 iTextSharp.LGPLv2.Core(.NET Core/.NET 5+ 兼容版)或经典 iTextSharp(.NET Framework)
  • PdfReader 构造后立即检查 NumberOfPages,避免空 PDF 导致循环越界
  • 每生成一个单页文件,必须新建 PdfCopy 实例并调用 AddPage,不能复用同一个 PdfCopy 写多个文件

代码示例:按页码导出独立 PDF 文件

以下片段可直接运行,支持 .NET 6+,已处理异常和资源释放:

using iTextSharp.text.pdf;
using System.IO;
<p>string inputPdf = @"C:\docs\multi.pdf";
using var reader = new PdfReader(inputPdf);</p><p>for (int i = 1; i <= reader.NumberOfPages; i++)
{
string outputPdf = $@"C:\docs\page_{i:D3}.pdf";
using var fs = new FileStream(outputPdf, FileMode.Create);
using var doc = new Document();
using var copy = new PdfCopy(doc, fs);</p><pre class="brush:php;toolbar:false;">doc.Open();
copy.AddPage(copy.GetImportedPage(reader, i));
doc.Close();

}

关键点:copy.GetImportedPage(reader, i) 是核心,它把原 PDF 第 i 页完整导入新文档;D3 格式化页码防止文件名顺序错乱(如 page_1.pdf 排在 page_10.pdf 前面)。

探迹
探迹

探迹AI销售智能体平台

下载

用 PdfPig 替代 iTextSharp(.NET Core 原生首选)

如果项目禁用 LGPL 库或需纯 .NET Standard 支持,PdfPig 是更现代的选择——MIT 协议、无依赖、支持读取但不支持写入 PDF。等等,那怎么拆页?答案是:只读 + 外部工具生成。实际流程是:PdfPig 解析页数 → 用 Ghostscript 命令行按页提取。

  • PdfPig 仅用于探测页数和元信息,避免自己解析 PDF 结构
  • 执行命令:gswin64c -sDEVICE=pdfwrite -dNOPAUSE -dQUIET -dFIRSTPAGE={i} -dLASTPAGE={i} -sOutputFile=page_{i}.pdf input.pdf
  • 注意 Windows 上 Ghostscript 路径需加入环境变量,否则 Process.Start 找不到命令

性能与大文件注意事项

拆 100 页 PDF 时,iTextSharp 方式内存占用约 2–3 倍原文档大小——因为每页都要加载字体、资源字典等。容易被忽略的点:

  • 不要在循环内反复 new PdfReader,它很重;一个实例复用即可
  • 若源 PDF 含加密(reader.IsEncrypted 为 true),需传密码构造 PdfReader(input, password),否则 GetImportedPageBadPasswordException
  • 含 XFA 表单或 AcroForm 的 PDF,iTextSharp v5 可能丢失交互逻辑,这种场景建议先用 Adobe Acrobat「打印为 PDF」扁平化再拆

真正麻烦的不是拆页本身,而是 PDF 的隐式结构差异:线性化 PDF、增量更新、对象流压缩……这些都会让“看似简单”的一页变成需要解压、重组、重映射的完整子文档。所以别省事跳过 PdfReader 初始化校验。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
点击input框没有光标怎么办
点击input框没有光标怎么办

点击input框没有光标的解决办法:1、确认输入框焦点;2、清除浏览器缓存;3、更新浏览器;4、使用JavaScript;5、检查硬件设备;6、检查输入框属性;7、调试JavaScript代码;8、检查页面其他元素;9、考虑浏览器兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

196

2023.11.24

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

1381

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1159

2023.07.27

windows照片无法显示
windows照片无法显示

当我们尝试打开一张图片时,可能会出现一个错误提示,提示说"Windows照片查看器无法显示此图片,因为计算机上的可用内存不足",本专题为大家提供windows照片无法显示相关的文章,帮助大家解决该问题。

829

2023.08.01

windows查看端口被占用的情况
windows查看端口被占用的情况

windows查看端口被占用的情况的方法:1、使用Windows自带的资源监视器;2、使用命令提示符查看端口信息;3、使用任务管理器查看占用端口的进程。本专题为大家提供windows查看端口被占用的情况的相关的文章、下载、课程内容,供大家免费下载体验。

460

2023.08.02

windows无法访问共享电脑
windows无法访问共享电脑

在现代社会中,共享电脑是办公室和家庭的重要组成部分。然而,有时我们可能会遇到Windows无法访问共享电脑的问题。这个问题可能会导致数据无法共享,影响工作和生活的正常进行。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

2361

2023.08.08

windows自动更新
windows自动更新

Windows操作系统的自动更新功能可以确保系统及时获取最新的补丁和安全更新,以提高系统的稳定性和安全性。然而,有时候我们可能希望暂时或永久地关闭Windows的自动更新功能。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

854

2023.08.10

windows boot manager
windows boot manager

windows boot manager无法开机的解决方法:1、系统文件损坏,使用Windows安装光盘或USB启动盘进入恢复环境,选择修复计算机,然后选择自动修复;2、引导顺序错误,进入恢复环境,选择命令提示符,输入命令"bootrec /fixboot"和"bootrec /fixmbr",然后重新启动计算机;3、硬件问题,使用硬盘检测工具进行扫描和修复;4、重装操作系统。本专题还提供其他解决

1944

2023.08.28

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

3

2026.03.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
成为PHP架构师-自制PHP框架
成为PHP架构师-自制PHP框架

共28课时 | 2.6万人学习

C# 教程
C# 教程

共94课时 | 10.6万人学习

C 教程
C 教程

共75课时 | 5.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号