0

0

如何使用 JavaScript 获取远程 PDF 文档页数并显示在网页中

碧海醫心

碧海醫心

发布时间:2025-12-29 15:22:38

|

726人浏览过

|

来源于php中文网

原创

如何使用 JavaScript 获取远程 PDF 文档页数并显示在网页中

本文介绍如何通过纯前端 javascript(配合 pdf.js)读取用户输入的 pdf url(如本地服务器路径),获取其总页数并动态显示在 html 页面中,同时说明跨域限制及解决方案。

在 Web 开发中,常需动态解析 PDF 文档信息(如页数),但直接通过 zuojiankuohaophpcninput type="text"> 输入任意 PDF 链接(例如 Google Drive、外部网站)并用 fetch 读取时,会因浏览器 同源策略(CORS) 而失败——尤其是公共云存储(如 drive.google.com)默认不向第三方站点开放跨域访问头(Access-Control-Allow-Origin)。因此,该方案仅适用于同源 PDF 资源(即 PDF 文件托管在同一域名下,如 https://yoursite.com/docs/report.pdf 或 http://localhost:8080/sample.pdf)。

以下为完整可运行的实现方案:

CreateWise AI
CreateWise AI

为播客创作者设计的AI创作工具,AI自动去口癖、提交亮点和生成Show notes、标题等

下载

✅ 正确实现步骤(同源 PDF)

  1. 用户在文本框中输入 PDF 的同源 URL
  2. 点击按钮后,使用 fetch() 获取 PDF 二进制流;
  3. 将响应转为 Blob,再用 FileReader 读取为 ArrayBuffer;
  4. 交由 pdfjsLib.getDocument() 解析,并提取 pdf.numPages。
<!DOCTYPE html>
<html>
<head>
  <title>Count Number of Pages inside PDF Document</title>
  <link rel="stylesheet" href="https://maxcdn.bootstrapcdn.com/bootstrap/3.4.1/css/bootstrap.min.css">
</head>
<body>
  <div class="container mt-4">
    <h1 class="text-center">Count Pages inside PDF Document</h1>
    <div class="form-group">
      <input 
        type="text" 
        id="pdfFile" 
        class="form-control" 
        placeholder="Enter same-origin PDF URL (e.g., /docs/manual.pdf or http://localhost:3000/file.pdf)" 
        required
      />
      <button id="btn" class="btn btn-primary mt-2">Get Number of Pages</button>
    </div>
    <br>
    <h2 class="text-primary" id="result"></h2>
  </div>

  <!-- 加载 pdf.js(CDN 版本,兼容性好) -->
  <script src="https://cdnjs.cloudflare.com/ajax/libs/pdf.js/2.12.313/pdf.min.js"></script>
  <script>
    document.getElementById("btn").addEventListener("click", async function () {
      const url = document.getElementById("pdfFile").value.trim();
      const resultEl = document.getElementById("result");

      if (!url) {
        resultEl.innerHTML = "<span class='text-danger'>⚠️ Please enter a valid PDF URL.</span>";
        return;
      }

      try {
        // Step 1: Fetch PDF as binary (only works for same-origin or CORS-enabled endpoints)
        const response = await fetch(url);
        if (!response.ok) throw new Error(`HTTP ${response.status}: ${response.statusText}`);

        const blob = await response.blob();
        const fileReader = new FileReader();

        fileReader.onload = function () {
          const typedarray = new Uint8Array(this.result);
          const loadingTask = pdfjsLib.getDocument(typedarray);

          loadingTask.promise.then(pdf => {
            resultEl.innerHTML = 
              `<span class="text-success">✅ The number of pages in this PDF is: <strong>${pdf.numPages}</strong></span>`;
          }).catch(err => {
            resultEl.innerHTML = 
              `<span class="text-danger">❌ Failed to parse PDF: ${err.message}</span>`;
          });
        };

        fileReader.onerror = () => {
          resultEl.innerHTML = "<span class='text-danger'>❌ Error reading file.</span>";
        };

        // Step 2: Read as ArrayBuffer
        fileReader.readAsArrayBuffer(blob);

      } catch (err) {
        resultEl.innerHTML = 
          `<span class="text-danger">❌ Network or CORS error: ${err.message}<br>
           ? Tip: Ensure the PDF is served from the same origin or has proper CORS headers.</span>`;
      }
    });
  </script>
</body>
</html>

⚠️ 重要注意事项

  • Google Drive、OneDrive、Dropbox 等不支持直连:它们返回的是 HTML 重定向页,而非原始 PDF 流;即使强制加 &export=download,也因缺失 CORS 头而被浏览器拦截。
  • 可行场景
    • 本地开发服务器(http://localhost:8080/report.pdf);
    • 同一域名下的静态资源(https://yourdomain.com/files/book.pdf);
    • 自建后端代理(如 Express/Nginx 添加 Access-Control-Allow-Origin: *);
  • ?️ 安全提示:避免在生产环境对不可信 PDF 执行 getDocument(),存在潜在解析风险(建议服务端预校验);
  • ? 替代方案(如需支持任意公网 PDF):必须引入服务端代理(Node.js/PHP/Python)绕过 CORS,或使用支持 CORS 的 PDF 托管服务(如 GitHub Pages + raw link + CORS proxy)。

综上,本方案是轻量、零依赖的前端页数检测方案,适用于可控环境下的 PDF 元数据快速提取。务必确认目标 PDF 可被浏览器合法跨域加载,否则将触发 TypeError: Failed to fetch 或 CORS 错误。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
nginx 重启
nginx 重启

nginx重启对于网站的运维来说是非常重要的,根据不同的需求,可以选择简单重启、平滑重启或定时重启等方式。本专题为大家提供nginx重启的相关的文章、下载、课程内容,供大家免费下载体验。

248

2023.07.27

nginx 配置详解
nginx 配置详解

Nginx的配置是指设置和调整Nginx服务器的行为和功能的过程。通过配置文件,可以定义虚拟主机、HTTP请求处理、反向代理、缓存和负载均衡等功能。Nginx的配置语法简洁而强大,允许管理员根据自己的需要进行灵活的调整。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

522

2023.08.04

nginx配置详解
nginx配置详解

NGINX与其他服务类似,因为它具有以特定格式编写的基于文本的配置文件。本专题为大家提供nginx配置相关的文章,大家可以免费学习。

610

2023.08.04

tomcat和nginx有哪些区别
tomcat和nginx有哪些区别

tomcat和nginx的区别:1、应用领域;2、性能;3、功能;4、配置;5、安全性;6、扩展性;7、部署复杂性;8、社区支持;9、成本;10、日志管理。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

244

2024.02.23

nginx报404怎么解决
nginx报404怎么解决

当访问 nginx 网页服务器时遇到 404 错误,表明服务器无法找到请求资源,可以通过以下步骤解决:1. 检查文件是否存在且路径正确;2. 检查文件权限并更改为 644 或 755;3. 检查 nginx 配置,确保根目录设置正确、没有冲突配置等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

714

2024.07.09

Nginx报404错误解决方法
Nginx报404错误解决方法

解决方法:只需要加上这段配置:try_files $uri $uri/ /index.html;即可。想了解更多Nginx的相关内容,可以阅读本专题下面的文章。

3618

2024.08.07

nginx部署php项目教程汇总
nginx部署php项目教程汇总

本专题整合了nginx部署php项目教程汇总,阅读专题下面的文章了解更多详细内容。

56

2026.01.13

nginx配置文件详细教程
nginx配置文件详细教程

本专题整合了nginx配置文件相关教程详细汇总,阅读专题下面的文章了解更多详细内容。

72

2026.01.13

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.5万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号