如何使用 JavaScript 获取远程 PDF 文档页数并显示在网页中

碧海醫心

发布时间：2025-12-29 15:22:38

726人浏览过

来源于php中文网

原创

如何使用 JavaScript 获取远程 PDF 文档页数并显示在网页中

本文介绍如何通过纯前端 javascript（配合 pdf.js）读取用户输入的 pdf url（如本地服务器路径），获取其总页数并动态显示在 html 页面中，同时说明跨域限制及解决方案。

在 Web 开发中，常需动态解析 PDF 文档信息（如页数），但直接通过 zuojiankuohaophpcninput type="text"> 输入任意 PDF 链接（例如 Google Drive、外部网站）并用 fetch 读取时，会因浏览器 同源策略（CORS） 而失败——尤其是公共云存储（如 drive.google.com）默认不向第三方站点开放跨域访问头（Access-Control-Allow-Origin）。因此，该方案仅适用于同源 PDF 资源（即 PDF 文件托管在同一域名下，如 https://yoursite.com/docs/report.pdf 或 http://localhost:8080/sample.pdf）。

以下为完整可运行的实现方案：

CreateWise AI

为播客创作者设计的AI创作工具，AI自动去口癖、提交亮点和生成Show notes、标题等

下载

✅ 正确实现步骤（同源 PDF）

用户在文本框中输入 PDF 的同源 URL；
点击按钮后，使用 fetch() 获取 PDF 二进制流；
将响应转为 Blob，再用 FileReader 读取为 ArrayBuffer；
交由 pdfjsLib.getDocument() 解析，并提取 pdf.numPages。

<!DOCTYPE html>
<html>
<head>
  <title>Count Number of Pages inside PDF Document</title>
  <link rel="stylesheet" href="https://maxcdn.bootstrapcdn.com/bootstrap/3.4.1/css/bootstrap.min.css">
</head>
<body>
  <div class="container mt-4">
    <h1 class="text-center">Count Pages inside PDF Document</h1>
    <div class="form-group">
      <input 
        type="text" 
        id="pdfFile" 
        class="form-control" 
        placeholder="Enter same-origin PDF URL (e.g., /docs/manual.pdf or http://localhost:3000/file.pdf)" 
        required
      />
      <button id="btn" class="btn btn-primary mt-2">Get Number of Pages</button>
    </div>
    <br>
    <h2 class="text-primary" id="result"></h2>
  </div>

  <!-- 加载 pdf.js（CDN 版本，兼容性好） -->
  <script src="https://cdnjs.cloudflare.com/ajax/libs/pdf.js/2.12.313/pdf.min.js"></script>
  <script>
    document.getElementById("btn").addEventListener("click", async function () {
      const url = document.getElementById("pdfFile").value.trim();
      const resultEl = document.getElementById("result");

      if (!url) {
        resultEl.innerHTML = "<span class='text-danger'>⚠️ Please enter a valid PDF URL.</span>";
        return;
      }

      try {
        // Step 1: Fetch PDF as binary (only works for same-origin or CORS-enabled endpoints)
        const response = await fetch(url);
        if (!response.ok) throw new Error(`HTTP ${response.status}: ${response.statusText}`);

        const blob = await response.blob();
        const fileReader = new FileReader();

        fileReader.onload = function () {
          const typedarray = new Uint8Array(this.result);
          const loadingTask = pdfjsLib.getDocument(typedarray);

          loadingTask.promise.then(pdf => {
            resultEl.innerHTML = 
              `<span class="text-success">✅ The number of pages in this PDF is: <strong>${pdf.numPages}</strong></span>`;
          }).catch(err => {
            resultEl.innerHTML = 
              `<span class="text-danger">❌ Failed to parse PDF: ${err.message}</span>`;
          });
        };

        fileReader.onerror = () => {
          resultEl.innerHTML = "<span class='text-danger'>❌ Error reading file.</span>";
        };

        // Step 2: Read as ArrayBuffer
        fileReader.readAsArrayBuffer(blob);

      } catch (err) {
        resultEl.innerHTML = 
          `<span class="text-danger">❌ Network or CORS error: ${err.message}<br>
           ? Tip: Ensure the PDF is served from the same origin or has proper CORS headers.</span>`;
      }
    });
  </script>
</body>
</html>

⚠️ 重要注意事项

❌ Google Drive、OneDrive、Dropbox 等不支持直连：它们返回的是 HTML 重定向页，而非原始 PDF 流；即使强制加 &export=download，也因缺失 CORS 头而被浏览器拦截。
✅ 可行场景：
- 本地开发服务器（http://localhost:8080/report.pdf）；
- 同一域名下的静态资源（https://yourdomain.com/files/book.pdf）；
- 自建后端代理（如 Express/Nginx 添加 Access-Control-Allow-Origin: *）；
?️ 安全提示：避免在生产环境对不可信 PDF 执行 getDocument()，存在潜在解析风险（建议服务端预校验）；
? 替代方案（如需支持任意公网 PDF）：必须引入服务端代理（Node.js/PHP/Python）绕过 CORS，或使用支持 CORS 的 PDF 托管服务（如 GitHub Pages + raw link + CORS proxy）。

综上，本方案是轻量、零依赖的前端页数检测方案，适用于可控环境下的 PDF 元数据快速提取。务必确认目标 PDF 可被浏览器合法跨域加载，否则将触发 TypeError: Failed to fetch 或 CORS 错误。

修复 PHP 跨域配置导致的 403 错误与 JSON 解析失败问题

数据库提交失败常见原因与解决方案：FormData 与 AJAX 的正确配合

数据库提交失败的常见原因与正确处理 FormData 的完整指南

如何正确实现URL缩短服务中的目标网站元数据展示

如何正确实现短链接重定向以确保社交平台抓取目标页面元数据

相关专题

nginx 重启

nginx重启对于网站的运维来说是非常重要的，根据不同的需求，可以选择简单重启、平滑重启或定时重启等方式。本专题为大家提供nginx重启的相关的文章、下载、课程内容，供大家免费下载体验。

248

2023.07.27

nginx 配置详解

Nginx的配置是指设置和调整Nginx服务器的行为和功能的过程。通过配置文件，可以定义虚拟主机、HTTP请求处理、反向代理、缓存和负载均衡等功能。Nginx的配置语法简洁而强大，允许管理员根据自己的需要进行灵活的调整。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

522

2023.08.04

nginx配置详解

NGINX与其他服务类似，因为它具有以特定格式编写的基于文本的配置文件。本专题为大家提供nginx配置相关的文章，大家可以免费学习。

610

2023.08.04

tomcat和nginx有哪些区别

tomcat和nginx的区别：1、应用领域；2、性能；3、功能；4、配置；5、安全性；6、扩展性；7、部署复杂性；8、社区支持；9、成本；10、日志管理。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

244

2024.02.23

nginx报404怎么解决

当访问 nginx 网页服务器时遇到 404 错误，表明服务器无法找到请求资源，可以通过以下步骤解决：1. 检查文件是否存在且路径正确；2. 检查文件权限并更改为 644 或 755；3. 检查 nginx 配置，确保根目录设置正确、没有冲突配置等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

714

2024.07.09