浏览器插件如何捕获页面上的XML并上传

幻夢星雲

发布时间：2026-03-10 13:00:50

901人浏览过

来源于php中文网

原创

xml捕获需区分xhr/fetch响应与dom嵌入两类来源：前者须拦截网络请求并解析响应体，后者应直接提取textcontent；混用方法将导致失败。

浏览器插件如何捕获页面上的xml并上传

XML 捕获必须区分来源：XHR 还是 DOM？

浏览器插件无法“全局监听所有 XML”，必须明确目标来源。常见两类：一是页面通过 fetch 或 XMLHttpRequest 加载的 XML 响应（如 RSS、SOAP 接口）；二是页面 DOM 中已存在的 <?xml> 声明或 <root><item>...</item></root> 结构。前者需拦截网络请求，后者可直接查询 DOM —— 方法完全不同，混用会导致捕获失败。

DOM 中的 XML 通常只是普通 HTML 元素（如 <pre class="brush:php;toolbar:false;"></code> 里放的 XML 字符串），没有解析为 XML 文档对象，不能用 <code>responseXML</code></li> <li>XHR/fetch 的 XML 响应，只有在 <code>responseType === 'document'</code> 或服务端返回 <code>Content-Type: application/xml</code> 且浏览器自动解析时，才可能拿到 <code>responseXML</code></li> <li>现代 fetch 默认不解析 XML，<code>response.text()</code> 是最稳妥的获取原始 XML 字符串方式</li> </ul> <H3>拦截 XHR/fetch 并提取 XML 响应体</H3> <p>需在 content script 中重写原生方法，捕获响应内容。注意：fetch 拦截比 XHR 更复杂，因它是 Promise 驱动，需包装 <code>response.clone()</code> 避免 body 被读取多次。</p> <pre class="brush:php;toolbar:false;">const originalFetch = window.fetch; window.fetch = function(...args) { return originalFetch(...args).then(response => { // 只处理明确返回 XML 的响应 const contentType = response.headers.get('content-type'); if (contentType && /application\/xml|text\/xml/i.test(contentType)) { const cloned = response.clone(); cloned.text().then(xmlStr => { // 此处发送 XML 字符串到后台脚本或上传接口 chrome.runtime.sendMessage({ type: 'xml-captured', url: response.url, xml: xmlStr.slice(0, 102400) // 限制长度防爆内存 }); }).catch(() => {}); } return response; }); };</pre> <ul> <li>不要在 fetch 拦截中直接调用 <code>response.text() 后返回新 Response —— 会破坏原始响应流
chrome.runtime.sendMessage 需在 manifest.json 中声明 "externally_connectable" 或仅用于内部通信
部分站点使用 blob: URL 或 Service Worker 拦截请求，此时 content script 无法捕获，需改用 webRequest API（需 "webRequest" 权限和 "host_permissions"）

从 DOM 提取 XML 字符串的可靠方式

当 XML 以文本形式嵌入 HTML（如 <script type="application/xml"></script>、<pre class="xml"></code>、或注释节点），用 <code>textContent</code> 最安全。避免用 <code>innerHTML</code>，防止误解析标签。</p><div class="aritcle_card flexRow"> <div class="artcardd flexRow"> <a class="aritcle_card_img" href="/xiazai/code/10454" title="通吃客零食网整站 for Shopex"><img src="https://img.php.cn/upload/webcode/000/000/020/176216580836240.jpg" alt="通吃客零食网整站 for Shopex" onerror="this.onerror='';this.src='/static/lhimages/moren/morentu.png'" ></a> <div class="aritcle_card_info flexColumn"> <a href="/xiazai/code/10454" title="通吃客零食网整站 for Shopex">通吃客零食网整站 for Shopex</a> <p>第一步】：将安装包中所有的文件夹和文件用ftp工具以二进制方式上传至服务器空间;(如果您不知如何设置ftp工具的二进制方式，可以查看：(http://www.shopex.cn/support/qa/setup.help.717.html)【第二步】：在浏览器中输入 http://您的商店域名/install 进行安装界面进行安装即可。【第二步】：登录后台，工具箱里恢复数据管理后台是url/sho</p> </div> <a href="/xiazai/code/10454" title="通吃客零食网整站 for Shopex" class="aritcle_card_btn flexRow flexcenter"><b></b><span>下载</span> </a> </div> </div> <pre class="brush:php;toolbar:false;">// 匹配常见的 XML 容器 const xmlCandidates = [ 'script[type="application/xml"]', 'script[type="text/xml"]', 'pre.xml', 'code.xml', 'textarea[lang="xml"]' ].map(sel => document.querySelectorAll(sel)).flat(); xmlCandidates.forEach(el => { let xmlStr = el.textContent.trim(); // 简单校验：开头是否含 <?xml 或 <root 类似结构 if (/^<\?xml\s|^\s*<\w+[\s>]/.test(xmlStr)) { chrome.runtime.sendMessage({ type: 'xml-from-dom', selector: el.outerHTML.substring(0, 50), xml: xmlStr.slice(0, 102400) }); } });</pre> <ul> <li>DOM 提取无法捕获动态生成的 XML（如 JS 拼接后写入 <code>innerHTML 但未挂载到文档）

若 XML 被压缩成一行且无换行，正则 /^ 仍有效；但纯二进制 XML（如 gzip 压缩）无法通过 DOM 提取

注意 CSP 限制：某些站点禁止内联脚本执行，需将逻辑注入到 run_at: "document_idle" 的 content script

上传前必须处理的三个实际问题

直接 fetch(uploadUrl, { method: 'POST', body: xmlStr }) 很容易失败。真实环境中需确认以下三点：

服务端是否要求 Content-Type: application/xml？还是接受 text/plain 或表单字段？不匹配会返回 400
XML 字符串是否含非法控制字符（如 \u0000–\u0008）？上传前建议用 xmlStr.replace(/[\x00-\x08\x0B\x0C\x0E-\x1F\x7F]/g, '') 清理
跨域上传时，若服务端未设置 Access-Control-Allow-Origin，需走 background script 中转（background 不受 CORS 限制）

最易被忽略的是编码一致性：XML 声明中的 encoding="GBK" 和实际传输字节不匹配，会导致服务端解析乱码。插件中统一用 UTF-8 处理和上传，除非服务端明确要求其他编码。

XML格式化查看器插件 Chrome浏览器预览XML的最佳扩展

XPointer是什么如何用它来定位XML文档的特定部分

MathML是什么如何在网页中显示数学公式XML

Web.config system.webServer directoryBrowse IIS目录浏览配置

什么是XPointer XPointer语法详解

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

454

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

546

2023.08.23

jquery怎么操作json

操作的方法有：1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”；3、“$.each(obj, callback)”；4、“$.ajax()”。更多jquery怎么操作json的详细内容，可以访问本专题下面的文章。

334

2023.10.13

go语言处理json数据方法

本专题整合了go语言中处理json数据方法，阅读专题下面的文章了解更多详细内容。

2025.09.10

chrome什么意思

chrome是浏览器的意思，由Google开发的网络浏览器，它在2008年首次发布，并迅速成为全球最受欢迎的浏览器之一。本专题为大家提供chrome相关的文章、下载、课程内容，供大家免费下载体验。

1051

2023.08.11

chrome无法加载插件怎么办

chrome无法加载插件可以通过检查插件是否已正确安装、禁用和启用插件、清除插件缓存、更新浏览器和插件、检查网络连接和尝试在隐身模式下加载插件方法解决。更多关于chrome相关问题，详情请看本专题下面的文章。php中文网欢迎大家前来学习。

832

2023.11.06

pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法：1. 使用在线转换器；2. 使用桌面软件（如 adobe acrobat、itext）；3. 使用命令行工具（如 pdftoxml）。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1945

2024.04.01

xml怎么变成word

步骤：1. 导入 xml 文件；2. 选择 xml 结构；3. 映射 xml 元素到 word 元素；4. 生成 word 文档。提示：确保 xml 文件结构良好，并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容，可以阅读本专题下面的文章。

2119

2024.08.01

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

热门下载

网站特效

网站源码

网站素材

前端模板