0

0

SeleniumBase 中正确拦截 HTTP 请求的完整指南

聖光之護

聖光之護

发布时间:2026-02-23 13:24:02

|

451人浏览过

|

来源于php中文网

原创

SeleniumBase 中正确拦截 HTTP 请求的完整指南

本文详解如何在 seleniumbase 中启用并使用 response_interceptor 实现请求级拦截,替代传统遍历 driver.requests 的低效方式,确保实时捕获所有网络请求(含 ajax、资源加载等),并给出可直接运行的代码示例与关键注意事项。

本文详解如何在 seleniumbase 中启用并使用 response_interceptor 实现请求级拦截,替代传统遍历 driver.requests 的低效方式,确保实时捕获所有网络请求(含 ajax、资源加载等),并给出可直接运行的代码示例与关键注意事项。

SeleniumBase 自 v4.18.0 起原生集成 selenium-wire 功能(需启用 wire=True),支持真正的请求/响应拦截——但必须通过 response_interceptor(或 request_interceptor)回调函数实现实时监听,而非依赖 driver.requests 属性。后者仅在页面加载完成后快照式返回已捕获的请求列表,无法覆盖动态加载(如 LinkedIn 首页的无限滚动、React 数据拉取、广告追踪脚本等触发的后续请求),因此你观察到“只打印单个 GET”的现象是预期行为,而非 Bug。

✅ 正确做法:为 Driver 实例动态绑定拦截器函数,并确保 wire=True 启用底层代理机制:

SpeechEasy
SpeechEasy

SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。

下载
from seleniumbase import Driver

def intercept_response(request, response):
    # request: seleniumwire.request.Request 对象
    # response: seleniumwire.response.Response 对象(可能为 None,若请求未返回响应)
    if response is not None:
        print(f"[{response.status}] {request.method} {request.url}")
        print("Headers:", dict(request.headers))

# 关键:必须设置 wire=True,否则拦截器无效
driver = Driver(
    browser="chrome",
    wire=True,  # ⚠️ 必须启用!否则 driver.response_interceptor 被忽略
    headed=True,
    # 其他参数(如 agent、proxy、pls)可按需添加,不影响拦截功能
)

# 绑定拦截器(支持 request_interceptor / response_interceptor / both)
driver.response_interceptor = intercept_response

try:
    driver.get("https://www.linkedin.com")
    # 建议添加显式等待,确保动态内容加载完成(如等待某元素出现)
    driver.wait_for_element_visible("nav", timeout=15)
finally:
    driver.quit()

? 重要注意事项

  • wire=True 是硬性前提:它会自动注入 selenium-wire 代理层,未启用时所有拦截器属性均被静默忽略;
  • 拦截器在每次网络交互时同步触发,因此可实时打印、修改请求头、阻断请求(通过 request.abort())或篡改响应(response.body = b'...');
  • 若需同时处理请求与响应,可分别设置:
    driver.request_interceptor = lambda r: r.headers.update({"X-Trace": "SeleniumBase"})
    driver.response_interceptor = lambda r, s: print(r.url, s.status)
  • 避免在拦截器中执行耗时操作(如 I/O、复杂计算),否则将显著拖慢页面加载;
  • 某些网站(如 LinkedIn)启用 CSP 或反爬策略,可能屏蔽代理流量;此时建议配合合法 User-Agent、禁用图片/JS(--blink-settings=imagesEnabled=false)或使用 --disable-blink-features=AutomationControlled 等 Chromium 参数增强稳定性。

? 总结:SeleniumBase 的请求拦截能力完全对标 selenium-wire,核心在于*启用 wire=True + 正确绑定 `_interceptor回调**。抛弃driver.requests` 的静态快照思维,转向事件驱动的实时拦截模型,才能真正掌控现代 SPA 应用的全链路网络行为。

相关标签:

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
ajax教程
ajax教程

php中文网为大家带来ajax教程合集,Ajax是一种用于创建快速动态网页的技术。通过在后台与服务器进行少量数据交换,Ajax可以使网页实现异步更新。这意味着可以在不重新加载整个网页的情况下,对网页的某部分进行更新。php中文网还为大家带来ajax的相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

165

2023.06.14

ajax中文乱码解决方法
ajax中文乱码解决方法

ajax中文乱码解决方法有设置请求头部的字符编码、在服务器端设置响应头部的字符编码和使用encodeURIComponent对中文进行编码。本专题为大家提供ajax中文乱码相关的文章、下载、课程内容,供大家免费下载体验。

168

2023.08.31

ajax传递中文乱码怎么办
ajax传递中文乱码怎么办

ajax传递中文乱码的解决办法:1、设置统一的编码方式;2、服务器端编码;3、客户端解码;4、设置HTTP响应头;5、使用JSON格式。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

122

2023.11.15

ajax网站有哪些
ajax网站有哪些

使用ajax的网站有谷歌、维基百科、脸书、纽约时报、亚马逊、stackoverflow、twitter、hacker news、shopify和basecamp等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

245

2024.09.24

js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

524

2023.06.20

js获取当前时间
js获取当前时间

JS全称JavaScript,是一种具有函数优先的轻量级,解释型或即时编译型的编程语言;它是一种属于网络的高级脚本语言,主要用于Web,常用来为网页添加各式各样的动态功能。js怎么获取当前时间呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

454

2023.07.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

618

2023.08.03

js是什么意思
js是什么意思

JS是JavaScript的缩写,它是一种广泛应用于网页开发的脚本语言。JavaScript是一种解释性的、基于对象和事件驱动的编程语言,通常用于为网页增加交互性和动态性。它可以在网页上实现复杂的功能和效果,如表单验证、页面元素操作、动画效果、数据交互等。

5756

2023.08.17

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1127

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号