0

0

Python爬虫怎么绕过Selenium检测_Undetected-Chromedriver反反爬神器使用

P粉602998670

P粉602998670

发布时间:2026-03-18 08:10:03

|

850人浏览过

|

来源于php中文网

原创

undetected-chromedriver 并非完全隐身,因网站通过多层检测(如 navigator.webdriver、Canvas 指纹、鼠标轨迹等)识别自动化行为;v3 更稳定且推荐使用,但需配合真实请求头、合理等待策略及避免异常操作。

python爬虫怎么绕过selenium检测_undetected-chromedriver反反爬神器使用

为什么 undetected-chromedriver 有时还是被识别?

它不是“开箱即隐身”,而是通过替换关键 WebDriver 属性和补丁 Chrome 启动流程来降低指纹特征。但网站(尤其是 Cloudflare、Akamai、PerimeterX)会做多层检测:检查 navigator.webdriverchrome.runtime、Canvas/WebGL 指纹、字体列表、甚至鼠标移动轨迹。一旦你手动调用 driver.execute_cdp_cmd 或注入 JS 修改 navigator,反而暴露异常行为。

实操建议:

立即学习Python免费学习笔记(深入)”;

  • 不要自己覆盖 navigator.webdriver —— undetected-chromedriver v3 已默认设为 undefined,再改可能触发校验
  • 禁用所有非必要扩展:传参 options.add_argument('--disable-extensions'),否则扩展后台脚本可能泄露 window.chrome
  • 避免使用 driver.get('javascript:...') 或频繁 execute_script 注入 DOM —— 这类操作在真实用户中极少见
  • 启动后先访问一个空白页(如 about:blank),等 1–2 秒再跳转目标站,模拟真实加载节奏

undetected-chromedriver v2 和 v3 怎么选?

v2(基于旧版 Selenium)依赖 patching ChromeDriver 二进制,兼容性差,对新版 Chrome 支持滞后;v3(推荐)改用 seleniumwire 风格的代理式拦截 + CDP 协议接管,更稳定,也支持自动匹配本地 Chrome 版本。

实操建议:

立即学习Python免费学习笔记(深入)”;

  • 优先用 v3:pip install undetected-chromedriver==3,并确保已装 selenium>=4.0
  • v3 默认启用 use_subprocess=True,能更好隔离环境;若遇到 fork 错误(常见于 macOS/Linux),改用 use_subprocess=False
  • v2 不再维护,且与 Chrome 115+ 兼容性差,出现 chrome not reachablesession not created 错误时基本就是版本不匹配
  • 别混用:v3 的 uc.Chrome() 返回的是标准 webdriver.Chrome 实例,可直接接续原有代码,无需重写 find_element 等逻辑

绕过检测 ≠ 能稳定抓取:必须配合请求头和等待策略

即使浏览器指纹干净,服务端仍会根据 User-Agent、Accept-Language、Referer、请求频率判断异常。单纯靠 undetected-chromedriver 启动一个“干净浏览器”,不设请求头、不加延迟、不处理 Cookie 复用,大概率触发 403 或滑块验证。

SongAI
SongAI

免费AI歌曲和音乐生成平台,支持文字生成歌曲、AI歌词创作、AI翻唱等功能

下载

实操建议:

立即学习Python免费学习笔记(深入)”;

  • 启动时注入真实 UA 和语言:options.add_argument('--user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36...')
  • 禁用图片/字体加载加速首屏(但别关 JS):prefs = {'profile.managed_default_content_settings.images': 2, 'font_rendering.level': 2}
  • time.sleep() 或显式等待代替 driver.implicitly_wait() —— 后者对反爬页面无效,且容易因超时抛出 TimeoutException
  • 每次会话结束后调用 driver.quit(),避免残留进程干扰下一次启动(v3 的 subprocess 模式尤其要注意)

哪些场景下不该用 undetected-chromedriver

它解决的是“被识别为自动化工具”的问题,不是万能解药。面对需要登录态维持、大量并发、或纯接口型站点时,它反而成为瓶颈。

实操建议:

立即学习Python免费学习笔记(深入)”;

  • 目标站有完善 API 且带签名机制(如某电商商品详情页)—— 直接逆向请求,比启 Chrome 快 5–10 倍,也更可控
  • 需每分钟抓 100+ 页面 —— undetected-chromedriver 启动慢、内存占用高,此时应切回 requests + fake-useragent + 手动维护 Cookie
  • 页面内容由 WebSocket 或 SSE 动态推送 —— 它无法监听这类连接,得换 seleniumwire 或抓包分析协议
  • 运行在无图形界面服务器(如 Docker Alpine)—— 需额外装 chromium 和字体包,且要传 --headless=new,配置稍复杂,不如先确认是否真需要浏览器渲染

真正难的从来不是“怎么让 Selenium 不被发现”,而是搞清目标站哪一层在拦你:是前端 JS 指纹?是后端行为分析?还是 CDN 网关规则?先抓包看返回状态和响应头,比急着换 driver 更有效。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
chrome什么意思
chrome什么意思

chrome是浏览器的意思,由Google开发的网络浏览器,它在2008年首次发布,并迅速成为全球最受欢迎的浏览器之一。本专题为大家提供chrome相关的文章、下载、课程内容,供大家免费下载体验。

1088

2023.08.11

chrome无法加载插件怎么办
chrome无法加载插件怎么办

chrome无法加载插件可以通过检查插件是否已正确安装、禁用和启用插件、清除插件缓存、更新浏览器和插件、检查网络连接和尝试在隐身模式下加载插件方法解决。更多关于chrome相关问题,详情请看本专题下面的文章。php中文网欢迎大家前来学习。

852

2023.11.06

pip安装使用方法
pip安装使用方法

安装步骤:1、确保Python已经正确安装在您的计算机上;2、下载“get-pip.py”脚本;3、按下Win + R键,然后输入cmd并按下Enter键来打开命令行窗口;4、在命令行窗口中,使用cd命令切换到“get-pip.py”所在的目录;5、执行安装命令;6、验证安装结果即可。大家可以访问本专题下的文章,了解pip安装使用方法的更多内容。

373

2023.10.09

更新pip版本
更新pip版本

更新pip版本方法有使用pip自身更新、使用操作系统自带的包管理工具、使用python包管理工具、手动安装最新版本。想了解更多相关的内容,请阅读专题下面的文章。

437

2024.12.20

pip设置清华源
pip设置清华源

设置方法:1、打开终端或命令提示符窗口;2、运行“touch ~/.pip/pip.conf”命令创建一个名为pip的配置文件;3、打开pip.conf文件,然后添加“[global];index-url = https://pypi.tuna.tsinghua.edu.cn/simple”内容,这将把pip的镜像源设置为清华大学的镜像源;4、保存并关闭文件即可。

806

2024.12.23

python升级pip
python升级pip

本专题整合了python升级pip相关教程,阅读下面的文章了解更多详细内容。

371

2025.07.23

cookie
cookie

Cookie 是一种在用户计算机上存储小型文本文件的技术,用于在用户与网站进行交互时收集和存储有关用户的信息。当用户访问一个网站时,网站会将一个包含特定信息的 Cookie 文件发送到用户的浏览器,浏览器会将该 Cookie 存储在用户的计算机上。之后,当用户再次访问该网站时,浏览器会向服务器发送 Cookie,服务器可以根据 Cookie 中的信息来识别用户、跟踪用户行为等。

6501

2023.06.30

document.cookie获取不到怎么解决
document.cookie获取不到怎么解决

document.cookie获取不到的解决办法:1、浏览器的隐私设置;2、Same-origin policy;3、HTTPOnly Cookie;4、JavaScript代码错误;5、Cookie不存在或过期等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

369

2023.11.23

抖漫入口地址合集
抖漫入口地址合集

本专题整合了抖漫入口地址相关合集,阅读专题下面的文章了解更多详细地址。

17

2026.03.17

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号