
本文介绍在使用 selenium 初始化 chromedriver 时偶发卡死的实战解决方案,重点通过启用新版无头模式、设置启动超时与自动重试机制,提升自动化脚本的健壮性与可靠性。
本文介绍在使用 selenium 初始化 chromedriver 时偶发卡死的实战解决方案,重点通过启用新版无头模式、设置启动超时与自动重试机制,提升自动化脚本的健壮性与可靠性。
在实际 Selenium 自动化开发中,开发者常遇到 webdriver.Chrome(...) 初始化语句(如 driver = webdriver.Chrome(service=service, options=options))偶发性阻塞——约每 3–4 次运行中就有一次无限等待,导致程序挂起、无法继续执行。该问题通常不抛出异常,而是静默卡在 WebDriver 启动阶段,根源多与 Chrome 浏览器版本兼容性、旧版无头模式(--headless)缺陷或系统资源竞争有关。
✅ 核心修复:升级无头模式至 --headless=new
自 Chrome 109+ 起,官方正式弃用传统 --headless 参数,转而推荐 --headless=new(基于全新 Headless Shell 架构)。旧参数在高版本 Chrome 中易引发进程僵死、GPU 初始化失败或沙箱通信超时等问题,是导致 Driver 卡死的最常见原因。
请将你的选项配置更新为:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
service = Service(executable_path=r'/usr/bin/chromedriver')
options = Options()
options.add_argument("--headless=new") # ✅ 关键:必须使用 new 模式
options.add_argument("--no-sandbox")
options.add_argument("--disable-gpu") # 推荐补充(尤其在容器/服务器环境)
options.add_argument("--disable-dev-shm-usage") # 避免共享内存不足
options.add_argument("--remote-debugging-port=9222") # 可选:便于调试
# 设置初始化超时(单位:秒)
driver = webdriver.Chrome(
service=service,
options=options,
timeout=30 # ⚠️ Selenium 4.11+ 支持此参数,强制限制 driver 启动耗时
)? 注意:timeout 参数需 Selenium ≥ 4.11 且 ChromeDriver ≥ 115 才生效。若版本较低,请手动实现超时控制(见下文)。
?️ 进阶防护:手动实现带超时与重试的 Driver 初始化
对于旧版 Selenium 或需更高可控性的场景,可借助 concurrent.futures 实现线程级超时,并结合指数退避重试:
import time
from concurrent.futures import ThreadPoolExecutor, TimeoutError
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
def create_driver_with_timeout(max_wait=30, max_retries=3):
for attempt in range(max_retries):
try:
with ThreadPoolExecutor(max_workers=1) as executor:
future = executor.submit(_launch_driver)
driver = future.result(timeout=max_wait)
print(f"✅ Driver initialized successfully on attempt {attempt + 1}")
return driver
except TimeoutError:
print(f"⚠️ Driver launch timed out (attempt {attempt + 1}/{max_retries})")
if attempt < max_retries - 1:
time.sleep(2 ** attempt) # 指数退避:1s → 2s → 4s
else:
raise RuntimeError("Failed to initialize ChromeDriver after all retries")
except Exception as e:
print(f"❌ Driver init failed: {e}")
if attempt == max_retries - 1:
raise
def _launch_driver():
service = Service(executable_path=r'/usr/bin/chromedriver')
options = Options()
options.add_argument("--headless=new")
options.add_argument("--no-sandbox")
options.add_argument("--disable-gpu")
options.add_argument("--disable-dev-shm-usage")
return webdriver.Chrome(service=service, options=options)
# 使用方式
try:
driver = create_driver_with_timeout(max_wait=25, max_retries=2)
except RuntimeError as e:
print(f"? Critical failure: {e}")
# 可在此触发告警、日志上报或降级策略? 关键注意事项与最佳实践
- 版本对齐:确保 Chrome、ChromeDriver 与 selenium 版本兼容(推荐使用 webdriver-manager 自动管理);
- 资源隔离:在 Docker 或 CI 环境中,务必添加 --no-sandbox 和 --disable-dev-shm-usage,避免因权限或共享内存限制导致卡死;
- 日志诊断:启用 Chrome 日志辅助排查:options.add_argument("--log-level=3")(INFO 级别),并捕获 service.log_path 输出;
- 避免重复初始化:Driver 实例应复用而非频繁创建销毁;如需多会话,考虑 webdriver.Remote 或浏览器实例池。
通过上述组合策略——强制启用 --headless=new、设置启动超时、增加智能重试——可将 Driver 初始化失败率趋近于零,显著提升生产环境脚本的稳定性与可维护性。










