Python网络重试机制核心是精准判断可重试场景与合理退避:仅对临时性失败(如502/503/504/429)重试,禁用对4xx客户端错误等重试;推荐requests+urllib3原生重试策略,或自定义带抖动指数退避函数,并需配合超时、限流、日志及幂等设计。

Python 网络重试机制的核心是:捕获异常、判断是否可重试、控制重试次数与间隔、避免雪崩。关键不在“重试多少次”,而在“什么情况下才值得重试”和“怎么退避才合理”。
明确哪些错误值得重试
不是所有网络异常都适合重试。应只对临时性失败(transient failure)重试,比如:
-
连接类错误:
ConnectionError、Timeout、ConnectTimeout - 服务端临时错误:HTTP 502/503/504、429(需结合 Retry-After 头)
- 忽略以下情况:400/401/403/404、SSL 验证失败、DNS 解析失败(除非确认是偶发)、请求体过大等客户端问题
用 requests + urllib3 的原生重试(推荐初用)
requests 底层基于 urllib3,支持开箱即用的重试策略:
from requests.adapters import HTTPAdapter from urllib3.util.retry import Retry import requestsretry_strategy = Retry( total=3, # 总重试次数(含首次请求) status_forcelist=[502, 503, 504, 429], allowed_methods=["HEAD", "GET", "OPTIONS", "POST"], # 显式指定可重试方法 backoff_factor=1.0, # 指数退避因子:第 n 次重试前等待 backoff_factor * (2^(n-1)) 秒 ) adapter = HTTPAdapter(max_retries=retry_strategy) session = requests.Session() session.mount("http://", adapter) session.mount("https://", adapter)
使用
resp = session.get("https://www.php.cn/link/46b315dd44d174daf5617e22b3ac94ca")
注意:backoff_factor=1.0 时,重试间隔依次为 0s、1s、2s、4s(总 3 次重试对应 3 次等待)。
立即学习“Python免费学习笔记(深入)”;
自定义重试逻辑(灵活控制场景)
当需要动态判断(如根据响应内容、Header、或熔断状态)时,建议封装一个重试函数:
import time import random from functools import wrapsdef retry_on_failure( max_attempts=3, backoff_base=1.0, jitter=True, exceptions=(ConnectionError, TimeoutError), ): def decorator(func): @wraps(func) def wrapper(*args, *kwargs): last_exc = None for attempt in range(max_attempts): try: return func(args, **kwargs) except exceptions as e: last_exc = e if attempt == max_attempts - 1: break
计算退避时间(带抖动防同步)
sleep_time = backoff_base * (2 ** attempt) if jitter: sleep_time *= random.uniform(0.8, 1.2) time.sleep(max(0.1, sleep_time)) raise last_exc return wrapper return decorator使用示例
@retry_on_failure(max_attempts=3, backoff_base=0.5) def fetch_data(url): resp = requests.get(url, timeout=5) resp.raise_for_status() return resp.json()
这种写法便于扩展:可加入日志、指标上报、熔断器(如
tenacity库的stop_after_attempt+circuit_breaker)。生产环境注意事项
真实系统中,重试不是万能解药,需配合其他机制:
- 设置合理超时:连接超时(connect timeout)和读取超时(read timeout)分开设,避免单次请求卡死太久
- 限制并发重试量:高并发下大量重试可能压垮下游,可用信号量或限流器控制
- 记录重试行为:记录重试次数、耗时、最终结果,用于故障定位和容量评估
- 避免重试非幂等操作:如 POST 创建资源,重复提交可能产生脏数据;此时应改用幂等设计(如带 idempotency-key)










