Python网络重试机制核心是精准判断可重试场景与合理退避:仅对临时性失败(如502/503/504/429)重试,禁用对4xx客户端错误等重试;推荐requests+urllib3原生重试策略,或自定义带抖动指数退避函数,并需配合超时、限流、日志及幂等设计。

Python 网络重试机制的核心是:捕获异常、判断是否可重试、控制重试次数与间隔、避免雪崩。关键不在“重试多少次”,而在“什么情况下才值得重试”和“怎么退避才合理”。
明确哪些错误值得重试
不是所有网络异常都适合重试。应只对临时性失败(transient failure)重试,比如:
-
连接类错误:
ConnectionError、Timeout、ConnectTimeout - 服务端临时错误:HTTP 502/503/504、429(需结合 Retry-After 头)
- 忽略以下情况:400/401/403/404、SSL 验证失败、DNS 解析失败(除非确认是偶发)、请求体过大等客户端问题
用 requests + urllib3 的原生重试(推荐初用)
requests 底层基于 urllib3,支持开箱即用的重试策略:
from requests.adapters import HTTPAdapter
from urllib3.util.retry import Retry
import requests
<p>retry_strategy = Retry(
total=3, # 总重试次数(含首次请求)
status_forcelist=[502, 503, 504, 429],
allowed_methods=["HEAD", "GET", "OPTIONS", "POST"], # 显式指定可重试方法
backoff_factor=1.0, # 指数退避因子:第 n 次重试前等待 backoff_factor * (2^(n-1)) 秒
)
adapter = HTTPAdapter(max_retries=retry_strategy)
session = requests.Session()
session.mount("http://", adapter)
session.mount("https://", adapter)</p><h1>使用</h1><p>resp = session.get("<a href="https://www.php.cn/link/46b315dd44d174daf5617e22b3ac94ca">https://www.php.cn/link/46b315dd44d174daf5617e22b3ac94ca</a>")
</p>注意:backoff_factor=1.0 时,重试间隔依次为 0s、1s、2s、4s(总 3 次重试对应 3 次等待)。
立即学习“Python免费学习笔记(深入)”;
自定义重试逻辑(灵活控制场景)
当需要动态判断(如根据响应内容、Header、或熔断状态)时,建议封装一个重试函数:
import time
import random
from functools import wraps
<p>def retry_on_failure(
max_attempts=3,
backoff_base=1.0,
jitter=True,
exceptions=(ConnectionError, TimeoutError),
):
def decorator(func):
@wraps(func)
def wrapper(*args, *<em>kwargs):
last_exc = None
for attempt in range(max_attempts):
try:
return func(</em>args, **kwargs)
except exceptions as e:
last_exc = e
if attempt == max_attempts - 1:
break</p><h1>计算退避时间(带抖动防同步)</h1><pre class="brush:php;toolbar:false;"> sleep_time = backoff_base * (2 ** attempt)
if jitter:
sleep_time *= random.uniform(0.8, 1.2)
time.sleep(max(0.1, sleep_time))
raise last_exc
return wrapper
return decorator使用示例
@retry_on_failure(max_attempts=3, backoff_base=0.5) def fetch_data(url): resp = requests.get(url, timeout=5) resp.raise_for_status() return resp.json()
这种写法便于扩展:可加入日志、指标上报、熔断器(如 tenacity 库的 stop_after_attempt + circuit_breaker)。
生产环境注意事项
真实系统中,重试不是万能解药,需配合其他机制:
- 设置合理超时:连接超时(connect timeout)和读取超时(read timeout)分开设,避免单次请求卡死太久
- 限制并发重试量:高并发下大量重试可能压垮下游,可用信号量或限流器控制
- 记录重试行为:记录重试次数、耗时、最终结果,用于故障定位和容量评估
- 避免重试非幂等操作:如 POST 创建资源,重复提交可能产生脏数据;此时应改用幂等设计(如带 idempotency-key)










