asyncio.gather()是并发启动并等待全部完成的批处理工具,create_task()是立即将协程调度为task对象以便精细控制;二者协作而非替代,gather适用于不关心响应顺序的并行请求,create_task适用于需穿插await的顺序依赖场景。

asyncio.gather() 和 asyncio.create_task() 的本质区别
asyncio.gather() 是并发启动、等待全部完成的“批处理工具”,而 asyncio.create_task() 是把协程立刻调度进事件循环、返回一个可随时 await 的 Task 对象。两者不是替代关系,而是协作关系。
常见错误是以为 await asyncio.gather(a(), b()) 能控制执行顺序——其实它只保证“全部开始、全部结束”,中间谁先返回谁后返回完全不可控;而用 create_task() 才能穿插 await 实现精细调度。
- 需要并行发多个 HTTP 请求且不关心响应顺序 → 用
gather() - 想发请求 A,等它返回后再发请求 B,但又不想阻塞整个协程 → 先
create_task(a()),再await它,接着create_task(b()) -
gather()中任意一个协程抛出异常,所有任务都会被取消(除非加return_exceptions=True);create_task()抛异常只影响自身,不影响其他已提交的 Task
用 asyncio.Semaphore 控制并发数,别靠 time.sleep()
很多人用 await asyncio.sleep(0.1) 模拟“错峰”,这既不准又浪费资源:sleep 不等于让出 CPU,只是延迟 await,实际并发数还是由事件循环调度决定,根本压不住连接数或 API 调用频次。
真正可控的方式是 asyncio.Semaphore,它像一道门禁,限制同时最多几个协程能通过关键代码段。
立即学习“Python免费学习笔记(深入)”;
- 初始化时指定最大并发数:
sem = asyncio.Semaphore(5) - 在要限流的代码块前加
async with sem:,自动 acquire/release - 注意:Semaphore 不感知任务实际耗时,只管“进的数量”,所以适合 IO 密集型场景(如爬虫、批量 API 调用),不适合 CPU 密集型(得用线程池)
- 别在循环里反复创建 Semaphore,它应作为共享对象传入或定义为模块级变量
await 一个已经完成的 Task 不会挂起,但 await 同一个协程两次会报错
这是容易混淆的点:create_task() 返回的是 Task 对象,它可被多次 await;而普通协程函数(比如 fetch_data())每次调用都返回新协程对象,只能 await 一次。
典型错误现象:RuntimeError: cannot reuse already awaited coroutine,往往出现在把协程赋值给变量后重复 await。
- ✅ 正确:
task = asyncio.create_task(fetch_data()),然后await task多次(第二次直接返回结果) - ❌ 错误:
coro = fetch_data(),然后await coro两次 - ⚠️ 注意:
asyncio.ensure_future()行为类似create_task(),但推荐用后者(更明确、有 loop 绑定保障) - 如果不确定来源是协程还是 Task,可用
asyncio.iscoroutine()或asyncio.isfuture()判断
asyncio.run() 内部会新建事件循环,别在已有 loop 中调用
在 Jupyter、FastAPI 生命周期、或已运行 asyncio.get_event_loop() 的进程里再调 asyncio.run(main()),会触发 RuntimeError: asyncio.run() cannot be called from a running event loop。
这不是 bug,是设计:asyncio.run() 是为脚本入口准备的“一键启动+清理”封装,它自己管理 loop 生命周期。生产环境里你通常不该手动调它。
- 脚本主入口(if __name__ == '__main__':)→ 用
asyncio.run(main()) - Web 框架(如 FastAPI、Starlette)→ 框架已接管 loop,你只写路由协程,不用管 run
- Jupyter / REPL → 用
await main()直接执行,或装nest_asyncio(仅调试) - 想复用当前 loop?直接
asyncio.create_task()或loop.create_task(),别碰run()
asyncio.current_task() 和 asyncio.all_tasks() 看一眼实际在跑啥。










