Python async/await 协程：CPU密集型任务的陷阱与解决方案

心靈之曲

发布时间：2025-12-01 11:55:02

197人浏览过

来源于php中文网

原创

python async/await 协程：cpu密集型任务的陷阱与解决方案

Python的`async/await`机制旨在通过协程实现并发，但其工作原理在处理CPU密集型任务时常引人困惑。本文将深入探讨为何`await`一个纯计算任务无法交出控制权，而`await asyncio.sleep(0)`却能实现任务切换。我们将剖析事件循环的协作机制，并提供针对CPU密集型任务的正确并发策略，帮助开发者避免常见陷阱。

1. asyncio 与协程概述

asyncio是Python中用于编写并发代码的库，它通过事件循环（event loop）和协程（coroutines）实现单线程内的协作式多任务。async/await语法是定义和等待协程的核心。其设计初衷是为了高效处理I/O密集型任务，例如网络请求、文件读写等。当一个协程遇到I/O操作并使用await关键字时，它会将控制权交还给事件循环，允许事件循环调度其他“准备就绪”的协程运行，从而避免了线程切换的开销，提高了资源利用率。

2. CPU密集型任务与 await 的误区

许多开发者在初次接触asyncio时，会误以为只要在函数前加上async，并在调用时使用await，就能实现任务的并发交替执行。然而，这并非总是如此，尤其是在处理CPU密集型任务时。

考虑以下示例代码：

立即学习“Python免费学习笔记（深入）”；

import asyncio
import time

async def long_function():
    """一个纯粹的CPU密集型任务，不涉及任何I/O或异步操作。"""
    print(f"Task {asyncio.current_task().get_name()}: long_function started...")
    for _ in range(50_000_000): # 大量循环，模拟耗时计算
        pass
    print(f"Task {asyncio.current_task().get_name()}: long_function finished.")

async def count_blocking():
    """包含阻塞性CPU任务的协程。"""
    for x in range(3):
        print(f"Count {x} in {asyncio.current_task().get_name()}")
        await long_function() # 等待一个CPU密集型任务

async def main_blocking():
    """主协程，启动两个阻塞性计数任务。"""
    task1 = asyncio.create_task(count_blocking(), name="Count-A")
    task2 = asyncio.create_task(count_blocking(), name="Count-B")
    await asyncio.gather(task1, task2)

if __name__ == "__main__":
    start_time = time.perf_counter()
    asyncio.run(main_blocking())
    end_time = time.perf_counter()
    print(f"\n总执行时间 (阻塞): {end_time - start_time:.2f} 秒")

运行上述代码，你会发现输出结果是：一个count_blocking协程会完全执行完毕，包括其内部的long_function的所有迭代，然后另一个count_blocking协程才开始执行。输出顺序会是：

Count 0 in Count-A
Task Count-A: long_function started...
Task Count-A: long_function finished.
Count 1 in Count-A
Task Count-A: long_function started...
Task Count-A: long_function finished.
Count 2 in Count-A
Task Count-A: long_function started...
Task Count-A: long_function finished.
Count 0 in Count-B
Task Count-B: long_function started...
Task Count-B: long_function finished.
...

这与我们期望的交替输出（如0、0、1、1...）大相径庭。原因是await关键字本身并不具备“中断”正在执行的函数的能力。它仅仅表示“我正在等待某个异步操作完成，在此期间，你可以去执行其他准备就绪的协程”。而long_function内部是一个纯粹的计算循环，它没有任何I/O操作，也没有主动向事件循环报告它正在“等待”什么。因此，一旦事件循环将控制权交给long_function，它就会一直运行直到计算完成，期间不会释放控制权，从而阻塞了整个事件循环。

3. asyncio.sleep(0) 的作用：显式交出控制权

为了实现CPU密集型任务的协作式并发，我们需要在耗时计算中显式地将控制权交还给事件循环。asyncio.sleep(0)就是实现这一目的的常用技巧。

import asyncio
import time

async def long_function_cooperative():
    """一个协作式的CPU密集型任务，周期性地交出控制权。"""
    task_name = asyncio.current_task().get_name()
    # print(f"Task {task_name}: long_function_cooperative started...")
    for i in range(50_000_000):
        # 每隔一定次数的循环，显式地交出控制权
        if i % 10_000_000 == 0 and i != 0:
            # print(f"Task {task_name}: Yielding at iteration {i}")
            await asyncio.sleep(0) # 关键：交出控制权
    print(f"Task {task_name}: long_function_cooperative finished.")

async def count_cooperative():
    """包含协作性CPU任务的协程。"""
    for x in range(3):
        print(f"Count {x} in {asyncio.current_task().get_name()}")
        await long_function_cooperative() # 等待一个协作性CPU任务

async def main_cooperative():
    """主协程，启动两个协作性计数任务。"""
    task1 = asyncio.create_task(count_cooperative(), name="Count-X")
    task2 = asyncio.create_task(count_cooperative(), name="Count-Y")
    await asyncio.gather(task1, task2)

if __name__ == "__main__":
    start_time = time.perf_counter()
    asyncio.run(main_cooperative())
    end_time = time.perf_counter()
    print(f"\n总执行时间 (协作): {end_time - start_time:.2f} 秒")

现在，运行这段代码，你会看到期望的交替输出：

Count 0 in Count-X
Count 0 in Count-Y
Count 1 in Count-X
Count 1 in Count-Y
Count 2 in Count-X
Count 2 in Count-Y
Task Count-X: long_function_cooperative finished.
Task Count-Y: long_function_cooperative finished.
...

await asyncio.sleep(0)的原理是：它是一个非阻塞的异步操作，告诉事件循环“我暂时不需要CPU，你可以去检查是否有其他协程准备好了”。即使是sleep(0)，它也触发了事件循环的调度机制，允许其他等待中的协程获得执行机会。这正是asyncio协作式多任务的核心体现。

PathFinder

AI驱动的销售漏斗分析工具

下载

4. 事件循环的工作机制

asyncio的事件循环是单线程的，它维护一个任务队列。当一个协程通过await等待一个异步操作（如网络I/O、定时器或asyncio.sleep(0)）时，它会暂停执行，并将控制权交还给事件循环。事件循环会检查任务队列，选择下一个“准备就绪”的协程来运行。

I/O密集型任务： 当协程等待网络响应时，操作系统会处理网络通信，而Python线程可以去执行其他协程。当网络数据到达时，事件循环会收到通知，然后将等待该数据的协程标记为“准备就绪”，并在合适的时机重新调度它。
CPU密集型任务： 如果一个协程正在执行纯粹的CPU计算，它不会自动释放控制权。它会一直占用CPU，直到计算完成。除非它内部显式地调用await一个异步操作（如asyncio.sleep(0)），否则事件循环无法介入并切换到其他协程。

因此，asyncio的并发性是“协作式”的，而不是“抢占式”的。协程必须主动选择何时交出控制权。

5. CPU密集型任务的真正解决方案

虽然asyncio.sleep(0)可以在一定程度上缓解CPU密集型任务的阻塞问题，但它并不能真正实现并行计算，因为asyncio事件循环仍然运行在单个线程中。对于需要充分利用多核CPU的重度CPU密集型任务，真正的解决方案是使用多进程（multiprocessing）。

concurrent.futures模块提供了ProcessPoolExecutor，可以方便地将CPU密集型任务提交到独立的进程中执行，从而绕过Python的全局解释器锁（GIL）限制，实现真正的并行。

import asyncio
import time
from concurrent.futures import ProcessPoolExecutor

def blocking_cpu_task(task_id, iterations):
    """一个阻塞的CPU密集型函数，适合在进程池中运行。"""
    print(f"Process {task_id}: Starting CPU-bound task with {iterations} iterations...")
    result = 0
    for i in range(iterations):
        result += i # 执行一些计算
    print(f"Process {task_id}: Finished CPU-bound task. Result: {result % 1000}")
    return f"Task {task_id} completed."

async def run_cpu_tasks_with_pool():
    """使用ProcessPoolExecutor异步运行CPU密集型任务。"""
    # 使用ProcessPoolExecutor创建进程池，max_workers=None表示使用CPU核心数
    with ProcessPoolExecutor(max_workers=2) as executor:
        loop = asyncio.get_running_loop()

        # 将CPU密集型任务提交到进程池，并等待其完成
        tasks = [
            loop.run_in_executor(executor, blocking_cpu_task, "Alpha", 50_000_000),
            loop.run_in_executor(executor, blocking_cpu_task, "Beta", 50_000_000)
        ]

        results = await asyncio.gather(*tasks)
        print("\n所有CPU密集型任务通过ProcessPoolExecutor完成:")
        for res in results:
            print(res)

if __name__ == "__main__":
    start_time = time.perf_counter()
    asyncio.run(run_cpu_tasks_with_pool())
    end_time = time.perf_counter()
    print(f"\n总执行时间 (ProcessPoolExecutor): {end_time - start_time:.2f} 秒")

运行此代码，你会看到两个blocking_cpu_task几乎同时开始执行，并且总执行时间会接近单个任务的执行时间，因为它们在不同的CPU核心上并行运行。

注意事项：

ThreadPoolExecutor vs ProcessPoolExecutor： concurrent.futures.ThreadPoolExecutor用于线程池。虽然它可以用于将阻塞I/O操作移出主事件循环，但由于GIL的存在，对于纯Python的CPU密集型任务，线程池无法实现真正的并行计算。因此，对于CPU密集型任务，应优先考虑ProcessPoolExecutor。
任务粒度： 如果CPU密集型任务可以被细分为许多小块，并且每小块的执行时间较短，那么在每小块结束后插入await asyncio.sleep(0)可能是一种权宜之计，但它增加了上下文切换的开销。对于长时间运行的、不可中断的CPU计算，使用进程池是更健壮的选择。

6. 总结

asyncio和async/await是Python实现高效并发的强大工具，但它们主要适用于I/O密集型任务。理解其协作式多任务的本质至关重要：

await关键字只有在等待一个异步操作（如I/O、定时器或显式地交出控制权）时，才会让出控制权。
纯粹的CPU密集型计算会阻塞整个asyncio事件循环，直到其完成。
await asyncio.sleep(0)可以作为一种显式交出控制权的机制，使事件循环有机会调度其他协程。
对于需要真正并行执行的CPU密集型任务，应使用concurrent.futures.ProcessPoolExecutor将任务提交到独立的进程中运行。

正确区分任务类型并选择合适的并发策略，是编写高效、响应迅速的Python异步应用程序的关键。

Python怎么统计元素频率_Counter计数器对象使用与频数排序

如何通过字典映射实现对独立变量的动态访问与修改

如何在Python中安全地从栈顶移除指定数量的盘子

Python Django自定义命令怎么写_management/commands脚本编写实现按周期自动清理数据

Python SSL模块报错怎么修_缺少OpenSSL依赖修复教程

相关专题

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

765

2023.08.10

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

177

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

102

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

227

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

530

2026.03.04

热门下载

网站特效

网站源码

网站素材

前端模板