答案是实现轻量级协程库需根据需求选择stackful或stackless模型:前者依赖上下文切换(如ucontext),支持任意位置挂起但性能较差;后者基于C++20协程,编译器生成状态机,高效且类型安全,适合现代应用;推荐使用C++20实现task或lazy类型封装,避免手动管理堆栈,生产环境优先选用标准协程或Boost.Coroutine2等成熟方案。

实现一个轻量级的协程库,首先要理解 C++ 中协程的基本模型:stackful 与 stackless。两者核心区别在于是否拥有独立的调用栈。理解这一点,才能决定如何设计和实现。
Stackful vs Stackless 协程:本质区别
Stackful 协程 拥有自己独立的栈空间,可以在线程内任意函数调用层级中挂起和恢复。它像一个“轻量线程”,支持在任意深度嵌套的函数中 yield。代表实现如 Boost.Context 或早期的 ucontext(已不推荐)。
Stackless 协程 则没有独立栈,挂起点只能在协程函数的顶层(即最外层协程函数中),不能在被调用的子函数中 yield。C++20 的标准协程就是典型的 stackless 实现,依赖编译器生成状态机来管理暂停与恢复。
简单说:stackful 更灵活但开销大;stackless 更高效但限制多。
立即学习“C++免费学习笔记(深入)”;
实现一个简单的 stackful 协程库(基于上下文切换)
使用 ucontext_t(仅用于教学,不推荐生产)可快速实现一个协作式调度器:
- 每个协程封装为一个
task,包含自己的栈和上下文 - 通过
makecontext和swapcontext实现上下文切换 - 主调度器管理协程的创建、切换与回收
示例骨架:
struct coroutine {
char* stack;
ucontext_t ctx;
void (*func)();
bool done = false;
coroutine(void (*f)()) {
stack = new char[64 * 1024];
getcontext(&ctx);
ctx.uc_stack.ss_sp = stack;
ctx.uc_stack.ss_size = 64 * 1024;
ctx.uc_link = nullptr;
func = f;
makecontext(&ctx, (void(*)())f, 0);
}
void resume() {
if (!done) swapcontext(¤t_ctx, &ctx);
}};
这种实现能实现真正的“任意位置挂起”,但依赖平台 API,且性能不如现代方法。
C++20 Stackless 协程:编译器驱动的状态机
C++20 引入关键字 co_await、co_yield、co_return,将函数变为协程。编译器会将其转换为状态机对象。
关键组件:
- promise_type:定义协程行为,如返回值、异常处理
-
awaiter:控制
co_await行为,决定是否挂起或继续 - coroutine_handle:用于手动控制协程的生命周期
优点是零成本抽象、类型安全、与标准库集成好;缺点是无法在普通函数中直接 co_await,必须从协程开始。
如何选择?轻量级库的设计思路
若追求极致轻量且跨平台,建议基于 C++20 实现 stackless 协程库,例如封装 task 类型:
- 定义
lazy或task类型,延迟执行 - 使用
co_await支持链式调用与异步等待 - 避免堆分配,利用
std::coroutine_handle::from_promise管理生命周期
对于需要深度挂起的场景,可考虑第三方库如 Boost.Coroutine2(基于汇编实现栈切换),而非自行实现 stackful。
基本上就这些。C++ 协程的选择取决于需求:现代应用优先用 C++20 stackless,兼容性和性能更好;特殊场景再考虑 stackful。自己写只是为了理解机制,生产环境建议用成熟库。









