c++如何实现一个无锁队列 (Lock-Free Queue)？ (std::atomic与内存序)

裘德小鎮的故事

发布时间：2026-01-20 16:25:02

993人浏览过

来源于php中文网

原创

不能直接用 std::queue + std::atomic 拼凑无锁队列，因为 std::queue 的 push/pop 包含多个非原子操作，仅原子化指针无法保证线性一致性，且忽略 ABA 问题和内存重排，易导致野指针或数据竞争。

c++如何实现一个无锁队列 (lock-free queue)？ (std::atomic与内存序)

为什么不能直接用 `std::queue` + `std::atomic` 拼凑无锁队列？

因为 std::queue 本身不是原子的，它的 push() 和 pop() 涉及多个非原子操作（如修改头尾指针、分配/释放节点、更新 size），哪怕把头尾指针声明为 std::atomic<node></node>，也无法保证整个操作的线性一致性。常见错误是只原子化指针读写，却忽略 ABA 问题和内存重排——比如消费者读到旧的 tail，以为有新节点，实际该节点已被回收并复用，导致解引用野指针。

用 Michael-Scott 算法实现单生产者单消费者（SPSC）无锁队列的关键点

SPSC 是唯一能用纯 std::atomic + 顺序一致内存序（std::memory_order_seq_cst）安全实现的场景，无需复杂 hazard pointer 或 epoch-based reclamation。核心是两个原子指针：head（消费者端）、tail（生产者端），以及环形缓冲区（避免动态分配）。

enqueue() 只由一个线程调用：先读 tail，计算下一个索引，用 compare_exchange_weak 尝试推进 tail；成功后才写入元素
dequeue() 同理，只由一个线程调用：读 head，计算索引，compare_exchange_weak 推进 head，再读出元素
必须用 std::memory_order_acquire 读指针、std::memory_order_release 写指针，或统一用 seq_cst（SPSC 下性能可接受）
缓冲区大小必须是 2 的幂，用位运算取模：index & (capacity - 1)，避免分支和除法

template<typename T, size_t N>
class spsc_queue {
    static_assert((N & (N-1)) == 0, "N must be power of 2");
    alignas(64) std::atomic<size_t> head_{0};
    alignas(64) std::atomic<size_t> tail_{0};
    T buffer_[N];
<p>public:
bool try<em>enqueue(const T& val) {
auto tail = tail</em>.load(std::memory_order_acquire);
auto next_tail = (tail + 1) & (N - 1);
if (next<em>tail == head</em>.load(std::memory_order<em>acquire)) return false;
buffer</em>[tail] = val;
tail_.store(next_tail, std::memory_order_release);
return true;
}</p><pre class='brush:php;toolbar:false;'>bool try_dequeue(T& val) {
    auto head = head_.load(std::memory_order_acquire);
    if (head == tail_.load(std::memory_order_acquire)) return false;
    val = std::move(buffer_[head]);
    head_.store((head + 1) & (N - 1), std::memory_order_release);
    return true;
}

};

MPMC 场景下为什么必须处理 ABA 问题？

多生产者多消费者时，仅靠 compare_exchange_weak 无法防止 ABA：线程 A 读到指针 P，被抢占；线程 B 把 P 指向的节点弹出、释放、又新建一个新节点恰好复用同一地址 P；线程 A 恢复后仍认为 P 有效，compare_exchange 成功但语义错误。解决方案不是禁用优化，而是给指针附加版本号（tagged pointer）。

Peppertype.ai

高质量AI内容生成软件，它通过使用机器学习来理解用户的需求。

下载

立即学习“C++免费学习笔记（深入）”；

典型做法：用 64 位整数低 48 位存指针，高 16 位存版本号，每次 CAS 前递增版本
std::atomic<uint64_t></uint64_t> 存储 head 和 tail，CAS 时同时比对指针+版本
注意：x86_64 支持 cmpxchg16b，但需编译器支持 -mcx16；否则退回到基于 hazard pointer 的方案（如 Folly::MPMCQueue）
不要手动用 reinterpret_cast 强转指针到整数再拼接——未定义行为，应使用 std::bit_cast（C++20）或联合体（union）安全地拆解

内存序选错会导致什么具体现象？

在 SPSC 队列中若把 tail_.store 改成 std::memory_order_relaxed，可能造成消费者看到更新后的 tail 却读到未初始化的 buffer_[old_tail]；因为编译器或 CPU 重排了写缓冲区数据和写 tail 的顺序。同样，head_.load 若用 relaxed，可能读到过期的 head 值，导致重复消费或跳过元素。

正确组合：写指针用 release，读指针用 acquire，构成同步关系（synchronizes-with）
seq_cst 更安全但有性能代价，在 x86 上多数 seq_cst store 会插入 mfence，而 release store 通常只是普通 store
ARM/AArch64 上差异更大：acquire/release 对应 ldar/stlr 指令，seq_cst 需额外 barrier

无锁队列真正难的不是写几个 atomic 操作，而是验证边界条件：满/空状态判断是否严格互斥、内存生命周期是否可控、不同架构下重排是否被正确约束。MPMC 场景下，几乎没人从零手写可靠实现——直接用 boost::lockfree::queue 或 moodycamel::ConcurrentQueue 更实际。

如何用c++实现一个行为树(Behavior Tree)？ (游戏AI逻辑)

c++中如何求矩阵的转置_c++二维数组矩阵转置代码

C++如何实现一个A*寻路算法？C++游戏AI与路径规划【算法实战】

c++在Unreal Engine中的应用_c++ UE4/5游戏开发基础

如何用C++实现一个有限状态机（FSM）？C++游戏AI与协议解析【设计模式】

c++速学教程(入门到精通)

c++怎么学习？c++怎么入门？c++在哪学？c++怎么学才快？不用担心，这里为大家提供了c++速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关专题

c语言union的用法

c语言union的用法是一种特殊的数据类型，它允许在相同的内存位置存储不同的数据类型，union的使用可以帮助我们节省内存空间，并且可以方便地在不同的数据类型之间进行转换。使用union时需要注意对应的成员是有效的，并且只能同时访问一个成员。本专题为大家提供union相关的文章、下载、课程内容，供大家免费下载体验。

129

2023.09.27

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

766

2023.08.10

页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章，大家可以免费体验。

500

2023.08.14

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

174

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

102

2026.03.06

热门下载

网站特效

网站源码

网站素材

前端模板