io_uring_enter失败主因是flags非法或内核不支持组合;SQ ring提交需正确更新tail并加内存屏障;mmap必须用MAP_SHARED且释放顺序为先munmap后close;多线程提交须同步tail避免乱序。

io_uring_enter 直接调用失败:返回 -1 且 errno=EINVAL
直接用 syscall(SYS_io_uring_enter, ...) 调用,但总卡在 EINVAL,不是权限问题,也不是 fd 错——大概率是 flags 参数非法或内核版本不支持该 flag 组合。
-
flags必须只含内核允许的位:常见合法值只有IORING_ENTER_GETEVENTS、IORING_ENTER_SQ_WAKEUP、IORING_ENTER_SQ_WAIT;混用IORING_ENTER_GETEVENTS | IORING_ENTER_SQ_WAKEUP在 5.11 之前内核会直接拒掉 - 调用前必须确保
sq_ring->flags已被映射且可读写(即mmap时用了PROT_READ | PROT_WRITE),否则内核看到 flags 地址不可读就判EINVAL - 传入的
fd必须是通过io_uring_setup成功返回的 ring fd,不能是任意整数;调试时可用ls -l /proc/self/fd/$(echo $ring_fd)确认是否为anon_inode:[io_uring]
struct io_uring_sqe 填写后没生效:submit 后 event 没回来
填了 sqe->opcode = IORING_OP_READV、设了 sqe->fd 和 sqe->addr,但 io_uring_enter 返回 0,io_uring_cqe_get 一直拿不到完成事件——核心原因是 SQ ring 的提交指针没推进,内核根本没看到这个 sqe。
- 必须手动更新
*sq_ring->khead(用户空间读取)和*sq_ring->ktail(用户空间写入)之间的差值,算出当前可用 slot 数;填完 sqe 后要调io_uring_smp_store_release(sq_ring->tail, new_tail)(不能裸写*sq_ring->tail = new_tail) - 如果用了
IORING_SETUP_IOPOLL,某些操作(如文件读)必须配合IORING_FEAT_POLL_32BITS才能进轮询路径,否则降级为中断模式但可能因驱动未注册 poll handler 导致挂起 - 检查
sq_ring->ring_mask是否与params->sq_entries匹配:比如申请了 256 个 entries,ring_mask应为 255;若误用 511 就会导致 tail 越界,内核静默丢弃
C++ RAII 封装 io_uring fd 和 mmap 区域时 double-close 或 double-unmap
用 std::unique_ptr 管理 mmap 内存、用自定义 deleter 关闭 fd,结果程序退出时报 munmap: Invalid argument 或 close: Bad file descriptor——本质是内核对 io_uring ring 的资源释放有严格顺序:必须先 munmap 所有 ring 映射区域,再 close(ring_fd)。
- 不要把 fd 和 mmap 指针塞进同一个 RAII 对象;建议拆成两个:一个
io_uring_fd(只管 close),一个io_uring_mmap(只管 munmap),并在io_uring_mmap的 destructor 里确保它比io_uring_fd先析构(靠声明顺序或显式reset()) - 避免在构造函数里直接
mmap:万一io_uring_setup失败,mmap 指针为 nullptr,但 deleter 可能仍尝试munmap(nullptr),触发 UB;应在 setup 成功后再调 mmap - 所有 mmap 区域(SQ ring、CQ ring、SQEs)必须用
MAP_SHARED;用MAP_PRIVATE会导致内核无法看到用户写的 tail/head 更新
跨线程提交 sqe 时出现乱序或丢失:多线程直接操作 sq_ring->tail
多个线程各自填 sqe 并原子增 *sq_ring->tail,结果部分请求永远不触发——因为 tail 是共享变量,但没做内存屏障,不同 CPU 核心看到的值不一致,或者编译器重排导致写 tail 在写 sqe 内容之前就完成了。
立即学习“C++免费学习笔记(深入)”;
- 必须用
io_uring_smp_store_release(即__atomic_store_n(..., __ATOMIC_RELEASE))写tail;对应地,读head时要用io_uring_smp_load_acquire - 不要假设
tail递增就是安全的:如果线程 A 获取 slot 0-3,线程 B 获取 4-7,但 B 先写完 tail=8 并调io_uring_enter,A 还没写完 sqe[0],内核就会读到脏数据 - 更稳妥的做法是用单生产者模型:由一个线程负责收集所有 sqe 并批量提交;若必须多线程,需配合 per-CPU ring 或额外互斥(比如用
std::atomic_flag控制临界区)
strace -e trace=io_uring* 和反复看 /proc/sys/fs/aio-max-nr。











