0

0

如何使用c++和CUDA的Cooperative Groups进行GPU线程协作? (网格级同步)

裘德小鎮的故事

裘德小鎮的故事

发布时间:2026-01-22 14:17:02

|

101人浏览过

|

来源于php中文网

原创

cooperative_groups网格级同步的本质是启动必须全部参与且原子性完成的跨SM kernel,并用cg::grid_group::synchronize()实现全局屏障;需满足计算能力≥6.0、TCC模式(Tesla卡)、空流三条件,且仅在该kernel内生效。

如何使用c++和cuda的cooperative groups进行gpu线程协作? (网格级同步)

什么是 cooperative_groups 网格级同步的本质

它不是“让所有 GPU 线程等一个栅栏”,而是允许你启动一个跨多个 SM 的、**必须全部参与且原子性完成**的 kernel,并在其中用 cg::grid_group 调用 synchronize()。前提是:kernel 必须用 cudaLaunchCooperativeKernel 启动,且设备支持(cudaDeviceGetAttribute(&attr, cudaDevAttrCooperativeLaunch, dev) 返回非零),常见于 Tesla A100 / V100 / H100,消费卡(如 RTX 4090)默认禁用或不支持。

启动 cooperative kernel 的三个硬性条件

缺一不可,否则 cudaLaunchCooperativeKernel 直接返回 cudaErrorNotSupportedcudaErrorInvalidValue

  • GPU 计算能力 ≥ 6.0(Pascal),但实际需看驱动与模式:Tesla 卡需在 TCC 模式下运行;Windows WDDM 下一律不支持
  • Host 端调用前必须设置流为 NULL:cudaStream_t stream = 0,不能传自定义流
  • Kernel 中若使用 cg::grid_group,必须在 kernel 入口第一行声明并获取,例如:
    __global__ void my_kernel() {
        namespace cg = cooperative_groups;
        cg::grid_group grid = cg::this_grid();
        // 后续才能调用 grid.synchronize()
    }

cg::grid_group::synchronize() 的行为边界

它只对当前 cooperative kernel 内所有线程生效,不阻塞 host,也不影响其他 kernel。但它会强制等待:所有 SM 上该 kernel 的所有 block 都执行到该语句,且所有 warp 都到达后才继续。注意以下陷阱:

  • 不能在 if (threadIdx.x == 0) 这类 divergent 分支里调用——会导致部分 warp 永远不执行,kernel hang 住
  • 不能和 __syncthreads() 混用在同个 block 内做嵌套同步——无定义行为,常见死锁
  • 每个 block 内只能调用一次 grid.synchronize()(多次调用不报错但无意义,且可能触发驱动异常)
  • 同步开销显著:A100 上单次耗时约 5–10 μs,比 __syncthreads() 高两个数量级

典型协作模式:全局归约 + 分布式 barrier

适合需要所有 block 协同完成阶段性计算的场景,比如多 block 共同构建哈希表、分阶段排序、或分布式 SGD 的梯度聚合。下面是最小可运行结构:

松果AI写作
松果AI写作

专业全能的高效AI写作工具

下载

立即学习C++免费学习笔记(深入)”;

__global__ void global_reduce_kernel(float* data, int n) {
    namespace cg = cooperative_groups;
    cg::grid_group grid = cg::this_grid();
    extern __shared__ float sdata[];
int tid = threadIdx.x;
int bid = blockIdx.x;
int offset = bid * blockDim.x;

// Step 1: block 内规约到 shared memory
sdata[tid] = (offset + tid < n) ? data[offset + tid] : 0.f;
__syncthreads();
for (int s = blockDim.x / 2; s > 0; s >>= 1) {
    if (tid < s) sdata[tid] += sdata[tid + s];
    __syncthreads();
}

// Step 2: 只有 block 0 把结果写入 global memory(或其他协调逻辑)
if (bid == 0 && tid == 0) {
    data[0] = sdata[0];
}

// Step 3: 所有 block 等待 block 0 完成写入,再进入下一阶段
grid.synchronize();

// Step 4: 此时可安全读取 data[0] 做后续广播/校正
if (bid == 1 && tid == 0) {
    float global_sum = data[0];
    // do something with global_sum...
}

}

真正难的从来不是写这十几行代码,而是确认你的运行环境是否满足 cooperative launch 的全部约束——尤其是驱动模式、设备属性、流参数这三个点,漏查一个,kernel 就静默失败或直接 crash。

相关专题

更多
什么是分布式
什么是分布式

分布式是一种计算和数据处理的方式,将计算任务或数据分散到多个计算机或节点中进行处理。本专题为大家提供分布式相关的文章、下载、课程内容,供大家免费下载体验。

327

2023.08.11

分布式和微服务的区别
分布式和微服务的区别

分布式和微服务的区别在定义和概念、设计思想、粒度和复杂性、服务边界和自治性、技术栈和部署方式等。本专题为大家提供分布式和微服务相关的文章、下载、课程内容,供大家免费下载体验。

233

2023.10.07

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

233

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

437

2024.03.01

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

757

2023.08.22

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

482

2023.08.10

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

647

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1125

2023.07.27

菜鸟裹裹入口以及教程汇总
菜鸟裹裹入口以及教程汇总

本专题整合了菜鸟裹裹入口地址及教程分享,阅读专题下面的文章了解更多详细内容。

0

2026.01.22

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.6万人学习

Excel 教程
Excel 教程

共162课时 | 12.9万人学习

PHP基础入门课程
PHP基础入门课程

共33课时 | 2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号